JP2017199343A - 卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化するための計算実行方法、プログラムおよび計算処理システム - Google Patents

卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化するための計算実行方法、プログラムおよび計算処理システム Download PDF

Info

Publication number
JP2017199343A
JP2017199343A JP2016249670A JP2016249670A JP2017199343A JP 2017199343 A JP2017199343 A JP 2017199343A JP 2016249670 A JP2016249670 A JP 2016249670A JP 2016249670 A JP2016249670 A JP 2016249670A JP 2017199343 A JP2017199343 A JP 2017199343A
Authority
JP
Japan
Prior art keywords
document
image
camera
text
projector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016249670A
Other languages
English (en)
Other versions
JP6828421B2 (ja
Inventor
パトリック チィーウ
Patrick Chiu
チィーウ パトリック
乂凡 張
Yifan Zhang
乂凡 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of JP2017199343A publication Critical patent/JP2017199343A/ja
Application granted granted Critical
Publication of JP6828421B2 publication Critical patent/JP6828421B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/0304Detection arrangements using opto-electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/042Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means by opto-electronic means
    • G06F3/0425Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means by opto-electronic means using a single imaging device like a video camera for tracking the absolute position of a single or a plurality of objects with respect to an imaged reference surface, e.g. video camera imaging a display or a projection screen, a table or a wall surface, on which a computer generated image is displayed or projected
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/12Picture reproducers
    • H04N9/31Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
    • H04N9/3179Video signal processing therefor
    • H04N9/3185Geometric adjustment, e.g. keystone or convergence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/12Picture reproducers
    • H04N9/31Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
    • H04N9/3191Testing thereof
    • H04N9/3194Testing thereof including sensor feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Abstract

【課題】卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化する方法を提供する。
【解決手段】処理ユニットとメモリとプロジェクタ(106)とカメラ(101)とを備え、前記プロジェクタと前記カメラは面(103)の上方に配置された計算処理システム(100)において実行される計算実行方法は、カメラ(101)を利用して面上に置かれた文書の画像を取得し、文書の取得画像を利用して文書(104)の少なくとも一部のテキストを取得し、取得された文書の少なくとも一部のテキストを利用してその文書に関連する複数の文書を見出し、取得された文書の少なくとも一部のテキストを利用してその文書に関連する複数の人物を見出し、プロジェクタ(106)を利用して複数の関連文書に対応する第1の複数のサムネール画像の少なくとも1つと複数の関連人物に対応する第2の複数のサムネール画像の少なくとも1つとを表示する。
【選択図】図1

Description

開示の実施形態は、一般的に文書とのインタラクティブ技術に関し、より具体的には卓上カメラ−プロジェクタシステムでの文書閲覧時に関連文書および人物を可視化するための計算実行方法、プログラムおよび計算処理システムに関する。
当業者には周知のように、テーブル上方にプロジェクタとカメラを取り付けることにより通常のテーブル面をインタラクティブなコンピュータディスプレイに変えることができる。初期の研究システムでは、例えば、非特許文献1に記載のデジタルデスクや、非特許文献2に記載のカムワークスなどが、この概念を論証した。あるシステムではビデオカメラを利用した指やジェスチャによる入力を支援した(非特許文献3を参照)。その一方で、より最新のシステムでは深度カメラを利用する(非特許文献4を参照)。
ユーザが卓上におかれた文書を読むシナリオでは、文書のコンテンツを自動的に解析して、上記のインタラクティブなテーブルトップを利用し所定の追加情報をユーザに提供することが望ましい。従って、この目的に対して適応可能な新規で改良されたシステムと方法が必要である。
Wellner,P.による「デジタルデスク計算器:卓上ディスプレイでの触覚操作(The DigitalDesk calculator:tangible manipulation on a desk top display)」(Proc.UIST’91,pp.27−33) Newman,W.,Dance,C.,Taylor,A.,Taylor,S.,Taylor,M.,Aldhous,T.による「カムワークス:紙のソース文書から効率的キャプチャをするための映像ベースツール(CamWorks:a video−based tool for efficient capture from paper source document)」(Proc,Intl.Conf. on Multimedia Computing and Systems(ICMCS’99),pp647−653) Pinhanez,C.,Kjeldsen,R.,Tang,L.,Levas,A.,Podlaseck,M.,Sukaviriya,N.及びPingali,G.による「インタラクティブな投影ディスプレイを用いた任意場所でのタッチスクリーンの生成(Creating touch−screens anywhere with interactive projected displays)」(Proc.ACM Multimedia’03(Demo),pp.460−461) Kane,S.K.,Avrahami,D.,Wobbrock,J.O.,Hanison,B.,Rea,A.D.,Philipose,M.,LaMarca,A.Bonfireによる「ラップトップ−テーブルトップ混合インタラクションのためのノマディックシステム(a nomadic system for hybrid laptop−tabletop interaction)」(Proc.UIST’909,pp.129−138) Schilit,B.N.,Golovchinsky,G.,Price,M.N.Beyondによる「紙を超えて:自由形式デジタルインク注釈を有する能動的読み方支援(Beyond paper:supporting active reading with free form digital ink annotations)」(Proc.CHI’98,pp.249−256) Liao,C.,Tang,H.,Liu,Q.,Chiu,P.,Chen,F.による、「FACT:ポータブルな紙−ラップトップ混合インタフェースを介した文書とのきめ細かい媒体間相互作用(FACT:Fine−grained cross−media interaction with documents via a portable hybrid paper−laptop interface)」(Proc.ACM Multimedia 2010,pp.361−370) Lim,S.,Chiu,P.による「共同作業マップ:小グループ共同作業の時間力学の可視化(Collaboration Map:Visualizing temporal dynamics of small group collaboration)」(CSCW2015 Companion(Demo),pp.41−44) Chiu,P.,Chen,F.,Denoue,L.による「文書ページ画像内の図形検出(Picture detection in document page images)」(Proc. ACM DocEng 2A10,pp.211−214) PinhaneZ,C.,Kjeldsen,R.,Tang,L.,Levas,A.,Podlaseck,M.,Sukaviriya,.N.及びPingali,G.による「インタラクティブ投影表示を用いた場所を問わないタッチスクリーンの生成(Creating touch−screens anywhere with interactive projected displays)」(Proc.ACM Multimedia’03(Demo),pp.460−461) ACM Digital Library(http://dl.acm.org、2016年4月25日) Arai, T.,Machii K.,及びKuzunuki,S.,による「インタラクティブデスク上で実世界上の物体を含む電子文書を取得する方法(Retrieving electronic documents with real−world objects on InteractiveDESK)」(Proc. UIST’95,pp.37−38) Dunnigan, I.らによる「芸術及び技術におけるテーブルトップテレプレゼンスシステムの歴史(Evolution of a tabletop telepresence system through art and technology)」(Proc. ACM Multimedia 2015(動画)、pp.775−776) Kim, C.,Chiu, P.,及びTang, H.,による「4Kビデオカメラにより乱雑なテーブルトップ上の文書を高画質で撮像する方法(High−quality capture of documents on a cluttered tabletop with a 4K video camera)」(Proc. ACM DocEng 2015、pp.219−222) Kim, J.,Seitz, S.,及びAgrawala, M.による「ビデオに基づく文書トラッキング:物理的及び電子的デスクトップを統合する(Video−based document tracking:Unifying your physical and electronic desktops)」(Proc. UIST’04, pp.99−107) PyPDF2ソフトウェアツール(https://pypi.python.org/pypi/PYPDF2,2016年4月25日) Xpdfソフトウェアツール(http://www.foolabs.com/xpdf, 2016年4月25日)
本明細書で記述する実施形態は、面上に存在する文書に関連する他の電子的な文書や、面上に存在する文書に関連する人物の情報をユーザに提供する方法、プログラムおよび計算処理システムを開示する。
本発明の第1の態様によれば、処理ユニットとメモリとプロジェクタとカメラを備える計算処理システムにおいて実行される計算実行方法が提供される。ここでプロジェクタとカメラは面の上方に配置される。計算実行方法は、カメラを利用して面上に配置された文書の画像を取得することと、取得された文書の画像を利用して文書の少なくとも一部のテキストを取得することと、取得された文書の少なくとも一部のテキストを利用して文書に関連する複数の関連文書を見出すことと、取得された文書の少なくとも一部のテキストを利用して文書に関連する複数の関連人物を見出すことと、プロジェクタを利用して複数の関連文書のそれぞれに対応する第1のサムネール画像の少なくとも一つと複数の関連人物のそれぞれに対応する第2のサムネール画像の少なくとも一つとを表示すること、とを含む。
本発明の第2の態様によれば、カメラは処理ユニットに動作可能に結合されたタレット上に装着され、かつ処理ユニットがタレットを動作させることでカメラを動かし、面上の文書を撮影するように構成されている。
本発明の第3の態様によれば、取得された文書の画像を利用して文書の少なくとも一部のテキストを得ることが、取得された文書の画像上で光学文字認識を実行して文書のテキストの少なくとも一部を得ることを含む。
本発明の第4の態様によれば、取得された文書の画像上で光学文字認識を実行することにより文書の全テキストを得る。
本発明の第5の態様によれば、取得された文書の画像を利用して文書の少なくとも一部のテキストを得ることが、取得された文書の画像内のキーポイントを判定することと、判定したキーポイントを電子文書コレクションのキーポイントと照合することと、電子文書コレクション内の一致する電子文書を一致するキーポイントと一緒に配置することと、配置された一致する電子文書から文書の少なくとも一部のテキストを抽出することとを含む。
本発明の第6の態様によれば、複数の関連文書のそれぞれに対応する第1のサムネール画像が、対応する関連文書から抽出された画像である。
本発明の第7の態様によれば、関連文書から第1のサムネール画像を抽出することが、図形検出を用いて対応する関連文書から複数の図形を抽出し、抽出された複数の図形のうちの一つの図形を第1のサムネール画像として選択することとを含む。
本発明の第8の態様によれば、文書の選択された図形は、コレクション中の他の文書の図形に比べて最も独自の色と模様の特徴を有する。
本発明の第9の態様によれば、文書の得られた少なくとも一部のテキストを利用して文書に関連する複数の人物を見出すことが、文書の少なくとも一部のテキストを用いてウェブ検索を実行することを含む。
本発明の第10の態様によれば、関連人物に対応する第2のサムネール画像は、関連人物のそれぞれに対応する複数の写真を検索して、そのうち1枚の写真を選択することによって得られる。
本発明の第11の態様によれば、検索された関連人物の複数の写真のそれぞれの画像特徴を算出し、複数の写真の画像特徴の中心値に近い画像特徴を有する写真を、第2のサムネール画像として得る。
本発明の第12の態様によれば、プロジェクタとカメラは、ユーザに着用されるヘッドマウント型拡張現実システムの部品である。
本発明の第13の態様によれば、プロジェクタは面の上方に固定装着され、複数の関連文書に対応する複数の第1のサムネール画像の少なくとも一つと、複数の関連人物に対応する複数の第2のサムネール画像の少なくとも一つとが、プロジェクタによって面上に表示される。
本発明の第14の態様によれば、この方法は、複数の第1のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された第1のサムネール画像に対応する関連文書に関する情報を表示することをさらに含む。
本発明の第15の態様によれば、この方法は、複数の第1のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された第1のサムネール画像に対応する関連文書を表示することをさらに含む。
本発明の第16の態様によれば、この方法は、複数の第2のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された第2のサムネール画像に対応する関連人物に関する情報を表示することをさらに含む。
本発明の第17の態様によれば、この方法は、複数の第2のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された第2のサムネール画像に対応する関連人物にユーザが連絡するための情報を表示することをさらに含む。
本発明の第18の態様によれば、面とはテーブル上面である。
本発明の第19の態様によれば、処理ユニットとメモリとカメラとプロジェクタとを備え、カメラとプロジェクタは面の上方に配置された計算処理システムにおいて実行されるプログラムであって、カメラを利用して面上に配置された文書の画像を取得し、取得された文書の画像を利用して文書の少なくとも一部のテキストを取得し、取得された文書の少なくとも一部のテキストを利用して文書に関連する複数の関連文書を見出し、取得された文書の少なくとも一部のテキストを利用してその文書に関連する複数の関連人物を見出し、プロジェクタを利用して複数の関連文書のそれぞれに対応する第1のサムネール画像の少なくとも一つと複数の関連人物のそれぞれに対応する第2のサムネール画像の少なくとも一つとを表示することを含む方法を、計算処理システムに実行させるプログラムが提供される。
本発明の第20の態様によれば、処理ユニットとメモリとカメラとプロジェクタとを備え、カメラとプロジェクタは面の上方に配置された計算処理システムが提供される。メモリは、カメラを利用して面上に配置された文書の画像を取得し、取得された文書の画像を利用して文書の少なくとも一部のテキストを取得し、取得された文書の少なくとも一部のテキストを利用して文書に関連する複数の関連文書を見出し、取得された文書の少なくとも一部のテキストを利用してその文書に関連する複数の関連人物を見出し、プロジェクタを利用して複数の関連文書のそれぞれに対応する第1のサムネール画像の少なくとも一つと複数の関連人物のそれぞれに対応する第2のサムネール画像の少なくとも一つとを表示することを含む方法を、計算処理システムに実行させる。
本発明に関連するさらなる態様は、一部が以下の記載で説明され、一部はその記載によって明白であるか、又は本発明の実施によって習得することができる。本発明の態様は、要素ならびに様々な要素と以下の詳細な説明および添付の特許請求の範囲において具体的に示される態様との組合せにより実現及び達成することが可能である。
上記及び以下の記載はいずれも単なる例示と説明であり、請求範囲に記載の発明またはその適用をいかなる形であれ制限することを意図するものではないことを理解されたい。
本明細書に組み込まれ、本明細書の一部を成す添付の図面は、本発明の実施形態を例示し、説明と相俟って本発明概念の原理の説明および例示に供する。具体的には以下の通りである。
卓上カメラ−プロジェクタシステムで文書を閲覧中に、関連する文書と人物を可視化するためのシステムの例示的実施形態を示す図である。 卓上カメラ−プロジェクタシステムで文書を閲覧中に関連する文書と人物を可視化するためのシステムによる、関連する文書と人物の可視化の例を示す図である。 関連文書と人物の可視化のための拡張現実デバイスを利用したシステムの例示的実施形態を示す図である。 関連する文書と人物を示す半透明スクリーンを有する、Google Glass(登録商標)のような拡張現実デバイスを用いたシステムによる、関連文書と人物の可視化の例を示す図である。 卓上カメラ−プロジェクタシステムで文書を閲覧中に関連文書と人物を可視化するシステムの例示的操作シーケンスを示す図である。 卓上カメラ−プロジェクタシステムで文書を閲覧中に関連文書と人物を可視化する計算処理システムの例示的実施形態を示す図である。
以下の詳細な記述において添付の図面を参照する。ここで同一の機能的要素は同様の参照符号で表す。上記の添付図面は、本発明の原理に合致する特定の実施形態および実装形態を限定としてではなく例示として示す。これらの実装形態は、当業者が本発明を実施できるように十分詳細に記述される。また、他の実装形態が利用されてもよいこと、および本発明の趣旨および範囲を逸脱することなしに、構成の変更および/または様々な要素の置換が行われてもよいことを理解されたい。したがって、以下の詳細な記述は限定的な意味に解釈されるべきではない。さらに、記述される本発明の様々な実施形態は、汎用コンピュータ上で実行されるソフトウェアの形態または専用ハードウェアの形態、あるいはソフトウェアとハードウェアの組合せ、のいずれで実装されてもよい。
ユーザが紙の文書(またはタブレット上のデジタル文書)を読んでいる場合、本発明のシステムの一実施形態は、ユーザが関連する文書と人物を見つけ、それらをテーブルトップの文書の近くに表示することを支援できる。一つ又は複数の実施形態において、これは、テーブル上方の高解像度カメラを使用して文書をキャプチャし、OCR処理によって得られたテキストを利用して関連部署と人物を検索し、関連文書から代表的図形を抽出し、関連人物の写真を見つけ出し、そしてそれらをサムネールとしてテーブルトップに投影することによって達成される。様々な実施形態において、文書のサムネールを選択して文書に関するより多くの情報を示すか又は文書を取り出してもよいし、人物のサムネールを選択してその人物に関するより多くの情報を示すか、又はその人物にコンタクトを取ってもよい。
図1は、文書を卓上カメラ−プロジェクタシステムで閲覧中に関連する文書と人物を可視化するためのシステム100の一例示的実施形態を示す。一つ又は複数の実施形態において、卓上カメラ−プロジェクタシステムで文書を閲覧中に関連する文書と人物を可視化するための上記のシステム100には、テーブルトップ又はその他の面103の上方に、任意選択の台座に装着された高解像度(例えば4K)カメラ101が組み込まれていてもよい。台座は、パン(水平方向の回転)やチルト(垂直方向の回転)といったカメラの撮影方向を有したものが好適で、人の操作指示により、またはプログラムからの操作指示信号により、カメラの撮影向きを制御することが可能となる。このような台座として、本実施形態では、カメラのパン−チルト式ロボットタレット102上に高解像度カメラ101を組み込んだ形態を用いて説明をする。任意選択のロボットタレット102は、カメラ101を移動させて、テーブルトップ103の任意の場所に置かれた文書104を探索する。文書104が検出されると、ロボットタレット102によってカメラ101を移動させて検出された文書のページに合わせて文書104の高解像度画像をキャプチャする。高解像度画像は次に計算処理システム105上で作動するOCR機械を利用して、キャプチャされた文書コンテンツをテキストに変換する。代替実施形態においては、パン−チルト式ロボットタレット102が備えられていなくて、その視野内にテーブルトップ103全体が入るようにカメラ101をテーブルトップ103上方に固定装着する。様々な実施形態において、文書104は、典型的な例として、テーブルトップ103の面上に存在する物理的文書であり、それは物理的な紙であってもよいし、デジタルコンテンツを表示するタブレットコンピュータ、携帯電話、電子ペーパー等の表示装置であってもよい。物理的文書として表示装置に適用する場合には、実質的に文書104は表示装置に表示されている表示文書が文書として扱われる。
一つ又は複数の実施形態において、カメラ101の画像解像度は少なくとも4096×2160ピクセルである。ただし、当業者には分かるように、本発明はカメラ101の特定の解像度に限定されるものではなく、他の任意の好適な解像度を有するカメラを使用してもよい。一つ又は複数の実施形態において、カメラ101からテーブルトップ103の中央までの距離は、最適なOCR性能を得るために、約20ピクセルのエックスハイト(x−height)の文書104の取得画像が約300dpiの解像度となるように計算される。
カメラ101の他に、卓上カメラ−プロジェクタシステム上で文書を閲覧中に関連文書と人物を可視化するシステム100は、コンテンツをテーブルトップ又はその他の面103に投影するように構成されたプロジェクタ106を含んでいる。そのために、プロジェクタ106は計算処理システム105と通信可能に接続されている。一つ又は複数の実施形態において、システム100は、ユーザが関連文書と人物を見つけ出すことを支援して、それらをテーブルトップ103の文書近くに表示するように構成されている。読んでいるときに関連文書を見つけ出すことは、「能動的読み方」をサポートする方法の一つである。これは例えば、非特許文献5に記述されており、参照によりこれを本明細書に援用する。関連する人物を見つけることは、その文書のコレクションが、ユーザがメンバであってその人物に簡単に接触できる組織からのものである場合に特に適用可能である。関連文書と人物を容易に見つけ出すために、計算処理システム105はインターネット及び/又は一つ以上のローカル及び/又はリモートデータベースシステムまたはサービス又は検索エンジンに接続されて、関連する人物と文書の検索を実行できるようになっていてもよい。一つ又は複数の実施形態において、システム100は、上記の文書のOCR処理されたテキストを検索クエリとして利用して、関連する文書及び/又は人物をそれぞれのコレクション内に見つけ出す。
一実施形態において、文書104はタブレットコンピュータを用いて表示されてもよい。これは文書104の電子版をユーザに示す。この実施形態では、分解能の低いカメラ101が使用されてもよい。このカメラではOCR操作向きの文書をキャプチャすることはできないが、カメラ101によってキャプチャされた画像を利用してコレクション内の文書のキーポイントに照合可能なキーポイントのセットを作成できる。これは例えば、非特許文献6に記述されており、これを参照により本明細書に援用する。対応する電子文書が見つかった後、その文書の電子版(PDFやワードなど)からテキストを取得することができ、OCRの実行を必要とせずに、前述した検索クエリとしてリモート検索エンジンやデータベースシステムへ使用できる。
一つ又は複数の実施形態において、例えば非特許文献7に記載されているように、文書のメタデータのコレクション上で標準的な類似性尺度を用いて、クエリから関連文書および人物を見つけ出すことができる。CoMapと称する上記のシステムを用いて、共著者関係から関連する人物が識別される。このようにクエリを文書と照合することで、このシステムでは関連文書の組を得ることができる。これらの関連文書から、一実施形態において上位M個の文書と上位N人の人物のリストが導出される。
一つ又は複数の実施形態において、卓上カメラ−プロジェクタシステム上で文書を閲覧中に関連する文書と人物を可視化するためのシステム100は、インタラクティブなテーブルトップ上での可視化のために見つけた文書から図形を抽出するように構成されている。前述のクエリを用いて見つけた各関連文書に対して、代表的な図形を使ってプロジェクタ106でサムネールを表示することができる。当業者には理解されるように、電子文書のフォーマットによって図形抽出法は異なっている。多くの文書はPDFフォーマットで記憶されているが、文書のコンテンツは、埋め込み式画像要素又はスキャンページ画像などの色々な方法で符号化される。文書から図形を抽出する技術の例示的実施形態を以下で詳細に述べる。
図2は、卓上カメラ−プロジェクタシステムで文書を閲覧中に関連する文書と人物を可視化するためのシステム100による、関連する文書と人物の可視化200の例を示している。可視化200はプロジェクタ106を用いてテーブルトップ103上のシステム100で行われる。図2に示すようにシステム100は、テーブルトップ103に置かれた文書104の横に、関連する人物201と関連する文書202を表示するようになっている。様々な実施形態において、関連する文書202と関連する人物201を表すサムネールは、文書104の横に互いに隣接する2列として配置される。
別の実施形態では、スマートフォンやタブレットなどのモバイルデバイス、あるいはGoogle Glass(登録商標)のような拡張現実デバイスが関連する文書と人物の可視化に用いられる。関連文書と人物の可視化のための拡張現実デバイスを利用したシステム300の例示的実施形態を図3に示す。システム300においてユーザは、テーブルトップ103上の文書104を拡張現実デバイス301で閲覧している。この実施形態では、カメラ302とディスプレイ303は一つの拡張現実デバイス301の一部である(これはプロジェクタ106とカメラ101が分離した別々のものである、図1に示すテーブルトップシステムの実施形態100とは違う)。この実施形態では、ユーザが紙の文書104を閲覧すると、拡張現実デバイス301が関連する情報を半透明スクリーン上に重ねることができる。図4は関連する文書401と人物402のサムネールを示す半透明スクリーンを有する、Google Glass(登録商標)のような拡張現実デバイス301を用いたシステム300による関連文書と人物の可視化400の例を示す。一つの実施形態では、スクリーンのスペースが限られているので一つの関連文書と一人の人物の2つのサムネールを有する1列のみを示し、ユーザにはランク分けされたサムネールリストをスクロールして上下させるインタフェースが与えられる。
図5は、卓上カメラ−プロジェクタシステムでの文書の閲覧中に関連文書と人物を可視化するシステム100の例示的操作シーケンス500を示す図である。先ずステップ501でユーザが文書104をテーブルトップ103に置く。ステップ502で、テーブルトップの上方に装着された高解像度カメラによって文書の高解像度画像がキャプチャされる。ステップ503で、画像化された文書のOCRを実行して文書のテキストと図形を抽出する。ステップ504で、抽出した文書のテキストを基に文書コレクション内に上位M個の関連文書が見つけ出される。ステップ505で、M個の関連文書のそれぞれから代表的図形が抽出される。ステップ506で、コレクション中に上位N人の関連人物が識別される。ステップ507で、各関連人物の代表的写真が取得される。ステップ508で、M個の代表的文書図形とN人の関連人物の写真がテーブルトップの文書の横にサムネールとして表示される。
ステップ509で、システム100がユーザ入力を待つ。ステップ510で、システム100はユーザが文書のサムネールを選択したかどうかを判定する。選択した場合にはステップ511において、選択文書の情報が検索されてユーザに表示されるか、又は文書全体が取り出されて表示される。ステップ512で、システム100はユーザが人物のサムネールを選択したかどうかを判定する。選択した場合にはステップ513で、システムが選択された人物の情報又はその連絡先を検索して表示する。ユーザは選択した人物に接触するオプションが与えられる場合もある。
次に、可視化のために関連文書からの図形抽出に利用される技術を詳細に記述する。以下の記述ではコレクション内の文書はPDFフォーマットであることを仮定する。課題は、PDFフォーマットは、埋め込み画像要素又はスキャンページ画像のような色々な方法で符号化され得ることである。前者の場合、文書からサムネール写真を抽出するのにシステム100はPyPDF2のようなソフトウェアツールを使用してもよい。後者の場合、先ずシステム100は最後の参照文献にも記述されているXpdfのようなソフトウェアツールを用いてページを画像として抽出する。そしてレイアウト解析又は図形検出のような文書画像解析手法を適用する。これについては例えば、非特許文献8を参照されたい。
一つ又は複数の実施形態において、関連文書に関する代表的サムネール図形を見つけるために、抽出図形の一つが自動的に選択される。一つの例示的実施形態において、システム100が、抽出図形セットの中から、またコレクション内の全文書の抽出図形からも、最も独自の色と模様の特徴を持つ図形画像を選択する。
一つ又は複数の実施形態において、関連人物に関する代表的なサムネール写真を見つけるために、その人物の写真の一つが自動的に選択される。関連人物に関する写真サムネールを取得するために、組織はウェブサイトまたはデータベース内にメンバの写真を保持していることが多い。ウェブ検索を利用して人物の写真を見つけることも可能である。たとえば、特定の人物に関する写真として、複数の写真が取得されたとすると、その複数の写真から代表的サムネール写真を決定するための一つの方法として、複数の写真のそれぞれの画像特徴(たとえば色や明度など画像を表す特徴量や、ヒストグラム、模様等の画像の特徴)を求めて、取得された複数の写真の画像特徴の中心値や平均値を求め、その中心値や平均値に最も近い画像特徴を有する写真画像を決定することができる。また、他の人物の写真も考慮に入れて、コレクション内の他の人物の代表的写真とは可能な限り視覚的に異なる写真をそれぞれの人物の代表的写真として選択することもできる。一つ又は複数の実施形態において、図形も写真もない場合には1ページ目の画像又は一般的な写真アイコンを使用することもできる。一実施形態において、上位M個の図形と上位N人の人物が取得されると、図2に示すようにそれらを見えるように配置してテーブルトップ上に投影する。
これらのサムネールとインタラクトするために、指又は手のジェスチャを利用してもよい。これは例えば、非特許文献9及び非特許文献4に記述されている。参照によりこれらを本明細書に援用する。一実施形態において、文書202のサムネールが選択(タップジェスチャと等価)されると、選択された文書に関する情報(例えば、タイトル、著者、日付など)が表示されたり、あるいはその文書が図示しない記憶手段から読み出されてポップアップウィンドウで表示して閲覧することができるようにしてもよい。さらに、人物201のサムネールが選択されると、その人物に連絡を取るための手段として、連絡先情報が表示されたり、又はその人物に(eメール、テキストメッセージ、音声会議、ビデオ会議などを介して)連絡をすることができるようにしてもよい。
コンピュータプラットフォームの例
図6は、卓上カメラ−プロジェクタシステムで文書を閲覧中に関連文書と人物を可視化する計算処理システム600の例示的実施形態を示す。一つ又は複数の実施形態において、計算処理システム600は、当業者に周知のデスクトップコンピュータのフォームファクタ内に実装されてもよい。代替実施形態においては、計算処理システム600は、ラップトップ、ノートブックコンピュータ、タブレット、又はスマートフォンをベースとして実装されてもよい。
計算処理システム600は、計算処理システム600の様々なハードウェア部品の部品間または部品全体に情報を通信するためのデータバス604あるいはその他の相互接続、通信機構と、そのデータバスに電気接続され、情報処理とその他の計算、制御タスクを遂行するための中央処理ユニット(CPUあるいは単にプロセッサ)601とを含んでいてもよい。また、計算処理システム600は、ランダムアクセスメモリ(RAM)や他の動的記憶装置のようなメモリ612も含む。メモリは、データバス604に接続され、様々な情報及びプロセッサ601で実行される命令を記憶する。メモリ612はまた、磁気ディスク、光ディスク、半導体フラッシュメモリデバイス、その他の不揮発性固体素子記憶デバイスのような永久記憶装置を含んでいてもよい。
一つ又は複数の実施形態においてメモリ612は、プロセッサ601による命令の実行時の一時変数またはその他の中間情報の記憶に使用されてもよい。任意選択により計算処理システム600は、読出し専用メモリ(ROMまたはEPROM)602や、データバス604に接続されたその他の静的記憶装置をさらに含んでいて、計算処理システム600の操作に必要なファームウェアや基本入出力システム(BIOS)、並びに計算処理システム600の様々な構成パラメータなどの、プロセッサ601のための静的情報及び命令を記憶するようになっていてもよい。
一つ又は複数の実施形態において計算処理システム600はディスプレイ装置609を含んでいてもよい。これもデータバス604に電気接続されて、計算処理システム600のユーザへ上述のキャプチャしたテキスト情報などの様々な情報を表示するようになっていてもよい。代替実施形態においてディスプレイ装置609は、グラフィックコントローラ及び/又はグラフィックプロセッサ(図示せず)に関連付けられていてもよい。ディスプレイ装置609は液晶ディスプレイ(LCD)として実装されていてもよい。これは、いずれも当業者には周知の、例えば薄膜トランジスタ(TFT)技術または有機発光ダイオード(OLED)技術を利用して製造されてもよい。様々な実施形態においてディスプレイ装置609は、計算処理システム600のその他の部品と共通の筐体に組み込まれていてもよい。代替実施形態において、ディスプレイ装置609はそのような筐体の外側、例えばテーブル又は机の面などに置かれてもよい。また、様々なモータ及び/又はアクチュエータが組み込まれて、カメラ101を前述したように移動及び/又は回転させるためのカメラタレット603(図1の要素102)が備えられていてもよい。カメラタレット603もデータバス604に接続される。
一つ又は複数の実施形態において、計算処理システム600は、方向情報やコマンド選択をプロセッサ601に通信し、ディスプレイ装置609上のカーソル移動を制御するための、マウス/ポインティングデバイス610のようなカーソル制御デバイスを含む一つ以上の入力デバイスを備えてもよい。これは例えば、マウス、トラックボール、タッチパッド、又はカーソル方向キーなどである。この入力装置は一般的には第1の軸(例えばx軸)と第2の軸(例えばy軸)の2つの軸内での2自由度を有し、それによってデバイスに面内位置を特定させる。
計算処理システム600はさらに、上述したように机やその上にある文書の画像を取得するための高解像度カメラ611と、キーボード606を備えていてもよい。これらはすべてデータバス604に接続されて、これに限らないが画像や映像を含む情報及びユーザコマンド(ジェスチャを含む)をプロセッサ601へ通信してもよい。
一つ又は複数の実施形態において計算処理システム600は、データバス604に接続されたネットワークアダプタ605などの通信インタフェースをさらに含んでいてもよい。ネットワークアダプタ605は、計算処理システム600とインターネット608の間の接続を、少なくともローカルエリアネットワーク(LAN)及び/又はISDNアダプタ607を利用して確立するようになっていてもよい。ネットワークアダプタ605は、計算処理システム600とインターネット608との間の双方向のデータ通信を可能とするように構成されていてもよい。計算処理システム600のLANアダプタ607が、例えば総合デジタル通信網(ISDN)カード又はモデムを利用して実装されて、対応する種類の電話回線へのデータ通信接続を提供してもよい。電話回線はインターネットサービスプロバイダのハードウェア(図示せず)を利用してインターネット608に接続される。別の例として、LANアダプタ607はローカルエリアネットワークインタフェースカード(LAN NIC)であって、互換性を有するLAN及びインターネット608にデータ通信接続を提供してもよい。例示的実装形態においてはLANアダプタ607が、種々のタイプの情報を表すデジタルデータストリームを伝送する電気信号、電磁信号を送受信する。
一つ又は複数の実施形態において、インターネット608は一般的には1つ以上のサブネットワークを介して他のネットワークリソースへデータ通信を提供する。こうして計算処理システム600は、リモートウェブサーバ、ウェブサーバ、その他のコンテンツサーバ、並びにその他のネットワークデータストレージリソースなどの、インターネット608上の任意の場所にある様々なネットワークリソースにアクセス可能である。一つ又は複数の実施形態において計算処理システム600は、ネットワークアダプタ(ネットワークインタフェース)605によって、メッセージ、メディア、またはアプリケーションプログラムコードを含むその他のデータを、インターネット608を含む様々なネットワークを介して送受信するように構成されている。インターネットの例では、計算処理システム600がネットワーククライアントとして動作する場合に、計算処理システム600上で実行するアプリケーションプログラムのためのコードやデータを要求してもよい。同様に、様々なデータ又は計算処理コードを他のネットワークリソースに送信してもよい。
一つ又は複数の実施形態において本明細書に記載の機能は、メモリ612に含まれる1つ以上の命令の1つ以上のシーケンスを実行するプロセッサ601に応答して、計算処理システム600によって実装される。そのような命令は別のコンピュータ可読媒体からメモリ612へ読み込まれてもよい。メモリ612に含まれる命令のシーケンスを実行することで、本明細書に記載した様々なプロセスステップをプロセッサ601が遂行する。代替実施形態において、ソフトウェアによる命令の代わりとして、あるいはソフトウェアによる命令と組み合わせて、配線による回路を使用して本発明の実施形態が実行されてもよい。したがって上記の実施形態は、ハードウェア回路及び/又はソフトウェアのいかなる特定の組み合わせにも限定されるものではない。
本明細書で使用される「コンピュータ可読媒体」という用語は、プロセッサ601に実行命令を与えることに関与する任意の媒体を指す。コンピュータ可読媒体はマシン可読媒体の単なる一例であって、本明細書に記載の任意の方法および/または技術を実装するための命令を伝送することができる。このような媒体には多くの形態があり、不揮発性媒体および揮発性媒体が含まれるがそれらに限定されるものではない。
非一時的なコンピュータ可読媒体の一般的形態として、例えばフロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、あるいは他の任意の磁気媒体、CD−ROM、他の任意の光媒体、パンチカード、紙テープ、孔パターンを有する任意の他の物理媒体、RAM、PROM、EPROM、フラッシュEPROM、フラッシュドライブ、メモリカード、任意の他のメモリチップまたはメモリカートリッジ、あるいはコンピュータが読み取り可能な任意の他の媒体が含まれる。様々な形態のコンピュータ可読媒体が、プロセッサ601での実行のために、1つまたは複数の命令の1つまたは複数のシーケンスの伝送に関与してもよい。例えば、先ず命令がリモートコンピュータから磁気ディスクへ伝送されてもよい。もしくは、リモートコンピュータが命令をそのダイナミックメモリに書込み、インターネット608を介して命令を送信してもよい。具体的にはコンピュータ命令は、当分野で周知の各種のネットワークデータ通信プロトコルを用いてインターネット608経由で、上記のリモートコンピュータから計算処理システム900のメモリ612へダウンロードされてもよい。
一つ又は複数の実施形態において計算処理システム600のメモリ612は、以下に述べるソフトウェアプログラム、アプリケーション、又はモジュールの任意のものを記憶してもよい。
1.オペレーティングシステム(OS)613。オペレーティングシステム(OS)613は、基本システムサービスを実装し、計算処理システム600の様々なハードウェア構成要素を管理する。オペレーティングシステム613の例示的実施形態は当業者にはよく知られており、既知又は今後開発される任意のモバイルオペレーティングシステムを含んでもよい。
2.ネットワークコミュニケーションモジュール614。ネットワークコミュニケーションモジュール614は、例えば計算処理システム600とインターネット608の様々なネットワークエンティティ間のネットワーク接続を、ネットワークアダプタ605を用いて確立するために利用される、一つもしくは複数のネットワークプロトコルスタックを含んでもよい。
2.アプリケーション615。アプリケーション615は、例えば、計算処理システム600のプロセッサ601によって実行されるソフトウェアセットを含んでよい。これにより、計算処理システム600は、例えばここに記述された技術を用いてカメラ611による机とその上の文書画像の取得のような所定のある処理を実行させる。一つ又は複数の実施形態においてアプリケーション615には、上記の機能を組み込んだ本発明のアプリケーション616が含まれてもよい。
一つ又は複数の実施形態において、本発明のテキスト検出とキャプチャのアプリケーション616は、紙文書又は電子文書104の画像をキャプチャするためのテキスト検出モジュール617を含んでいる。さらに本発明のテキスト検出とキャプチャのアプリケーション616は、文書ページのキャプチャと再構築のための、文書ページキャプチャ及び再構築モジュール618を含んでもよい。さらにはキャプチャしたページ画像をテキスト変換するためのOCRモジュール619が含まれていてもよい。任意選択により、計算処理システム600のメモリ612に展開されるその他のアプリケーションとして、OCRモジュール619で生成されたテキストを受信することのできる、索引付けと検索のシステム、文書保管及び/又は言語翻訳アプリケーション(図示せず)が含まれてもよい。
最後に、本明細書で説明したプロセスおよび技術はいかなる特定の装置にも固有に関係するものではなく、構成要素の任意の適切な組み合わせによって実装可能であることを理解されたい。さらに種々のタイプの汎用デバイスを、ここで説明した教示にしたがって使用してもよい。ここで説明した方法のステップを実行するための専用装置を構築することが有利な場合もあるであろう。本発明を特定の例に関連して説明したが、これらは全ての点において限定ではなく例示であることを意図している。本発明の実行には、ハードウェア、ソフトウェア、及びファームウェアの多くの異なる組み合わせが適することが、当業者には理解されるであろう。例えば、説明したソフトウェアは、アセンブラ、C/C++、Objective−C、perl、shell、PHP、Java(登録商標)などの広範なプログラム言語又はスクリプト言語、並びに既知又は今後開発される任意のプログラム言語又はスクリプト言語によって実装することが可能である。
さらに本発明の他の実装は、ここに開示した本発明の詳細及び実行を考慮すれば当業者には明らかとなるであろう。記述した実施形態の様々な態様及び/又は構成要素は、卓上カメラ−プロジェクタシステム上での文書の閲覧中に関連文書及び人物を可視化するためのシステムと方法において、単独又は任意の組合せで使用することができる。詳細および例は例示としてのみ考慮されるべきであり、本発明の真の範囲と趣旨は添付の特許請求の範囲に示されている。
100 システム
101 カメラ
102 ロボットタレット
103 面
104 文書
105 計算処理システム
106 プロジェクタ
200 可視化
201 サムネール
201 人物
202 文書

Claims (20)

  1. 処理ユニットとメモリとプロジェクタとカメラとを備え、前記プロジェクタと前記カメラは面の上方に配置された計算処理システムにおいて実行される計算実行方法であって、
    a.前記カメラを利用して前記面上に配置された文書の画像を取得することと、
    b.取得された前記文書の画像を利用して、前記文書の少なくとも一部のテキストを取得することと、
    c.取得された前記文書の前記少なくとも一部のテキストを利用して、前記文書に関連する複数の関連文書を見出すことと、
    d.取得された前記文書の前記少なくとも一部のテキストを利用して、前記文書に関連する複数の関連人物を見出すことと、
    e.前記プロジェクタを利用して、複数の前記関連文書のそれぞれに対応する第1のサムネール画像の少なくとも一つと、複数の前記関連人物のそれぞれに対応する第2のサムネール画像の少なくとも一つとを表示することと、
    を含む計算実行方法。
  2. 前記カメラは前記処理ユニットに動作可能に結合されたタレット上に装着され、かつ前記処理ユニットが前記タレットを動作させることで前記カメラを動かし、前記面上の前記文書を撮影するように構成された、請求項1に記載の計算実行方法。
  3. 取得された前記文書の画像を利用して前記文書の前記少なくとも一部のテキストを得ることが、取得された前記文書の画像上で光学文字認識を実行して、前記文書のテキストの少なくとも一部を得ることを含む、請求項1又は2に記載の計算実行方法。
  4. ステップbにおいて、取得された前記文書の画像上で光学文字認識を実行することにより前記文書の全テキストを得る、請求項1〜3のいずれか一項に記載の計算実行方法。
  5. 取得された前記文書の画像を利用して前記文書の前記少なくとも一部のテキストを得ることが、取得された前記文書の画像内のキーポイントを判定することと、前記判定したキーポイントを電子文書コレクションのキーポイントと照合することと、前記電子文書コレクション内の一致する電子文書を一致するキーポイントと一緒に配置することと、前記配置された一致する電子文書から前記文書の前記少なくとも一部のテキストを抽出することと、を含む請求項1〜4のいずれか一項に記載の計算実行方法。
  6. 複数の前記関連文書のそれぞれに対応する前記第1のサムネール画像が、対応する前記関連文書から抽出された画像である、請求項1〜5のいずれか一項に記載の計算実行方法。
  7. 前記関連文書から前記第1のサムネール画像を抽出することが、図形検出を用いて対応する前記関連文書から複数の図形を抽出し、前記抽出された複数の図形のうちの一つの図形を前記第1のサムネール画像として選択することとを含む、請求項6に記載の計算実行方法。
  8. 前記文書の前記選択された図形は、前記コレクション中の他の文書の図形に比べて最も独自の色と模様の特徴を有する、請求項7に記載の計算実行方法。
  9. 前記文書の前記少なくとも一部のテキストを利用して前記文書に関連する複数の人物を見出すことが、前記文書の前記少なくとも一部のテキストを用いてウェブ検索を実行することを含む、請求項1〜8のいずれか一項に記載の計算実行方法。
  10. 前記関連人物に対応する前記第2のサムネール画像は、前記関連人物のそれぞれに対応する複数の写真を検索して、そのうち1枚の写真を選択することによって得られる、請求項1〜9のいずれか一項に記載の計算実行方法。
  11. 検索された前記関連人物の複数の写真のそれぞれの画像特徴を算出し、前記複数の写真の画像特徴の中心値に近い画像特徴を有する写真を、前記第2のサムネール画像として得る、請求項10に記載の計算実行方法。
  12. 前記プロジェクタと前記カメラは、ユーザに着用されるヘッドマウント型拡張現実システムの部品である、請求項1〜11のいずれか一項に記載の計算実行方法。
  13. 前記プロジェクタは前記面の上方に固定装着され、複数の前記関連文書に対応する複数の前記第1のサムネール画像の少なくとも一つと、複数の前記関連人物に対応する複数の前記第2のサムネール画像の少なくとも一つとが、前記プロジェクタによって前記面上に表示される、請求項1〜12のいずれか一項に記載の計算実行方法。
  14. 複数の前記第1のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された前記第1のサムネール画像に対応する前記関連文書に関する情報を表示することをさらに含む、請求項1〜13のいずれか一項に記載の計算実行方法。
  15. 複数の前記第1のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された前記第1のサムネール画像に対応する前記関連文書を表示することをさらに含む、請求項1〜14のいずれか一項に記載の計算実行方法。
  16. 複数の前記第2のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された前記第2のサムネール画像に対応する前記関連人物に関する情報を表示することをさらに含む、請求項1〜15のいずれか一項に記載の計算実行方法。
  17. 複数の前記第2のサムネール画像の少なくとも一つをユーザが選択することを検出し、選択された前記第2のサムネール画像に対応する前記関連人物にユーザが連絡するための情報を表示することをさらに含む、請求項1〜16のいずれか一項に記載の計算実行方法。
  18. 前記面はテーブル上の面である、請求項1〜17のいずれか一項に記載の計算実行方法。
  19. 処理ユニットとメモリとカメラとプロジェクタとを備え、前記カメラと前記プロジェクタは面の上方に配置された計算処理システムにおいて実行されるプログラムであって、
    a.前記カメラを利用して前記面上に配置された文書の画像を取得し、
    b.取得された前記文書の画像を利用して、前記文書の少なくとも一部のテキストを取得し、
    c.取得された前記文書の前記少なくとも一部のテキストを利用して、前記文書に関連する複数の関連文書を見出し、
    d.取得された前記文書の前記少なくとも一部のテキストを利用して、前記文書に関連する複数の関連人物を見出し、
    e.前記プロジェクタを利用して、複数の前記関連文書のそれぞれに対応する第1のサムネール画像の少なくとも一つと、複数の前記関連人物のそれぞれに対応する第2のサムネール画像の少なくとも一つとを表示する、
    ことを含む方法を前記計算処理システムに実行させるためのプログラム。
  20. 処理ユニットとメモリとカメラ、プロジェクタとを備え、前記カメラと前記プロジェクタは面の上方に配置された計算処理システムであって、前記メモリは、
    a.前記カメラを利用して前記面上に配置された文書の画像を取得し、
    b.取得された前記文書の画像を利用して、前記文書の少なくとも一部のテキストを取得し、
    c.取得された前記文書の前記少なくとも一部のテキストを利用して、前記文書に関連する複数の関連文書を見出し、
    d.取得された前記文書の前記少なくとも一部のテキストを利用して、前記文書に関連する複数の関連人物を見出し、
    e.前記プロジェクタを利用して、複数の前記関連文書のそれぞれに対応する第1のサムネール画像の少なくとも一つと、複数の前記関連人物のそれぞれに対応する第2のサムネール画像の少なくとも一つとを表示する、
    ことを含む方法を前記計算処理システムに実行させるコンピュータ実行可能命令セットを記憶する、計算処理システム。
JP2016249670A 2016-04-25 2016-12-22 卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化するための計算実行方法、プログラムおよび計算処理システム Active JP6828421B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/137,390 US20170308550A1 (en) 2016-04-25 2016-04-25 Visualizing relevant documents and people while viewing a document on a camera-projector tabletop system
US15/137,390 2016-04-25

Publications (2)

Publication Number Publication Date
JP2017199343A true JP2017199343A (ja) 2017-11-02
JP6828421B2 JP6828421B2 (ja) 2021-02-10

Family

ID=60090275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016249670A Active JP6828421B2 (ja) 2016-04-25 2016-12-22 卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化するための計算実行方法、プログラムおよび計算処理システム

Country Status (2)

Country Link
US (1) US20170308550A1 (ja)
JP (1) JP6828421B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019197534A (ja) * 2018-05-09 2019-11-14 富士ゼロックス株式会社 文書及びテーブルの周囲の人物の検出に基づく文書及び人物を検索するためのシステム、方法並びにプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10331732B1 (en) * 2016-12-16 2019-06-25 National Technology & Engineering Solutions Of Sandia, Llc Information searching system

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0783149A1 (en) * 1995-10-14 1997-07-09 Rank Xerox Limited Clipboard for interactive desktop system
JP2005327122A (ja) * 2004-05-14 2005-11-24 Ns Solutions Corp 情報検索装置、情報検索方法及びプログラム
JP2007094544A (ja) * 2005-09-27 2007-04-12 Fuji Xerox Co Ltd 情報検索システム
JP2010267021A (ja) * 2009-05-13 2010-11-25 Canon Inc 情報処理装置及び情報処理方法
JP2012043400A (ja) * 2010-08-16 2012-03-01 Fuji Xerox Co Ltd 情報処理システム、情報処理方法、およびコンピュータプログラム
JP2013034168A (ja) * 2011-08-01 2013-02-14 Fuji Xerox Co Ltd 画像投影装置ならびに画像投影制御装置およびプログラム
JP2014219753A (ja) * 2013-05-02 2014-11-20 株式会社リコー 情報処理システム、情報処理装置及びプログラム
WO2015063873A1 (ja) * 2013-10-30 2015-05-07 株式会社日立製作所 情報検索システムおよび情報検索方法
JP2015114798A (ja) * 2013-12-11 2015-06-22 キヤノン株式会社 情報処理装置および情報処理方法、プログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0783149A1 (en) * 1995-10-14 1997-07-09 Rank Xerox Limited Clipboard for interactive desktop system
JP2005327122A (ja) * 2004-05-14 2005-11-24 Ns Solutions Corp 情報検索装置、情報検索方法及びプログラム
JP2007094544A (ja) * 2005-09-27 2007-04-12 Fuji Xerox Co Ltd 情報検索システム
JP2010267021A (ja) * 2009-05-13 2010-11-25 Canon Inc 情報処理装置及び情報処理方法
JP2012043400A (ja) * 2010-08-16 2012-03-01 Fuji Xerox Co Ltd 情報処理システム、情報処理方法、およびコンピュータプログラム
JP2013034168A (ja) * 2011-08-01 2013-02-14 Fuji Xerox Co Ltd 画像投影装置ならびに画像投影制御装置およびプログラム
JP2014219753A (ja) * 2013-05-02 2014-11-20 株式会社リコー 情報処理システム、情報処理装置及びプログラム
WO2015063873A1 (ja) * 2013-10-30 2015-05-07 株式会社日立製作所 情報検索システムおよび情報検索方法
JP2015114798A (ja) * 2013-12-11 2015-06-22 キヤノン株式会社 情報処理装置および情報処理方法、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KIM CHELHWON, ET AL.: "High-quality capture of documents on a cluttered tabletop with a 4K video camera", [ONLINE], JPN7020003168, 8 September 2015 (2015-09-08), CH, pages 219 - 222, ISSN: 0004362205 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019197534A (ja) * 2018-05-09 2019-11-14 富士ゼロックス株式会社 文書及びテーブルの周囲の人物の検出に基づく文書及び人物を検索するためのシステム、方法並びにプログラム
JP7293735B2 (ja) 2018-05-09 2023-06-20 富士フイルムビジネスイノベーション株式会社 文書及びテーブルの周囲の人物の検出に基づく文書及び人物を検索するためのシステム、方法並びにプログラム

Also Published As

Publication number Publication date
JP6828421B2 (ja) 2021-02-10
US20170308550A1 (en) 2017-10-26

Similar Documents

Publication Publication Date Title
US11113523B2 (en) Method for recognizing a specific object inside an image and electronic device thereof
Chang et al. Deep shot: a framework for migrating tasks across devices using mobile phone cameras
US20190333478A1 (en) Adaptive fiducials for image match recognition and tracking
EP2733629B1 (en) System for associating tag information with images supporting image feature search
US20140193038A1 (en) Image processing apparatus, image processing method, and program
JP2017187850A (ja) 画像処理システム、情報処理装置、プログラム
US20120133650A1 (en) Method and apparatus for providing dictionary function in portable terminal
JP6260241B2 (ja) ユーザの入力を受け付けるシステム、プログラムおよび方法
US20130283260A1 (en) Image guided method for installing application software
US9262689B1 (en) Optimizing pre-processing times for faster response
JP6828421B2 (ja) 卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化するための計算実行方法、プログラムおよび計算処理システム
KR102303206B1 (ko) 전자장치에서 이미지 내의 특정 객체를 인식하기 위한 방법 및 장치
US20150138077A1 (en) Display system and display controll device
US10915778B2 (en) User interface framework for multi-selection and operation of non-consecutive segmented information
US20220269396A1 (en) Dynamic targeting of preferred objects in video stream of smartphone camera
JP2014219822A (ja) コンテンツ表示装置、コンテンツ表示方法、プログラム、及び、コンテンツ表示システム
JP6408055B2 (ja) 情報処理装置、方法及びプログラム
EP2784736A1 (en) Method of and system for providing access to data
JP6115673B2 (ja) 装置、及びプログラム
JP5967036B2 (ja) 画像検索システム、情報処理装置及びプログラム
JP5941483B2 (ja) 共有ファイルを取得する方法、電子機器およびコンピュータ・プログラム
JP5920448B2 (ja) 撮像装置、プログラム
JP5655916B2 (ja) 画像検索システム
JP5532748B2 (ja) 撮像装置
Nguyen et al. Multi-user smartphone-based interaction with large high-resolution displays

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210104

R150 Certificate of patent or registration of utility model

Ref document number: 6828421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350