JP5895828B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP5895828B2
JP5895828B2 JP2012259006A JP2012259006A JP5895828B2 JP 5895828 B2 JP5895828 B2 JP 5895828B2 JP 2012259006 A JP2012259006 A JP 2012259006A JP 2012259006 A JP2012259006 A JP 2012259006A JP 5895828 B2 JP5895828 B2 JP 5895828B2
Authority
JP
Japan
Prior art keywords
information
component
relevance
processing apparatus
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012259006A
Other languages
English (en)
Other versions
JP2014106729A (ja
Inventor
大祐 辰巳
大祐 辰巳
大西 健司
健司 大西
左右田 宏之
宏之 左右田
栄作 林
栄作 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012259006A priority Critical patent/JP5895828B2/ja
Priority to PCT/JP2013/068195 priority patent/WO2014083878A1/ja
Publication of JP2014106729A publication Critical patent/JP2014106729A/ja
Priority to US14/716,943 priority patent/US9870632B2/en
Application granted granted Critical
Publication of JP5895828B2 publication Critical patent/JP5895828B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour

Description

本発明は、情報処理装置及びプログラムに関する。
電子文書に含まれる文書及び画像といった構成要素に、当該構成要素に関連する文書及びタイトルなど他の構成要素に関する関連構成要素情報を関連付け、この関連構成要素情報を用いて構成要素を検索する技術がある。
特開2008−134954号公報
本発明の目的の1つは、構成要素に関連する関連構成要素情報の当該構成要素との関連の強さを表示態様により識別できるようにすることにある。
請求項1に記載の発明は、情報処理装置であって、電子情報を構成する複数の構成要素のうち少なくとも一つを選択する選択手段と、前記選択手段により選択された構成要素に関連する他の構成要素と、当該選択された構成要素と、の関連の強さを示す関連度を算出する関連度算出手段と、前記選択された構成要素に関連する他の構成要素に関する関連構成要素情報を、前記関連度算出手段にて算出した関連度に基づいた態様で表示する表示手段と、を含むこととしたものである。
請求項2に記載の発明は、請求項1に記載の情報処理装置であって、前記関連度算出手段は、構成要素に含まれる同一文字列が多い構成要素間の関連度を高く算出する、こととしたものである。
請求項3に記載の発明は、請求項1に記載の情報処理装置であって、前記関連度算出手段は、構成要素間の関係性を示す文字列に応じて当該文字列の位置に応じて選択された構成要素間の関連度を算出する、こととしたものである。
請求項4に記載の発明は、請求項1〜3のいずれか1項に記載の情報処理装置であって、前記表示手段は、前記関連構成要素情報を、前記関連度に応じて定められる大きさの表示領域に表示する、こととしたものである。
請求項5に記載の発明は、請求項4に記載の情報処理装置であって、前記表示手段は、前記関連度に応じて前記関連構成要素情報の情報量を変化させることで、前記関連構成要素情報26を前記定められる大きさの表示領域に適合させて表示する、こととしたものである。
請求項6に記載の発明は、請求項5に記載の情報処理装置であって、前記関連構成要素情報は、前記選択された構成要素に関連する他の構成要素から一部を抽出した情報である、としたものである。
請求項7に記載の発明は、請求項5に記載の情報処理装置であって、前記関連構成要素情報は、前記選択された構成要素に関連する他の構成要素に関する要約文である、としたものである。
請求項8に記載の発明は、請求項5に記載の情報処理装置であって、前記関連構成要素情報は、前記選択された構成要素に関連する他の構成要素を縮小表示した情報である、としたものである。
請求項9に記載の発明は、請求項1〜3のいずれか1項に記載の情報処理装置であって、前記表示手段は、前記関連構成要素情報を、前記関連度に応じて定められる色を用いて表示する、こととしたものである。
請求項10に記載の発明は、請求項1〜9のいずれか1項に記載の情報処理装置であって、前記表示手段は、前記関連構成要素情報を、前記選択された構成要素の位置に基づいて定められる位置に表示する、こととしたものである。
請求項6に記載の発明は、プログラムであって、電子文書を構成する複数の構成要素のうち少なくとも一つを選択する選択手段、前記選択手段により選択された構成要素に関連する他の構成要素と、当該選択された構成要素と、の関連の強さを示す関連度を算出する関連度算出手段、前記選択された構成要素に関連する他の構成要素に関する関連構成要素情報を、前記関連度算出手段にて算出した関連度に基づいた態様で表示する表示手段、としてコンピュータを機能させることとしたものである。
請求項1及び6に記載の発明によれば、選択された構成要素に関連する関連構成要素情報の当該構成要素との関連の強さを、関連構成要素情報の表示態様により識別できることとなる。
請求項2に記載の発明によれば、構成要素間の類似度に応じて関連度を算出できることとなる。
請求項3に記載の発明によれば、構成要素間の関係性に応じて関連度を算出できることとなる。
請求項4に記載の発明によれば、選択された構成要素に関連する関連構成要素情報の当該構成要素との関連の強さを、関連構成要素情報の表示領域により識別できることとなる。
請求項5に記載の発明によれば、選択された構成要素に関連する関連構成要素情報の当該構成要素との関連の強さを、関連構成要素情報の情報量により識別できることとなる。
請求項6に記載の発明によれば、関連構成要素情報を、もとの構成要素の内容を示すとともに狭小な表示領域に表示できることとなる。
請求項7に記載の発明によれば、関連構成要素情報を、もとの構成要素の内容を示すとともに狭小な表示領域に表示できることとなる。
請求項8に記載の発明によれば、関連構成要素情報を、もとの構成要素の構成を維持するとともに狭小な表示領域に表示できることとなる。
請求項9に記載の発明によれば、選択された構成要素に関連する関連構成要素情報の当該構成要素との関連の強さを、関連構成要素情報の表示色により識別できることとなる。
請求項10に記載の発明によれば、選択された構成要素に関連する関連構成要素情報の閲覧性を向上できることとなる。
本発明の一実施形態における情報処理装置の構成の一例を示す図である。 電子情報の一例を示す図である。 電子情報の別の一例を示す図である。 本発明の一実施形態における情報処理装置により実現される機能の一例を示す機能ブロック図である。 本発明の一実施形態における情報処理装置により行われる処理の流れの一例を示す図である。 構成要素間の関連付けの一例を示す図である。 本発明の一実施形態における情報処理装置により行われる処理の流れの一例を示す図である。
以下、本発明の一実施形態について、図面に基づき詳細に説明する。
図1は、本実施形態に係る情報処理装置10のハードウェア構成の一例を示す図である。図1に例示するように、本実施形態における情報処理装置10は、例えば、制御部12、記憶部14、操作部16、表示部18、通信部20、を含んでいる。これらの要素は、バスなどを介して接続される。
制御部12は、例えば、CPU等のプログラム制御デバイスであり、記憶部14にインストールされるプログラムに従って動作する。
記憶部14は、例えば、ROMやRAM等の記憶素子やハードディスクなどを含んで構成される。記憶部14には、制御部12によって実行されるプログラムや各種のデータなどが記憶される。また、記憶部14は、制御部12のワークメモリとしても動作する。
操作部16は、キーボード、マウス、ボタン、タッチパネル等であり、利用者の指示操作を受け付けて、当該指示操作の内容を制御部12に対して出力する。表示部18は、ディスプレイなどであり、制御部12から入力される指示に従って情報を表示出力する。表示部18は、例えばディスプレイ装置等であり、制御部12からの指示に従って、情報の表示を行う。
通信部20は、例えば、LANカード等のネットワークインターフェースであり、LANや無線通信網などの通信手段を介して、各種情報の送受信を行う。
本実施形態では、情報処理装置10の記憶部14に、予め、文字列、図(図形、絵、写真等を含む)、表等の構成要素を含む電子情報21が記憶されていることとする(図2参照)。
ここで、電子情報21とは、文字列、図(図形、絵柄、写真等を含む)、表等の構成要素を1つまたは複数組み合わせて、1または複数の頁に配置した電子情報である。具体的には、例えば、紙文書をスキャンしたスキャン文書、ワードプロセッサー等により編集される文書、表計算ソフトにより編集される表計算シート、図面、ウェブページ等を含むものである。図2は、複数の構成要素が配置された電子情報21の一例を示す図である。図2に例示する電子情報21には、構成要素として絵柄等を示した絵柄領域22と、文書を段落毎に分割した文章領域24(24−a,24−b、及び24−c)と、が含まれている。なお、電子情報21において、各画素の値はRGB色空間で表現されているものとする。そして、電子情報21は、上述のようなPDF等の形式を指すだけではなく、たとえばスキャン画像やカメラ撮影画像等も含まれることとし、電子情報21は、画像のみ、図のみの電子情報であってもよい。また、電子情報21を、通信部20を介して他の装置から受信して取得してもよいし、図示しないスキャン装置のスキャン結果に基づいて取得してもよい。
本実施形態では、情報処理装置10の制御部12は、記憶部14に記憶されている電子情報21に含まれる構成要素間の関連付けを行うとともに、関連付ける構成要素間の関連の強さを示す関連度を算出する。そして、利用者が構成要素に対する選択操作(例えば、マウスを用いて構成要素に対してクリック操作する)を行うと、操作部16が当該選択操作を受け付けて、当該選択操作情報を制御部12に対して出力する。なお、選択操作は、指によるタップ操作、視線等の生体情報を用いた操作であってもよい。制御部12は、操作部16から取得した選択操作情報に基づいて、利用者が選択した構成要素に関連付けられる他の構成要素に関する情報(以下、関連構成要素情報26とする。)を、当該利用者が選択した構成要素の位置に基づいて定められる位置に表示するべき指示を表示部18に出力する。この時、表示部18が表示する関連構成要素情報26は、利用者が選択した構成要素に関連づけられる他の構成要素と、当該選択した構成要素と、の関連度に基づいた態様となる。図3は、利用者が絵柄領域22に対して選択操作を行った場合に、絵柄領域22に関連する他の構成要素に関する、関連構成要素情報26−a、及び関連構成要素情報26−bが表示される一例を示す図である。図3に例示する関連構成要素情報26−aは、関連度が高い関連構成要素情報であり、当該関連構成要素情報26−aの元となる構成要素がそのままポップアップ表示されたものである。そして、関連度が低い関連構成要素情報26−bは、当該関連構成要素情報26−bの元となる構成要素の一部を抽出した情報、または当該関連構成要素情報26−bの元となる構成要素から生成した情報が、関連構成要素情報26−aよりも小さい表示領域にポップアップ表示されたものである。なお、選択した構成要素に関連する他の構成要素は、同一の電子情報に含まれる構成要素に限定されず、他の電子情報に含まれる構成要素であってもよい。ここで、構成要素の一部を抽出する方法としては、例えば、構成要素内から当該構成要素の記載内容を示す特徴的な文字列を抜き出すことが挙げられる。そして、構成要素から情報を生成する方法としては、例えば、構成要素の記載内容の要約を作成することが挙げられる。また、構成要素が絵柄領域22である場合は、例えば、絵柄領域22に含まれる図、画像等をサムネイル表示することで関連構成要素情報26を小さい表示領域に表示する。そうすることで、関連度の高い関連構成要素情報26−aは、関連度の低い関連構成要素情報26−bより表示領域が大きくなり、利用者は、選択した構成要素に関連する他の構成要素に関する関連構成要素情報26を取得することができるとともに、当該関連構成要素情報26と選択した構成要素との関連度を容易に把握することが可能となる。
以下、本実施形態に係る情報処理装置10が実現する機能について、説明する。図4は情報処理装置10により実現される主な機能の一例を示す機能ブロック図である。図4に例示するように、本実施形態における情報処理装置10は、機能的には、例えば、電子文書取得部30、文字絵柄分離部32、絵柄領域文字列解析部34、文章解析部36、構成要素関連付け部38、関連度算出部40、構成要素選択部42、関連構成要素情報生成部46、表示位置決定部48を含んでいる。なお、本実施形態に係る情報処理装置10において、図4に示す機能以外の機能が実現されていてもよい。これらの機能は、コンピュータである情報処理装置10の記憶部14にインストールされた、これらの機能に対応する命令を含むプログラムを、情報処理装置10の制御部20で実行することにより実現されている。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ可読な情報記憶媒体を介して、あるいは、インターネットなどの通信手段を介して情報処理装置10に供給される。
本実施形態に係る情報処理装置10は、情報処理装置10の記憶部14に予め記憶されている電子情報21に基づいて、電子情報21に含まれる各構成要素間の関連付け処理と、関連付けられた構成要素間の関連の強さを示す関連度を算出する処理を行う。
ここで、本実施形態における情報処理装置10により行われる、電子情報21に含まれる構成要素間の関連付け処理と関連度算出処理の流れの一例を図5に例示するフロー図を参照しながら説明する。
電子文書取得部30は、情報処理装置10の記憶部14に記憶されている電子情報21を取得する(S101)。
文字絵柄分離部32は、電子文書取得部30が取得した電子情報21に対して文字絵柄分離処理を行う(S102)。
文字絵柄分離部32は、公知のレイアウト解析技術または文字絵柄分離技術を用いて、タイトル領域、本文領域、ヘッダ/フッタ領域、絵柄領域22等、複数の構成要素領域に分割する。具体的には、例えば、文字絵柄分離部32は、電子情報21の各画素の値をRGBからYCbCrに変換した画像データから文字絵柄分離処理を行う。まず、YCbCr色空間で表現された画像データの色情報を用いて、文字と絵柄とを分離する。具体的には、下地色判定後、下地色以外の画像データ(画像データの集合・オブジェクト)ごとに、特徴量を算出する。特徴量として、色数、色の分布、大きさ及び形状などを用いる。文字は色数が少ない、大きさが大きくないなどの特徴がある。さらに、YCbCr色空間で表現された画像データに二値化処理を行い、当該二値化処理後の画像データから黒画素が連結している領域を抽出する。そして、黒画素が連結している黒画素連結領域の大きさと黒画素の密度に基づいて絵柄領域と文章領域とに分離する。具体的には、例えば、一般的な電子文書で利用されるフォントサイズの最大値に相当する面積以上の大きさをもつ黒画素連結領域は絵柄領域と特定する。また、黒画素連結画素数(ランレングス)が大きい線分を罫線と判定し、縦方向および横方向の長ランレングスの配置や交点の数・分布等から表を分離する。さらに、文字判定された画像に対し、段落領域を判定する。具体的には、縦方向および横方向に黒画素のヒストグラムを取得し、ヒストグラムの谷(すなわち黒画素が少ない箇所を指す。たとえば、段落間や行間。)やヒストグラムの山(すなわち黒画素が連なっている箇所を指す。たとえば、領域の区切りを表すセパレータなど。)の位置で、文字領域を分割する。さらに分割された領域に対し、同様の処理を繰り返していき、段落単位・文字行単位などの領域に分割する。なお、他の方法を用いて絵柄領域と文章領域とを分離してもよい。また、本実施形態では、図、表、絵柄等に含まれる文字列は絵柄領域22の一部とする。そして、分離した絵柄領域毎及び文章領域毎に各領域を識別する識別番号を付与することとする(例えば、図表1、図表2、段落1、段落2、等とする)。
絵柄領域文字列解析部34は、文字絵柄分離部32が分離処理を行った電子情報21から図表等を含んだ絵柄領域22を取得し、当該絵柄領域22内に含まれる文字列をさらに分離して抽出する。そして、絵柄領域文字列解析部34が、公知の形態素解析または構文解析を用いて抽出した文字列を解析する(S103)。具体的には、例えば、絵柄領域文字列解析部34は、エッジ検出(急峻な境界を絵柄と絵柄中文字の境界として認識)による境界検出と、隣接境界がある条件を満たした時にその境界で囲まれる画素を文字と判別する判別回路と組み合せることで絵柄部から文字部を分離する。スキャン画像やカメラ画像のように、文字コードを含まない場合、これら絵柄領域中の文字列、および、文章領域中の文字列に対し、OCR(Optical-Character-Reader)により文字コードを取得する。すでに文字コードを含む文書の場合、該当する文章領域や絵柄領域に文字コードを紐付ける。そして、絵柄領域文字列解析部34は、分離した文字列に対して形態素解析を行い、文字列を形態素に分解するとともに、各形態素の品詞や活用法を特定する。また、絵柄領域文字列解析部34は、分離した文字列に対して構文解析を行い、文節間の係り受け等を特定する。
文章解析部36は、文字絵柄分離部32が分離処理を行った電子情報21から文章領域24を取得し、公知の形態素解析または構文解析を用いて、当該文章領域24内に含まれる文字列を解析する(S104)。ここで、本実施形態では、文章領域24を、絵柄領域22に含まれる文字列を含まない、タイトル領域、本文領域等の文字領域とする。なお、本実施形態では、文章領域24は、本文領域を段落毎に分割したものとする。具体的には、例えば、文章解析部36は、取得した文章領域24内の文字列に対して、公知の文字認識技術を用いて、各文字を認識する。そして、文章解析部36は、各文章領域24内の文字列に対して形態素解析を行い、文章領域24内の文字列を形態素に分解するとともに、各形態素の品詞や活用形を特定する。また、絵柄領域文字列解析部34は、分離した文章領域24内の文字列に対して構文解析を行い、文節間の係り受け等を特定する。
構成要素関連付け部38は、絵柄領域文字列解析部34及び文章解析部36が解析した結果に基づいて、構成要素間の関連付けを行う(S105)。構成要素関連付け部38は、構成要素間において、構成要素内の文字列を比較して同一の文字列が存在するか否かを判断し、存在すると判断した場合に、同一の文字列が含まれる構成要素間を関連付ける。その他、同一文字列の存在有無の他、出現頻度を算出し、構成要素間を関連付けることもできる。または、構成要素関連付け部38は、文章領域24内の文字列に構成要素間の並列関係、従属関係、因果関係等を示す記述がある場合に当該構成要素間を関連付ける。
ここで、構成要素間の関連付け手法の一例を説明する。まず、例えば、絵柄領域22が図表等である場合に、構成要素関連付け部38は、絵柄領域文字列解析部34が解析した図表内に記されている図表番号が、文章解析部36が解析した文章領域24内の文字列と一致するか否かを判断し、一致する場合に当該図表番号が文字列として含まれる文章領域24と、当該図表番号に対応する絵柄領域22と、を関連付ける。なお、図表番号の代わりとして、図表内のキャプションを用いてもよい。
また、構成要素関連付け部38は、絵柄領域文字列解析部34が解析した絵柄領域22内の文字列が、文章解析部36が解析した文章領域24内の文字列と一致するか否かを判断し、一致する場合に当該絵柄領域22内の文字列が、文字列として含まれる文章領域24と、当該絵柄領域22と、を関連付けてもよい。
また、構成要素関連付け部38は、文章領域24内の文字列の中に、絵柄領域間の並列関係、主従関係、因果関係等を示す記述(例えば、「図Aと図Bは〜」など)がある場合に、当該関係が記述された絵柄領域間を関連付けてもよい。また、構成要素関連付け部38は、文章領域間の並列関係、主従関係、因果関係等を示す記述(例えば、段落の文頭に「したがって」、「しかし」などの接続語が記載されている)がある場合に、当該関係が記述された文章領域間を関連付けてもよい。具体的には、例えば、文章領域24の文頭に位置する接続語を抽出し、当該接続語が従属関係、因果関係等を示す接続語である場合に、当該接続語を含む文章領域24とその直前の文章領域24とを関連付ける。
構成要素関連付け部38は、上述のいずれか一つの手法を用いて関連付けを行ってもよいし、複数の手法を組み合わせて用いることで関連付けを行うこととしてもよい。
関連度算出部40は、構成要素関連付け部38で関連付けた構成要素間の関連度を算出する(S106)。関連度とは、関連付けた構成要素間の関連の強さを表す指標値であり、例えば、関連度算出部40は、構成要素間において、同一の文字列が存在すると判断して当該構成要素間を関連づけている場合に、構成要素内における同一文字列の出現頻度に基づいて関連度を算出する。また、関連度算出部40は、各構成要素内の頻出単語及び頻出文字列を抽出し、当該頻出単語及び頻出文字列の組み合わせの相似度に基づいて関連度を算出することとしてもよい。さらに、関連度算出部40は、文章領域内に構成要素間の並列関係、主従関係、因果関係等の記載があるとして構成要素間を関連付けている場合に、いずれの接続関係を有しているかに基づいて関連度を算出することとしてもよい。
ここで、関連度算出方法の一例を説明する。関連度算出部40は、図表番号、キャプションの文字列または図表内の文字列が含まれるとして、絵柄領域22と文章領域24とを関連付けている場合に、図表番号等が記載されている位置に基づいて関連度を算出する。つまり、文章領域24内の文頭に近い位置に記載されている図表番号等に対応する絵柄領域22の関連度を高く算出する。または、文章領域24内に図表番号等が記載されている位置が当該図表番号等に対応する絵柄領域22が配置されている位置に近い場合は関連度を高く算出する。また、関連度算出部40は、図表番号、キャプションの文字列または図表内の文字列が含まれるとして絵柄領域22と文章領域24とを関連付けている場合に、文章領域24内に図表番号等が集中して記載されている場合は関連度を高く算出する。また、文章領域間の関連度算出方法も同様であり、比較する2つの文章領域Aと文章領域Bとにおいて、それぞれ、出現頻度の高い文字列、固有名詞及び絵柄領域内で使われている文字列などを取得し、これらの文字列が文章領域内全体の文字列に対して一致(あるいは類似)する割合に応じて、文章領域Aと文章領域Bとの関連度を算出する。
また、関連度を数値として定義することとしてもよい。例えば、絵柄領域22と文章領域24との関連度Rは、同一文字列出現頻度をa、文章領域24内における同一文字列位置をbとして、R=α・a+β・b(α、βは重み)と定義することとしてもよい。また、文章領域24間、絵柄領域22の関連度Rは頻出単語及び頻出文字列の組み合わせの相似度をc、接続関係(因果、主従、並列等)をdとして、R=γ・c+δ・d(γ、δは重み)と定義することとしてもよい。この場合は、関連度Rは0から1の間の数値と定義し、R=0の場合は関連づけされないことを示し、1に近いほど関連度が高いことを示している。
図6は構成要素間の関連付けの一例を模式的に示した図である。図6に例示するように、関連付けされる構成要素間を実線で結ぶこととする。そして、関連付けされる構成要素間の関連度Rをそれぞれ記している。
次に、電子文書内における構成要素の選択に応じた関連構成要素表示処理の流れの一例を図7に例示するフロー図を参照しながら説明する。
まず、電子文書取得部30が、利用者の電子文書取得指示に応じて情報処理装置10の記憶部14に記憶されている電子情報21を取得する(S201)。
そして、構成要素選択部42が、利用者の構成要素選択指示(例えば、マウスを用いて構成要素に対してクリック操作する)に応じて、取得した電子情報21内に複数配置されている構成要素のうちから当該利用者が指示した構成要素を選択する(S202)。
関連構成要素情報生成部46は、構成要素選択部42が選択した構成要素に関連付けられている他の構成要素から、関連度算出部40で算出した関連度に基づいた態様で、関連構成要素情報26を生成する(S203)。
具体的には、例えば、関連構成要素情報生成部46は、構成要素選択部42が選択した構成要素に関連付けられている他の構成要素と、当該構成要素と、の関連度Rに応じて関連構成要素情報26を表示する表示領域の大きさを設定し、当該表示領域に表示するべき関連構成要素情報26を生成する。
ここで、関連構成要素情報26の態様について一例を説明する。まず、関連構成要素情報生成部46は、関連度Rの高い順に、関連構成要素情報26を表示する表示領域の面積が大きくなるよう設定する。例えば、表示領域の面積S=h・R(hは任意の係数)という定義式から表示領域の面積を設定することとしてもよい。または、選択された構成要素に関連する他の構成要素の中で最も関連度の高い構成要素はそのまま表示する。そして、最も関連度の高い構成要素の表示領域を基準として、関連度が低下するに従い基準の表示領域を縮小して設定することとしてもよい。また、予め、異なる面積の表示領域を複数用意しておき、関連度の高い順に面積の大きい表示領域を選択して設定することとしてもよい。
そして、関連構成要素情報生成部46は、設定した表示領域内に適合して表示されるよう関連構成要素情報26を生成する。例えば、関連構成要素情報生成部46は、構成要素から一部を抽出したものを関連構成要素情報26として生成する。具体的には、例えば、関連構成要素生成部46は、構成要素から当該構成要素内の記載内容を示す特徴的な文字列を抜き出す。つまり、段落の記載内容をまとめた文である、「まとめると〜」または「要するに〜」等で始まる一文を抜き出す。または、構成要素内の記載内容の要約を作成することとしてもよいし、構成要素内の記載内容を示す題目を抜き出すこととしてもよい。また、関連構成要素情報生成部46は、構成要素が絵柄領域の場合には、当該絵柄領域に含まれる図、画像等のサムネイル画像を生成して関連構成要素情報26とする。そうすることで、狭小な表示領域にも構成要素の内容を把握できる情報を表示することが可能となる。
また、関連度Rと、関連構成要素情報26の態様と、の対応関係が予め定義されていてもよい。例えば、1>R>x1(例えば、x1=0.8)の場合は構成要素をそのまま関連構成要素情報26として生成する。そして、x1≧R>x2(例えば、x2=0.4)の場合は構成要素内から構成要素内の記載内容を示す特徴的な文字列を抜き出して関連構成要素情報26として生成、または構成要素内の記載内容の要約を関連構成要素情報26として生成する。そして、x2≧R>0の場合は、構成要素内の記載内容を示す題目を抜き出して関連構成要素情報26として生成する。
また、関連構成要素情報26の態様は上記の例に限定されるものではない。例えば、関連構成要素情報生成部46は、関連度Rに基づいて関連構成要素情報26の表示色または表示線の太さを変化させることとしてもよい。具体的には、関連度Rの高い構成要素から関連度Rの低い構成要素にかけて関連構成要素情報26の表示色の濃度を低下または上昇させる。または、関連度Rの高い構成要素から関連度Rの低い構成要素にかけて関連構成要素情報26の表示線の太さを細くまたは太くする。また、表示色、表示線を変化させる対象は、関連構成要素情報26を構成する文字列、図表の線であってもよいし、関連構成要素情報26の背景または枠線であってもよい。
そして、表示位置決定部48は、関連構成要素情報生成部46が生成した関連構成要素情報26を表示するべき位置を、選択した構成要素の位置に基づいて決定する(S204)。
表示位置決定部48は、構成要素選択部42が選択した構成要素の電子文書における位置、当該構成要素の大きさ、または関連構成要素情報生成部46が生成した関連構成要素情報26を表示する表示領域の大きさに基づいて当該関連構成要素情報26を表示する位置を決定する。例えば、関連構成要素情報26を、選択した構成要素と重なりが生じない、かつ出来るだけ構成要素の近くに位置するようにする。最も関連度の高い関連構成要素情報を、選択した構成要素の外周に沿うように動かし、当該関連構成要素情報が電子情報21の外枠と重なりが生じない位置を関連構成要素情報の表示位置とする。そして、次に関連度の高い関連構成要素情報を、最も関連度の高い関連構成要素情報の表示位置の外周に沿うように動かし、当該関連構成要素情報が電子情報21の外枠と重なりが生じない位置を関連構成要素情報の表示位置とする。さらに関連構成要素情報が存在する場合は上述の手法と同様にして関連度の順に関連構成要素情報の表示位置を決定する。
そして、関連構成要素情報生成部46が生成した関連構成要素情報26は、表示位置決定部48が決定した位置に表示される(S205)。図3は電子情報21に関連構成要素情報26が表示された一例を示す図である。なお、図3に示すように関連構成要素情報26の表示領域は矩形となっているが、このような形態に限定されるものではない。例えば、表示領域は円形、楕円形等であってもよい。
また、利用者が表示された関連構成要素情報26を選択指示(例えば、マウスを用いて関連構成要素情報26に対してクリック操作する)することで、当該関連構成要素情報26の元となる構成要素の全容を表示することとする。そして、関連構成要素情報26が表示されている状態で、利用者が選択した構成要素を再度選択指示等することで、関連構成要素情報26が表示されていない元の電子情報21が表示されることとする。あるいは、関連構成要素情報26を選択指示することで、関連度が次に高い関連構成要素情報を表示されるようにしてもよい。
なお、本発明は上述の実施形態に限定されるものではない。
例えば、文章領域24は、段落毎の領域ではなく隣接する複数の段落を連結したものであってもよい。また、文章領域24は、1つの段落を複数の文字列に分割したものであってもよい。また、絵柄領域22も、隣接する複数の絵柄領域22を連結したものであってもよい。
また、利用者は同時に2以上の構成要素に対して選択指示を行うこととしてもよい。その場合は、それぞれの構成要素に対する関連構成要素情報26が表示される。また、構成要素間の関連付け処理、関連度算出処理は、複数の電子情報間において行うこととしてもよい。
また、上述の実施形態では、電子情報21における構成要素間の関連付け処理、関連度算出処理は予め実行されることとしたが、この例には限定されない。例えば、利用者が構成要素選択指示(例えば、マウスを用いて構成要素に対してクリック操作する)を行った場合に、選択指示を行った構成要素に関連する他の構成要素を抽出し、当該構成要素間の関連度を算出することとしてもよい。
また、関連構成要素情報26の態様として、設定された表示領域に適合するよう構成要素を縮小したものを表示させてもよい。
また、上記の具体的な文字列や数値、並びに図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。
10 情報処理装置、12 制御部、14 記憶部、16 操作部、18 表示部、20 通信部、21 電子情報、22 絵柄領域、24,24−a,24−b,24−c 文章領域、26,26−a,26−b 関連構成要素情報、30 電子情報取得部、32 文字絵柄分離部、34 絵柄領域文字列解析部、36 文章解析部、38 構成要素関連付け部、40 関連度算出部、42 構成要素選択部、46 関連構成要素情報生成部、48 表示位置決定部。

Claims (11)

  1. 電子情報を構成する複数の構成要素のうち少なくとも一つを選択する選択手段と、
    前記選択手段により選択された構成要素に関連する他の構成要素と、当該選択された構成要素と、の関連の強さを示す関連度を算出する関連度算出手段と、
    前記選択された構成要素に関連する他の構成要素に関する関連構成要素情報を、前記関連度算出手段にて算出した関連度に基づいた態様で表示する表示手段と、
    を含み、
    前記他の構成要素は、前記電子情報を構成する複数の構成要素の一部であり、
    前記関連度算出手段は、前記電子情報における前記選択された構成要素の位置と、前記電子情報における複数の前記他の構成要素それぞれの位置との近さに応じて前記関連度を算出する、
    ことを特徴とする情報処理装置。
  2. 前記関連度算出手段は、構成要素に含まれる同一文字列が多い構成要素間の関連度を高く算出する、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記関連度算出手段は、構成要素間の関係性を示す文字列に応じて当該文字列の位置に応じて選択された構成要素間の関連度を算出する、
    ことを特徴とする請求項1に記載の情報処理装置。
  4. 前記表示手段は、前記関連構成要素情報を、前記関連度に応じて定められる大きさの表示領域に表示する、
    ことを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 前記表示手段は、前記関連度に応じて前記関連構成要素情報の情報量を変化させることで、前記関連構成要素情報を前記定められる大きさの表示領域に適合させて表示する、
    ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記関連構成要素情報は、前記選択された構成要素に関連する他の構成要素から一部を抽出した情報である、
    ことを特徴とする請求項5に記載の情報処理装置。
  7. 前記関連構成要素情報は、前記選択された構成要素に関連する他の構成要素に関する要約文である、
    ことを特徴とする請求項5に記載の情報処理装置。
  8. 前記関連構成要素情報は、前記選択された構成要素に関連する他の構成要素を縮小表示した情報である、
    ことを特徴とする請求項5に記載の情報処理装置。
  9. 前記表示手段は、前記関連構成要素情報を、前記関連度に応じて定められる色を用いて表示する、
    ことを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
  10. 前記表示手段は、前記関連構成要素情報を、前記選択された構成要素の位置に基づいて表示する、
    ことを特徴とする請求項1〜9のいずれか1項に記載の情報処理装置。
  11. 電子情報を構成する複数の構成要素のうち少なくとも一つを選択する選択手段、
    前記選択手段により選択された構成要素に関連する他の構成要素と、当該選択された構成要素と、の関連の強さを示す関連度を算出する関連度算出手段、
    前記選択された構成要素に関連する他の構成要素に関する関連構成要素情報を、前記関連度算出手段にて算出した関連度に基づいた態様で表示する表示手段、
    としてコンピュータを機能させるためのプログラムであって、
    前記他の構成要素は、前記電子情報を構成する複数の構成要素の一部であり、
    前記関連度算出手段は、前記電子情報における前記選択された構成要素の位置と、前記電子情報における複数の前記他の構成要素それぞれの位置との近さに応じて前記関連度を算出する、
    ことを特徴とするプログラム
JP2012259006A 2012-11-27 2012-11-27 情報処理装置及びプログラム Active JP5895828B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012259006A JP5895828B2 (ja) 2012-11-27 2012-11-27 情報処理装置及びプログラム
PCT/JP2013/068195 WO2014083878A1 (ja) 2012-11-27 2013-07-03 情報処理装置及びプログラム
US14/716,943 US9870632B2 (en) 2012-11-27 2015-05-20 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012259006A JP5895828B2 (ja) 2012-11-27 2012-11-27 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014106729A JP2014106729A (ja) 2014-06-09
JP5895828B2 true JP5895828B2 (ja) 2016-03-30

Family

ID=50827535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012259006A Active JP5895828B2 (ja) 2012-11-27 2012-11-27 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US9870632B2 (ja)
JP (1) JP5895828B2 (ja)
WO (1) WO2014083878A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017208367A1 (ja) * 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
JP7236286B2 (ja) * 2019-02-15 2023-03-09 シャープ株式会社 画像形成装置
JP7327370B2 (ja) 2020-12-07 2023-08-16 横河電機株式会社 装置、方法およびプログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3711636B2 (ja) * 1996-06-18 2005-11-02 富士ゼロックス株式会社 情報検索装置および方法
JP4418036B2 (ja) * 1997-04-24 2010-02-17 富士通株式会社 情報提供装置および情報提供方法
EP0965943A3 (en) * 1998-06-04 2001-11-28 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and their application
US6401105B1 (en) * 1999-07-08 2002-06-04 Telescan, Inc. Adaptive textual system for associating descriptive text with varying data
JP4108948B2 (ja) * 2000-09-25 2008-06-25 富士通株式会社 複数の文書を閲覧するための装置および方法
US7813915B2 (en) 2000-09-25 2010-10-12 Fujitsu Limited Apparatus for reading a plurality of documents and a method thereof
US7015910B2 (en) * 2000-12-21 2006-03-21 Xerox Corporation Methods, systems, and computer program products for the display and operation of virtual three-dimensional books
CA2340531C (en) * 2001-03-12 2006-10-10 Ibm Canada Limited-Ibm Canada Limitee Document retrieval system and search method using word set and character look-up tables
JP2004326565A (ja) * 2003-04-25 2004-11-18 Oki Electric Ind Co Ltd 電子文書検索装置
US8533270B2 (en) * 2003-06-23 2013-09-10 Microsoft Corporation Advanced spam detection techniques
US20080040315A1 (en) * 2004-03-31 2008-02-14 Auerbach David B Systems and methods for generating a user interface
US7446914B2 (en) 2005-03-16 2008-11-04 Kabushiki Kaisha Toshiba Image processing apparatus
JP2007310502A (ja) * 2006-05-16 2007-11-29 Canon Inc 情報処理装置、その制御方法、及びプログラム
JP2007310503A (ja) 2006-05-16 2007-11-29 Canon Inc 情報処理装置、その制御方法、及びプログラム
JP2008134954A (ja) 2006-11-29 2008-06-12 Canon Inc 情報処理装置、その制御方法、及びプログラム
JP2009048598A (ja) * 2007-08-20 2009-03-05 Daisuke Kamiyama 文書情報表示システム
JP5151368B2 (ja) * 2007-09-28 2013-02-27 富士ゼロックス株式会社 情報処理装置および情報処理プログラム
JP2011034504A (ja) 2009-08-05 2011-02-17 Canon Inc 文書処理装置、文書処理方法、プログラム及び記憶媒体
US20120272171A1 (en) * 2011-04-21 2012-10-25 Panasonic Corporation Apparatus, Method and Computer-Implemented Program for Editable Categorization
US20140114942A1 (en) * 2012-10-23 2014-04-24 International Business Machines Corporation Dynamic Pruning of a Search Index Based on Search Results

Also Published As

Publication number Publication date
US9870632B2 (en) 2018-01-16
US20150254884A1 (en) 2015-09-10
JP2014106729A (ja) 2014-06-09
WO2014083878A1 (ja) 2014-06-05

Similar Documents

Publication Publication Date Title
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
JP5274305B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP5733907B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4945813B2 (ja) 印刷構造化文書
US8396294B2 (en) Image processing device, image processing method, and program and recording medium thereof
JP2002063215A (ja) 文書表示方法及びシステム、コンピュータプログラム、記録媒体
US20110043869A1 (en) Information processing system, its method and program
JPH10162150A (ja) ページ解析システム
JP2004234656A (ja) 文書分析情報を使用して文書を再フォーマット化する方法及び製造物
WO2020125345A1 (zh) 电子书笔记处理方法、手写阅读设备和存储介质
US20130036113A1 (en) System and Method for Automatically Providing a Graphical Layout Based on an Example Graphic Layout
JP5895828B2 (ja) 情報処理装置及びプログラム
JP4983526B2 (ja) データ処理装置及びデータ処理プログラム
KR101598789B1 (ko) 화상 처리 장치, 비일시적인 컴퓨터 판독 가능한 매체, 및 화상 처리 방법
JP2013152564A (ja) 文書処理装置及び文書処理方法
JP2011141597A (ja) 画像処理装置、画像処理方法、プログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP7098897B2 (ja) 画像処理装置、プログラム及び画像データ
JP5721052B2 (ja) 画像処理装置およびプログラム
JP6593559B1 (ja) 画像処理装置、プログラム及びデータ構造
JP2007087197A (ja) 文書処理装置、文書処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5895828

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350