JP2019003237A - 提示方法、提示装置及び提示プログラム - Google Patents

提示方法、提示装置及び提示プログラム Download PDF

Info

Publication number
JP2019003237A
JP2019003237A JP2017114855A JP2017114855A JP2019003237A JP 2019003237 A JP2019003237 A JP 2019003237A JP 2017114855 A JP2017114855 A JP 2017114855A JP 2017114855 A JP2017114855 A JP 2017114855A JP 2019003237 A JP2019003237 A JP 2019003237A
Authority
JP
Japan
Prior art keywords
sentence
image
ranges
images
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017114855A
Other languages
English (en)
Inventor
充 織田
Mitsuru Oda
充 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017114855A priority Critical patent/JP2019003237A/ja
Publication of JP2019003237A publication Critical patent/JP2019003237A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】指定された範囲の文章内容に適した画像を提示する方法、装置およびプログラムを提供する。【解決手段】本提示方法は、1又は複数の画像を含む第1の文章のデータから、第1の文章の構造と1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、第2の文章のデータから、第2の文章の構造に基づき、複数の第2文章範囲を抽出し、複数の第1文章範囲の各々と、複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、1又は複数の画像のうち複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する処理を含む。【選択図】図14

Description

本発明は、文書作成の支援技術に関する。
文書に挿絵を挿入することにより、文書の作成者は文書の内容をよりわかりやすく或いは正確に読み手に対して伝えることができる。但し、文書の作成者が自ら挿絵を作成するには、技量が必要である上に手間がかかる。
文書に画像を挿入することに関して、或る文献は以下のような技術を開示する。具体的には、画像データを含む文書から、該画像データと、該画像データの近くに出現した語句、文、語句あるいは文の並びと、該語句、文、語句あるいは文の並びが存在する文書中における位置あるいは構成とが抽出される。そして、文書入力部から入力された文書の入力箇所あるいは構成と類似する構成あるいは箇所に存在する語句、文、語句あるいは文の並びの近くに出現する画像データが提示される。
但し、上記技術は、入力された文書の構成と、画像データを含む文書の構成とが類似していることを前提とした技術であり、両者が類似していない場合には適切な画像が提示されないことがある。
特開2003−308314号公報
本発明の目的は、1つの側面では、指定された範囲の文章内容に適した画像を提示するための技術を提供することである。
一態様に係る提示方法は、1又は複数の画像を含む第1の文章のデータから、第1の文章の構造と1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、第2の文章のデータから、第2の文章の構造に基づき、複数の第2文章範囲を抽出し、複数の第1文章範囲の各々と、複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、1又は複数の画像のうち複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する処理を含む。
1つの側面では、指定された範囲の文章内容に適した画像を提示できるようになる。
図1は、情報処理装置の機能ブロック図である。 図2は、文書の階層について説明するための図である。 図3は、文書の一例を示す図である。 図4は、文書のデータの一例を示す図である。 図5は、文書のデータの取得時に実行する処理の処理フローを示す図である。 図6は、文書構造の一例を示す図である。 図7Aは、第1階層データ格納部に格納されるデータの一例を示す図である。 図7Bは、第1階層データ格納部に格納されるデータの一例を示す図である。 図7Cは、第1階層データ格納部に格納されるデータの一例を示す図である。 図7Dは、第1階層データ格納部に格納されるデータの一例を示す図である。 図8は、説明文章範囲の一例を示す図である。 図9は、文書構造の一例を示す図である。 図10は、説明文章範囲の一例を示す図である。 図11は、文書構造の一例を示す図である。 図12は、説明文章範囲の一例を示す図である。 図13は、第1特徴データ格納部に格納されるデータの一例を示す図である。 図14は、文章範囲がユーザにより指定された場合に実行する処理の処理フローを示す図である。 図15は、対象文書の文書構造の一例を示す図である。 図16は、第2範囲データ格納部に格納されるデータの一例を示す図である。 図17は、第2特徴データ格納部に格納されるデータの一例を示す図である。 図18は、類似度格納部に格納されるデータの一例を示す図である。 図19は、本実施の形態の効果について説明するための図である。 図20は、本実施の形態の効果について説明するための図である。 図21は、コンピュータの機能ブロック図である。
[実施の形態1]
図1は、本実施の形態の情報処理装置1の機能ブロック図である。例えばパーソナルコンピュータ或いはサーバ等である情報処理装置1は、第1抽出部101と、第2抽出部102と、比較部103と、出力部104と、第1文書データ格納部111と、第1構造データ格納部112と、第1範囲データ格納部113と、第1特徴データ格納部114と、類似度格納部115と、第2文書データ格納部121と、第2構造データ格納部122と、第2範囲データ格納部123と、第2特徴データ格納部124と、提示データ格納部125とを有する。第1抽出部101、第2抽出部102、比較部103及び出力部104は、例えば、図21におけるメモリ2501にロードされたプログラムが図21におけるCPU(Central Processing Unit)2503により実行されることで実現される。第1文書データ格納部111、第1構造データ格納部112、第1範囲データ格納部113、第1特徴データ格納部114、類似度格納部115、第2文書データ格納部121、第2構造データ格納部122、第2範囲データ格納部123、第2特徴データ格納部124及び提示データ格納部125は、例えば、図21におけるメモリ2501又は図21におけるHDD2505により実現される。
第1抽出部101は、第1文書データ格納部111に格納されている文書(本実施の形態においては、画像を含む文書)のデータに基づき文書構造を特定する処理を実行し、処理結果を第1構造データ格納部112に格納する。また、第1抽出部101は、第1構造データ格納部112に格納されているデータに基づき説明文章範囲を抽出する処理を実行し、処理結果を第1範囲データ格納部113に格納する。また、第1抽出部101は、第1範囲データ格納部113に格納されているデータに基づき特徴情報を生成する処理を実行し、処理結果を第1特徴データ格納部114に格納する。
第2抽出部102は、第2文書データ格納部121に格納されている文書或いは文章(本実施の形態においては、ユーザにより指定された文書或いは文章)のデータに基づき文書構造を特定する処理を実行し、処理結果を第2構造データ格納部122に格納する。また、第2抽出部102は、第2構造データ格納部122に格納されているデータに基づき対象文章範囲を抽出する処理を実行し、処理結果を第2範囲データ格納部123に格納する。また、第2抽出部102は、第2範囲データ格納部123に格納されているデータに基づき特徴情報を生成する処理を実行し、処理結果を第2特徴データ格納部124に格納する。
比較部103は、第1特徴データ格納部114に格納されているデータ及び第2特徴データ格納部124に格納されているデータに基づき類似度を算出する処理を実行し、処理結果を類似度格納部115に格納する。
出力部104は、類似度格納部115に格納されているデータに基づき画像が挿入される対象範囲および挿入される画像を特定する処理を実行し、処理結果を提示データ格納部125に格納する。出力部104は、提示データ格納部125に格納されているデータに基づき生成した出力データを出力する処理(例えば表示装置に表示させる処理)を実行する。
一般的に文書は、図2に示すようないくつかの構造要素によって階層化される。図2に示した例においては、構造要素として文書、章、節および段落が示されている。段落は最下位の構造要素であり、節は段落より上位の構造要素であり、章は節より上位の構造要素であり、文書は最上位の構造要素である。本実施の形態においては、図2に示したような構造要素に従って文書構造が特定される。なお、本実施の形態では「文章」とはいくつかの文が連なったものであり文書の少なくとも一部に相当する部分のことを意味する。したがって「文章」が文書そのもののことを指す場合がある。
図3は、文書の一例を示す図である。図3に示した文書には、3つの章が含まれており、各章には1又は複数の段落が含まれる。段落3には画像Aが配置されている。
図3に示したような文書のデータは、例えばXHTML(Extensible HyperText Markup Language)のようなマークアップ言語で記述されたデータである。図4は、XTHMLで記述された文書のデータの一例を示す図である。タグ(例えばdivタグ、pタグ、h1乃至h6タグ、sectionタグ等)に注目することで、機械的に文書構造を特定することができる。
次に、図5乃至図13を用いて、文書のデータを取得した時に実行される処理について説明する。
まず、第1抽出部101は、インターネット上で公開されているウェブデータ等に含まれる文書のデータを取得(例えば、他のコンピュータ等から受信)し(図5:ステップS1)、取得した文書のデータを第1文書データ格納部111に格納する。
第1抽出部101は、ステップS1において第1文書データ格納部111に格納された文書のデータを読み出す。そして、第1抽出部101は、読み出された文書のデータを用いて文書構造と画像の出現位置とを特定し(ステップS3)、文書構造及び画像の出現位置を表すデータを第1構造データ格納部112に格納する。
図6は、文書構造の一例を示す図である。図6の例では、文書構造はツリー構造で表されており、文書に3つの章が含まれている。章1は段落1を含み、章2は段落2乃至4を含み、章3は段落5及び6を含む。また、画像Aは段落3内に配置されている。
図7A乃至7Dは、第1構造データ格納部112に格納されるデータの一例を示す図である。図7Aは、文書についての構造体の一例を示す図である。図7Bは、章についての構造体の一例を示す図である。図7Cは、段落についての構造体の一例を示す図である。図7Dは、画像についての構造体の一例を示す図である。このように、文書構造の各ノードに相当する構造体には、そのノード自体に関する情報および別のノードへのリンクの情報が含まれる。
第1抽出部101は、ステップS5において第1構造データ格納部112に格納されたデータに基づき、画像を説明する文章の範囲である説明文章範囲を抽出する(ステップS5)。第1抽出部101は、抽出した説明文章範囲を示すデータを第1範囲データ格納部113に格納する。
例えば図6に示したような文書構造及び画像の出現位置である場合には、まず画像Aが配置されている段落3が説明文章範囲として抽出される。また、段落3の直前の段落である段落2と段落3とを含む説明文章範囲も抽出される。同様に、段落3と段落3の直後の段落である段落4とを含む説明文章範囲も抽出される。このような考え方に基づいて徐々に範囲を拡大することで複数の説明文章範囲が抽出される。図8は、抽出される説明文章範囲の一例を示す図であり、図8の例では候補1乃至7として7つの説明文章範囲が示されている。
また、例えば図9に示すような文書構造及び画像の出現位置である場合には、まず画像Aが配置されている段落2と画像Bが配置されている段落4とが説明文章範囲として抽出される。段落3については、画像Aに対する説明文章範囲である可能性と画像Bに対する説明文章範囲である可能性との両方がある。段落4は画像Bの説明を含むと考えられるため、画像Aの説明文章範囲には含められない。同様に、段落2は画像Aの説明を含むと考えられるため、画像Bの説明文章範囲には含められない。結果として、図10に示すような説明文章範囲が抽出される。図10の例では、画像A及び画像Bのそれぞれについて、2つの候補が抽出されている。
また、例えば図11に示すような文書構造及び画像の出現位置である場合には、まず画像Aが配置されている段落2と画像Bが配置されている段落5とが説明文章範囲として抽出される。段落2の上位の構造要素は章2であり、段落5の上位の構造要素は章3であり、2つの章は異なる内容を有する可能性がある。従って、図12に示すような説明文章範囲が抽出される。図12の例では、画像Aに対する説明範囲候補として段落2、段落2及び3、段落2、段落3及び4(つまり章2)が抽出され、また画像Bに対する説明文章範囲として段落5、段落5及び6(つまり章3)が抽出されている。
第1抽出部101は、ステップS5において抽出された各説明文章範囲について特徴情報を生成する(ステップS7)。
本実施の形態における特徴情報とは特徴ベクトルであり、特徴ベクトルは、例えば、説明文章範囲に出現する単語名を属性とし、説明文章範囲内における単語の出現分布及び文書全体における単語の出現分布から算出される数値を成分値とするベクトルとして与えられる。
例えば単語の出現頻度を利用する場合、注目する説明文章範囲内での単語の出現頻度を正規化した値(すなわち、各出現頻度を総出現単語数で割った値)が成分値とされる。
また、単語のTF−IDF(Term Frequency-Inverse Document Frequency)値を利用する場合、全説明文章範囲でのTF−IDF値に基づき、注目する説明文章範囲における単語のTF−IDF値が計算され、成分値とされる。ここで、各説明文章範囲は文書として取り扱われる。
また、単語の分散表現を利用する場合、注目する説明文章範囲に対する分散表現が注目する説明文章範囲についての特徴ベクトルの成分値とされる。ここで、各説明文章範囲は、例えば、文章分析のニューラルネットワークであるdoc2vecでの文書として取り扱われる。
ここで、図3に示した文書の画像Aの説明文章範囲のうち段落2及び3から構成される説明文章範囲を例として、特徴ベクトルの生成について説明する。段落2は「当店では、オフィスで使用するパソコンから、ソフト開発に使えるサーバまで、様々な要望にお応えする計算機を販売しています。」という文章aを含み、段落3は「本日のおすすめは、F社製のサーバです。」という文章bを含むとする。
単語の出現頻度を利用する場合、図3に示した文書の全単語数が仮に1000個であるとすれば、特徴ベクトル<0.001/当店,0.001/オフィス,0.001/パソコン,0.001/ソフト開発,0.002/サーバ,0.001/要望,0.001/計算機,0.001/本日,0.001/おすすめ,0.001/F社製>が生成される。例えばこの特徴ベクトルにおいて3つめの成分である「0.001/パソコン」は、「パソコン」という単語が段落2及び3において出現する数を総出現単語数で割った値が0.001であることを表す。
第1抽出部101は、画像のデータに対応付けて、ステップS7において生成された特徴情報を第1特徴データ格納部114に格納する(ステップS9)。そして処理は終了する。
図13は、第1特徴データ格納部114に格納されるデータの一例を示す図である。図13の例では、画像Aの説明文章範囲の各候補について、説明文章範囲に含まれる文章を基にして生成された特徴ベクトルが格納されている。なお、図13の例では画像のデータが格納されるが、第1文書データ格納部111に格納されている文書のデータに含まれる画像へのポインタ等が格納されてもよい。
以上のような処理を実行すれば、説明文章範囲の各々について特徴ベクトルが生成され、後述する対象文章範囲について生成される特徴ベクトルとの比較に利用できるようになる。
次に、図14乃至図20を用いて、文章範囲がユーザにより指定された場合に実行する処理について説明する。ここでは、ユーザは該文章範囲の適切な位置に画像を挿入することを望んでおり、文章範囲として1つの文書が指定されたとする。指定された文書のことを、以下では対象文書と呼ぶ。
まず、第2抽出部102は、対象文書のデータの入力を受け付け(図14:ステップS11)、対象文書のデータを第2文書データ格納部121に格納する。
第2抽出部102は、ステップS11において第2文書データ格納部121に格納された対象文書のデータを読み出す。そして、第2抽出部102は、読み出された対象文書のデータを用いて文書構造を特定し(ステップS13)、文書構造を表すデータを第2構造データ格納部122に格納する。
図15は、対象文書の文書構造の一例を示す図である。図15の例では、対象文書に2つの章が含まれている。章1は段落1を含み、章2は段落2及び3を含む。文書構造を表すデータとして第2構造データ格納部122に格納されるデータの形式は、図7A乃至7Dに示した形式と同様である。
第2抽出部102は、ステップS13において第2構造データ格納部122に格納されたデータに基づき、1又は複数の段落をそれぞれ含む複数の対象文章範囲を抽出する(ステップS15)。第2抽出部102は、抽出した対象文章範囲を示すデータを第2範囲データ格納部123に格納する。対象文章範囲は、画像が挿入される文章の範囲である。
例えば図15に示した文書構造を有する対象文書に対してステップS15の処理が実行されると、図16に示すようなデータが第2範囲データ格納部123に格納される。図16の例では、段落1からなる対象文章範囲(すなわち章1)と、段落2及び3からなる対象文章範囲(すなわち章2)と、段落1及び2からなる対象文章範囲と、段落1、2及び3からなる対象文章範囲(すなわち対象文書)とが抽出される。
第2抽出部102は、ステップS15において抽出された各対象文章範囲について特徴情報を生成する(ステップS17)。そして、第2抽出部102は、画像のデータに対応付けて、ステップS17において生成された特徴情報を第2特徴データ格納部124に格納する。各特徴ベクトルは、上で説明したような方法によって生成される。
図17は、第2特徴データ格納部124に格納されるデータの一例を示す図である。図17の例では、対象文章範囲に含まれる文章を基にして生成された特徴ベクトルが格納されている。
そして、比較部103は、各説明文章範囲の特徴情報と各対象文章範囲の特徴情報との間の類似度(例えばコサイン類似度)を算出する(ステップS19)。比較部103は、算出した類似度を類似度格納部115に格納する。
図18は、類似度格納部115に格納されるデータの一例を示す図である。図18の例では、対象文章範囲の識別情報と、説明文章範囲の識別情報と、類似度とが格納される。
出力部104は、類似度格納部115に格納されている類似度が最大である説明文章範囲に対応付けられた画像を第1特徴データ格納部114から特定し、特定された画像のデータを提示データ格納部125に格納する。また、出力部104は、類似度格納部115に格納されている類似度が最大である対象文章範囲を特定し、特定された対象文章範囲を提示データ格納部125に格納する。そして、出力部104は、提示データ格納部125に格納した画像のデータと対象文章範囲とを出力する(ステップS21)。そして処理は終了する。出力とは、例えば、情報処理装置1の表示装置による表示である。
なお、ステップS21においては、類似度が所定値以上又は所定順位以上である画像のデータ及び対象文章範囲とを出力してもよい。
以上のような処理を実行すれば、ユーザは、対象文書のどの位置にどのような画像が挿入されるかを把握することができるようになる。
具体例を用いて、本実施の形態の効果について説明する。例えば図19に示すように、サーバに関する文章が記述された対象文書のデータの特定の位置に対して、既存の文書群に含まれる文書1及び文書2の画像のうち適切な画像を挿入することを考える。文書1にはウォーターサーバの画像Aが含まれており、文書2にはコンピュータであるサーバの画像Bが含まれている。単純に、特定の位置の近傍の範囲191を対象文章範囲とし且つ画像Aの近傍の範囲192及び画像Bの近傍の範囲193を説明文章範囲とした場合には、「オフィス」及び「サーバ」の両方を含む範囲192が範囲191との類似度が高いと判定される可能性がある。その場合、対象文書には適さない画像Aが挿入されてしまうことになる。
一方、本実施の形態においては、図20に示すように、対象文書については複数の対象文章範囲が生成され、既存の文書についても複数の説明文章範囲が生成され、全組み合わせについて類似度が計算される。すなわち、対象文章範囲としては範囲201が抽出され、説明文章範囲として範囲202及び203が抽出されるようになる。これにより、最も高い類似度であると推定される範囲201と範囲203との間の類似度が算出されるようになり、この場合、コンピュータであるサーバの画像Bが対象文書に挿入されるようになる。
このように、本実施の形態においては、対象文章範囲および説明文章範囲が画像近傍の範囲に制限されるわけではない。文書がもともと有する章、節或いは段落といった構造要素は内容毎に区切られるため、単に文書全体をテキスト検索する画像検索技術に比べ、画像の説明となる文章範囲を適切に設定できるので、効率的に画像を推薦することができる。ユーザにとっては、文書構造や画像の内容を表す文章範囲を気にすることなく画像の推薦を受けられるようになる。また、ユーザは、推薦された画像がどの範囲に挿入されるべきかを知ることができるようになる。
また、文書構造を特定することで、文章範囲を段落等の構造要素で扱うことが可能になり、単語や文といった単位の範囲で類似性を評価する処理に比べると計算量を少なくすることができるようになる。
[実施の形態2]
第1の実施の形態においては、文書の構造に基づき文書から複数の説明文章範囲を抽出するが、文書を複数の文章に区分けし、区分けにより得られた複数の文章を、文書に含まれる画像の位置に基づいて組み合わせることで複数の説明文章範囲を生成してもよい。また、対象文書を複数の文章に区分けし、区分けにより得られた複数の文章を組み合わせることで複数の対象文章範囲を生成してもよい。
このような処理を実行すれば、文書の構造を利用せずとも画像を提示することができるようになる。
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明した情報処理装置1の機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
また、上で説明した各テーブルの構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
また、上に示した例では第1文書データ格納部111に格納されている文書の数が1であるが、文書の数が2以上であっても同様の処理を実行することができる。
また、上に示した例では段落の上位の構造要素が章であるが、段落の上位の構造要素が節であるような文書のデータに対しても適用可能である。
また、本実施の形態の方法の適用は画像に限られるわけではなく、文書に挿入されている音声やリンクといったオブジェクトの推薦にも適用することができる。
なお、上で述べた情報処理装置1は、コンピュータ装置であって、図21に示すように、メモリ2501とCPU2503とHDD2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
以上述べた本発明の実施の形態をまとめると、以下のようになる。
本実施の形態の第1の態様に係る提示方法は、(A)1又は複数の画像を含む第1の文章のデータから、第1の文章の構造と1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、(B)第2の文章のデータから、第2の文章の構造に基づき、複数の第2文章範囲を抽出し、(C)複数の第1文章範囲の各々と、複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、1又は複数の画像のうち複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する処理を含む。
指定された範囲に含まれる文章の内容に適した画像と画像が挿入される文章範囲とを提示できるようになる。
また、本提示方法は、(D)複数の第2文章範囲のうち第1の画像が関連付けられる第2文章範囲を提示する処理をさらに含んでもよい。
提示された第1の画像がどの文章範囲に適しているかをユーザが把握できるようになる。
また、複数の第1文章範囲の各々は、1又は複数の画像のうちいずれかの画像が配置された構造要素、又は、当該構造要素を含み且つ連続する複数の構造要素を含んでもよい。
画像が配置された構造要素(例えば段落)は画像の説明を含むため、上記のようにすれば画像との関係が深い第1文章範囲を抽出できるようになる。
また、第1の文章のデータに含まれる画像の数が複数である場合、複数の画像のうち或る画像について抽出される第1文章範囲に含まれる構造要素と、或る画像以外の画像について抽出される第1文章範囲に含まれる構造要素とが異なってもよい。
画像が配置された構造要素はその画像についての説明を主に含み、その他の画像についての説明を含むことは一般的ではないので、上記のようにすれば適切に第1文章範囲を抽出できるようになる。
また、第1の文章のデータに含まれる画像の数が複数であり、且つ、複数の画像のうち第2の画像が配置された構造要素の上位の構造要素と複数の画像のうち第3の画像が配置された構造要素の上位の構造要素とが異なる場合、第2の画像については第2の画像が配置された構造要素の上位の構造から第1文章範囲が抽出され、第3の画像については第3の画像が属する構造要素の上位の構造要素から第1文章範囲が抽出されてもよい。
上位の構造要素それぞれに画像が存在する場合、上位の構造要素をまたいで単一の画像の説明が行われることは一般的ではないので、上記のようにすれば適切に第1文章範囲を抽出できるようになる。なお、上位の構造要素とは、例えば章または節である。
また、複数の第2文章範囲の各々は、1つの構造要素又は連続する複数の構造要素を含んでもよい。
適切な第2文章範囲を抽出できるようになる。
また、第1の画像と第1の画像が挿入される第2文章範囲とを特定する処理において、算出された類似度が最大である第2文章範囲を特定してもよい。
また、類似度を算出する処理において、(c1)複数の第1文章範囲の各々および複数の第2文章範囲の各々について特徴情報を生成し、複数の第1文章範囲の各々の特徴情報と複数の第2文章範囲の各々の特徴情報とに基づき類似度を算出してもよい。
本実施の形態の第2の態様に係る提示装置は、(E)1又は複数の画像を含む第1の文章のデータから、第1の文章の構造と1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出する第1抽出部(実施の形態における第1抽出部101は上記第1抽出部の一例である)と、(F)第2の文章のデータから、第2の文章の構造に基づき、複数の第2文章範囲を抽出する第2抽出部(実施の形態における第2抽出部102は上記第2抽出部の一例である)と、(G)複数の第1文章範囲の各々と、複数の第2文章範囲の各々との類似度を算出する算出部(実施の形態における比較部103は上記算出部の一例である)と、(H)算出された当該類似度に基づき、1又は複数の画像のうち複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する提示部(実施の形態における出力部104は上記提示部の一例である)とを有する。
本実施の形態の第3の態様に係る提示方法は、(I)第2の文章のデータから、第2の文章の構造に基づき、複数の第2文章範囲を抽出し、(J)複数の第2文章範囲の各々の第2特徴量を算出し、(K)1又は複数の画像を含む第1の文章のデータから抽出される第1の文章の構造と1又は複数の画像の位置とに基づいた、画像毎に対応付けられる複数の第1文章範囲の各々の第1特徴量が格納される記憶部を参照し、(L)第1特徴量と第2特徴量との比較に基づき、1又は複数の画像のうち複数の第2の文章範囲のいずれかに関連付けられる画像を提示する処理を含む。
本実施の形態の第4の態様に係る提示方法は、(M)第2の文章のデータから、第2の文章を複数に区分けし、区分けされた文章が組み合わされた複数の第2文章範囲を抽出し、(N)複数の第2文章範囲の各々の第2特徴量を算出し、(O)1又は複数の画像を含む第1の文章のデータから抽出される第1の文章が複数に区分けされ、区分けにより得られた複数の文章が、1又は複数の画像の位置に基づいて組み合わされた複数の第1文章範囲の各々の第1特徴量が格納される記憶部を参照し、(P)第1特徴量と第2特徴量との比較に基づき、1又は複数の画像のうち複数の第2の文章範囲のいずれかに関連付けられる画像を提示する処理を含む。
なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
コンピュータに、
1又は複数の画像を含む第1の文章のデータから、前記第1の文章の構造と前記1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、
第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出し、
前記複数の第1文章範囲の各々と、前記複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、前記1又は複数の画像のうち前記複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する、
処理を実行させる提示プログラム。
(付記2)
前記コンピュータに、
前記複数の第2文章範囲のうち前記第1の画像が関連付けられる第2文章範囲を提示する、
処理をさらに実行させる付記1記載の提示プログラム。
(付記3)
前記複数の第1文章範囲の各々は、前記1又は複数の画像のうちいずれかの画像が配置された構造要素、又は、当該構造要素を含み且つ連続する複数の構造要素を含む、
付記1又は2記載の提示プログラム。
(付記4)
前記第1の文章のデータに含まれる画像の数が複数である場合、複数の画像のうち或る画像について抽出される前記第1文章範囲に含まれる構造要素と、前記或る画像以外の画像について抽出される前記第1文章範囲に含まれる構造要素とが異なる、
付記1又は2記載の提示プログラム。
(付記5)
前記第1の文章のデータに含まれる画像の数が複数であり、且つ、複数の画像のうち第2の画像が配置された構造要素の上位の構造要素と前記複数の画像のうち第3の画像が配置された構造要素の上位の構造要素とが異なる場合、前記第2の画像については前記第2の画像が配置された構造要素の上位の構造から前記第1文章範囲が抽出され、前記第3の画像については前記第3の画像が属する構造要素の上位の構造要素から前記第1文章範囲が抽出される、
付記1又は2記載の提示プログラム。
(付記6)
前記複数の第2文章範囲の各々は、1つの構造要素又は連続する複数の構造要素を含む、(図16)
付記1乃至5のいずれか1つ記載の提示プログラム。
(付記7)
前記第1の画像と前記第1の画像が挿入される第2文章範囲とを特定する処理において、
算出された前記類似度が最大である第2文章範囲を特定する、
付記1乃至6のいずれか1つ記載の提示プログラム。
(付記8)
前記類似度を算出する処理において、
前記複数の第1文章範囲の各々および前記複数の第2文章範囲の各々について特徴情報を生成し、前記複数の第1文章範囲の各々の特徴情報と前記複数の第2文章範囲の各々の特徴情報とに基づき類似度を算出する、
付記1乃至7のいずれか1つ記載の提示プログラム。
(付記9)
コンピュータが、
1又は複数の画像を含む第1の文章のデータから、前記第1の文章の構造と前記1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、
第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出し、
前記複数の第1文章範囲の各々と、前記複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、前記1又は複数の画像のうち前記複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する、
処理を実行する提示方法。
(付記10)
1又は複数の画像を含む第1の文章のデータから、前記第1の文章の構造と前記1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出する第1抽出部と、
第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出する第2抽出部と、
前記複数の第1文章範囲の各々と、前記複数の第2文章範囲の各々との類似度を算出する算出部と、
算出された当該類似度に基づき、前記1又は複数の画像のうち前記複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する提示部と、
を有する提示装置。
(付記11)
コンピュータに、
第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出し、
前記複数の第2文章範囲の各々の第2特徴量を算出し、
1又は複数の画像を含む第1の文章のデータから抽出される前記第1の文章の構造と前記1又は複数の画像の位置とに基づいた、画像毎に対応付けられる複数の第1文章範囲の各々の第1特徴量が格納される記憶部を参照し、
前記第1特徴量と前記第2特徴量との比較に基づき、前記1又は複数の画像のうち前記複数の第2の文章範囲のいずれかに関連付けられる画像を提示する、
処理を実行させる提示プログラム。
(付記12)
コンピュータに、
第2の文章のデータから、前記第2の文章を複数に区分けし、区分けにより得られた複数の文章が組み合わされた複数の第2文章範囲を抽出し、
前記複数の第2文章範囲の各々の第2特徴量を算出し、
1又は複数の画像を含む第1の文章のデータから抽出される前記第1の文章が複数に区分けされ、区分けにより得られた複数の文章が、前記1又は複数の画像の位置に基づいて組み合わされた複数の第1文章範囲の各々の第1特徴量が格納される記憶部を参照し、
前記第1特徴量と前記第2特徴量との比較に基づき、前記1又は複数の画像のうち前記複数の第2の文章範囲のいずれかに関連付けられる画像を提示する、
処理を実行させる提示プログラム。
1 情報処理装置 101 第1抽出部
102 第2抽出部 103 比較部
104 出力部 111 第1文書データ格納部
112 第1構造データ格納部 113 第1範囲データ格納部
114 第1特徴データ格納部 115 類似度格納部
121 第2文書データ格納部 122 第2構造データ格納部
123 第2範囲データ格納部 124 第2特徴データ格納部
125 提示データ格納部

Claims (10)

  1. コンピュータに、
    1又は複数の画像を含む第1の文章のデータから、前記第1の文章の構造と前記1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、
    第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出し、
    前記複数の第1文章範囲の各々と、前記複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、前記1又は複数の画像のうち前記複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する、
    処理を実行させる提示プログラム。
  2. 前記コンピュータに、
    前記複数の第2文章範囲のうち前記第1の画像が関連付けられる第2文章範囲を提示する、
    処理をさらに実行させる請求項1記載の提示プログラム。
  3. 前記複数の第1文章範囲の各々は、前記1又は複数の画像のうちいずれかの画像が配置された構造要素、又は、当該構造要素を含み且つ連続する複数の構造要素を含む、
    請求項1又は2記載の提示プログラム。
  4. 前記第1の文章のデータに含まれる画像の数が複数である場合、複数の画像のうち或る画像について抽出される前記第1文章範囲に含まれる構造要素と、前記或る画像以外の画像について抽出される前記第1文章範囲に含まれる構造要素とが異なる、
    請求項1又は2記載の提示プログラム。
  5. 前記第1の文章のデータに含まれる画像の数が複数であり、且つ、複数の画像のうち第2の画像が配置された構造要素の上位の構造要素と前記複数の画像のうち第3の画像が配置された構造要素の上位の構造要素とが異なる場合、前記第2の画像については前記第2の画像が配置された構造要素の上位の構造から前記第1文章範囲が抽出され、前記第3の画像については前記第3の画像が属する構造要素の上位の構造要素から前記第1文章範囲が抽出される、
    請求項1又は2記載の提示プログラム。
  6. 前記複数の第2文章範囲の各々は、1つの構造要素又は連続する複数の構造要素を含む、
    請求項1乃至5のいずれか1つ記載の提示プログラム。
  7. コンピュータが、
    1又は複数の画像を含む第1の文章のデータから、前記第1の文章の構造と前記1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出し、
    第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出し、
    前記複数の第1文章範囲の各々と、前記複数の第2文章範囲の各々との類似度を算出し、算出された当該類似度に基づき、前記1又は複数の画像のうち前記複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する、
    処理を実行する提示方法。
  8. 1又は複数の画像を含む第1の文章のデータから、前記第1の文章の構造と前記1又は複数の画像の位置とに基づき、画像毎に対応付けられる複数の第1文章範囲を抽出する第1抽出部と、
    第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出する第2抽出部と、
    前記複数の第1文章範囲の各々と、前記複数の第2文章範囲の各々との類似度を算出する算出部と、
    算出された当該類似度に基づき、前記1又は複数の画像のうち前記複数の第2文章範囲のいずれかに関連付けられる第1の画像を提示する提示部と、
    を有する提示装置。
  9. コンピュータに、
    第2の文章のデータから、前記第2の文章の構造に基づき、複数の第2文章範囲を抽出し、
    前記複数の第2文章範囲の各々の第2特徴量を算出し、
    1又は複数の画像を含む第1の文章のデータから抽出される前記第1の文章の構造と前記1又は複数の画像の位置とに基づいた、画像毎に対応付けられる複数の第1文章範囲の各々の第1特徴量が格納される記憶部を参照し、
    前記第1特徴量と前記第2特徴量との比較に基づき、前記1又は複数の画像のうち前記複数の第2の文章範囲のいずれかに関連付けられる画像を提示する、
    処理を実行させる提示プログラム。
  10. コンピュータに、
    第2の文章のデータから、前記第2の文章を複数に区分けし、区分けにより得られた複数の文章が組み合わされた複数の第2文章範囲を抽出し、
    前記複数の第2文章範囲の各々の第2特徴量を算出し、
    1又は複数の画像を含む第1の文章のデータから抽出される前記第1の文章が複数に区分けされ、区分けにより得られた複数の文章が、前記1又は複数の画像の位置に基づいて組み合わされた複数の第1文章範囲の各々の第1特徴量が格納される記憶部を参照し、
    前記第1特徴量と前記第2特徴量との比較に基づき、前記1又は複数の画像のうち前記複数の第2の文章範囲のいずれかに関連付けられる画像を提示する、
    処理を実行させる提示プログラム。
JP2017114855A 2017-06-12 2017-06-12 提示方法、提示装置及び提示プログラム Pending JP2019003237A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017114855A JP2019003237A (ja) 2017-06-12 2017-06-12 提示方法、提示装置及び提示プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017114855A JP2019003237A (ja) 2017-06-12 2017-06-12 提示方法、提示装置及び提示プログラム

Publications (1)

Publication Number Publication Date
JP2019003237A true JP2019003237A (ja) 2019-01-10

Family

ID=65006154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017114855A Pending JP2019003237A (ja) 2017-06-12 2017-06-12 提示方法、提示装置及び提示プログラム

Country Status (1)

Country Link
JP (1) JP2019003237A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021009886A1 (ja) * 2019-07-17 2021-01-21 日本電信電話株式会社 支援装置、支援方法および支援プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021009886A1 (ja) * 2019-07-17 2021-01-21 日本電信電話株式会社 支援装置、支援方法および支援プログラム
JPWO2021009886A1 (ja) * 2019-07-17 2021-01-21

Similar Documents

Publication Publication Date Title
US11244203B2 (en) Automated generation of structured training data from unstructured documents
US20210192126A1 (en) Generating structured text summaries of digital documents using interactive collaboration
US11210328B2 (en) Apparatus and method for learning narrative of document, and apparatus and method for generating narrative of document
US9904936B2 (en) Method and apparatus for identifying elements of a webpage in different viewports of sizes
US10936806B2 (en) Document processing apparatus, method, and program
US9588941B2 (en) Context-based visualization generation
KR102059743B1 (ko) 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템
US10606922B2 (en) Analyzing document content and generating an appendix
EP4285270A1 (en) Auditing citations in a textual document
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
JP7388256B2 (ja) 情報処理装置及び情報処理方法
JP2024091709A (ja) 文作成装置、文作成方法および文作成プログラム
WO2016191912A1 (en) Comment-centered news reader
US20170351755A1 (en) Dita relationship table based on contextual taxonomy density
JP2019003237A (ja) 提示方法、提示装置及び提示プログラム
JP2013222418A (ja) パッセージ分割方法、装置、及びプログラム
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP5533272B2 (ja) データ出力装置、データ出力方法およびデータ出力プログラム
JP2007220144A (ja) 特許検索装置、特許検索装置の制御方法および制御プログラム
US20220050837A1 (en) Selectively targeting content section for cognitive analytics and search
Adamu et al. A framework for enhancing the retrieval of UML diagrams
WO2014188555A1 (ja) テキスト処理装置、及び、テキスト処理方法
Kohan et al. Automated dataset construction from web resources with tool Kayur
US11100099B2 (en) Data acquisition device, data acquisition method, and recording medium
US20240015117A1 (en) Method and system for providing chatbot service