JP2015084183A - 新聞記事アーカイブシステム - Google Patents

新聞記事アーカイブシステム Download PDF

Info

Publication number
JP2015084183A
JP2015084183A JP2013222654A JP2013222654A JP2015084183A JP 2015084183 A JP2015084183 A JP 2015084183A JP 2013222654 A JP2013222654 A JP 2013222654A JP 2013222654 A JP2013222654 A JP 2013222654A JP 2015084183 A JP2015084183 A JP 2015084183A
Authority
JP
Japan
Prior art keywords
newspaper
image
tag
newspaper page
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013222654A
Other languages
English (en)
Other versions
JP6187972B2 (ja
Inventor
中島 誠
Makoto Nakajima
誠 中島
重喜 松原
Shigeki Matsubara
重喜 松原
祐耶 ▲高▼木
祐耶 ▲高▼木
Yuya Takagi
幹登 後藤
Mikito Goto
幹登 後藤
裕基 中上
Hiroki Nakagami
裕基 中上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oita University
Original Assignee
Oita University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oita University filed Critical Oita University
Priority to JP2013222654A priority Critical patent/JP6187972B2/ja
Publication of JP2015084183A publication Critical patent/JP2015084183A/ja
Application granted granted Critical
Publication of JP6187972B2 publication Critical patent/JP6187972B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】新聞記事をブラウジングする際に処理の負荷が増大することなく読みたい新聞記事を効率よく探すことができる新聞記事アーカイブシステムを提供する。【解決手段】新聞紙面画像表示制御部14は、選択部13が選択した一つの新聞紙面画像をディスプレイ2に表示するように制御する。タグ判定部15は、操作部10が入力したタグ候補文字列が、表示された新聞紙面画像上に存在するか否かに基づいて入力されたタグ候補文字列が適正であるか否かを判定し、適正であると判定されたタグ候補をタグ情報としてタグデータベース4に記憶させる。タグ表示制御部16は、新聞紙面画像をディスプレイ2に表示する際に、新聞紙面画像に対応して設定された複数の矩形領域をディスプレイ2に表示させると共に、適正であると判定したタグ候補文字列が存在する新聞紙面画像上の位置に対応した矩形領域にタグ情報を表示させる。【選択図】図1

Description

本発明は、ディスプレイに表示された新聞紙面画像に含まれる新聞記事をブラウジング可能な新聞記事アーカイブシステムに関する。
従来、新聞記事をユーザにブラウジング(閲覧)させるために新聞紙面画像をディスプレイに表示させるシステムが提案されている(例えば、特許文献1,2)。このようなシステムにおいて、ユーザは、ディスプレイに表示された新聞紙面画像から読みたい新聞記事を探し出すことができる。
特開2003−141105号公報 特開2010−257333号公報
従来のシステムでは、読みたい新聞記事を探し出すための手がかりが示されないので、ディスプレイに表示された新聞紙面画像から読みたい新聞記事を効率よく探し出すのが容易でなく、ブラウジング対象となる新聞紙面画像の枚数が増大するに従って、読みたい新聞記事を探し出すのが困難になる。一方、読みたい新聞記事を効率よく探し出すために、キーワード等の質問用語を用いた検索を行うことによって読みたい新聞記事を探し出すことも考えられる。しかしながら、検索を行う場合、新聞紙面画像を光学文字認識可能な画像(例えば、JPEG画像)によって形成し、検索を行うために必要な索引を、光学式文字読取装置(OCR)を用いた画像の光学文字認識により事前に作成しておく必要がある上に、光学文字認識の結果の正誤判定を人手にて行う必要があるので、光学文字認識に伴う処理の負荷が増大するという不都合がある。
本発明の目的は、新聞記事をブラウジングする際に処理の負荷が増大することなく読みたい新聞記事を効率よく探すことができる新聞記事アーカイブシステムを提供することである。
本発明による新聞記事アーカイブシステムは、ディスプレイに表示された新聞紙面画像に含まれる新聞記事をブラウジング可能な新聞記事アーカイブシステムであって、データベースに格納された複数の新聞紙面画像から一つの新聞紙面画像を選択する選択部と、選択部により選択された新聞紙面画像をディスプレイに表示するように制御する新聞紙面画像表示制御部と、表示された新聞紙面画像に対応したタグ候補文字列を入力するための入力部と、光学文字認識により、入力部が入力したタグ候補文字列が、表示された新聞紙面画像上に存在するか否かに基づいて入力されたタグ候補文字列が適正であるか否かを判定し、適正であると判定されたタグ候補文字列をタグ情報としてデータベースに記憶させるタグ判定部と、新聞紙面画像表示制御部が選択された新聞紙面画像をディスプレイに表示する際に、表示された新聞紙面画像に対応して設定された複数の紙面区域をディスプレイに表示させると共に、タグ判定部が適正であると判定したタグ候補文字列が存在する表示された新聞紙面画像上の位置に対応した紙面区域にタグ情報を表示させるタグ表示制御部と、を有することを特徴とする。
好適には、本発明による新聞記事アーカイブシステムは、発刊日に基づいて整列された1か月間に発刊されている互いに異なる発刊日の複数の新聞紙面画像を含む複数の新聞紙面整列画像を、ディスプレイの画面上で複数列に亘って配置するために、複数の新聞紙面整列画像に含まれる全ての新聞紙面画像を新聞紙面画像データベースから取得し、取得した全ての新聞紙面画像に基づいて複数の新聞紙面整列画像を生成し、複数の新聞紙面整列画像をそれぞれ配置する複数の画像配置領域を年月に基づいて決定する新聞紙面整列画像配置領域決定部と、画像配置領域に配置された新聞紙面整列画像をディスプレイに表示するように制御する新聞紙面整列画像表示制御部と、を更に有し、選択部は、ブラウジングする対象を絞り込むための情報に基づいて、拡大表示する新聞紙面整列画像及び縮小表示する新聞紙面整列画像を選択し、選択した新聞紙面整列画像を新聞紙面整列画像表示制御部によって拡大表示及び縮小表示させる。
好適には、ブラウジングする対象を絞り込むための情報は、新聞の発刊年月日、新聞社名及びタグを検索するための文字列のうちの少なくとも一つを含む。
好適には、選択部は、ディスプレイに拡大表示された新聞紙面整列画像に含まれる複数の新聞紙面画像のうちの一つを、新聞紙面画像表示制御部によってディスプレイに表示される一つの新聞紙面画像として選択し、選択した一つの新聞紙面画像をデータベースから取得する。
好適には、タグ判定部は、タグ候補文字列が適正であるか否かを、タグ候補文字列の意味が対応する表示された新聞紙面画像上に存在する文字列の意味と一致又は類似するか否か又はタグ候補文字列が表示された新聞紙面画像上に存在する表象を表すか否かに基づいて判定する。
好適には、タグ表示制御部は、矩形領域に表示されたタグを指定し、新聞紙面画像表示制御部は、指定したタグに対応する表示された新聞紙面画像上に存在する文字列をハイライト表示する。
本発明によれば、新聞記事をブラウジングする際に処理の負荷が増大することなく読みたい新聞記事を効率よく探すことができる。
本発明の一実施の形態による新聞記事アーカイブシステムを含む配置のブロック図である。 複数の画像配置領域にそれぞれ配置される複数の新聞紙面整列画像を含む画像を示す図である。 拡大表示された新聞紙面整列画像及び縮小表示された新聞紙面整列画像を含む画像の一例を示す図である。 拡大表示された新聞紙面整列画像及び縮小表示された新聞紙面整列画像を含む画像の他の例を示す図である。 拡大表示された新聞紙面整列画像及び縮小表示された新聞紙面整列画像を含む画像の他の例を示す図である。 拡大表示された新聞紙面整列画像の選択を説明するための図である。 一つの新聞紙面画像及び複数の矩形領域を含む画像を示す図である。 拡大した新聞紙面画像及び対応するタグ領域を含む画像を示す図である。
本発明による新聞記事アーカイブシステムの実施の形態を、図面を参照しながら詳細に説明する。
図1は、本発明の一実施の形態による新聞記事アーカイブシステムを含む配置のブロック図である。図1に示す配置は、新聞記事アーカイブシステム1と、ディスプレイ2と、データベースとしての新聞紙面画像データベース3と、データベースとしてのタグデータベース4と、類義語辞書データベース5と、を備える。
新聞記事アーカイブシステム1は、ディスプレイ2、新聞紙面画像データベース3、タグデータベース4及び類義語辞書データベース5に接続される。ディスプレイ2は、各種画像を表示し、例えば、液晶ディスプレイ(LCD)によって構成される。
新聞紙面画像データベース3は、新聞のマイクロフィルムをスキャニングすることによって得られた光学文字認識可能な(例えば、JPEG画像によって構成される)複数の新聞紙面画像を格納し、例えば、EEPROMによって構成される。例えば、新聞紙面画像の各々は、新聞社ごとに年及び月ごとのフォルダに、日と発刊区分(朝刊、夕刊、号外、付録)及びページ番号からなるファイル名で新聞紙面画像データベース3に格納される。本実施の形態では、新聞紙面画像データベース3は、1876年から1961年までに大分県内及びその周辺地域で発刊された地方新聞の新聞紙面画像を格納している。
タグデータベース4は、後に説明するようにして新聞紙面に付されたタグを格納し、例えば、EEPROMによって構成される。類義語辞書データベース5は、後に詳細に説明する類義語辞書を格納し、例えば、EEPROMによって構成される。
本実施の形態では、新聞記事アーカイブシステム1は、ディスプレイ2に表示された新聞紙面画像に含まれる新聞記事をブラウジング可能であり、ディスプレイ2に表示された新聞紙面画像をその配置に従って閲覧しながら新聞記事を探すために用いられる。このために、新聞記事アーカイブシステム1は、入力部としての操作部10と、新聞紙面整列画像配置領域決定部11と、新聞紙面整列画像表示制御部12と、選択部13と、新聞紙面画像表示制御部14と、タグ判定部15と、タグ表示制御部16と、を備える。
操作部10は、表示された新聞紙面画像に対応したタグ候補文字列、ブラウジングする対象を絞り込むための情報、新聞記事アーカイブシステム1を操作するための各種指令等を入力するために用いられ、例えば、マウス及びキーボードによって構成される。
本実施の形態では、新聞紙面整列画像配置領域決定部11、新聞紙面整列画像表示制御部12、選択部13、新聞紙面画像表示制御部14、タグ判定部15及びタグ表示制御部16は、例えば、パーソナルコンピュータ(PC)によって構成され、(例えば、EEPROMによって構成された)図示しないプログラムデータベースに格納された処理プログラムに基づいて各種処理を実行する。
新聞紙面整列画像配置領域決定部11は、操作部10からの指令に応じて、発刊日に基づいて整列された1か月間に発刊されている互いに異なる発刊日の複数の新聞紙面画像を含む複数の新聞紙面整列画像を、ディスプレイ2の画面(2次元空間)上で複数列に亘って配置する。このために、新聞紙面整列画像配置領域決定部11は、複数の新聞紙面整列画像に含まれる全ての新聞紙面画像を新聞紙面画像データベース3から取得し、取得した全ての新聞紙面画像に基づいて複数の新聞紙面整列画像を生成する。そして、新聞紙面整列画像配置領域決定部11は、複数の新聞紙面整列画像をそれぞれ配置する複数の画像配置領域を年月に基づいて決定する。
新聞紙面整列画像表示制御部12は、新聞紙面整列画像配置領域決定部11による画像配置領域の決定に応じて、画像配置領域に配置された新聞紙面整列画像をディスプレイ2に表示するように制御する。図2は、複数の画像配置領域にそれぞれ配置される複数の新聞紙面整列画像を含む画像を示す図である。図2に示す画像は、新聞記事アーカイブシステム1が起動されたときに新聞紙面整列画像配置領域決定部11によってディスプレイ2の画面上に形成され、新聞紙面整列画像配置領域表示画像21及び年代表示画像22を含む。新聞紙面整列画像配置領域表示画像21は、新聞紙面整列画像配置領域に対して、対応する新聞紙面整列画像が新聞紙面整列画像配置領域決定部11によってそれぞれ配置される。
新聞紙面整列画像配置領域表示画像21には、新聞紙面整列画像を年月が古い順に複数列に亘って配置する新聞紙面整列画像配置領域が配置される。すなわち、年月が最も古い明治9年(1876年)1月の新聞紙面整列画像21aが1列目の右端の新聞紙面整列画像配置領域に配置され、年月が最も新しい昭和36年(1961年)12月の新聞紙面整列画像21bが最終列の左端に配置される。また、新聞紙面整列画像配置領域表示画像21には、時間の流れを明確にするために1月から12月に向けて白から黒に明度を月ごとに段階的に下げたラベルを上部に付している。ラベルは、各月の区切りとなり、1月と12月の明度の差が年の区切りとなる。さらに、元号ごとに新聞紙面整列画像配置領域の背景色を変えることによって時代をわかりやすくしている。年代表示画像22は、新聞紙面整列画像配置領域に配置される新聞紙面整列画像の各列の年代を表す。
選択部13は、操作部10からの指令に応じて、新聞紙面画像データベース3に格納された光学文字認識可能な複数の新聞紙面画像から一つの新聞紙面画像を選択する。そして、選択部13は、選択した一つの新聞紙面画像を新聞紙面画像データベース3から取得する。本実施の形態では、選択部13は、ブラウジングする対象を絞り込むための情報が操作部10から入力され、当該情報に基づいて、拡大表示する新聞紙面整列画像及び縮小表示する新聞紙面整列画像を選択し、選択した新聞紙面整列画像を新聞紙面整列画像表示制御部12によって拡大表示及び縮小表示させる。このために、新聞紙面整列画像表示制御部12は、拡大表示した新聞紙面整列画像及び縮小表示した新聞紙面整列画像を、ディスプレイ2の画面上の対応する新聞紙面整列画像配置領域にそれぞれ表示させる。
図3は、拡大表示された新聞紙面整列画像及び縮小表示された新聞紙面整列画像を含む画像の一例を示す図である。図3に示す画像は、新聞紙面整列画像配置領域表示画像21及び年代表示画像22の他に選択画面表示画像23を含む。
選択画面表示画像23は、(新聞の発刊年月日、新聞社名及びタグを検索するための文字列のうちの少なくとも一つを含む)ブラウジングする対象を絞り込むための情報を操作部10によって選択部13に入力するために、新聞社名(この場合、○×合同新聞、○×新聞、△△新聞、その他)、発刊期間、発刊区分(朝刊、夕刊、号外、付録)、キーワード入力スペース、検索条件表示スペース及びリストアップ新聞紙面表示スペースを示す。新聞社名、発刊期間、発刊区分及び文字列のうちの少なくとも一つを操作部10によって新聞紙面整列画像配置領域決定部11に入力することによって、探し出したい記事がある新聞の発行日を含む新聞紙面整列画像を選択することができる。
図3に示す画像は、ブラウジングする対象を絞り込むための情報として大正15年(1926年)1月1日から昭和6年(1931年)12月31日までの発刊期間が操作部10によって選択部13に入力された場合に形成される。この場合、当該発刊期間に対応する新聞紙面整列画像のそれぞれの幅をa倍(aは1以上かつ所定の数値(例えば、3)以下の数値)に拡大してハイライト表示し、それ以外の新聞紙面整列画像のそれぞれの幅をb倍(bは0より大きくかつ1未満の数値)に縮小して表示する。図3において、拡大してハイライト表示した新聞紙面整列画像群に符号21cを付す。
図4は、拡大表示された新聞紙面整列画像及び縮小表示された新聞紙面整列画像を含む画像の他の例を示す図である。図4に示す画像は、図3に示す画像がディスプレイ2に表示された後にブラウジングする対象を絞り込むための情報として文字列「飛行機」が操作部10によって選択部13に入力された場合に形成される。この場合、拡大表示する新聞紙面画像が更に絞り込まれ、文字列「飛行機」が検索条件として検索条件表示スペースに表示され、条件に該当する全ての新聞紙面の新聞名、発刊日、発刊区分、頁及び当該新聞紙面に付された全てのタグがリストアップ新聞紙面表示スペース内にリストアップされる。図4に示す画像では、新聞紙面に付された全てのタグを表示するに際し、入力された文字列に一致するタグ「飛行機」に括弧が付される。図4において、拡大してハイライト表示した新聞紙面整列画像群に符号21dを付す。
図5は、拡大表示された新聞紙面整列画像及び縮小表示された新聞紙面整列画像を含む画像の他の例を示す図である。図5に示す画像は、図4に示す画像がディスプレイ2に表示された後にブラウジングする対象を絞り込むための情報として文字列「大分」が操作部10によって選択部13に更に入力された場合に形成される。この場合、拡大表示する新聞紙面画像が一層絞り込まれ、文字列「大分」及び「飛行機」が検索条件として検索条件表示スペースに表示され、リストアップ新聞紙面表示スペースにリストアップされる条件に該当する全ての新聞紙面の新聞名、発刊日、発刊区分、頁及び当該新聞紙面に付された全てのタグが更に絞り込まれる。図5に示す画像では、新聞紙面に付された全てのタグを表示するに際し、入力された文字列に一致するタグ「大分」及び「飛行機」に括弧が付される。図5において、拡大してハイライト表示した新聞紙面整列画像群に符号21eを付す。
上述したように拡大表示した新聞紙面整列画像及び縮小表示した新聞紙面整列画像を形成することによって、時間の流れに沿った新聞紙面整列画像の並びが維持されるので、ブラウジングの際の新聞紙面画像の位置を容易に把握することができる。
さらに、選択部13は、操作部10による操作(例えば、マウスによるクリック)に応じて、ディスプレイ2に拡大表示された新聞紙面整列画像に含まれる複数の新聞紙面画像のうちの一つを、新聞紙面画像表示制御部14によってディスプレイ2に表示される一つの新聞紙面画像として選択する。そして、選択部13は、選択した一つの新聞紙面画像を新聞紙面画像データベース3から取得する。
このために、選択部13は、操作部10による操作(例えば、マウスによるクリック)に応じて新聞紙面整列画像を選択すると、図6に示すように、更に拡大した新聞紙面整列画像31を、新聞紙面整列画像表示制御部12によって新聞紙面整列画像配置領域表示画像21に重畳して表示させる。
図6において、新聞紙面整列画像31は、1929年6月の新聞紙面整列画像であり、1929年6月1日から6月30日までの○×合同新聞の朝刊の1頁の新聞紙面画像がカレンダー形式で配置される。休刊日のように○×合同新聞が発行されていない日がある場合、例えば、他の新聞(例えば、○×新聞)の朝刊の1頁の新聞紙面画像を代わりに配置する。いずれの新聞も発行されていない日がある場合、ブランク領域にする。その後、選択部13は、操作部10による操作(例えば、マウスによるクリック)に応じて、更に拡大した新聞紙面整列画像31に含まれる一つの新聞紙面画像を選択する。
そして、選択部13は、後に説明する画像の切り替えを行うことによって、新聞紙面画像表示制御部14によってディスプレイ2に表示される一つの新聞紙面画像を選択し、選択した一つの新聞紙面画像を新聞紙面画像データベース3から取得する。その後、選択部13は、取得した一つの新聞紙面画像を、新聞紙面画像表示制御部14に供給する。
新聞紙面画像表示制御部14は、選択部13が選択した新聞紙面画像をディスプレイ2に表示するように制御する。タグ判定部15は、操作部10からタグ候補文字列が入力される。タグ判定部15は、光学文字認識により、操作部10が入力したタグ候補文字列が、ディスプレイ2に表示された新聞紙面画像上に存在するか否かに基づいて、入力されたタグ候補文字列が適正であるか否かを判定する。そして、タグ判定部15は、適正であると判定されたタグ候補文字列を、タグ情報としてタグデータベース4に記憶させる。この場合、タグ候補文字は、タグ候補文字が存在する(後に説明する)紙面領域及び当該紙面領域に対応する(後の説明する)矩形領域とともにタグデータベース4に記憶される。タグ候補文字が存在する紙面領域が二つ以上存在する場合、タグ候補情報は、タグ候補文字が存在する二つ以上の紙面領域及びこれらの紙面領域にそれぞれ対応する二つ以上の矩形領域とともにタグデータベース4に記憶される。
本実施の形態では、タグ判定部15は、タグ候補文字列が適正であるか否かを、タグ候補文字列が表示された新聞紙面画像上に存在するか否かに基づいて判定するだけでなく、タグ候補文字列の意味が対応する表示された新聞紙面画像上に存在する文字列の意味と一致又は類似するか否か又はタグ候補文字列が表示された新聞紙面画像上に存在する表象を表すか否かにも基づいて判定する。このために、タグ判定部15は、入力された文字列が紙面区域に存在するか否かを判断するために光学文字認識を行うためのOCRソフトを用いる(OCR技術による文字認識)とともに、類義語辞書データベース5に格納された類義語辞書を用いる。類義語辞書には、所定の文字列の類似語に対応する文字列、新字体の文字列に対応する旧字体、文字列を意味する表象等が登録される。
このような類義語データを用いることによって、例えば、表示された新聞紙面画像上に所定の文字列が含まれ、当該文字列の類似語に対応するタグ候補文字列が操作部10によってタグ判定部15に入力されたとしても、タグ判定部15は、タグ候補文字列が適正であると判定することができる。
また、表示された新聞紙面画像上に旧字体の文字列が含まれ、当該旧字体の文字列に対応する新字体のタグ候補文字列が操作部10によってタグ判定部15に入力されたとしても、タグ判定部15は、タグ候補文字列が適正であると判定することができる。このように旧字体の文字列と新字体の文字列の対応付けを行うことによって、1961年より古い発行年月日の新聞紙面に対しても適切なタグ付を行うことができる。
さらに、表示された新聞紙面画像上に文字列を意味する表象(例えば、つぶれ文字を含む文字列のような光学文字認識により判別困難な印刷された文字列)が含まれ、当該表象に対応するタグ候補文字列が操作部10によってタグ判定部15に入力されたとしても、タグ判定部15は、タグ候補文字列が適正であると判定することができる。このように表象と文字列との対応付けを行うことによって、文字列に対応する表象を含む表示された新聞紙面画像上に対して適切なタグ付を行うことができる。
タグ表示制御部16は、新聞紙面画像表示制御部14が選択された新聞紙面画像をディスプレイ2に表示する際に、表示された新聞紙面画像(さらに詳しくは、新聞紙面画像の段組みの構成)に対応して設定された複数の紙面区域をディスプレイ2に表示させる。さらに、タグ表示制御部16は、タグ判定部15が適正であると判定したタグ候補文字列が存在する表示された新聞紙面画像上の位置に対応した紙面区域にタグ情報としてのタグを表示させる。このために、タグ表示制御部16は、紙面区域ごとに付されたタグをタグデータベース4から読み出す。タグ表示制御部16が紙面区域に表示するタグの順序は、タグを付した時間が早い順となる。
図7は、一つの新聞紙面画像及び複数の矩形領域を含む画像を示す図である。図7に示す画像は、例えば、新聞紙面画像表示制御部14によって、図6に示す更に拡大した新聞紙面整列画像31に重畳して表示される。図7に示す画像は、新聞紙面画像41と、2行3列に配置された六つの矩形領域42−1,42−2,42−3,42−4,42−5,42−6と、画像切替部43,44と、を有する。
新聞紙面画像41は、1957年1月3日に発刊された○×合同新聞の朝刊の3頁の新聞紙面画像であり、縦3段組みの構成を有する。本実施の形態では、新聞紙面画像表示制御部14は、段組み(この場合、縦3段組み)の構成に基づいて、破線で示す六つの紙面区域41−1,41−2,41−3,41−4,41−5,41−6を新聞紙面画像41に設定する。
矩形領域42−1,42−2,42−3,42−4,42−5,42−6は、紙面区域41−1,41−2,41−3,41−4,41−5,41−6に付されたタグを表示するために、新聞紙面画像表示制御部14によって紙面区域41−1,41−2,41−3,41−4,41−5,41−6にそれぞれ対応して設定される。
図7に示す画像では、紙面区域41−1内の「飛行機」、「大分」、「空港」、「安部」、「勝平」、「歴史」及び「市」の文字列に対応するタグが矩形領域42−1に表示される。また、紙面区域41−2内の「清末清文」、「ダンス熱」及び「清中国」の文字列に対応するタグが矩形領域42−2に表示され、紙面区域41−3内の「清末清文」、「ダンス熱」及び「清中国」の文字列に対応するタグが矩形領域42−3に表示される。例えば、一つの新聞記事が二つの紙面区域に亘って記載されている場合、一方の紙面区域に付される全てのタグを他方の紙面区域に付される全てのタグに完全に一致させてもよい。さらに、矩形領域42−4,42−5,42−6はブランクである。例えば、新聞記事の代わりに広告が紙面区域に記載されている場合、当該紙面区域に対応する新聞紙面画像の個所を読み飛ばすことができるようにするために矩形領域をブランクにすることができる。
画像切替部43,44は、新聞紙面画像表示制御部14によってディスプレイ2に表示する新聞紙面画像を切り替える、すなわち、いわゆるページ切替を行うために用いられる。画像切替部43が操作部10によって指定された(例えば、マウスによってクリックされた)場合、新聞紙面画像表示制御部14は、ディスプレイ2に表示された新聞紙面画像の前の頁の新聞紙面画像を表示する。一方、画像切替部44が操作部10によって指定された場合、新聞紙面画像表示制御部14は、ディスプレイ2に表示された新聞紙面画像の後の頁の新聞紙面画像を表示する。
本実施の形態では、タグ表示制御部16は、操作部10の操作に応じて、矩形領域に表示されたタグを指定する。この場合、新聞紙面画像表示制御部14は、指定したタグに対応する紙面区域内の文字列をハイライト表示する。例えば、矩形領域42−1に含まれるタグ「飛行機」が操作部10によって指定された(例えば、マウスによってクリックされた)場合、新聞紙面画像表示制御部14は、紙面区域41−1内の文字列「飛行機」をハイライト表示する。
操作部10によって紙面区域を指定する(例えば、マウスによってクリックする)ことによって指定した紙面区域を拡大し、指定した拡大領域に対応する矩形領域以外の矩形領域のタグの表示を消去することもできる。例えば、図8に示すように、紙面区域41−1を指定した場合、矩形領域42−2,42−3にそれぞれ表示されたタグの表示(すなわち、「清末清文」、「ダンス熱」及び「清中国」)を消去することができる。
本実施の形態では、新聞記事アーカイブシステム1にユーザ投票機能を持たせ、投票数が所定の数を超えたタグを示す符号(図8の「いいね」)を矩形領域に付すこともできる。
紙面区域41−1,41−2,41−3,41−4,41−5,41−6の設定は、新聞紙面画像の選択前又は新聞紙面画像の選択時に操作部10の操作に応じて新聞紙面画像表示制御部14によって行われる。紙面区域41−1,41−2,41−3,41−4,41−5,41−6の設定は、新聞紙面画像の選択前又は新聞紙面画像の選択時に操作部10の操作に応じてタグ表示制御部16によって行われる。このように紙面区域及び矩形領域を設定することによって、新聞記事が段組みに沿って不規則に配置されていても、紙面区域に目を通しながら段組みに沿った新聞記事のブラウジングができるようになる。
本実施の形態によれば、新聞紙面の段組みに基づいて設定される新聞紙面画像の複数の紙面区域ごとにタグを配置することにより、紙面区域に配置されたタグと、段組みに基づいて配置される新聞記事の領域との対応付けを容易に行うことができるので、新聞記事を探し出すための手がかりを適切に示すことができる。また、タグ付の際にOCRを用いて画像の光学文字認識を行うことによって紙面区域内のタグに対応する文字列の位置を特定すれば、その文字列をハイライト表示することで、読みたい新聞記事を効率よく探すことができる。
また、本実施の形態によれば、複数列に亘って線形的に配置された新聞紙面整列画像及び紙面区域を用いているので、新聞の発行年月日を表す年、月及び日の時間単位及び新聞紙面の段組みの構成の空間単位(紙面区域)に基づく時空間知識を用いて新聞記事のブラウジングを行うことができる。さらに、検索を行うための索引を事前に作成する必要がないため、OCRを用いて画像の光学文字認識を行ってその結果を人手で正誤判定する必要がなくなり、光学文字認識に伴う処理の負荷が増大することなく読みたい新聞記事を効率よく探すことができる新聞記事アーカイブシステムを提供できる。
本発明は、上記実施の形態に限定されるものではなく、幾多の変更及び変形が可能である。例えば、選択部13は、新聞紙面画像表示制御部14によってディスプレイ2に表示させる一つの新聞紙面画像を、操作部10を用いて新聞名、発刊日、発刊区分及び頁を指定することによって選択することができる。また、光学文字認識可能でない複数の新聞紙面画像を新聞紙面画像データベース3に格納し、これらの新聞紙面画像のうちの一つの新聞紙面画像を選択部13によって選択することもできる。
上記実施の形態において、新聞紙面画像データベース3及びタグデータベース4を別個のデータベースで実現する場合について説明したが、新聞紙面画像データベース3及びタグデータベース4を同一のデータベースで実現する場合にも本発明を適用することができる。
上記実施の形態において、新聞紙面が縦3段組みの構成を有する場合について説明したが、新聞紙面が他の段組み(例えば、横3段組み)の構成を有する場合にも本発明を適用することができる。
上記実施の形態において、2行3列に配置された六つの紙面区域41−1,41−2,41−3,41−4,41−5,41−6及びそれに対応する矩形領域42−1,42−2,42−3,42−4,42−5,42−6を設定する場合について説明したが、m行n列(mとnのうちのいずれか一方が2以上の整数であり、他方が1以上の整数)に配置されたm×n個の紙面区域及びそれに対応する矩形領域を設定してもよい。
上記実施の形態において、入力された文字列がタグとして適正であるか否かを判定するために、新字体の文字列に対応する旧字体を登録した類義語辞書を用いる場合について説明したが、当該類義語辞書を用いる代わりに新・旧字体変換ソフトウェアを用いることもできる。
上記実施の形態において、矩形領域に表示するタグの順序がタグを付した時間が早い順である場合について説明したが、当該順序をタグの文字列が長い順にしてもよい。
1 新聞記事アーカイブシステム
2 ディスプレイ
3 新聞紙面画像データベース
4 タグデータベース
5 類義語辞書データベース
10 操作部
11 新聞紙面整列画像配置領域決定部
12 新聞紙面整列画像表示制御部
13 選択部
14 新聞紙面画像表示制御部
15 タグ判定部
16 タグ表示制御部
21 新聞紙面整列画像配置領域表示画像
21a,21b,31 新聞紙面整列画像
21c,21d,21e 新聞紙面整列画像群
22 年代表示画像
23 選択画面表示画像
41 新聞紙面画像
41−1,41−2,41−3,41−4,41−5,41−6 紙面区域
42−1,42−2,42−3,42−4,42−5,42−6 矩形領域
43,44 画像切替部

Claims (6)

  1. ディスプレイに表示された新聞紙面画像に含まれる新聞記事をブラウジング可能な新聞記事アーカイブシステムであって、
    データベースに格納された複数の新聞紙面画像から一つの新聞紙面画像を選択する選択部と、
    前記選択部により選択された新聞紙面画像をディスプレイに表示するように制御する新聞紙面画像表示制御部と、
    表示された新聞紙面画像に対応したタグ候補文字列を入力するための入力部と、
    光学文字認識により、前記入力部が入力したタグ候補文字列が、前記表示された新聞紙面画像上に存在するか否かに基づいて前記入力されたタグ候補文字列が適正であるか否かを判定し、適正であると判定された前記タグ候補文字列をタグ情報としてデータベースに記憶させるタグ判定部と、
    前記新聞紙面画像表示制御部が前記選択された新聞紙面画像をディスプレイに表示する際に、前記表示された新聞紙面画像の段組みに対応して設定された複数の矩形領域をディスプレイに表示させると共に、前記タグ判定部が適正であると判定したタグ候補文字列が存在する前記表示された新聞紙面画像上の位置に対応した矩形領域にタグを表示させるタグ表示制御部と、
    を有することを特徴とする新聞記事アーカイブシステム。
  2. 発刊日に基づいて整列された1か月間に発刊されている互いに異なる発刊日の複数の新聞紙面画像を含む複数の新聞紙面整列画像を、ディスプレイの画面上で複数列に亘って配置するために、前記複数の新聞紙面整列画像に含まれる全ての新聞紙面画像を新聞紙面画像データベースから取得し、取得した全ての新聞紙面画像に基づいて前記複数の新聞紙面整列画像を生成し、前記複数の新聞紙面整列画像をそれぞれ配置する複数の画像配置領域を年月に基づいて決定する新聞紙面整列画像配置領域決定部と、
    前記画像配置領域に配置された前記新聞紙面整列画像をディスプレイに表示するように制御する新聞紙面整列画像表示制御部と、
    を更に有し、
    前記選択部は、ブラウジングする対象を絞り込むための情報に基づいて、拡大表示する前記新聞紙面整列画像及び縮小表示する前記新聞紙面整列画像を選択し、選択した前記新聞紙面整列画像を前記新聞紙面整列画像表示制御部によって拡大表示及び縮小表示させる、請求項1に記載の新聞記事アーカイブシステム。
  3. 前記ブラウジングする対象を絞り込むための情報は、新聞の発刊年月日、新聞社名及びタグを検索するための文字列のうちの少なくとも一つを含む、請求項2に記載の新聞記事アーカイブシステム。
  4. 前記選択部は、ディスプレイに拡大表示された前記新聞紙面整列画像に含まれる複数の新聞紙面画像のうちの一つを、前記新聞紙面画像表示制御部によってディスプレイに表示される一つの新聞紙面画像として選択し、選択した一つの新聞紙面画像をデータベースから取得する、請求項2又は3に記載の新聞記事アーカイブシステム。
  5. 前記タグ判定部は、前記タグ候補文字列が適正であるか否かを、前記タグ候補文字列の意味が対応する前記表示された新聞紙面画像上に存在する文字列の意味と一致又は類似するか否か又は前記タグ候補文字列が前記表示された新聞紙面画像上に存在する表象を表すか否かに基づいて判定する、請求項1から4のうちのいずれか1項に記載の新聞記事アーカイブシステム。
  6. タグ表示制御部は、前記矩形領域に表示されたタグを指定し、前記新聞紙面画像表示制御部は、指定したタグに対応する前記表示された新聞紙面画像上に存在する文字列をハイライト表示する、請求項1から5のうちのいずれか1項に記載の新聞記事アーカイブシステム。
JP2013222654A 2013-10-25 2013-10-25 新聞記事アーカイブシステム Active JP6187972B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013222654A JP6187972B2 (ja) 2013-10-25 2013-10-25 新聞記事アーカイブシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013222654A JP6187972B2 (ja) 2013-10-25 2013-10-25 新聞記事アーカイブシステム

Publications (2)

Publication Number Publication Date
JP2015084183A true JP2015084183A (ja) 2015-04-30
JP6187972B2 JP6187972B2 (ja) 2017-08-30

Family

ID=53047749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013222654A Active JP6187972B2 (ja) 2013-10-25 2013-10-25 新聞記事アーカイブシステム

Country Status (1)

Country Link
JP (1) JP6187972B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292957A (ja) * 1995-04-20 1996-11-05 Hitachi Ltd 電子新聞システムの記事見出し表示方法
JPH09204511A (ja) * 1996-01-24 1997-08-05 Sharp Corp ファイリング装置
JP2003067587A (ja) * 2001-08-23 2003-03-07 Nec Corp 紙面イメージ型電子新聞配信方法、電子新聞配信システム及び電子新聞配信プログラム
JP2007323369A (ja) * 2006-05-31 2007-12-13 Yappa Corp 電子新聞表示装置及び電子新聞表示システム
WO2011145649A1 (ja) * 2010-05-19 2011-11-24 シャープ株式会社 電子機器、表示制御方法、プログラム、およびコンピュータが読取可能な一時的でない記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292957A (ja) * 1995-04-20 1996-11-05 Hitachi Ltd 電子新聞システムの記事見出し表示方法
JPH09204511A (ja) * 1996-01-24 1997-08-05 Sharp Corp ファイリング装置
JP2003067587A (ja) * 2001-08-23 2003-03-07 Nec Corp 紙面イメージ型電子新聞配信方法、電子新聞配信システム及び電子新聞配信プログラム
JP2007323369A (ja) * 2006-05-31 2007-12-13 Yappa Corp 電子新聞表示装置及び電子新聞表示システム
WO2011145649A1 (ja) * 2010-05-19 2011-11-24 シャープ株式会社 電子機器、表示制御方法、プログラム、およびコンピュータが読取可能な一時的でない記録媒体

Also Published As

Publication number Publication date
JP6187972B2 (ja) 2017-08-30

Similar Documents

Publication Publication Date Title
US8015203B2 (en) Document recognizing apparatus and method
US20070098263A1 (en) Data entry apparatus and program therefor
JP6426417B2 (ja) 電子機器、方法及びプログラム
US20160179834A1 (en) Information processing apparatus, search server, web server, and non-transitory computer readable storage medium
WO2008041367A1 (fr) Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document
JP6135331B2 (ja) 電子機器、プログラム、および、検索システム、検索方法
AU2013325961B2 (en) Information processing device and program
JP6430198B2 (ja) 電子機器、方法及びプログラム
US20150026224A1 (en) Electronic device, method and storage medium
JP6536214B2 (ja) 辞書端末、情報表示制御方法及び情報表示制御プログラム
JP6187972B2 (ja) 新聞記事アーカイブシステム
JP5672357B2 (ja) 電子機器及びプログラム
US20120154436A1 (en) Information display apparatus and information display method
JP5330714B2 (ja) 検索支援装置、および検索支援プログラム
CN100498774C (zh) 文档文件管理装置、方法、及程序
US20080056620A1 (en) Document file management apparatus, document file management method and document file management program
JP4906044B2 (ja) 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体
JP6028905B2 (ja) 帳票管理装置及び帳票管理方法並びに帳票管理プログラム
JP2002259173A (ja) ファイル管理プログラム、ファイル管理プログラムを記録したコンピュータ読取可能な記録媒体、ファイル管理装置およびファイル管理方法
JP2019057102A (ja) 表示制御プログラム
CN103677504A (zh) 文件阅读器及文件信息显示方法
JP2013175136A (ja) トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラム
JP2011141708A (ja) 電子機器及び情報表示プログラム
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム
JP2008077335A (ja) 自動略称作成装置及び自動略称作成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170725

R150 Certificate of patent or registration of utility model

Ref document number: 6187972

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250