JP5870815B2 - 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム - Google Patents

書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム Download PDF

Info

Publication number
JP5870815B2
JP5870815B2 JP2012077819A JP2012077819A JP5870815B2 JP 5870815 B2 JP5870815 B2 JP 5870815B2 JP 2012077819 A JP2012077819 A JP 2012077819A JP 2012077819 A JP2012077819 A JP 2012077819A JP 5870815 B2 JP5870815 B2 JP 5870815B2
Authority
JP
Japan
Prior art keywords
book
index word
occurrence index
search
search keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012077819A
Other languages
English (en)
Other versions
JP2013206388A (ja
Inventor
侑吾 西川
侑吾 西川
伊藤 直之
直之 伊藤
和久 大野
和久 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2012077819A priority Critical patent/JP5870815B2/ja
Publication of JP2013206388A publication Critical patent/JP2013206388A/ja
Application granted granted Critical
Publication of JP5870815B2 publication Critical patent/JP5870815B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、書籍を検索する書籍情報検索装置等に関するものである。
従来、電子書籍販売サイトや書籍のEC(Electronic Commerce)サイトの書籍全文を対象としたキーワード検索では、検索数が多く、また、検索された書籍が必ずしも検索キーワードについて詳しく述べているとは限らないため、利用者が捜し求めている情報にたどり着くまで、時間や手間がかかる。
そこで、例えば、特許文献1には、検索キーワードにより検索された文書から共起により、検索に用いる関連語を取得し、絞込みに利用する技術が開示されている。
例えば、特許文献2には、検索キーワードと関連する索引語を利用者に提示・選択させることで、情報を絞り込む技術が開示されている。
例えば、特許文献3には、検索キーワードにより検索された文書から共起により、検索に用いる関連語を取得する技術が開示されている。
特開2000−137730号公報 特開2000−259671号公報 特許第3099756号公報
特許文献1では、全ての語を対象に共起語を取得しているため、書籍のように文書量の多い文章を対象に行うと、関連語として一般的な語(「今日」、「私」など)が大量に引っかかり、利用者に効果的な絞込み用のキーワードを提示することが困難である課題があった。
また特許文献2では、あらかじめ作成したキーワードデータベースを用いているため、利用者が検索したキーワードがキーワードデータベースに登録されていなかった場合、利用することができなくなってしまう課題があった。
さらに特許文献3では、文書全文を用いて共起情報を取得しているため、検索キーワードと関連語候補の関連性が高いとは限らない。また、関連語候補が文書内で重要な語なのか分からない課題があった。
本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、利用者の検索キーワードと共起する索引語を提示し、選択させることで、利用者が知りたい内容が記載されている書籍にたどり着きやすくすることが可能な書籍情報検索装置などを提供することである。
前述した目的を達成するための第1の発明は、端末とネットワークを介して接続される書籍情報検索装置であって、索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶手段と、前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索手段と、前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索手段と、前記書籍検索手段によって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出手段と、前記共起索引語抽出手段によって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出手段と、前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出手段と、前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出手段によって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信手段と、を具備することを特徴とする書籍情報検索装置である。
第1の発明によって、利用者の検索キーワードと共起する索引語を含む書籍を効率良く検索することが可能となる。
第1の発明は、前記端末に送信された前記共起索引語がユーザによって選択された場合、前記ユーザによって選択された共起索引語を前記検索キーワードに追加することが望ましい。
これによって、利用者が知りたい内容が記載されている書籍の絞り込みを行うことが可能となる。
前記文章集合は見出しを有し、前記見出しが前記共起索引語である場合には、前記見出しを有する書籍の重要度を高くすることが望ましい。
また、前記検索キーワードが含まれる文章集合から抽出された共起索引語の数が多い書籍の重要度を高くすることが望ましい。
これによって、検索キーワードに特に共起する索引語を含む書籍の絞り込みを行うことが可能となる。
第2の発明は、サーバと端末がネットワークを介して接続される書籍情報検索システムであって、前記サーバは、索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶手段と、前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索手段と、前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索手段と、前記書籍検索手段によって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出手段と、前記共起索引語抽出手段によって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出手段と、前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出手段と、前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出手段によって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信手段と、を具備し、前記端末は、前記検索キーワードを送信する送信手段と、前記サーバによって送信された前記共起索引語と、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を受信し、表示する表示手段と、を具備することを特徴とする書籍情報検索システムである。
第2の発明によって、利用者の検索キーワードと共起する索引語を提示することで、利用者が知りたい内容が記載されている書籍にたどり着きやすくなる。
第3の発明は、サーバと端末がネットワークを介して接続される書籍情報検索システムで行われる書籍情報検索方法であって、前記サーバが、索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶ステップと、前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索ステップと、前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索ステップと、前記書籍検索ステップによって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出ステップと、前記共起索引語抽出ステップによって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出ステップと、前記共起索引語頻度算出ステップによって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出ステップと、前記共起索引語頻度算出ステップによって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出ステップによって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信スッテップと、を含み、前記端末が、前記検索キーワードを送信する送信ステップと、前記サーバによって送信された前記共起索引語と、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を受信し、表示する表示ステップと、
を含むことを特徴とする書籍情報検索方法である。
第4の発明は、端末とネットワークを介して接続されるコンピュータを、索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶手段と、前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索手段と、前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索手段と、前記書籍検索手段によって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出手段と、前記共起索引語抽出手段によって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出手段と、前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出手段と、前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出手段によって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信手段と、を具備する書籍情報検索装置として機能させるプログラムである。
第4の発明のプログラムを汎用のコンピュータにインストールすることによって、第1の発明の書籍情報検索装置を得ることができる。
本発明により、利用者の検索キーワードと共起する索引語を含む書籍を効率良く検索することが可能な書籍情報検索装置などを提供することができる。
本発明の実施の形態に係る書籍情報検索システムの構成例を示す図である。 サーバ(端末)のハードウェア構成図である。 サーバの記憶部に記憶されるデータベースを示す図である。 書籍データベースに記憶される書籍データ群の一例を示している。 ある書籍の索引の一例を示している。 書籍情報検索処理を説明するフローチャートである。 検索キーワード入力画面の表示例を示す図である。 検索キーワードを含む書籍群の一例を示す図である。 図6のステップS102〜S104の処理の具体例について説明するための図である。 共起索引語、共起索引語が抽出された書籍の冊数、および共起索引語が抽出された文章集合の集計結果の一例を示す図である。 図10に示す共起索引語を、書籍の冊数順に並べた集計結果を示す図である。 各書籍の重要度を高い順に並べた算出結果を示す図である。 検索結果画面の表示例を示す図である。 共起索引語が見出しである場合の一例を示す図である。 共起索引語が同じ書籍に多く登場する場合の一例を示す図である。
以下、図面に基づいて、本発明の実施形態を詳細に説明する。
[本発明の実施の形態]
図1は、本発明の実施の形態に係る書籍情報検索システム1の構成例を示す図である。なお、サーバ2および端末3の数は、任意であり、それぞれ複数設けることも勿論可能である。
図1に示すように、書籍情報検索システム1は、サーバ2と端末3とがネットワーク5を介して接続されている。ネットワーク5は、LAN(Local Area Network)、インターネット等である。
サーバ2は、端末3から書籍情報の検索要求を受信して、端末3に書籍情報の検索結果等を送信する。
端末3は、ユーザによる入力情報を受け付けて、サーバ2に検索要求として送信し、サーバ2から検索結果等を受信して、検索結果等をユーザに提示する。
尚、本発明の実施形態は、図1に示すようにクライアントサーバ型の構成に限られず、スタンドアローン型の構成であっても良い。すなわち、書籍情報検索装置として、後述するサーバ2及び端末3の機能を有する1台のコンピュータによる構成であっても良い。
図2は、サーバ2(端末3)のハードウェア構成図である。尚、図2のハードウェア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
サーバ2(端末3)を実現するコンピュータは、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F(インターフェース)部17等が、バス18を介して接続される。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。
CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、サーバ2(端末3)が行う後述する処理を実現する。ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
記憶部12は、HDD(ハードディスクドライブ)であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OS(オペレーティングシステム)に相当する制御プログラムや、後述する処理をコンピュータに実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。通信制御部14は、通信制御装置、通信ポート等を有し、コンピュータとネットワーク間の通信を媒介する通信インターフェースであり、ネットワーク5を介して、他のコンピュータ間との通信制御を行う。ネットワーク5は、有線、無線を問わない。
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、コンピュータに対して、操作指示、動作指示、データ入力等を行うことができる。表示部16は、CRTモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータのビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
周辺機器I/F(インターフェース)部17は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部17を介してコンピュータは周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USBやIEEE1394やRS−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
以下、本実施の形態の説明にあたり、用語について定義する。「索引語」とは、書籍の最後にある索引に登場する語である。「共起索引語」とは、検索キーワードが含まれる章(文章集合)から抽出された索引語である。なお、「共起」とは、同じ文章などで2つ以上の言葉が同時に頻出する事象をいう。
図3は、サーバ2の記憶部12に記憶されるデータベースを示す図である。図3に示すように、サーバ2の記憶部12には、書籍情報データベース21が記憶される。書籍情報データベース21は、少なくとも、目次データ及び索引データを含む全文データを、書籍ごとに書籍データとして記憶する。
図4は、書籍データベース21に記憶される書籍データ群の一例を示している。
図4に示すように、書籍データベース21には、書籍Aの全文データ、書籍Bの全文データ、書籍Cの全文データ、書籍Dの全文データ、書籍Eの全文データ、書籍Fの全文データ、書籍Gの全文データ、および書籍Hの全文データが含まれている。なお、実際には、図示しきれない多数の書籍の全文データが記憶されている。
図5は、ある書籍の索引の一例を示している。
図5の例に示す、ある書籍の索引20には、「Android(登録商標)」が、「10、25p(ページ)」に記載されていることが示されており、「apache(登録商標)」が「15、34p」に記載されていることが示されており、「CSS」が「18、30p」に記載されていることが示されており、「iphone(登録商標)」が「3、8、24、32p」に記載されていることが示されている。
本実施の形態では、これら、「Android(登録商標)」、「apache(登録商標)」、「CSS」、「iphone(登録商標)」、・・・を含む語を索引語22として定義する。
図6は、書籍情報検索システム1が実行する、書籍情報検索処理を説明するフローチャートである。図6の説明に当たり、図7〜図13を参照し、具体的な処理内容も説明する。
ステップS101において、端末3の制御部11は、利用者による検索キーワードの入力を検知する。
例えば、端末3の制御部11は、図7に示すような検索キーワード入力画面31を表示部16に表示させる。利用者は、表示部16に表示された検索キーワード入力画面31のキーワード入力エリア32に、検索したいキーワードを、入力部15を用いて入力し、「検索」のボタン33を押下することで、書籍情報の検索を指示することができる。つまり、端末3の制御部11は、検索キーワード入力画面31のキーワード入力エリア32に入力された検索キーワードを検知する。図7の例では、「ホームページ スマートフォン」の検索キーワードが入力されている。
そして、端末3の制御部11は、検知した検索キーワード(図7の例では、「ホームページ スマートフォン」)を、通信制御部14およびネットワーク5を介してサーバ2に送信する。
ステップS102において、サーバ2の制御部11は、端末3からネットワーク5を介して送信されてきた検索キーワードを受信し、記憶部12の書籍情報データベース21から、検索キーワードが含まれる書籍情報を検索する。これにより、例えば、図8に示すような書籍群41が検索される。図8の例では、検索キーワードである「ホームページ スマートフォン」を含む書籍群41として、書籍A、書籍B、書籍C、書籍D、書籍E、書籍F、書籍Gが検索されている。
ステップS103において、サーバ2の制御部11は、ステップS102の処理で検索した書籍情報の中から、さらに検索キーワードが含まれる文章集合(章、節、段落など)を検索する。ステップS104において、サーバ2の制御部11は、ステップS102の処理で検索した書籍情報の索引に登場する語を、ステップS103の処理で検索した文章集合の中から、共起索引語として抽出する。
ここで、図9を参照して、ステップS102〜S104の処理の具体例について説明する。
ステップS102において、サーバ2の制御部11は、検索キーワードである「ホームページ スマートフォン」が含まれる書籍情報として「書籍A」を検索する(図9(a))。ステップS103において、サーバ2の制御部11は、「書籍A」の中から、さらに「ホームページ スマートフォン」が含まれる文章集合として「第二章」の本文を検索する(図9(b))。ステップS104において、サーバ2の制御部11は、「第二章」の本文の中から、共起索引語として「CSS、FLASH、Apache(登録商標)・・・」を抽出する(図9(c))。
そして、サーバ2の制御部11は、以上のような処理を、書籍B、書籍C、書籍D、書籍E、書籍F、書籍Gに対しても行う
図6の説明に戻る。ステップS105において、サーバ2の制御部11は、共起索引語が抽出された書籍の冊数(登場数)を集計する。
図10は、共起索引語、共起索引語が抽出された書籍の冊数、および共起索引語が抽出された文章集合の集計結果の一例を示す図である。
図10(a)は、「ホームページ」が含まれる文章集合(章)から抽出された共起索引語ごとの集計結果の一例を示している。図10(a)の例の場合、「CSS」の共起索引語が抽出された書籍の冊数は、「6冊」であり、抽出された文章集合(章)は、「書籍A>第二章(書籍Aの第二章に登場)」と「書籍B>第二章(書籍Bの第二章に登場)」である。「データベース」の共起索引語が抽出された書籍の冊数は、「5冊」であり、抽出された文章集合(章)は、「書籍C>第一章(書籍Cの一章に登場)」、「書籍C>第二章(書籍Cの第二章に登場)」である。「iphone(登録商標)」の共起索引語が抽出された書籍の冊数は、「2冊」であり、抽出された文章集合(章)は、「書籍A>第四章(書籍Aの第四章に登場)」である。「FLASH」の共起索引語が抽出された書籍の冊数は、「2冊」であり、抽出された文章集合(章)は、「書籍A>第二章(書籍Aの第二章に登場)」である。「apache」の共起索引語が抽出された書籍の冊数は、「2冊」であり、抽出された文章集合(章)は、「書籍A>第二章(書籍Aの第二章に登場)」である。
図10(b)は、「スマートフォン」が含まれる文章集合(章)から抽出された共起索引語ごとの集計結果の一例を示している。図10(b)の例の場合、「iphone(登録商標)」の共起索引語が抽出された書籍の冊数は、「5冊」であり、抽出された文章集合(章)は、「書籍A>第四章(書籍Aの第四章に登場)」と「書籍C>第一章(書籍Cの第一章に登場)」である。「Android(登録商標)」の共起索引語が抽出された書籍の冊数は、「4冊」であり、抽出された文章集合(章)は、「書籍B>第五章(書籍Bの第五章に登場)」、「書籍G>第六章(書籍Gの第六章に登場)」である。「FLASH」の共起索引語が抽出された書籍の冊数は、「1冊」であり、抽出された文章集合(章)は、「書籍A>第二章(書籍Aの第二章に登場)」である。
なお、図10(a)に示す「CSS」の共起索引語は、「6冊」の書籍が抽出されているにもかかわらず、「書籍A>第二章」と「書籍B>第二章」の文章集合しか図示されていないが、実際には、6冊の書籍に「CSS」の共起索引語が登場している。例えば、「書籍A>第二章」、「書籍B>第二章」、「書籍D>第一章」、「書籍E>第四章」、「書籍F>第三章」、「書籍G>第四章」の文章集合に「CSS」の共起索引語が登場する。
図11は、図10に示す共起索引語を、書籍の冊数順(書籍登場回数が多い順)に並べた集計結果を示している。
図11に示すように、「iphone」の共起索引語が抽出された書籍の冊数は、「7冊」で、「1位」であり、抽出された文章集合(章)は、「書籍A>第四章」と「書籍C>第一章」である。「CSS」の共起索引語が抽出された書籍の冊数は、「6冊」で、「2位」であり、抽出された文章集合(章)は、「書籍A>第二章」と「書籍B>第二章」である。「データベース」の共起索引語が抽出された書籍の冊数は、「5冊」で、「3位」であり、抽出された文章集合(章)は、「書籍C>第一章」と「書籍C>第二章」である。「Android」の共起索引語が抽出された書籍の冊数は、「4冊」で、「4位」であり、抽出された文章集合(章)は、「書籍B>第五章」と「書籍G>第六章」である。「FLASH」の共起索引語が抽出された書籍の冊数は、「3冊」で、「5位」であり、抽出された文章集合(章)は、「書籍A>第二章」である。「Apache」の共起索引語が抽出された書籍の冊数は、「2冊」で、「6位」であり、抽出された文章集合(章)は、「書籍A>第二章」である。
図6の説明に戻る。ステップS105において、サーバ2の制御部11は、集計した書籍の冊数(登場数)に基づいて、次式(1)に従って書籍の重要度Scoreを算出する。
Figure 0005870815
書籍Aの重要度=1/(1+1)+1/(2+1)+1/(5+1)+1/(6+1)=1.142
書籍Bの重要度=1/(2+1)+1/(4+1)=0.533
書籍Cの重要度=1/(1+1)+1/(3+1)=0.750
書籍Gの重要度=1/(4+1)=0.200
図12は、各書籍の重要度を高い順に並べた算出結果を示している。
図12に示すように、書籍Aの重要度は、「1.142」であり、書籍Cの重要度は、「0.750」であり、書籍Bの重要度は、「0.533」であり、書籍Gの重要度は、「0.200」である。
図6の説明に戻る。ステップS106において、サーバ2の制御部11は、ステップS104の処理で抽出した共起索引語、共起索引語が抽出された書籍情報(抽出された文章集合を含む)を、ステップS105の処理で算出した書籍の重要度とともに、ネットワーク5を介して端末3に送信する。
ステップS107において、端末3の制御部11は、ネットワーク5を介してサーバ2から送信されてきた、共起索引語および共起索引語が抽出された書籍情報に基づいて、検索結果を表示部16に表示させる。
図13は、表示部16に表示される検索結果画面の一例である。
図13に示す検索結果画面51には、「ホームページ スマートフォン」を含む書籍群が、共起索引語ごとに表示されている。検索結果表示エリア52−1には、「iphone」の共起索引語が抽出された書籍A、書籍Cが表示され、検索結果表示エリア52−2には、「CSS」の共起索引語が抽出された書籍A、書籍Bが表示され、検索結果表示エリア52−3には、「データベース」の共起索引語が抽出された書籍Cが表示されている。
なお、検索結果画面51において、共起索引語は、書籍登場回数が多い順に上から並べられ、かつ、検索結果表示エリア52−1、52−2において、書籍の重要度が高い順に左から並べられている。
利用者は、検索結果表示エリア52−1〜52−3に表示されている書籍群のうち、所望の書籍を、入力部15を用いて選択すると、選択した書籍の詳細ページの表示に切り替えることができる。また、利用者は、検索結果表示エリア52−1に表示されている「iphone」のボタン53−1、検索結果表示エリア52−2に表示されている「CSS」のボタン53−2、検索結果表示エリア52−3に表示されている「データベース」のボタン53−2を選択すると、選択した共起索引語を検索キーワードに追加し、再度、共起する索引語を抽出する処理を、サーバ2に対して行わせることができる。
図6の説明に戻る。ステップS107において、端末3の制御部11は、表示部16に表示されている検索結果画面51の、検索結果表示エリア52−1〜52−3に表示されている書籍群のうち、所定の書籍が選択されたことを検知すると、ステップS108に進み、選択された書籍の詳細情報の表示に切り替える。
またステップS107において、端末3の制御部11は、表示部16に表示されている検索結果画面51の、検索結果表示エリア52−1〜52−3に表示されているボタン53−1〜53−3のうち、検索キーワードに追加したい共起索引語のボタンが選択されたことを検知すると、その共起索引語を、通信制御部14およびネットワーク5を介してサーバ2に送信する。
ステップS109において、サーバ2の制御部11は、端末3からネットワーク5を介して送信されてきた共起索引語を受信し、その共起索引語を検索キーワードに追加し、ステップS102に戻り、上述した処理を繰り返し実行する。例えば、図13の検索結果画面51において、「iphone」のボタン53−1が選択された場合、先に入力された検索キーワードである「ホームページ スマートフォン」に「iphone」のキーワードを追加する。これによって、さらに利用者が知りたい内容の書籍を検索することができる。
[本発明の実施の形態における効果]
以上のように、利用者の検索キーワードと共起する索引語を提示し、選択させることで、利用者が知りたい内容が記載されている書籍を効率良く検索することが可能となる。
[変形例]
書籍の重要度を算出する際、上記式(1)を用いるようにしたが、さらに、抽出された文章集合の見出しが、共起索引語である場合、その見出しを有する書籍の重要度を高くするようにしてもよい。例えば、図14に示すように、抽出された文章集合61の見出し62が、共起索引語である「CSS」となっている場合、その書籍の重要度を所定値(例えば、0.2)高くするような処理を行うようにしてもよい。
また、同じ書籍で共起索引語が多く登場する場合には、その重要度を高くするようにしてもよい。例えば、図15に示すように、「書籍B」では、「第二章」の文章集合71に「ホームページ」の検索キーワードと「CSS」の共起索引語が登場し、「第五章」の文章集合72に「ホームページ」の検索キーワードと「Android」の共起索引語が登場しているため、それぞれに所定値(例えば、0.1)高くするような処理を行うようにしてもよい。つまり、書籍Bの重要度は、以下のようになる。
書籍Bの重要度={1/(2+1)+0.1}+{1/(4+1)+0.1}=0.733
さらに、同じ文章集合に複数の共起索引語があった場合、1つの共起索引語につき重要度を所定値(例えば、0.1)高くするような処理を行うようにしてもよい。
以上、添付図面を参照しながら、本発明に係る書籍情報検索システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………書籍情報検索システム
2………サーバ
3………端末
5………ネットワーク
11………制御部
12………記憶部
13………メディア入出力部
14………通信制御部
15………入力部
16………表示部
17………周辺機器I/F部

Claims (7)

  1. 端末とネットワークを介して接続される書籍情報検索装置であって、
    索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶手段と、
    前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索手段と、
    前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索手段と、
    前記書籍検索手段によって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出手段と、
    前記共起索引語抽出手段によって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出手段と、
    前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出手段と、
    前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出手段によって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信手段と、
    を具備することを特徴とする書籍情報検索装置。
  2. 前記端末に送信された前記共起索引語がユーザによって選択された場合、前記ユーザによって選択された共起索引語を前記検索キーワードに追加することを特徴とする請求項1に記載の書籍情報検索装置。
  3. 前記文章集合は見出しを有し、前記見出しが前記共起索引語である場合には、前記見出しを有する書籍の重要度を高くすることを特徴とする請求項1又は請求項2に記載の書籍情報検索装置。
  4. 前記検索キーワードが含まれる文章集合から抽出された共起索引語の数が多い書籍の重要度を高くすることを特徴とする請求項1乃至請求項3のいずれかに記載の書籍情報検索装置。
  5. サーバと端末がネットワークを介して接続される書籍情報検索システムであって、
    前記サーバは、
    索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶手段と、
    前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索手段と、
    前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索手段と、
    前記書籍検索手段によって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出手段と、
    前記共起索引語抽出手段によって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出手段と、
    前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出手段と、
    前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出手段によって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信手段と、
    を具備し、
    前記端末は、
    前記検索キーワードを送信する送信手段と、
    前記サーバによって送信された前記共起索引語と、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を受信し、表示する表示手段と、
    を具備することを特徴とする書籍情報検索システム。
  6. サーバと端末がネットワークを介して接続される書籍情報検索システムで行われる書籍情報検索方法であって、
    前記サーバが、
    索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶ステップと、
    前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索ステップと、
    前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索ステップと、
    前記書籍検索ステップによって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出ステップと、
    前記共起索引語抽出ステップによって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出ステップと、
    前記共起索引語頻度算出ステップによって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出ステップと、
    前記共起索引語頻度算出ステップによって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出ステップによって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信スッテップと、
    を含み、
    前記端末が、
    前記検索キーワードを送信する送信ステップと、
    前記サーバによって送信された前記共起索引語と、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を受信し、表示する表示ステップと、
    を含むことを特徴とする書籍情報検索方法。
  7. 端末とネットワークを介して接続されるコンピュータを、
    索引を含む書籍の全文データを、前記書籍ごとに記憶する記憶手段と、
    前記端末から送信される検索キーワードが含まれる前記書籍を検索する書籍検索手段と、
    前記検索キーワードが含まれる書籍の中から、前記検索キーワードが含まれる文章集合を検索する文章集合検索手段と、
    前記書籍検索手段によって検索された特定の書籍の索引に登場する語を、その書籍の前記検索キーワードが含まれる文章集合から共起索引語として抽出する共起索引語抽出手段と、
    前記共起索引語抽出手段によって同じ共起索引語が抽出された前記書籍の冊数を算出する共起索引語頻度算出手段と、
    前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記検索キーワードが含まれる書籍の重要度を算出する書籍重要度算出手段と、
    前記共起索引語頻度算出手段によって算出された前記書籍の冊数に基づいて、前記共起索引語を前記端末に送信し、前記書籍重要度算出手段によって算出された書籍の重要度に基づいて、前記検索キーワード及び前記共起索引語が含まれる書籍の情報を前記端末に送信する送信手段と、
    を具備する書籍情報検索装置として機能させるプログラム。
JP2012077819A 2012-03-29 2012-03-29 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム Active JP5870815B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012077819A JP5870815B2 (ja) 2012-03-29 2012-03-29 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012077819A JP5870815B2 (ja) 2012-03-29 2012-03-29 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013206388A JP2013206388A (ja) 2013-10-07
JP5870815B2 true JP5870815B2 (ja) 2016-03-01

Family

ID=49525348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012077819A Active JP5870815B2 (ja) 2012-03-29 2012-03-29 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5870815B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7082333B2 (ja) * 2017-11-30 2022-06-08 学校法人酪農学園 設問自動生成プログラム及び設問自動生成装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7739277B2 (en) * 2004-09-30 2010-06-15 Microsoft Corporation System and method for incorporating anchor text into ranking search results
JP5541014B2 (ja) * 2010-09-08 2014-07-09 大日本印刷株式会社 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム

Also Published As

Publication number Publication date
JP2013206388A (ja) 2013-10-07

Similar Documents

Publication Publication Date Title
JP5497022B2 (ja) 入力文字列からのリソースロケータの提案
US20120304073A1 (en) Web Browser with Quick Site Access User Interface
JP5417471B2 (ja) 構造化文書管理装置、構造化文書検索方法
JP6956119B2 (ja) 文脈情報を提供するためのシステムおよび方法
JP2014241034A (ja) 文を検索する装置、方法およびプログラム
JP2012118773A (ja) 電子書籍閲覧システム、電子書籍閲覧方法、プログラム及び記憶媒体
JP2015106354A (ja) 検索サジェスト装置、検索サジェスト方法、及び、プログラム
JP2012212397A (ja) 情報処理装置及び情報処理方法
JP2012212377A (ja) 情報処理装置及び情報処理プログラム
JP2012243033A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2017059184A (ja) 検索装置、検索方法、及びプログラム
US20120254233A1 (en) Information processing system, information processor, and computer program product
JP5568195B1 (ja) 検索システム、検索条件設定装置、検索条件設定装置の制御方法、プログラム、及び情報記憶媒体
EP3084636A1 (en) Identifying semantically-meaningful text selections
JP5870815B2 (ja) 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム
JP5918714B2 (ja) 文献検索装置、文献検索方法、プログラム、および文献検索システム
JP5541014B2 (ja) 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム
JP2016192067A (ja) 検索装置
JP2009271671A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP6524668B2 (ja) 文書検索装置、文書検索方法、プログラム、
US20130151514A1 (en) Extracting tips
JP2012073879A (ja) 順位決定装置、順位決定プログラム及び順位決定方法
JP2010211530A (ja) 情報検索端末装置、情報検索システム、情報検索方法、および情報検索プログラム
JP2013200800A (ja) 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム
JP6623698B2 (ja) 情報処理装置、情報処理方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151228

R150 Certificate of patent or registration of utility model

Ref document number: 5870815

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150