JP2008090781A - 検索文字列位置情報表示装置 - Google Patents

検索文字列位置情報表示装置 Download PDF

Info

Publication number
JP2008090781A
JP2008090781A JP2006273877A JP2006273877A JP2008090781A JP 2008090781 A JP2008090781 A JP 2008090781A JP 2006273877 A JP2006273877 A JP 2006273877A JP 2006273877 A JP2006273877 A JP 2006273877A JP 2008090781 A JP2008090781 A JP 2008090781A
Authority
JP
Japan
Prior art keywords
character string
position information
search
display
index data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006273877A
Other languages
English (en)
Inventor
Kiyoshi Sasaki
潔 佐々木
Masamichi Takase
将道 高瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2006273877A priority Critical patent/JP2008090781A/ja
Publication of JP2008090781A publication Critical patent/JP2008090781A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】全文データを利用することなく、印刷物としての書籍における位置情報をユーザが検索を望む全ての文字列について表示することが可能となる。
【解決手段】紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶し、ユーザが検索を望む文字列の入力を受け付け、文字列入力ステップにおいて入力された文字列又はこれに意味的に類似する文字列を上記記憶ステップにおいて記憶したインデックスデータから検索し、検索した上記文字列に予め関連付けされている位置情報を読み出し、文字列検索ステップにおいて読み出した位置情報に関する表示を行う。
【選択図】図1

Description

本発明は、ユーザが検索を望む文字列が実際に紙媒体に印刷された位置に関する位置情報を表示する検索文字列位置情報表示装置及びシステム、検索文字列位置情報表示方法並びにプログラムに関するものである。
近年において、パーソナルコンピュータや携帯電話、携帯情報端末(PDA)等のメディアで書籍を読むことが可能な、いわゆる電子書籍が広まりつつある。この電子書籍は、文字を電子化することにより、紙媒体としての書籍の収納場所を軽減し、また印刷コストを削減できる利点に加え、紙資源の消費を減らすことによる環境保護を図ることができる点においても注目されている。
しかしながら、電子書籍は、著作権保護の観点、電子化する際の権利関係の点において解決しなければならない点があり、また実際に書籍を読む際の利便性にも未だ向上の余地があることから、浸透に時間がかかるものと考えられている。これに加えて、書籍から情報を取得する際には、紙媒体に印刷された書籍を介して行うものであるという観念が未だ強いことから、現時点では印刷物としての書籍が主流を占めている。
ところで、ある特定のキーワード等で構成される文字列をこの印刷物としての書籍から探し出す場合には、例えば、巻頭に記載されている目次や、巻末に記載されている索引を利用するのが一般的である。しかしながら、実際に目次や索引に記載されているのは、比較的上位概念にあるキーワードが代表的に記載されている場合が多く、個別具体的な下位概念の内容までは記載されていない場合が多い。このため、ユーザが検索を望む任意の文字列が、目次や索引に記載されていない場合が多く、これを検索することができないという問題点があった。さらに、目次や索引を介してしか文字列の検索が不可能な印刷物としての書籍では、複数の文字列が現れるページを探し出すことや、AND検索、OR検索を組み合わせた複雑な検索を行うことができないという問題点があった。
従来においては、ユーザから指定された文字列を検索し、その位置情報(ページ、行、列等)を表示する方法が特許文献1において提案されている。しかし、この特許文献1の開示技術は、あくまでワードプロセッサ等の文書編集装置において文書を編集する過程において、検索文字列の位置情報を表示するものであり、印刷物としての書籍に対応する位置情報を表示する具体的な構成は開示されていない。
特開平5−314132号公報
なお、印刷物としての書籍中の文書につき、全文データを電子化し、パーソナルコンピュータを介して電子的に検索することは従来においても可能である。
しかしながら、この方法においてユーザは、検索結果をディスプレイ上に表示されたテキスト上で確認することが前提となっているため、実際のページ、行、列等を始めとした紙媒体中の位置情報を一括して得ることはできない。特に所望の文字列の章毎、段落毎に出現頻度を確認したい場合があり、書籍中における文字列の分布情報を一括して確認できる構成が従来より特に望まれていた。
また、この全文データを利用して位置情報を取得する方法では、著作権の問題の解決等、実際の運用面において様々な障壁が存在する。このため、全文データを極力利用することなく、印刷物としての書籍における位置情報をユーザが検索を望む全ての文字列について表示することができるシステムを案出する必要があった。
そこで、本発明は、上述した問題点に鑑みて案出されたものであり、その目的とするところは、全文データを利用することなく、印刷物としての書籍における位置情報をユーザが検索を望む全ての文字列について表示することが可能な検索文字列位置情報表示装置及びシステム、検索文字列位置情報表示方法並びにプログラムを提供することにある。
本発明者は、上述した課題を解決するために、紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶し、ユーザが検索を望む文字列の入力を受け付け、文字列入力ステップにおいて入力された文字列又はこれに意味的に類似する文字列を上記記憶ステップにおいて記憶したインデックスデータから検索し、検索した上記文字列に予め関連付けされている位置情報を読み出し、文字列検索ステップにおいて読み出した位置情報に関する表示を行う検索文字列位置情報表示装置を発明した。
即ち、本発明に係る検索文字列位置情報表示装置は、紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶手段と、ユーザが検索を望む文字列を入力するための文字列入力手段と、上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記記憶手段に記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索手段と、上記文字列検索手段により読み出された位置情報に関する表示を行う表示手段とを備えることを特徴とする。
また、本発明に係る検索文字列位置情報表示装置は、紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶手段と、予め設定した文字列群における各文字列を所定の形状からなる要素に割り当て、上記各文字列の上記紙媒体中の出現頻度を上記要素のサイズを介して表現するとともに、上記文字列間の類似度を上記要素間を連結する線の太さを介して表現する表示手段と、ユーザが検索を望む文字列を上記表示手段に表示されている要素又は線を介して指定するための文字列入力手段と、上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記記憶手段に記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索手段とを備え、上記表示手段は、上記文字列検索手段により読み出された位置情報に関する表示を行う表示手段とを備えることを特徴とする。
また、本発明に係る検索文字列位置情報表示システムは、紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶するサーバと、上記サーバに対して通信回線を介してアクセス可能な端末装置とを備え、上記端末装置は、ユーザが検索を望む文字列を入力するための文字列入力手段と、上記通信回線を介してサーバにアクセスし、上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記サーバに記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索手段と、上記文字列検索手段により読み出された位置情報に関する表示を行う表示手段とを備えることを特徴とする。
また、本発明に係る検索文字列位置情報表示方法は、紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶ステップと、ユーザが検索を望む文字列の入力を受け付ける文字列入力ステップと、上記文字列入力ステップにおいて入力された文字列又はこれに意味的に類似する文字列を上記記憶ステップにおいて記憶したインデックスデータから検索し、検索した上記文字列に予め関連付けされている位置情報を読み出す文字列検索ステップと、上記文字列検索ステップにおいて読み出した位置情報に関する表示を行う表示ステップとを有することを特徴とする。
また、本発明に係るプログラムは、紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶手段と、ユーザが検索を望む文字列を入力するための文字列入力手段とを有するコンピュータに実装され、上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記記憶手段に記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索ステップと、上記文字列検索ステップにおいて読み出した位置情報に関する表示を行う表示ステップとをコンピュータに実行させる。
以下、本発明を実施するための最良の形態として、ユーザが検索を望む文字列の紙媒体中の位置情報に関する表示を行う検索文字列位置情報表示装置システムについて、図面を参照しながら詳細に説明する。
図1は、本発明を適用した検索文字列位置情報表示システム1の構成図である。この検索文字列位置情報表示システム1は、システムを利用するユーザ用の端末装置3と、この端末装置3に対して公衆通信網2を介して接続されるサーバ4とを備えている。
公衆通信網2は、端末装置3とサーバ4とを電話回線を介して接続されるインターネット網を始め、TA/モデムと接続されるISDN(Integrated Services Digital Network)/B(broadband)−ISDN等のように、情報の双方向送受信を可能としたネットワーク、或いはSTBと接続される衛星通信網(Broadcasting)等である。ちなみにこの検索文字列位置情報表示システム1を一定の狭いエリア内で運用する場合には、この公衆通信網2を、LAN(Local Area Network)で構成してもよい。また、この公衆通信網2につきいわゆる光ファイバ通信網で構成してもよい。また、この公衆通信網2は、有線通信網に限定されるものではなく、無線通信網で実現するようにしてもよい。
端末装置3は、例えば、パーソナルコンピュータ(PC)、携帯電話、携帯情報端末(PDA)等であり、少なくともユーザの操作に基づいて公衆通信網2を介して通信可能なデバイスである。以下の例では、この端末装置3につき、PCを適用する場合を例にとり説明をする。
図2は、端末装置3の具体的な構成例を示している。この端末装置3は、ROM(Read Only Memory)22と、データの蓄積や展開等に使用する作業領域としてのRAM(Random Access Memory)23と、端末装置3全体を制御するためのCPU(Central Processing Unit)24と、操作ボタンやキーボード等を介して各種制御用の指令を入力するための操作部25と、各種情報の表示を制御するための表示制御部16と、ハードディスク等に代表され、実行すべき検索を行うためのプログラムを格納するための記憶部27とが内部バス21にそれぞれ接続されている。さらに、この内部バス21には、通信I/F28が接続されている。また、表示制御部16には、実際に情報を表示するモニタとしての表示部26が接続されている。
ROM22は、端末装置3全体のハードウェア資源を制御するためのプログラムが格納されている。なお、このROM22の代替として、例えば、EEPROM(Electronically Erasable and Programmable Read Only Memory)等の記憶媒体を適用するようにしてもよい。
RAM23は、端末装置3全体のハードウェア資源を制御するときの各種命令を一時的に記憶する。このRAM23の代替として、上記EEPROMやCD−R/RW等の記憶媒体を適用するようにしてもよい。
CPU24は、内部バス21を介して制御信号を送信することにより、端末装置3内に実装された各構成要素を制御するためのいわゆる中央演算ユニットである。また、このCPU24は、操作部25を介したユーザの操作に応じて各種制御用の指令を内部バス21を介して伝達する。
操作部25は、マウスやキーボード等で具体化され、ユーザが実際に書籍から検索を望む文字列を入力するために使用される他、上記プログラムを実行するための実行命令がユーザから入力される。この操作部25は、上記実行命令がユーザにより入力された場合には、これをCPU24に通知する。この通知を受けたCPU24は、上記プログラムを記憶部27から読み出して実行する。
表示制御部16は、CPU24による制御に基づいて表示画像を作り出すグラフィックコントローラにより構成されている。この表示制御部16に接続される表示部26は、例えば、液晶ディスプレイ(LCD)等によって実現される。
記憶部27は、ハードディスクで構成される場合において、CPU24による制御に基づき、各アドレスに対して所定の情報が書き込まれるとともに、必要に応じてこれが読み出される。また、この記憶部27には、本発明を実行するためのプログラムが格納されている。このプログラムはCPU24により読み出されて実行されることになる。
通信I/F28は、公衆通信網2と接続するための回線制御回路と、他の端末装置との間でデータ通信を行うための信号変換装置としてのモデム等によって実現される。この通信I/F28は、内部バス21からの各種命令に変換処理を施してこれを公衆通信網2側へ送出するとともに、公衆通信網2からのデータを受信した場合にはこれに所定の変換処理を施して内部バス21、或いはCPU24へ送信する。
サーバ4には、インデックスデータベース5が構築されている。このインデックスデータベース5には、紙媒体として具体化される文書毎に予め作成されたインデックスデータが記憶されている。このインデックスデータが作成される文書は、紙媒体として具体化できるものであれば書籍、広告、ちらし、雑誌等、いかなるものであってもよい。
図3は、サーバ4に構築されているインデックスデータベース5に記録されるインデックスデータのイメージ図を示している。このインデックスデータは、文書に印刷された文字列51と、その位置情報52とが互いに関連付けされた状態で構築されている。例えば文字列“旅行”に対して、位置情報として“0x0064c”、“0x0068d”、“0x0071c”、・・・が並べられているものとする。各位置情報は、それぞれ文字列“旅行”が実際の文書において印刷されているページと行に対応するものである。即ち、一の位置情報“0x0064c”を識別することができれば、文字列“旅行”が例えば文書における123ページの12行目に印刷されていることを表すことが可能となる。ちなみに位置情報としては、ページ、行を表すものに加えて、何文字目に表示されているかを示すものであってもよいし、さらに、文書の章や段落を示すものであってもよい。即ち、一の位置情報は、章、段落、ページ、行の何れか1以上に対応するものであればよい。また位置情報は、文字列毎にそれぞれ割り当てられている。例えば、“時計”という文字列には、“0x0073c”、“0c0023d”、“0y0011c”、・・・という位置情報が割り当てられ、それぞれの文書において実際に印刷された位置に対応している。
ちなみに、このインデックスデータは、紙媒体が例えば書籍等の場合には、書籍を印刷する際に必ず必要になるものであることから、これを取得することでインデックスデータベース5を順次構築していくことが可能となる。
本発明を適用した検索文字列位置情報表示システム1の動作について説明をする。
先ず、ユーザは、検索を望む文字列が印刷されている紙媒体として具体化される文書名を操作部25を介して入力する。この文書名の入力は、文書が書籍である場合には書籍の題名を介して行うようにしてもよいし、著者名や出版社名を介して行うようにしてもよい。CPU24は、この操作部25を介した文書名の入力を受けて通信I/F28から公衆通信網2を介してサーバ4へとアクセスする。そして、このサーバ4に対して、入力された文書名に対応する文書のインデックスデータの有無を確認する。仮に、このサーバ4内に、入力された文書名に関するインデックスデータが存在する場合には、サーバ4は、公衆通信網2を介してその旨を端末装置3へと通知する。端末装置3は、CPU24による制御の下、ユーザに対して検索を望む文字列の入力を要求する。この要求は、例えば表示制御部16を介して表示部26から実行するようにしてもよい。
ユーザは、この文字列の入力要求に対して検索を望む所望の文字列を入力する。CPU24は、この操作部25を介した文字列の入力を受けて通信I/F28から公衆通信網2を介してサーバ4へとアクセスする。そして、このサーバ4に対して、入力された文字列がインデックスデータ中に存在するか否か確認する。仮に、このサーバ4内に、文字列がインデックスデータ中に存在する場合には、当該文字列に対応する位置情報の全てを読み出して、これを公衆通信網2を介して端末装置3へと送信する。仮に図3の例において、文字列“旅行”が入力された場合には、これに対応する全ての位置情報“0x0064c”、“0x0068d”、“0x0071c”、・・・を送信する。端末装置3は、この文字列に対応する位置情報を公衆通信網2を介して受信し、これをCPU24の制御の下、表示制御部16を介して表示部26へと表示する。
この表示部26への位置情報の表示はいかなる方法で実行するようにしてもよい。図4は、表示部26からの位置情報の表示例を示している。この表示例では、本の形状に類似させた枠31内に1章、2章、3章、・・・n章と章毎に区切り、上記入力された文字列の出現頻度が各章についてどれくらい分布しているかを色彩又は色彩の濃淡を介して表示する。文字列の各章における出現頻度は、取得した位置情報を介して容易に計算することができる。
この位置情報は、章毎の出現頻度のみならず、例えばページ毎、行毎に計算するようにしてもよい。枠32には、ページ毎に計算した出現頻度を色彩又は色彩の濃淡を介して表した結果を、また、枠33には、行毎に計算した出現頻度を色彩又は色彩の濃淡を介して表した結果を示している。
表示部26から、最初に枠31を表示することにより、ユーザは、入力した文字列の出現頻度の章毎の分布を識別することができる。そして、ユーザは、入力した文字列につき3章におけるページ毎の分布の確認を望む場合には、この枠31における3章の部分を操作部25を介して指定する。これにより、入力した文字列の3章における出現頻度を色彩の濃淡を介して表した枠32が表示部26を介して表示されることになる。この枠32を介してユーザは、3章を構成するページ毎に文字列の出現頻度を確認することができる。
ユーザは、入力した文字列につき、ページを構成する行毎に分布の確認を望む場合には、この枠32における所望のページ(図4の例でいう72ページ)を操作部25を介して指定する。端末装置3は、この操作部25を介した指定を受けて、表示部26により枠33を表示する。この枠33は、入力された文字列の出現頻度をさらに72ページの行毎に色彩又は色彩の濃淡を介して表している。
このように文書としての書籍を、章、ページ、行毎に階層化させて表示することにより、ユーザにとって視認性、操作性を向上させることができ、文字列が文書において実際にどの位置に表示されているかを容易に識別するか可能となる。また、章、ページ、行にこだわることなく、文書のいかなる記載構成に基づいて、広い範囲から狭い範囲にかけて表示画面を階層化するようにしてもよいことは勿論である。
なお本発明では、出現頻度を表示すること以外に、文字列の類似度を表示するようにしてもよい。かかる場合において、ユーザは、文字列の入力要求に対して検索を望む所望の文字列を複数個に亘り入力する。CPU24は、この操作部25を介した複数個に亘る文字列の入力を受けて通信I/F28から公衆通信網2を介してサーバ4へとアクセスする。そして、サーバ4から、この入力された複数個に亘る文字列の位置情報を上述の如きプロセスにより取得する。これとともに、この複数個に亘る文字列間の類似度を計算する。この類似度の計算は、周知のいかなる方法を利用して行うようにしてもよい。また、この類似度の意味するところもいかなるものであってもよい。例えば、“研究”という文字列と“発表”という文字列の出現位置は、互いに相関性を持っている場合が多い。即ち、“研究”という文字列が使用されているページや章では、同時に“発表”という文字列も高い確率でしようされている。更には“研究発表”という一つのキーワードとして用いられる場合もある。このように互いに出現位置について相関性を持っている文字列の類似度を高いものとして定義し、相関性の低い文字列の類似度を低いものとして定義するようにしてもよい。
この類似度の計算は、端末装置3内で行うようにしてもよいが、サーバ4に接続された図示しない中央制御装置により計算し、その計算結果のみを公衆通信網2を介して端末装置3へ送るようにしてもよい。端末装置3は、この計算された類似度を表示部26を介して表示する。
さらに、本発明では、入力された文字列の出現頻度、類似度を表示することに加え、出現頻度と類似度とから所定の演算式に基づいてスコアを計算し、これを表示するようにしてもよい。ちなみに、このスコアは、例えば類似度の総和で表すようにしてもよい。かかる場合には、入力された複数個の文字列の類似度をあるページにつき検索した結果、類似する文字列が3個に亘り検出され、その類似度がそれぞれ0.2、0.5、0.99であった場合、出現頻度はページ当たり3個、スコアは、0.2+0.5+0.99の総和で表されることになる。即ち、このスコアは、類似度が高いほど、またページ当たりの出現頻度が多くなるほど、値が大きくなる。このスコアを図4における色彩又は色彩の濃淡を介して表示するようにしてもよい。
図5は、表示部26からの位置情報の他の表示例を示している。この表示例では、文字列の出現頻度を色彩又は色彩の濃淡で表す代わりに、線の数を介して表示している。この例では、枠35から枠36にかけて、文書中の広い範囲から狭い範囲にかけて表示画面を階層化し、出現頻度を線の数を介して表示する。ユーザはマウスクリックを介して順次下位層を拡大表示させ、文字列の分布状況等を即座に把握することが可能となる。このとき、上述したスコア又は類似度を、線の太さを介して表示するようにしてもよい。
このように、ユーザは、自らが与えた文字列に対する検索結果から、実際の文書内の出現位置を直接的に識別することが可能となる。ユーザが実際に書籍を読む際において、検索を望む文字列がいかなる章のいかなるページの何行目に印刷されているのか、即座に把握したい場合もある。特に所望の文字列の章毎、ページ毎に出現頻度を確認したい場合もある。かかる場合において、本発明は、書籍中における文字列の分布情報を一括して確認できる点において有用である。
特に、本発明では、印刷物としての書籍中の文書につき、電子化された全文データを利用することなく、あくまでインデックスデータのみを活用することで上述した検索を実現することができる。このため、より便宜的な検索を実現することができることに加え、全文データを利用しない点において著作権等の問題が生じることがなくなり、実際の運用面における障壁も取り除くことが可能となる。
また、電子データを介して得ることができる位置情報は、概して紙媒体として具体化される文書の印刷位置に対応していることが少ないが、本発明は、文字列をあくまで紙媒体としての文書の印刷位置に対応した位置情報を表示することができる。しかも本発明では、検索を望む文字列の位置情報を出現頻度、類似度又はスコア等のパラメータを介してグラフィカルに表示させることができ、目次や索引等から所望の文字列を探し出していた従来と比較して、その検索効率を格段に向上させることができる。
なお、上述した例では、サーバ4においてインデックスデータを一括管理し、公衆通信網2に接続された各端末装置3からこれにアクセスすることで、位置情報を取得する場合について説明したが、かかる構成に限定されるものではない。
例えば、サーバ4に構築されているインデックスデータベース5そのものを各端末装置3の記憶部27内に構築するようにしてもよい。また、各端末装置3からの要求に基づいて所望の文書のインデックスデータを公衆通信網2を介してサーバ4からダウンロードし、これを端末装置3内において格納するようにしてもよい。これにより、検索の都度、公衆通信網2を介すことなく、あくまで端末装置3内で入力動作から、検索動作、表示動作までを一括して行うことが可能となる点において有用となる。
またこのインデックスデータベース5そのもの、又はインデックスデータベース5における所定のインデックスデータのみを、例えば可搬性の記録媒体(CD、DVD等)に焼付け、これを流通させるようにしてもよい。この記録媒体に記録されている情報を端末装置3内の記憶部27に記憶させることで、端末装置3内においてユーザは自由に検索処理を行うことが可能となる。即ち、記憶部27として着脱自在な記録媒体として構成してもよいことになる。
また、この記録媒体を販売すべき書籍に添付するようにしてもよい。このとき記録媒体には、販売すべき書籍に印刷されている各文字列の位置情報をまとめたインデックスデータを記録しておく。これにより、書籍を購入したユーザは、これに添付されている記録媒体に記録されているインデックスデータを取得することができ、端末装置3を介してこれにアクセスすることで、当該書籍に印刷されている所望の文字列の位置情報を随時取得することが可能となる。
さらに、端末装置3自体を、記憶部27内にインデックスデータベース5が予め構築されているものとして具現化するようにしてもよいことは勿論である。即ち、本発明は、検索文字列位置情報表示システム1として具現化される以外に、いわゆる検索文字列位置情報表示装置として具現化されるようにしてもよいし、その方法として具現化されるようにしてもよい。さらに本発明は、上述した検索表示フローを実行するプログラムとして具現化されるようにしてもよいことは勿論である。
また、本発明は、例えば、書籍の通販サービスのホームページにおいて、組み合わせて実行するようにしてもよい。ユーザが購入する書籍を選ぶ際に、所望のキーワードがどれくらい含まれているかを確認したい場合もある。かかる場合において、通販サービスのホームページにおいて、購入を望む書籍に対して上述した検索を行うことにより、上述した表示画面を視認することができ、購入対象選定のための的確な指針を得ることが可能となる。
また、本発明では、購入対象選定のための便宜を図る観点から、例えば、図6に示すような、いわゆるキーワードマップを表示するようにしてもよい。このキーワードマップは、要素とこれらを連結する線の太さで表現される。
要素A〜Fには、それぞれ文字列が割り当てられる。この要素A〜Fにそれぞれ割り当てられる文字列は、例えばジャンル毎等に応じてグループ分けされた文字列群であり、互いにある程度類似していることが望ましい。
先ず、上述した検索対象の文書においてこの要素A〜Fに割り当てられた文字列について、上述したプロセスに基づいて出現頻度を計算する。この出現頻度は、章毎、ページ毎等、各種カテゴリ別に求めるようにしてもよい。次に、要素A〜Fの類似度を計算する。計算した出現頻度は要素のサイズを介して表現する。また、計算した類似度は線の太さを介して表現する。即ち、出現頻度が多くなるほど要素のサイズを大きくし、類似度が高くなるほど線を太くする。
図6の例では、要素Aに割り当てられた文字列の出現頻度が最も高く、次いで要素D、要素Cの順で出現頻度が高くなる。また、要素Aに割り当てられている文字列は、要素Fに割り当てられている文字列が最も類似度が高く、次いで要素Cに割り当てられている文字列が、次いで要素Bに割り当てられている文字列の類似度が高い傾向が示されている。
即ち、ユーザは、図6の表示画面を視認することにより、要素A〜Fに割り当てられている文字列の出現頻度並びにそれらの間の類似度を容易に識別することが可能となる。しかもユーザは、この要素A〜Fに割り当てられている文字列の出現頻度並びにそれらの間の類似度を、書籍全体、章毎、ページ毎等、任意に指定した上で、これを識別することができる。この図6の表示画面上において各要素に割り当てられている文字列の指定を受け付けた場合には、当該文字列につき、文書における実際の位置情報を取得して枠31〜33又は枠35〜36を介して表示するようにしてもよい。
また、文字列の出現頻度並びにそれらの間の類似度を要素の大きさや線の太さで表示する場合のみならず、例えば要素間の距離、要素間の角度、要素の位置等を介して表示するようにしてもよい。また、要素の表示は2次元的に表示する場合のみならず、3次元的に表示するものであってもよい。また、文字列の上位概念から下位概念にかけて、これに割り当てられた要素を階層化させて表示するものであってもよい。
更に、この要素に割り当てられる文字列をユーザが自ら入力するようにしてもよい。これにより、ユーザが例えば読書中等において所望の文字列からなるキーワードマップの作成を望む場合に、例えば、操作部25を介してこれを入力することができる。
本発明を適用した検索文字列位置情報表示システムの構成図である。 端末装置の具体的な構成例を示す図である。 サーバに構築されているインデックスデータベースに記録されるインデックスデータのイメージ図である。 表示部からの位置情報の表示例を示す図である。 表示部からの位置情報の他の表示例を示す図である。 いわゆるキーワードマップを表示する例を示す図である。
符号の説明
1 検索文字列位置情報表示システム
2 公衆通信網
3 端末装置
4 サーバ
5 インデックスデータベース
16 表示制御部
21 内部バス
22 ROM
23 RAM
24 CPU
25 操作部
26 表示部
27 記憶部
28 通信I/F
31〜33、34、35 枠

Claims (14)

  1. 紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶手段と、
    ユーザが検索を望む文字列を入力するための文字列入力手段と、
    上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記記憶手段に記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索手段と、
    上記文字列検索手段により読み出された位置情報に関する表示を行う表示手段とを備えること
    を特徴とする検索文字列位置情報表示装置。
  2. 上記記憶手段は、文字列が紙媒体に実際に印刷されている章、段落、ページ、行の何れか1以上を表す上記位置情報を関連付けしたインデックスデータを記憶すること
    を特徴とする請求項1記載の検索文字列位置情報表示装置。
  3. 上記文字列検索手段により読み出された位置情報に基づいて、検索すべき文字列の上記紙媒体における出現頻度を算出する演算手段を更に備え、
    上記表示手段は、上記紙媒体の章、段落、ページ、行の何れか1以上に対応させた表示画面に上記出現頻度を表示すること
    を特徴とする請求項2記載の検索文字列位置情報表示装置。
  4. 意味的に類似する文字列を上記インデックスデータから検索した場合にはその類似度を算出する演算手段を更に備え、
    上記表示手段は、上記紙媒体の章、段落、ページ、行の何れか1以上に対応させた表示画面に上記類似度を表示すること
    を特徴とする請求項2記載の検索文字列位置情報表示装置。
  5. 上記文字列検索手段により読み出された位置情報に基づいて、検索すべき文字列の上記紙媒体における出現頻度を算出し、また意味的に類似する文字列を上記インデックスデータから検索した場合にはその類似度を算出し、また上記出現頻度と上記類似度とに基づいてスコアを計算する演算手段を更に備え、
    上記表示手段は、上記紙媒体の章、段落、ページ、行の何れか1以上に対応させた表示画面に対して上記スコアを表示すること
    を特徴とする請求項2記載の検索文字列位置情報表示装置。
  6. 上記表示手段は、上記出現頻度、類似度又は上記スコアを、色彩又は色彩の濃淡を介して表示すること
    を特徴とする請求項3〜5のうち何れか1項記載の検索文字列位置情報表示装置。
  7. 上記表示手段は、上記出現頻度を上記表示画面中の線の数を介して表示し、上記スコア又は類似度を、上記線の太さを介して表示すること
    を特徴とする請求項3〜5のうち何れか1項記載の検索文字列位置情報表示装置。
  8. 上記表示手段は、上記紙媒体中の記載構成に基づいて、広い範囲から狭い範囲にかけて上記表示画面を階層化し、各階層の上記表示画面に対して上記出現頻度、上記類似度、スコアの何れかを表示すること
    を特徴とする請求項3〜7のうち何れか1項記載の検索文字列位置情報表示装置。
  9. 紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶手段と、
    予め設定した文字列群における各文字列を所定の形状からなる要素に割り当て、上記各文字列の上記紙媒体中の出現頻度並びに上記文字列間の類似度を、上記要素のサイズ、上記要素間を連結する線の太さ、要素間の距離、要素間の角度、要素の位置のいずれかを介して表現する表示手段と、
    ユーザが検索を望む文字列を上記表示手段に表示されている要素又は線を介して指定するための文字列入力手段と、
    上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記記憶手段に記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索手段とを備え、
    上記表示手段は、上記文字列検索手段により読み出された位置情報に関する表示を行う表示手段とを備えること
    を特徴とする検索文字列位置情報表示装置。
  10. 上記文字列入力手段は、ユーザから上記文字列群の入力を受け付けること
    を特徴とする請求項9記載の検索文字列位置情報表示装置。
  11. 上記記憶手段は、上記着脱自在な記録媒体で構成されていること
    を特徴とする請求項1〜10のうち何れか1項記載の検索文字列位置情報表示装置。
  12. 紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶するサーバと、
    上記サーバに対して通信回線を介してアクセス可能な端末装置とを備え、
    上記端末装置は、
    ユーザが検索を望む文字列を入力するための文字列入力手段と、
    上記通信回線を介してサーバにアクセスし、上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記サーバに記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索手段と、
    上記文字列検索手段により読み出された位置情報に関する表示を行う表示手段とを備えること
    を特徴とする検索文字列位置情報表示システム。
  13. 紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶する記憶ステップと、
    ユーザが検索を望む文字列の入力を受け付ける文字列入力ステップと、
    上記文字列入力ステップにおいて入力された文字列又はこれに意味的に類似する文字列を上記記憶ステップにおいて記憶したインデックスデータから検索し、検索した上記文字列に予め関連付けされている位置情報を読み出す文字列検索ステップと、
    上記文字列検索ステップにおいて読み出した位置情報に関する表示を行う表示ステップとを有すること
    を特徴とする検索文字列位置情報表示方法。
  14. 紙媒体に印刷された文字列とその位置情報とを関連付けたインデックスデータを予め記憶する記憶手段と、ユーザが検索を望む文字列を入力するための文字列入力手段とを有するコンピュータに実装され、
    上記文字列入力手段を介して入力された文字列又はこれに意味的に類似する文字列を上記記憶手段に記憶されたインデックスデータから検索し、検索された上記文字列に予め関連付けされている位置情報を読み出す文字列検索ステップと、
    上記文字列検索ステップにおいて読み出した位置情報に関する表示を行う表示ステップとをコンピュータに実行させるためのプログラム。
JP2006273877A 2006-10-05 2006-10-05 検索文字列位置情報表示装置 Withdrawn JP2008090781A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006273877A JP2008090781A (ja) 2006-10-05 2006-10-05 検索文字列位置情報表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006273877A JP2008090781A (ja) 2006-10-05 2006-10-05 検索文字列位置情報表示装置

Publications (1)

Publication Number Publication Date
JP2008090781A true JP2008090781A (ja) 2008-04-17

Family

ID=39374830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006273877A Withdrawn JP2008090781A (ja) 2006-10-05 2006-10-05 検索文字列位置情報表示装置

Country Status (1)

Country Link
JP (1) JP2008090781A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222093A (zh) * 2011-06-09 2011-10-19 中国工程物理研究院计算机应用研究所 一种获取字符串最长公共子串的方法
JP2019159906A (ja) * 2018-03-14 2019-09-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222093A (zh) * 2011-06-09 2011-10-19 中国工程物理研究院计算机应用研究所 一种获取字符串最长公共子串的方法
JP2019159906A (ja) * 2018-03-14 2019-09-19 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP6998245B2 (ja) 2018-03-14 2022-01-18 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP4768537B2 (ja) コンテンツ閲覧システムおよびプログラム
US9632652B2 (en) Switching search providers within an application search box
US6880132B2 (en) Method and apparatus for arranging and displaying files or folders in a three-dimensional body
US7908284B1 (en) Content reference page
US9569541B2 (en) Evaluating preferences of content on a webpage
JP2018503895A (ja) ウェブコンテンツのタグ付けおよびフィルタリング
KR20120037401A (ko) 통합 디지털 북 및 줌 인터페이스 디스플레이
US20120136892A1 (en) Book content distribution system and content server
US20030197738A1 (en) Navigational, scalable, scrolling ribbon
JP2008226061A (ja) 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム
KR20110099225A (ko) 제안된 미세 조정 용어 및 버티컬 검색의 검색 결과 미리보기
JP2011516942A (ja) アプリケーション・ページからのサービス・プレビュー及びアクセス
US20120159301A1 (en) Semantically enabled, data sensitive negotiation and collaboration engine
US20140379701A1 (en) Chronology providing method, chronology providing apparatus, and recording medium containing chronology providing program
JP2005202952A (ja) グラフィカル的に表示されたアイコンを利用するデータ項目をアクセスし、選択するための方法およびシステム
US20140082550A1 (en) Systems and methods for integrated query and navigation of an information resource
JP5727684B1 (ja) 閲覧装置、表示制御方法、記録媒体、ならびに、プログラム
KR101350525B1 (ko) 질의에 대응하는 탭을 사용하여 추가적인 정보를 제공하는방법 및 그 장치
JP2007080109A (ja) データ表示装置、データ表示方法、およびその方法をコンピュータに実行させるプログラム
US10216363B2 (en) Navigating a network of options
JP5881937B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2008090781A (ja) 検索文字列位置情報表示装置
US20140115525A1 (en) Systems and methods for integrated query and navigation of an information resource
JP2010165120A (ja) 電子情報表示装置及び電子情報表示方法
JP2014222448A (ja) 書籍抽出装置、書籍抽出方法及び書籍抽出用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090928

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20110201

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110301