JP2009230210A - テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法 - Google Patents

テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法 Download PDF

Info

Publication number
JP2009230210A
JP2009230210A JP2008071627A JP2008071627A JP2009230210A JP 2009230210 A JP2009230210 A JP 2009230210A JP 2008071627 A JP2008071627 A JP 2008071627A JP 2008071627 A JP2008071627 A JP 2008071627A JP 2009230210 A JP2009230210 A JP 2009230210A
Authority
JP
Japan
Prior art keywords
search
character string
text sentence
user terminal
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008071627A
Other languages
English (en)
Other versions
JP2009230210A5 (ja
JP5270199B2 (ja
Inventor
Katsuyoshi Nagashima
克佳 長嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2008071627A priority Critical patent/JP5270199B2/ja
Publication of JP2009230210A publication Critical patent/JP2009230210A/ja
Publication of JP2009230210A5 publication Critical patent/JP2009230210A5/ja
Application granted granted Critical
Publication of JP5270199B2 publication Critical patent/JP5270199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 検索文字を強調表示し、ユーザが検索文字および特定表示を迅速に発見させる。
【解決手段】 インターネット12を介して検索エンジン14からユーザ端末10が受信するウェブサイト情報をダウンロード手段16によりユーザ端末10の記憶手段18に記憶し、記憶手段18からウェブサイト情報を読出し、テキスト文章に含まれる改行記号およびスペース記号を第1編集手段20により除去してから、分断されたテキスト文章を連結し第2編集手段22により連結テキスト文章を生成し、ユーザ端末10のディスプレイ24上の入力ボックス26に入力された検索文字列の色、サイズ、および背景色の情報に基づいてヒット文字強調手段28によりヒット文字列書式に書き換え、第3編集手段30により強調表示テキスト文章を生成し、ユーザ端末10のディスプレイ24上に強調表示手段32によりブラウザ表示する。
【選択図】 図1

Description

本発明は、テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法に関し、より詳細には、インターネット上に設けられた検索エンジンの出力情報の中に存在するであろう所定の検索文字を強調表示し、ユーザがその検索文字およびその周辺に存在するであろう特定表示を迅速に発見できるテキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法に関する。
従来は、検索対象文書と単語辞書から正規表現辞書と単語索引を作成し、正規表現辞書と単語索引を用いて高速に文書検索を行なうように、単語辞書から、長さが等しい文字列の集合を表わす正規表現辞書を作成し、検索対象文書中に含まれ、かつ正規表現辞書中の正規表現に照合する文字列について、着目索引要素を演繹できる他の索引要素がない場合に、索引要素を単語索引に記録することにより、索引容量をあまり増やすことなく、高速な全文検索 ができる単語索引を作成し、この単語辞書と正規表現辞書と単語索引を用いて、文書検索 装置 により検索対象文書を検索することにより、文字数が少なく重なりの少ない単語で検索対象文字列が被覆される場合でも検索効率が低下せず、高速に全文検索ができる。この検索対象文書に含まれない特別な文字を終端文字として1文字追加した拡大文字セットを用い、検索対象文書の前後に、必要なだけ終端文字を付加して拡大検索 対象文書とし、拡大文字セットを文字セットとして用い、拡大検索対象文書を検索対象文書として用いた辞書索引作成装置が知られている(特許文献1)。
特開平10−334118号公報
しかしながら、従来の辞書索引作成装置では、検索文字列を拡大文字によりディスプレイに表示するが、検索文字列が表示される毎に文章は改行されディスプレイに表示されている情報量を減少させるという問題が発生した。
また、従来の辞書索引作成装置では拡大表示した文字列と原文が重畳し、ユーザが目視するには酷であるという課題も存在する。
本発明は、この問題に対応してなされたものであり、インターネット上に設けられた検索エンジンの出力情報の中に存在するであろう所定の検索文字を強調表示し、ユーザがその検索文字およびその周辺に存在するであろう特定表示を迅速に発見できるテキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法を提供することを目的とする。
上記目的を達成するために、本発明のコンピュータソフトウエアプログラムは、例えば、ブラウザ表示機能を有するユーザ端末に文字列に基づくテキスト検索処理を実行させるコンピュータソフトウエアプログラムであって、インターネットを介して検索エンジンからユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段によりユーザ端末の記憶手段に記憶する検索結果記憶機能と、記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成機能と、連結テキスト文章の中の検索文字列に対してユーザ端末のディスプレイ上の入力ボックスに入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成機能と、強調表示テキスト文章をユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示機能と、を備えることを要旨とする。
上記目的を達成するために、本発明のコンピュータソフトウエアプログラムは、例えば、ブラウザ表示機能を有するユーザ端末に文字列に基づくテキスト検索処理を実行させるコンピュータソフトウエアプログラムであって、複数のウェブサイトをインターネットを介して巡回しウェブサイト情報を収集しながら、コンピュータにより検索用の索引を巡回するウエブサイトに対応させてそれぞれ生成し蓄積する検索エンジンに対し、インターネットを介してユーザ端末からアクセスしユーザ端末のディスプレイ上に検索エンジンの文字検索入力画面をブラウザ表示すると共に、この文字検索入力画面の近傍に位置し検索文字列、該検索文字列の色、該検索文字列のサイズ、該検索文字列の背景色をそれぞれユーザが入力する入力ボックスを入力ボックス表示手段によりブラウザ表示するブラウザ機能と、入力ボックスへユーザが指定する検索文字列、検索文字列の色、検索文字列のサイズ、検索文字列の背景色の情報をそれぞれポインタやキーボードを含む入力手段を介して入力する検索文字列入力機能と、ユーザ端末から検索エンジンにインターネットを介して文字検索入力画面上で入力するテキスト検索情報を送信し検索処理を起動させるテキスト検索機能と、インターネットを介して検索エンジンからユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段によりユーザ端末の記憶手段に記憶する検索結果記憶機能と、記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成機能と、連結テキスト文章の中の検索文字列に対して入力ボックスに入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成機能と、強調表示テキスト文章をユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示機能と、を備えることを要旨とする。
上記目的を達成するために、本発明のテキスト検索処理方法は、例えば、ブラウザ表示機能を有するユーザ端末によるテキスト検索処理方法であって、インターネットを介して検索エンジンからユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段によりユーザ端末の記憶手段に記憶する検索結果記憶ステップと、記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成ステップと、連結テキスト文章の中の検索文字列に対してユーザ端末のディスプレイ上の入力ボックスに入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成ステップと、強調表示テキスト文章をユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示ステップと、を含むことを要旨とする。
上記目的を達成するために、本発明のテキスト検索処理方法は、例えば、ブラウザ表示機能を有するユーザ端末に文字列に基づくテキスト検索処理方法であって、複数のウェブサイトをインターネットを介して巡回しウェブサイト情報を収集しながら、コンピュータにより検索用の索引を巡回するウエブサイトに対応させてそれぞれ生成し蓄積する検索エンジンに対し、インターネットを介してユーザ端末からアクセスしユーザ端末のディスプレイ上に検索エンジンの文字検索入力画面をブラウザ表示すると共に、この文字検索入力画面の近傍に位置し検索文字列、該検索文字列の色、該検索文字列のサイズ、該検索文字列の背景色をそれぞれユーザが入力する入力ボックスを入力ボックス表示手段によりブラウザ表示するブラウザステップと、入力ボックスへユーザが指定する検索文字列、検索文字列の色、検索文字列のサイズ、検索文字列の背景色の情報をそれぞれポインタやキーボードを含む入力手段を介して入力する検索文字列入力ステップと、ユーザ端末から検索エンジンにインターネットを介して文字検索入力画面上で入力するテキスト検索情報を送信し検索処理を起動させるテキスト検索ステップと、インターネットを介して検索エンジンからユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段によりユーザ端末の記憶手段に記憶する検索結果記憶ステップと、記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成ステップと、連結テキスト文章の中の検索文字列に対して入力ボックスに入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成ステップと、強調表示テキスト文章をユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示ステップと、を含むことを要旨とする。
以上のように、インターネット上に設けられた検索エンジンの出力情報の中に存在するであろう所定の検索文字を強調表示し、ユーザがその検索文字およびその周辺に存在するであろう特定表示を迅速に発見できるテキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法を提供することができる。
本発明の実施の一形態を図1乃至図14に基づいて説明する。本実施形態のコンピュータソフトウエアプログラム1(以下、「ソフトウエア」と略記する。)は、概略的には、ブラウザ表示機能を有するユーザ端末10に文字列に基づくテキスト検索処理を実行させるコンピュータソフトウエアプログラム1であって、インターネット12を介して検索エンジンサーバ14a乃至14cからユーザ端末10が受信する検索対象のウェブサイト情報をダウンロード手段16によりユーザ端末10の記憶手段18に記憶する検索結果記憶機能と、記憶手段18からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段20により除去してから、分断されたテキスト文章を連結し第2編集手段22により連結テキスト文章を生成する連結テキスト文章生成機能と、連結テキスト文章の中の検索文字列に対してユーザ端末10のディスプレイ24上の入力ボックス26に入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段28によりヒット文字列書式に書き換えてから、ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段30により強調表示テキスト文章を生成する強調表示テキスト文章生成機能と、強調表示テキスト文章をユーザ端末10のディスプレイ24上に強調表示手段32によりブラウザ表示46する検索文字列強調表示機能と、を備えるソフトウエアである。
図1は、テキスト検索システムの全体構成を概略的に示すブロック図で、図示するテキスト検索システムは、情報処理装置としてのパーソナルコンピュータ等のユーザ端末10が、複数の検索エンジンサーバ14a〜14c、例えば、バーチャル・プライベート・ネットワークVPN、ローカル・エリア・ネットワークLAN、ADSL、FTTHを経由し相互接続するネットワークであるインターネット12に接続され、これらの検索エンジンサーバ14a〜14c「例えば、Google(登録商標)、Yahoo(登録商標)、MSN(登録商標)」からコンピュータ上の情報を一定の目的に沿って表示し閲覧に供するブラウザ「例えば、インターネツトエクスプローラ(登録商標)、Firefox(登録商標)、Opera(登録商標)」を利用してユーザ端末10のにダウンロードする。CPU19はウエブサイト情報をブラウザにプラグインされたソフトウエア1と協同しユーザ端末10の記憶手段であるRAM17(ランダムアクセスメモリ)若しくはHDD18(ハードディスクドライブ)に記憶し、この記憶手段からウェブサイト情報を読み出し、加工若しくは編集しディスプレイ24上にブラウザ画面46上に表示する。
ここで、ソフトウエア1は、店舗でパッケージとして購入しユーザ端末本体15へインストールてもよく、ソフトウエア提供サーバ42からインターネット12を介してソフトウエア1aをユーザ端末本体15へダウンロードしてもよい。そして、ソフトウエア1は、ダウンロード手段16、第1編集手段20、第2編集手段、ヒット文字強調手段28、第3編集手段30、強調表示手段32、および入力ボックス表示手段が実装されている。このソフトウエア1は、RAM17若しくはHDD18に記憶しCPU19(制御手段)により読出して実行される。
また、ソフトウエア1は、ユーザ端末10に内蔵されるHDD(ハードディスク)や、外付けされる記憶装置、例えばCD−RW、磁気ディスク、光ディスク、光磁気ディスクのほかフラッシュメモリICカード、EEPROMカートリッジ、磁気テープ、USBメモリなどのコンピュータ読み取り可能な記録媒体を用いて格納することができる。
さらに、ユーザ端末10は、キーボード38およびポインティングデバイスであるマウス36のような入力手段40を備え、強調表示文字列の入力ボックス26や検索エンジンサーバ14a乃至14cへ送信する検索文字の入力ボックス44の入力指定を操作し、検索文字列をキーボード38から入力することができる。
図2は、検索エンジンサーバ14cから受信したブラウザ画面46である。このブラウザ画面46の左側には検索エンジンサーバ14cに送信する検索文字を入力する入力ボックス44と、この入力ボックス44に入力されたキーワードにヒットした所定長のテキスト文章をソフトウエア1により編集加工したウエブサイト情報48と、ウエブサイト情報48の中にヒットした文字列が強調表示テキスト文章48として表示する。また、ブラウザ画面46の右側には検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報を入力する入力ボックス26がマトリクス状に表示する。例示するブラウザ画面では、(スコアリング システム 「CRE)の文字列を含む複数行のテキスト文章の中に「システム」の文字列を強調表示するので、ユーザは容易に興味のある検索文字を視認することができる。
図3は、本実施形態のソフトウエア1の実行シーケンスを例示するフローチャートである。ユーザ端末10はブラウザ機能を実現し検索エンジンの入力ボックス44へキーボード30(図1参照)を用いて検索文字列を入力するステップ50(以下、ステップを「S」として略記する。)を実行する。次に、ユーザはキーボード30またはマウス36を用いて検索文字列の入力ボックス26を指定し、この入力ボックス26の中の検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報を入力する(S51)。
CPU19は、検索文字列入力機能が実行された否かを判定する(S52)。検索文字列が入力された場合は送信キーの入力処理S53へ分岐するが検索文字列が未入力の場合は検索文字列入力機能S51へ処理を復帰させ検索入力が確定するまでS52の検知シーケンスを繰り返す。そして、CPU19は送信キー(「Enter」キーの押下またはマウス36のクリック操作)の信号を検知した時は「入力あり」と判定し処理を記憶処理S55へ分岐させるが、未入力の場合は検索文字列入力機能S51へ処理を復帰させ検索入力が確定するまでS52の検知シーケンスを繰り返す。
図中のS55は、ユーザ端末10からブラウザ機能を実行しインターネット12を経由して任意の検索エンジンサーバ14a乃至14cの何れか1つのサーバを指定してから入力ボックス44に入力した検索文字列を含む複数のウエブサイト情報49をユーザ端末10側の記憶手段であるRAM17またはHDD18へ記憶するシーケンスである。引き続き、CPU19はソフトウエア1を実行し連結テキスト文章生成機能S56を実行する。例えば、ウエブサイト情報49の中にテキスト文章制御タグ情報としての改行記号(改行タグ)やスペース記号(Tabタグ)が存在する場合は、これらタグ情報を除去してから前後の文章を連結し連結テキスト文章を生成するとよい。
CPU19は、ソフトウエア1に含まれる強調テキスト文章生成機能S56を実行し入力ボックス26に入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいて連結テキスト文章をヒット文字列書式に書き換えてから、ウェブサイト情報のテキスト文章制御タグ情報に対応させて強調表示テキスト文章を生成する。ここで、本実施形態で例示するテキスト文章制御タグ情報は、ウエブサイト情報49に含まれるコンテンツの画面表示フォーマットを決定するタグ情報である。例えば、複数のコンテンツをリストする場合は各コンテンツの上下の間隔や画像表示領域を指定するタグ情報が該当する。
CPU19は、強調表示テキスト文章を生成した段階で強調表示機能S58を実行し、ユーザ端末10のディスプレイ24上に強調表示テキスト文章をブラウザ表示する。勿論、S51 のシーケンスでユーザがキーボード30またはマウス36を用いて検索文字列の入力ボックス26に入力した検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報もブラウザ表示することもできる。
図4は、本実施形態に用いるソフトウエア1の基本動作を示すフローチャートである。CPU19は、S60を実行しウエブサイト情報としてのHTMLのソースをAファイルとして記憶手段(例えば、RAM17またはHDD18若しくはCPU19内部のキャッシュメモリを含む)に記憶する。次に、CPU1はS61を実行し記憶手段からAファイルを読出し解析する。そして、HTMLのソースに含まれる改行タブやスペースタブを除去してから前後の文章を結合させ生成した連結テキスト文章をBファイルとして記憶手段へ記憶する。引き続き、CPU19はS62を実行し記憶手段から、Bファイルを読出しブラウザ表示するウエブサイト情報の中に存在する検索文字列のカラー(色)、文字サイズ(フォントサイズ)、強調する文字列の背景色のタグ情報を書き込み強調表示テキスト文章を完成させることができる。CPU19はこの強調表示テキスト文章を完成させた段階で処理をS58(図3参照)へ分岐させ強調表示テキスト文章をユーザ端末10へブラウザ表示させることができる。
図5は本実施形態の検索エンジンによる検索結果のキーワード部を書き換え表示する方法のブロック図である。図左側に示す準備処理ではユーザ端末10へソフトウエア提供サーバ42からインターネット12を介してテキスト検索のソフトウエア1aをダウンロードし、このソフトウエア1aを解凍しながらユーザ端末10へソフトウエア1をインストールすることができる。このソフトウエア1には入力ボックス26のマトリクス領域を設定し、この入力ボックス26に入力する検索文字列のカラー(色)、文字サイズ(フォントサイズ)、強調する文字列の背景色を設定することができる。
図左側に示す検索結果の画面表示時の処理は、CPU19がソフトウエア1を実行し検索結果を表示する全画面の指定キーワード個所を瞬時に強調表示条件に書き換えることができる。そして、CPU19はブラウザ画面46に強調表示条件に書き換えた結果を表示する。例えば、書き換えワード部は文字拡大や未ヒットの文字と識別し易い色により表示することができる。
図6乃至図14を用いて本実施形態のテキスト検索のソフトウエア1を実行するブラウザ画面46を例示する。図6では、検索キーワード、文字色、背景色、拡大度、正規表現、コンパイルを含む入力ボックス26を例示している。文字色は未ヒット文字列色と異なる色を指定することができしたがって例えば、「黄」、「赤」、「ライム」、「黒」を含むダウンメニューの中から何れか1つの色をマウス36またはキーボード38を用いて指定することができる。
図7では、図右側に示す検索エンジンの入力ボックス44の中に「クローバーネツトワークコム」という検索文字列を入力してから、図左側に示す検索ボックス26の中に所定の検索文字列情報を入力している。例えば、第1ラインへ検索キーワード「システム」、文字色「赤」、背景色「黄」、拡大度「3」を指定し、第2ラインに検索キーワード「Doc Bell」、文字色「黒」、背景色「ラインム」、拡大度「1」を指定している。
図8では、文字検索結果を示している。ここで、注目すべき表示は「システム」の文字列が赤色表示であり、他の未ヒット文字列に比して拡大表示され、しかも「システム」の文字サイズに対応し且つ「システム」の文字列を囲む区形状の背景領域が黄色で塗り潰している点である。つまり「システム」の検索文字に重畳表示される未ヒット文字列郡は背景色の黄色で隠蔽されているので、ユーザは検索文字列を発見し易く、ウエブサイト情報の行間を維持しているためブラウザ画面46に表示される情報量を低減させないという利益がある。
図9では、文字検索結果を示している。ここで、注目すべき表示は検索文字列の「システム」が2行に跨っている場合であっても本実施形態では精度よく検索できる点である。つまり、従来の文字検索システムでは2行に跨っている文字列は改行タブまたはスペースタグにより文章が分離しているため、検索精度が低下するのである。同様の例示を図10に示す。例えば、検索文字列の「Doc Bell」が2段表示のウエブサイト情報であっても本実施形態では精度よく拡大表示することができる。図左側に示す「Doc Bell」はソースに記述したタグ情報により2段表示であるが、本実施形態では第1編集手段および第2編集手段により不要なタグを削除してから文章を結合しているので文字検索精度が従来に比して向上させることができる。
図9では、ソフトウエア1によるアフェリエイト広告監視補助プログラムの検索結果を示している。本実施形態は、ユーザ端末10から検索エンジンサーバ14a乃至14cの何れか1つのサーバへインターネツト12を介してアクセスし、語句によるテキスト検索を実行し、検索文字に該当する部分を強調表示する。ユーザである企業様のアフェリエイトl広告の監視をサポートすることができる。つまり、企業様の担当者は、強調文字表示の付近に自社サービスに関するバーナ広告が表示されているか否かを瞬時にチャックするだけで監視作業を完了させることができる。例えば、改正貸金業規正法を遵守するため、「広告の樹種規制基準細則」に規定する誇大広告に関する語句を強調表示させることができ、しかも脅威となる語句の背景形状を楕円枠付の塗り潰し表示にできるため、一目しただけで脅威となる文字列を目視することができる。
図10では、ソフトウエア1による強調表示テキスト文章のHTML言語で記述するウエブサイト情報のリストである。例えば、検索文字列の「おかき」が検索結果として2段に跨った場合でも上述の通り不要タグの削除および前後文章の結合処理により精度よく検索ができ且つ強調表示を出力することができる。検索エンジンからの検索結果をHTML言語で図13に示す。図示したウエブサイト情報によれば「あいうえお」の行と「かきくけこ」の行は2段表示である。但し、本発明はHTML言語で記述されたウエブサイト情報に限定されずXML言語で記述されたソースにも適用できることは言うまでもない。
図14は、図13を用いて説明した強調表示の出力状態をを示す図である。図示するように、第1行目の「あいうえお」の中の「お」は強調表示され、第2行目の「かきくけこ」の中の「かき」も同様に強調表示され ている。このように、指定した検索文字列が分離している場合であっても高い精度で検索結果を表示できる点で従来に比して飛躍的に文字検索を容易に提供することができる。
なお、本発明の実施形態または他の実施形態若しくは追加の実施形態に記載された、作用及び効果は、本発明から生じる最も好適な作用及び効果を列挙したに過ぎず、本発明に
よる作用及び効果は、本発明の実施形態に記載されたものに限定されるものではない。例えば、ウエブサイト情報の中のヒットしたURLおよびタイトルを検索結果に表示させながら、未ヒット文字列だけで構成されたライン(行)を削除することにより、より多くのウエブサイト情報をウエブ画面に表示してもよい。
本発明の実施形態として文字検索システムを概略的に示すブロック図。 本発明の実施形態としてウエブ画面を示すブロック図。 実施形態の文字検索ソフトウエアの動作を示すフローチャート。 実施形態の文字検索ソフトウエアの動作を示すフローチャート。 実施形態の文字検索ソフトウエアの動作を示すフローチャート。 本発明の実施形態としてウエブ画面を示すブロック図。 ウエブ画面を示すブロック図。 ウエブ画面を示すブロック図。 ウエブ画面を示すブロック図。 ウエブ画面を示すブロック図。 ウエブ画面を示すブロック図。 本実施形態のHTML言語のソースを示す図。 本実施形態のHTML言語のソースを示す図。 ウエブ画面を示すブロック図。
符号の説明
1 コンピュータソフトウエアプログラム
10 ユーザ端末
12 インターネット
14a〜14c 検索エンジンサーバ
15 パーソナルコンピュータ本体
17 RAM
18 ハードディスク
19 CPU
24 ディスプレイ
36 ポインティングデバイス
38 キーボード

Claims (6)

  1. ブラウザ表示機能を有するユーザ端末に文字列に基づくテキスト検索処理を実行させるコンピュータソフトウエアプログラムであって、
    インターネットを介して検索エンジンからユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段により前記ユーザ端末の記憶手段に記憶する検索結果記憶機能と、
    前記記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成機能と、
    前記連結テキスト文章の中の検索文字列に対して前記ユーザ端末のディスプレイ上の入力ボックスに入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、前記ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成機能と、
    前記強調表示テキスト文章を前記ユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示機能と、
    を備えることを特徴とするコンピュータソフトウエアプログラム。
  2. ブラウザ表示機能を有するユーザ端末に文字列に基づくテキスト検索処理を実行させるコンピュータソフトウエアプログラムであって、
    複数のウェブサイトをインターネットを介して巡回しウェブサイト情報を収集しながら、コンピュータにより検索用の索引を巡回する前記ウエブサイトに対応させてそれぞれ生成し蓄積する検索エンジンに対し、インターネットを介して前記ユーザ端末からアクセスし前記ユーザ端末のディスプレイ上に検索エンジンの文字検索入力画面をブラウザ表示すると共に、この文字検索入力画面の近傍に位置し検索文字列、該検索文字列の色、該検索文字列のサイズ、該検索文字列の背景色をそれぞれユーザが入力する入力ボックスを入力ボックス表示手段によりブラウザ表示するブラウザ機能と、
    前記入力ボックスへユーザが指定する検索文字列、検索文字列の色、検索文字列のサイズ、検索文字列の背景色の情報をそれぞれポインタやキーボードを含む入力手段を介して入力する検索文字列入力機能と、
    前記ユーザ端末から前記検索エンジンにインターネットを介して前記文字検索入力画面上で入力するテキスト検索情報を送信し検索処理を起動させるテキスト検索機能と、
    インターネットを介して前記検索エンジンから前記ユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段により前記ユーザ端末の記憶手段に記憶する検索結果記憶機能と、
    前記記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成機能と、
    前記連結テキスト文章の中の検索文字列に対して前記入力ボックスに入力された前記検索文字列の色、前記検索文字列のサイズ、および前記検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、前記ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成機能と、
    前記強調表示テキスト文章を前記ユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示機能と、
    を備えることを特徴とするコンピュータソフトウエアプログラム。
  3. 前記強調表示手段は、前記検索文字列のサイズの情報に対応する面積を有する略矩形背景領域の中を前記検索文字列の背景色の情報で指定された色に塗りつぶす請求項1または請求項2に記載したコンピュータソフトウエアプログラム。
  4. ブラウザ表示機能を有するユーザ端末によるテキスト検索処理方法であって、
    インターネットを介して検索エンジンからユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段により前記ユーザ端末の記憶手段に記憶する検索結果記憶ステップと、
    前記記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成ステップと、
    前記連結テキスト文章の中の検索文字列に対して前記ユーザ端末のディスプレイ上の入力ボックスに入力された検索文字列の色、検索文字列のサイズ、および検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、前記ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成ステップと、
    前記強調表示テキスト文章を前記ユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示ステップと、
    を含むことを特徴とするテキスト検索処理方法。
  5. ブラウザ表示機能を有するユーザ端末に文字列に基づくテキスト検索処理方法であって、
    複数のウェブサイトをインターネットを介して巡回しウェブサイト情報を収集しながら、コンピュータにより検索用の索引を巡回する前記ウエブサイトに対応させてそれぞれ生成し蓄積する検索エンジンに対し、インターネットを介して前記ユーザ端末からアクセスし前記ユーザ端末のディスプレイ上に検索エンジンの文字検索入力画面をブラウザ表示すると共に、この文字検索入力画面の近傍に位置し検索文字列、該検索文字列の色、該検索文字列のサイズ、該検索文字列の背景色をそれぞれユーザが入力する入力ボックスを入力ボックス表示手段によりブラウザ表示するブラウザステップと、
    前記入力ボックスへユーザが指定する検索文字列、検索文字列の色、検索文字列のサイズ、検索文字列の背景色の情報をそれぞれポインタやキーボードを含む入力手段を介して入力する検索文字列入力ステップと、
    前記ユーザ端末から前記検索エンジンにインターネットを介して前記文字検索入力画面上で入力するテキスト検索情報を送信し検索処理を起動させるテキスト検索ステップと、
    インターネットを介して前記検索エンジンから前記ユーザ端末が受信する検索対象のウェブサイト情報をダウンロード手段により前記ユーザ端末の記憶手段に記憶する検索結果記憶ステップと、
    前記記憶手段からウェブサイト情報を読出し、テキスト文章制御タグ情報により制御される所定長のテキスト文章に含まれる改行記号およびスペース記号を第1編集手段により除去してから、分断されたテキスト文章を連結し第2編集手段により連結テキスト文章を生成する連結テキスト文章生成ステップと、
    前記連結テキスト文章の中の検索文字列に対して前記入力ボックスに入力された前記検索文字列の色、前記検索文字列のサイズ、および前記検索文字列の背景色の情報に基づいてヒット文字強調手段によりヒット文字列書式に書き換えてから、前記ウェブサイト情報のテキスト文章制御タグ情報に対応させて第3編集手段により強調表示テキスト文章を生成する強調表示テキスト文章生成ステップと、
    前記強調表示テキスト文章を前記ユーザ端末のディスプレイ上に強調表示手段によりブラウザ表示する検索文字列強調表示ステップと、
    を含むことを特徴とするテキスト検索処理方法。
  6. 前記強調表示ステップは、前記検索文字列のサイズの情報に対応する面積を有する略矩形背景領域の中を前記検索文字列の背景色の情報で指定された色に塗りつぶす請求項4または請求項5に記載したテキスト検索処理方法。
JP2008071627A 2008-03-19 2008-03-19 テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法 Active JP5270199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008071627A JP5270199B2 (ja) 2008-03-19 2008-03-19 テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008071627A JP5270199B2 (ja) 2008-03-19 2008-03-19 テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法

Publications (3)

Publication Number Publication Date
JP2009230210A true JP2009230210A (ja) 2009-10-08
JP2009230210A5 JP2009230210A5 (ja) 2011-04-07
JP5270199B2 JP5270199B2 (ja) 2013-08-21

Family

ID=41245573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008071627A Active JP5270199B2 (ja) 2008-03-19 2008-03-19 テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法

Country Status (1)

Country Link
JP (1) JP5270199B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014057962A1 (ja) * 2012-10-09 2014-04-17 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP5703399B1 (ja) * 2014-01-20 2015-04-15 アイ・ピー・ファイン株式会社 特許情報処理装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073685A (ja) * 2000-09-04 2002-03-12 Ntt Communications Kk 検索結果提供方法・検索結果提供装置
JP2003044517A (ja) * 2001-07-27 2003-02-14 Univ Nihon インターネット検索結果修飾方法及びプログラム
JP2005071062A (ja) * 2003-08-25 2005-03-17 Shukichi Tanaka 検索結果分析出力装置、検索結果分析出力方法およびコンピュータプログラム
JP2005084879A (ja) * 2003-09-08 2005-03-31 Canon Software Inc 情報処理装置および情報処理方法およびプログラムおよび記録媒体
WO2005121982A1 (ja) * 2004-06-14 2005-12-22 Nec Corporation 情報提供システム、方法、プログラム、情報通信端末、および情報表示切り替えプログラム
WO2006008871A1 (ja) * 2004-07-21 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声合成装置
JP2006163603A (ja) * 2004-12-03 2006-06-22 Toshiba Corp 画像生成装置、画像生成方法および画像生成プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073685A (ja) * 2000-09-04 2002-03-12 Ntt Communications Kk 検索結果提供方法・検索結果提供装置
JP2003044517A (ja) * 2001-07-27 2003-02-14 Univ Nihon インターネット検索結果修飾方法及びプログラム
JP2005071062A (ja) * 2003-08-25 2005-03-17 Shukichi Tanaka 検索結果分析出力装置、検索結果分析出力方法およびコンピュータプログラム
JP2005084879A (ja) * 2003-09-08 2005-03-31 Canon Software Inc 情報処理装置および情報処理方法およびプログラムおよび記録媒体
WO2005121982A1 (ja) * 2004-06-14 2005-12-22 Nec Corporation 情報提供システム、方法、プログラム、情報通信端末、および情報表示切り替えプログラム
WO2006008871A1 (ja) * 2004-07-21 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声合成装置
JP2006163603A (ja) * 2004-12-03 2006-06-22 Toshiba Corp 画像生成装置、画像生成方法および画像生成プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014057962A1 (ja) * 2012-10-09 2014-04-17 株式会社Ubic フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
JP2014078081A (ja) * 2012-10-09 2014-05-01 Ubic:Kk フォレンジックシステム及びフォレンジック方法並びにフォレンジックプログラム
US9542474B2 (en) 2012-10-09 2017-01-10 Ubic, Inc. Forensic system, forensic method, and forensic program
JP5703399B1 (ja) * 2014-01-20 2015-04-15 アイ・ピー・ファイン株式会社 特許情報処理装置

Also Published As

Publication number Publication date
JP5270199B2 (ja) 2013-08-21

Similar Documents

Publication Publication Date Title
AU2010328181B2 (en) Resource search operations
US9075873B2 (en) Generation of context-informative co-citation graphs
US20130254189A1 (en) Using Anchor Text to Provide Context
JP4437500B2 (ja) データをタグ情報に対応付けて管理する技術
JP6553032B2 (ja) ハイパーリンクが設定されたマイニングされたテキストスニペットを介する画像のブラウジング
US8204950B2 (en) Webpage search
US20080235671A1 (en) Injecting content into third party documents for document processing
US20140108921A1 (en) Method and system for providing suggested tags associated with a target web page for manipulation by a user optimal rendering engine
JP5793601B2 (ja) 自動スクロール実行システムおよび方法
JP2006164269A (ja) 検索結果のカスタマイゼーションのためのシステムおよび方法
US8185825B2 (en) Hiding search box based on search provider settings
JPWO2019224891A1 (ja) 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム
US8612431B2 (en) Multi-part record searches
JP5270199B2 (ja) テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法
CN110275712A (zh) 一种文本替换方法、装置及设备
JP4714117B2 (ja) 企業名抽出方法およびプログラム
JP2007034464A (ja) 広告コンテンツ提示システム、広告コンテンツ提示プログラム
Tarawneh et al. a hybrid approach for indexing and searching the holy Quran
JP5564442B2 (ja) 文章検索装置
JP6044422B2 (ja) 略称生成方法および略称生成装置
CN116362223B (zh) 一种网页文章标题和正文的自动识别方法及装置
KR20080091736A (ko) 사용자가 입력중인 검색어에 기반한 실시간 광고 방법, 시스템 및 상기 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체
US7860704B2 (en) Lexicon-based content correlation and navigation
US20150169526A1 (en) Heuristically determining key ebook terms for presentation of additional information related thereto
JP5289498B2 (ja) カテゴリ別共通付加情報追加装置及びカテゴリ別共通付加情報追加方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121010

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130228

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130509

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5270199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250