JP2005327221A - 検索システム及び検索プログラム並びにパーソナルコンピュータ - Google Patents

検索システム及び検索プログラム並びにパーソナルコンピュータ Download PDF

Info

Publication number
JP2005327221A
JP2005327221A JP2004154637A JP2004154637A JP2005327221A JP 2005327221 A JP2005327221 A JP 2005327221A JP 2004154637 A JP2004154637 A JP 2004154637A JP 2004154637 A JP2004154637 A JP 2004154637A JP 2005327221 A JP2005327221 A JP 2005327221A
Authority
JP
Japan
Prior art keywords
search
unit
interface
browser
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004154637A
Other languages
English (en)
Inventor
Takashige Tanaka
敬重 田中
Yasuo Kasai
庸雄 河西
Kazuyoshi Nagaho
和義 長保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2004154637A priority Critical patent/JP2005327221A/ja
Priority to EP04255067A priority patent/EP1510948A3/en
Priority to KR1020040067779A priority patent/KR100681084B1/ko
Priority to CNA2004100572933A priority patent/CN1591420A/zh
Priority to US10/929,116 priority patent/US20050102280A1/en
Publication of JP2005327221A publication Critical patent/JP2005327221A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 初心者のユーザでも、HTTPサーバを稼働する余裕のないパソコン内において、質問文である自然言語の文字列を入力することにより、容易に、この文字列から所望の文章を検索することが可能なWebブラウザを利用した検索システム及び検索プログラムを提供する。
【解決手段】 HTML形式のファイルに含まれるスクリプトを解釈可能なブラウザの機能を利用し、インストールされているブラウザに対応したインターフェースコンポーネントを起動し、このインターフェースコンポーネントにより、検索コンポーネントを呼び出すインターフェース手段と、前記検索コンポーネントにより起動され、入力される文字列を解釈し、解釈結果に対応してデータベースにおいて、この文字列に対応するデータの検索処理を行う検索エンジン手段とを備える。
【選択図】 図1

Description

本発明は、入力された自然言語に基づいて、所望の文書データを効率良く検索することが可能な検索システム及び検索プログラム並びにパーソナルコンピュータに関する。
現在、イントラネットやインターネットなどのあらゆる場面において、検索システムが標準的に準備され、多用されている。
すなわち、文書のストレージ及び配信が盛んに行われており、検索システムは、所望の文書を多くの文書のなかから検索するために重要なツールとなっている。
従来において、イントラネットの場合には、公開サーバにHTTPサーバを立ち上げて、サーバサイドスクリプト(例えば、ASP,CGI,PHP)を利用してHTTPページから検索を行うことが主流である。
一方、パーソナルコンピュータ(パソコン)内などにおいて、ユーザがハードディスクにある任意の文書の検索を行う場合、HTTPサーバを立ち上げる程、スペックに余裕がなかったり、元々HTTPサーバがインストールされていないものも多い。
このため、ヘルプの検索等において、予め形態素解析によって含まれるキーワードを抽出し、アプリケーションを立ち上げて、このアプリケーションにより、上記キーワードに基づいて所望の文書の検索を行う(特許文献1参照)。
特開2001−67363号公報
しかしながら、上述した検索処理は、検索を行う場合に、特別なアプリケーションを立ち上げ、入力欄にキーワード入力を行う必要があり、ヘルプなどをあまり使用することがなく、ヘルプ検索などに慣れていない初心者には利用しにくいと言う欠点がある。
また、上記検索処理は、キーワードを入力する必要があり、例えば、誤動作の状況は判るが、自分の知りたい情報が得るための単語を適切に抽出し、順序立てて検索することが初心者に困難であるという欠点がある。
例えば、「プリンタがうまく動作しない」場合、ユーザは「プリンタ」を入力して、プリンタの項目の下に、また複数の項目があり、この項目から動作しない状況を解析するものを選択する必要があり、慣れない人間にとっては困難である。
本発明は、このような事情に鑑みてなされたもので、HTTPサーバを使わずに、質問文である自然言語の文字列を入力することにより、容易に、この文字列から所望の文書を検索することが可能なWebブラウザを利用した検索システム及び検索プログラムを提供することを目的とする。
本発明の検索システムは、HTML形式のファイルに含まれるスクリプトを解釈可能なブラウザの機能を利用し、インストールされているブラウザに対応したインターフェースコンポーネントを起動し、このインターフェースコンポーネントにより、検索コンポーネントを呼び出すインターフェース手段と、前記検索コンポーネントにより起動され、入力される文字列を解釈し、解釈結果に対応してデータベースにおいて、この文字列に対応するデータの検索処理を行う検索エンジン手段とを有している。
このため、本発明の検索システムによれば、パソコン内にインストールされているブラウザのスクリプトまたはアプレット等のオブジェクト呼び出し(DLLのロード)機能を利用して検索コンポーネントを呼び出し、検索エンジン部5を起動するため、HTTPサーバを稼動せずにWebブラウザを利用した検索システムを構成することが可能となる。
また、本発明の検索システムによれば、通常インターネットにおける検索において用いているブラウザへの検索のキーワード入力のように、自然言語そのままの文字列として質問文を入力することにより、入力される質問文の解析を行い、この質問文に対応する所望の文書の検索が行われ、ヘルプの検索に慣れていない初心者のユーザにも、容易に所望の文書の検索を行うことが可能となる効果がある。
さらに、本発明の検索システムによれば、インターフェース手段の記述がHTML内スクリプト文であるため、容易に変更することが可能であり、インストールされているブラウザに対応させることにより、スクリプト文の変更により、容易にシステムの移植を行うことが可能である。
本発明の検索システムは、前記インターフェース手段において、インストール情報記憶部(例えば、実施形態におけるインストール情報記憶部4)に記憶されているコンポーネントのインストール情報(Windows(登録商標)であればレジストリ情報、Mac−OS(登録商標)であれば、プリファレンス情報)から、いずれのブラウザがインストールされているかを検出する検索手段を有している。
本発明の検索システムによれば、インストールされている上記ブラウザのいずれにも対応することができ、また、ブラウザの種類を変更した場合にも、システムをインストールし直したり、面倒な設定変更などの処理を行わずに、複数のブラウザに対応させることが可能である。
これにより、本発明の検索システムは、ユーザが意識をせずに、インターフェース手段がパソコンにインストールされている上記ブラウザの種別を検出するため、ユーザが文字列を入力して所望のデータの検索が容易に行われる。
本発明の検索システムは、前記インターフェース手段において、前記検索手段が、複数のブラウザと、各ブラウザに各々対応したインターフェース手段との関係が記載されたテーブルを有している。
本発明の検索システムは、前記インターフェース手段において、検索手段の検出したブラウザに対応するインターフェースコンポーネントを前記テーブルから抽出する判定部を有している。
これにより、本発明の検索システムによれば、インストール情報記憶部に記憶されているインストール情報から、いずれのブラウザがインストールされているかを検出すると、上記テーブルから、検出されたブラウザに対応したインターフェースコンポーネントを容易に選択し、選択されたコンポーネントをロードして用いることが可能となり、インターフェース部を複数のブラウザ各々に対応させることができる。
本発明の検索システムは、前記検索手段が、検索対象の文書データを記録する文書データベースと、形態素解析用のデータが予め記録された形態素解析用辞書データベースと、前記形態素解析用辞書データベースを参照して、入力部から入力される文字列を形態素解析することにより単語を抽出するとともに、該単語について、肯定形または否定形を特定する形態素解析手段と、前記単語と肯定または否定を特定する情報に基づいて、検索条件を作成する検索条件作成手段と、前記検索条件に合致する文書を、前記文書データベースから文書データを検索する文書検索手段とを備えている。
本発明の検索システムによれば、文書登録時における形態素解析時において、肯定否定フラグを検索用データベースに登録するようにしたため、全く逆の意味を持つ文書が見つかることを防止することができる。特に、トラブル対応処理時には、全く逆の意味を持つ文書データは不要であるため、効率よく所望の文書データを見つけだすことが可能となる。また、質問文を形態素解析した結果得られた単語の類似語を含む文書を検索するようにしたため、所望の文書データを見つけだすことが容易になる。
本発明の検索プログラムは、コンピュータにおいて動作可能であり、インターフェース手段が、HTML形式のファイルに含まれるスクリプトを解釈可能なブラウザの機能を利用し、インストールされているブラウザに対応した記載のインターフェースコンポーネントを起動し、このインターフェースコンポーネントにより、検索コンポーネントを呼び出す処理と、検索エンジン手段が、前記検索コンポーネントにより起動され、入力される文字列を解釈し、解釈結果に対応してデータベースにおいて、この文字列に対応するデータの検索処理を行う処理とを有している。
本発明の検索プログラムは、上記記載の検索プログラムにおいて、記憶部に記憶されているインストール情報から、いずれのブラウザがインストールされているかを検出するスクリプト検索処理を有している。
本発明のパーソナルコンピュータは、HTML形式のマニュアル文書を記憶したマニュアル記憶部と、前記マニュアル文書に含まれるスクリプトを解釈可能なブラウザと、前記ブラウザに対応したインターフェースコンポーネントを起動し、前記インターフェースコンポーネントにより検索コンポーネントを呼び出すインターフェース部と、検索対象の文書データを記憶する文書データベースと、前記検索コンポーネントにより起動され、入力される質問文を解釈し、その解釈結果に対応して、前記検索対象の文書データの検索を行う検索エンジン部と、インストールされた各種アプリケーションやデータの情報を記憶したインストール情報記憶部とを備えることを特徴とする。
本発明は、Windows(登録商標)などに予め設けられているインターネットエクスプローラ(登録商標)等が有するActiveX(登録商標)、またはJAVA(登録商標)アプレット等のコンポーネント呼び出し機能を有するブラウザを用いて、通常インターネットの検索方法と同様に、検索条件の入力欄に自然言語の文字列を入力して、ユーザのパソコン内において、所望の文書の検索を行う検索システムである。このとき、検索エンジンにおいて、入力された文字列の形態素解析が行われ、必要なキーワード(検索条件)の抽出が行われる。
ここで、上記ActiveXやJAVA(登録商標)アプレット等のコンポーネントは、検索処理を開始させる機能を有するHTML形式のファイルに含まれるスクリプトと、検索を行う検索エンジン部(すなわち、検索コンポーネントで起動される検索エンジン部)との間で、キーワード及び検索結果の受け渡しを行う。すなわち、本発明は、予めパソコン内にインストールされている、ブラウザの機能を利用して、HTML形式のファイルに含まれるスクリプトと検索エンジン部との間において、自然言語検索の起動処理及びデータの受け渡しを行っている。
以下、本発明の一実施形態による検索システムを図面を参照して説明する。図1は同実施形態の構成を示すブロック図である。マニュアル記憶部1には、パーソナルコンピュータ(パソコン)に接続されている外部機器(例えば、プリンタ,スキャナ,CRTなど)の取り扱い説明などのマニュアルが、HTMLにより記載されて記憶されている。
インターフェース部2は、マニュアルが選択されると、予めパソコンに、HTML形式のファイルを読むために設定されているブラウザが起動し、このブラウザがマニュアルのスクリプト文を解釈して実行することにより起動される。また、インターフェース部2は、起動すると実行インターフェース機能により、ブラウザであるコンポーネント3の記述形式(命令形式)に対応して記載されたコンポーネント(以下インターフェースコンポーネント)を呼び出して、このコンポーネントを起動させる。ここで、インターフェース機能は、マニュアルに記載されたHTMLで記載された上記インターフェースコンポーネントを呼び出すスクリプト文の処理機能である。
コンポーネント3は、同様に、インターフェースコンポーネントを起動して、検索エンジン部5を起動するDLL(検索コンポーネント)を呼び出し、起動された検索エンジン5とインターフェース部2との各データ(質問文の文字列、検索結果)の授受を行う。また、インターフェース部2は、検索用ブラウザの種類をインストール情報記憶部4から検索する検索部2aと、検索された検索用ブラウザをテーブル2cにより使用可能か否か判定する判定部2bと、各検索用ブラウザと、この各検索用ブラウザに対応するインターフェースコンポーネントとの関係を示すテーブル2cとを有している。
また、インターフェースコンポーネントは、各対応するブラウザの命令形式で記載されており、例えばWindows(登録商標)の場合、インターネットエクスプローラ(登録商標)の有するActiveX(登録商標)に対応した形式で記載されたもの、あるいは、JAVA(登録商標)アプレットに対応した形式で記載されたもの等があり、後に説明する検索エンジン部5を起動する検索コンポーネントを呼び出す機能を有している。インストール情報記憶部4は、パソコンにインストールされたアプリケーションの情報と、検索エンジン部5のコンポーネント,文書データベース7,形態素解析用辞書データベース6,及び類似語辞書データベース13のディレクトリ情報と、が記憶されている。
インターフェースコンポーネントは、各検索用ブラウザに対応した内容で記載されており、上述したように検索コンポーネントを呼び出す機能を有している。ここで、検索用ブラウザとは、OS(オペレーションシステム)とともにインストールされるインターネットエクスプローラ(Windows(登録商標)システム)等のActiveX(登録商標)、またはJAVA(登録商標)アプレット(マッキントッシュ(登録商標))などのブラウザ機能を有し、HTML文を解釈して、かつHTMLによりDLLを呼び出すスクリプト文を記載できるものを指している。
ブラウザについては上記種別以外に、OSのインストール時に同時にインストールはされないが、HTMLのスクリプト文により呼び出すことが可能であり、HTMLのスクリプト文によりDLLを呼び出すことが可能な他のブラウザを利用することも可能である。以下、この他のブラウザと、ActiveX(登録商標)及びJAVA(登録商標)アプレットを総称して検索用ブラウザとする。
検索エンジン部5は、入力された文字列を形態素解析用辞書データベース6を用いて形態素解析し、キーワードを抽出する。形態素解析用辞書データベース6は、文を形態素解析するための辞書データが記録されている。また、検索エンジン部5は、文書データベース7における上記キーワード検索により、文字列、すなわち質問文に対応した所望の文書データを検索し、検索結果を出力する。文書データベース7には、検索対象の複数の文書データが記録されている。
尚、前述した同実施形態のパソコン上におけるブロック構成を図7に示す。図7に示したパソコン100においては、図1で示した検索システムの各要素と、ブラウザ20、インターフェースコンポーネント21、検索コンポーネント22との関係が示されている。
次に、図2を参照して、検索エンジン部5の構成の説明を行う。図2は、検索エンジン部5の構成例を示すブロック図である。この図において、文書データベース7及び形態素解析用辞書データベース6及び類似語辞書データベース13は図1に記載されているデータベースである。
形態素解析部10は、形態素解析用辞書データベース6を参照して、入力部11を介して入力される質問文の文字列の形態素解析を行う。入力部11は、所望の文書データを見つけるための質問文の文字列を、コンポーネント3から入力する入力部である。検索条件作成部12は、入力部11から入力される質問文に対する回答を効率よく検索するため、文字列からの検索条件(キーワード)を作成する。ここで、検索条件作成部12は、例えば、検索条件として、類似語辞書データベース13を参照して、質問文を形態素解析した結果得られた単語について、類似語を求める。類似語辞書データベース13には、使用される頻度の高い単語毎に類似語が関連付けられて記録されている。文書検索部14は、検索条件作成部12が作成した検索条件に従って検索を行う。
また、文書データベース7においては、単語とこの単語に対応する文書との関連が、インデックス部とデータ部とに領域を分けて格納されている。すなわち、インデックス部には単語の1部と、この単語の1部を有する単語グループの、データ部における先頭アドレスとが対応して示されている。また、データ部には、上記単語の1部を有する単語グループ毎に、単語の全データと、この単語の含まれる文書が記憶されているアドレスを示す文書アドレスとが記憶され、別の領域に上記文書の文書データが記憶されている。
これにより、後に述べるが、文書検索部14は、インデックス部において得られたアドレスの示すデータ部から文書を検索することになるので、文書データベース7から高速に単語に基づく文書の検索を行うことができる。
さらに、文を形態素解析すると、自立語と付属語が取得できるとともに、それぞれの活用形を取得することができる。ここでは文書データベース7への登録時において、動詞、形容詞、形容動詞、名詞のいずれかに分類する。そして、活用語尾品詞(付属語品詞)は原則登録しない。ただし、形容詞,形容動詞及び動詞等の単語に「肯定否定フラグ」を設け、「肯定」の場合は「肯定否定フラグ」を「0」とし、「打ち消し」があった場合は「肯定否定フラグ」を「1」とする。
次に、図1,図2及び図3を参照して、一実施形態の検索コンポーネントをロードして、検索エンジン部5を起動する動作例の説明を行う。図3は、検索エンジン部5の起動動作を示すフローチャートである。以下の説明は、プリンタマニュアルを検索する処理を、検索システムの動作例として説明する。
予めパソコンにインストールされ、CRT画面上に表示されているHTML形式のプリンタマニュアルのアイコンを、ユーザがマウスなどによりクリックする。これにより、パソコンに搭載されているHTML解釈可能なブラウザが起動して、プリンタマニュアルのHTMLのスクリプト文を解釈し、インターフェース部2を起動させて検索コンポーネントのロード処理を開始する。
次に、インターフェース部2において、検索部2aは、インストール情報記憶部4から、パソコンにインストールされているブラウザの検索を行う。そして、判定部2bは、テーブル2cにこのブラウザが検索用ブラウザとして設定されているか否かの判定を行う。
このとき、判定部2bがテーブル2cにおいて、インストール情報記憶部4から検索されたブラウザが検索用ブラウザとしてテーブル2cに設定されていることを検出した場合、検索エンジン部5が使用可能(インターフェースコンポーネントのロードが可能)と判定し、処理をステップS2へ進める。一方、判定部2bがテーブル2cにおいて、インストール情報記憶部4から検索されたブラウザが検索用ブラウザとして設定されていないことを検出した場合、検索エンジン部5が使用不可能と判定し処理をステップS5へ進める(ステップS1)。
次に、インターフェース部2は、使用可能と判定されたインターフェースコンポーネントを、所定のDLL記憶領域からロードして、メモリ上に展開して検索コンポーネント、すなわちコンポーネント3の起動を行う。この起動されるブラウザは、OSのインストール時に同時にインストールされたものであり、OSがWindows(登録商標)であればActiveX(登録商標)またはJAVA(登録商標)アプレットであり、Mac−OS−X(登録商標)であればJAVA(登録商標)アプレット群のいずれかである。(ステップS2)
そして、コンポーネント3は、検索エンジン部5の検索コンポーネントを呼び出す機能を有しており(HTMLのスクリプト文の記述による検索エンジン部5の検索コンポーネントの呼び出し機能)、上記DLL記憶領域から上記検索コンポーネントを検索し、ロードしてメモリ上において展開して検索エンジン部5を起動する(ステップS3)。これにより、コンポーネント3は、CRT画面において、検索に用いる質問文の文字列を入力する入力欄を含む検索ウィンドウを表示し(ステップS4)、検索エンジン部5の起動処理を終了する(ステップS5)。そして、インターフェース部2は、プリンタマニュアルの表紙等の他のHTML表示を、上記検索ウインドウの隣接部分に表示する(ステップS6)。これにより、インターフェース部2は、プリンタマニュアルのマニュアル記憶部1からのロードを終了する。
次に、図4を参照して、コンポーネント3が行う検索コンポーネントのロード動作を説明する。図4は、コンポーネント3における検索コンポーネントのロード動作(図3のステップS2及びS3に対応)の一例を示すフローチャートである。
インターフェース部2がコンポーネント3のインターフェースコンポーネントをロードし、コンポーネント3が起動される(ステップS11)。そして、コンポーネント3は起動すると、HTMLのスクリプト文に記述された処理により、検索コンポーネントのロードが可能か否かの判定を行い、可能であれは検索コンポーネントのロードを行い、処理をステップS13進め、可能で無ければ処理をステップS16へ進める、すなわち、検索HTMLの表示をスキップする(ステップS12)。
次に、コンポーネント3は、検索エンジン部5が検索コンポーネントがロードされることにより起動すると、インストール情報記憶部4から、形態素解析用辞書データベース6,文書データベース7及び類似語辞書データベース13等のディレクトリ情報を読み出し、検索エンジン部5の検索処理に必要な初期化を行う(ステップS13)。そして、コンポーネント3は、例えばマニュアル記憶部1から、検索HTMLに表示する検索分類を取得する(ステップS14)。この検索分類は、検索範囲を絞り込むため、検索対象の文書の種類により分類したものであり、例えば、プリンタマニュアルとしては「印刷方法」,「トラブル」,「ソフトウェア」等のカテゴリに分類している。
次に、コンポーネント3は、CRT画面において、検索するための質問文を入力する入力欄を含む検索ウィンドウと、上記検索分類を選択するための選択部を表示する(ステップS15)。そして、インターフェース部2はコンポーネント3のインターフェースコンポーネントのロードを終了し、コンポーネント3は検索エンジン部5の初期化を終了する(ステップS16)。
次に、図5を参照して、検索エンジン部5が行う検索処理の動作を説明する。図5は、検索エンジン部5における検索処理の動作例を示すフローチャートである。
図4のステップS13に記載されているように、検索エンジン部5の検索処理に必要な初期化を行う(ステップS21)。検索エンジン部5は、上記選択部から検索分類を取得し、検索対象の絞り込みを行い、コンポーネント3を介してインターフェース部2から入力される文字列の形態素解析を行い、検索条件の解析及び抽出を行う(ステップS22)。
すなわち、ステップS22において、入力部11は入力された質問文を読み取る。ここでは、文字列として「プリンタが動作しない」と入力したものとする。入力部11は、ここで入力された文字列を検索条件作成部12へ受け渡す。次に、検索条件作成部12は、受け取った質問文を形態素解析部10へ渡す。これを受けて、形態素解析部10は、形態素解析用辞書データベース6を参照して、受け取った質問文を形態素解析する。この解析の結果、「名詞:プリンタ」、「動詞:動作し(否定形)」が解析結果として得られる。
続いて、形態素解析部10は、ここで得られた解析結果を、検索条件作成部12へ返す。
次に、検索条件作成部12は、形態素解析結果に基づいて、検索条件を作成する。ここでは検索条件が、「名詞:プリンタ&動詞:動作し(否定肯定フラグ=1)」となる。検索条件作成部12は、ここで作成した検索条件を検索部14へ受け渡す。
また、ステップS23において、文書検索部14は、検索条件作成部12より受け取った検索条件を使用して、文書データベース7内を検索する(ステップS23)。この検索の結果、名詞の「プリンタ」を含み、かつ動詞の動作し(否定形)を含む文書データのページIDが文書検索部14において、文書データベース7から得られる。該当する文書データが複数存在すれば、複数のページIDが文書検索部14において得られる。そして、文書検索部14は、検索が終了したことを検索条件作成部12へ通知する。続いて、検索条件作成部12は、文書検索部14の検索した検索結果を、予め設定されている重要度,重み付け値またはタイトル順(例えば、あいうえお順、アルファベット順)に基づいて、ページIDを文書データ順に並べ替えた上で、文書検索部14へ出力する(ステップS24)。次に、インターフェース部2はコンポーネント3を介して、文書検索部14から入力される、並べ替えられた検索結果の文書をCRT(カソードレイチューブ)等に表示する。
次に、図6を参照して、本発明の検索システムのパソコンに対するインストール処理について説明する。図6は、インストールの動作例を説明するためのフローチャートである。インストールは、インストールプログラム及び検索システムに必要なファイル等が記憶されたCD−ROM(コンパクトディスクリードオンリーメモリー)を用いて行う。
ユーザがインストール処理を開始すると、インストーラがパソコンのメモリ上に展開されて起動し、このインストーラ(インストール手段)がパソコンにインストールされているOSの種類、例えばWindows(登録商標)なのかMac−OS(登録商標)のいずれであるかを判定する(ステップ31)。
次に、検索コンポーネントをインストールする処理に移行するが、図1に示すインターフェース部2の構成の場合には、インターフェース部2の起動時において、インストールされている検索用ブラウザの種類が検出され、この検索用ブラウザに対応した呼び出しDLLが使用される。このため、検索用ブラウザの検索と判定がを行う必要が無いため、インストール操作において、ステップS32とステップS33とがスキップされて実行されない。すなわち、インストーラは、ステップS31から処理をステップS34へ進め、検索用コンポーネントのインストール処理を行う。
例えば、インストーラがステップS31において、OSがWindows(登録商標)であることを検出すると、インターネットエクスプローラ(登録商標)におけるActiveX(登録商標)に対応する検索コンポーネント,または、JAVA(登録商標)アプレットに対応する検索コンポーネント等を、各検索用ブラウザの種類に対応させ、インターフェース部2のテーブル2cとしてインストールを行う(ステップS34)。
そして、インストーラは、インストールした全ての種類の検索コンポーネントをインストール情報記憶部4に登録する(ステップS35)。次に、インストーラは、検索に使用する他のファイル、すなわち、インターフェース部2の検索部2a及び判定部2b,検索エンジン部5のコンポーネント,形態素解析用辞書データベース6,文書データベース7のファイルのインストールを行い(ステップS36)、インストールの処理を終了する(ステップS37)。そして、インストーラは、プリンタマニュアルのファイル等のインストールを行う(ステップS38)。
一方、図1のインターフェース部2の構成とは異なり、予めインストールされている検索用ブラウザに対応して、検索コンポーネントをインストールする場合、図6におけるステップS32及びステップS33の処理が実行される。
ステップS31においてOSの種別が検出された後、インストーラはインストール情報記憶部4において、いずれの検索用ブラウザがインストールされているかの検出を行う(ステップS32)。
そして、インストーラは検索用ブラウザが検出された場合、処理をステップS34へ進め、また、検索用ブラウザが検出されない場合、処理をステップS37へ進める(ステップS33)。次に、インストーラは上記検索用インストーラに対応した検索コンポーネントのインストールを行う(ステップS34)。以降の処理はすでに述べたステップS35〜S38までと同様である。ここで、ステップS37においてインストールされるインターフェース部2には、検索部2a,判定部2b及びテーブル2cのファイルがなく、インストールされている検索用ブラウザの検索を行うことなく、インストールされた検索コンポーネントをロードする機能のみがインストールされる。
なお、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、上記検索システムにおける検索処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。さらに、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。加えて、「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本発明の一実施形態による検索システムの構成の一例を示すブロック図である。 図1の検索エンジン部5の構成の一例を示すブロック図である。 HTML形式のマニュアルファイルの起動動作を説明するフローチャートである。 検索コンポーネントのロード(検索エンジン部5の起動)の動作の一例を示すフローチャートである。 検索エンジン部5による検索の動作の一例を示すフローチャートである。 図1の検索システムのコンピュータへのインストール処理の一例を示すフローチャートである。 本発明の一実施形態によるパーソナルコンピュータ上での構成を示すブロック図である。
符号の説明
1…マニュアル記憶部、2…インターフェース部、2a…検索部、2b…判定部、2c…テーブル、3…コンポーネント、4…インストール情報記憶部、5…検索エンジン部、6…形態素解析用辞書データベース、7…文書データベース、10…形態素解析部、11…入力部、12…検索条件作成部、13…類似語辞書データベース、14…検索部、20…ブラウザ、21…インターフェースコンポーネント、22…検索コンポーネント、100…パーソナルコンピュータ。

Claims (12)

  1. HTML形式のファイルに含まれるスクリプトを解釈可能なブラウザの機能を利用し、インストールされているブラウザに対応したインターフェースコンポーネントを起動し、このインターフェースコンポーネントにより、検索コンポーネントを呼び出すインターフェース手段と、
    前記検索コンポーネントにより起動され、入力される文字列を解釈し、解釈結果に対応してデータベースにおいて、この文字列に対応するデータの検索処理を行う検索エンジン手段と
    を有することを特徴とする検索システム。
  2. 前記インターフェース手段がインストール情報記憶部に記憶されているインストール情報から、いずれの種類のブラウザがインストールされているかの検出を行う検索手段を有することを特徴とする請求項1記載の検索システム。
  3. 前記インターフェース手段が、複数のブラウザと、各ブラウザに各々対応したインターフェースコンポーネントとの関係が記載されたテーブルを有することを特徴とする請求項1または請求項2記載の検索システム。
  4. 前記インターフェース手段が、検索手段の検出したブラウザに対応するインターフェースコンポーネントを前記テーブルから抽出する判定部とを有することを特徴とする請求項3に記載の検索システム。
  5. 前記検索手段が、
    検索対象の文書データを記録する文書データベースと、
    形態素解析用のデータが予め記録された形態素解析用辞書データベースと、
    前記形態素解析用辞書データベースを参照して、入力部から入力される文字列を形態素解析することにより単語を抽出するとともに、該単語について、肯定形または否定形を特定する形態素解析手段と、
    前記単語と肯定または否定を特定する情報に基づいて、検索条件を作成する検索条件作成手段と、
    前記検索条件に合致する文書を、前記文書データベースから文書データを検索する文書検索手段と
    を備えたことを特徴とする請求項1から請求項3のいずれかに記載の検索システム。
  6. インターフェース手段が、HTML形式のファイルに含まれるスクリプトを解釈可能なブラウザの機能を利用し、インストールされているブラウザに対応した記載のインターフェースコンポーネントを起動し、このインターフェースコンポーネントにより、検索コンポーネントを呼び出す処理と、
    検索エンジン手段が、前記検索コンポーネントにより起動され、入力される文字列を解釈し、解釈結果に対応してデータベースにおいて、この文字列に対応するデータの検索処理を行う処理と
    を有するコンピュータにおいて実行可能な検索プログラム。
  7. 前記インターフェース処理がインストール情報記憶部に記憶されているインストール情報から、いずれのブラウザがインストールされているかを検出する処理を有することを特徴とする請求項6記載の検索プログラム。
  8. HTML形式のマニュアル文書を記憶したマニュアル記憶部と、
    前記マニュアル文書に含まれるスクリプトを解釈可能なブラウザと、
    前記ブラウザに対応したインターフェースコンポーネントを起動し、前記インターフェースコンポーネントにより検索コンポーネントを呼び出すインターフェース部と、
    検索対象の文書データを記憶する文書データベースと、
    前記検索コンポーネントにより起動され、入力される質問文を解釈し、その解釈結果に対応して、前記検索対象の文書データの検索を行う検索エンジン部と、
    インストールされた各種アプリケーションやデータの情報を記憶したインストール情報記憶部と
    を備えることを特徴とするパーソナルコンピュータ。
  9. 前記インターフェース部は、前記インストール情報記憶部に記憶した情報から、いずれの種類のブラウザがインストールされているかの検出を行う検索部を備えることを特徴とする請求項8記載のパーソナルコンピュータ。
  10. 前記インターフェース部は、複数のブラウザと、各ブラウザに各々対応したインターフェースコンポーネントとの関係が記載されたテーブルを備えることを特徴とする請求項8または9記載のパーソナルコンピュータ。
  11. 前記インターフェース部は、前記検索部が検出したブラウザに対応するインターフェースコンポーネントを前記テーブルから抽出する判定部を備えることを特徴とする請求項10記載のパーソナルコンピュータ。
  12. 更に、形態素解析用のデータが予め記憶された形態素解析用辞書データベースと、使用される頻度の高い単語毎に類似語が関連付けられて記憶されている類似語辞書データベースとを備え、
    前記検索エンジン部は、
    前記形態素解析用辞書データベースを参照して、前記質問文を解析することにより単語を抽出するとともに、前記単語について肯定形または否定形を特定する形態素解析部と、
    前記類似語辞書データベースを参照して、前記質問文を解析することにより抽出された単語についての類似語を含む検索条件を求める検索条件作成部と、
    前記文書データベースの中から前記検索条件に合致する文書を検索する文書検索部と
    を備えることを特徴とする請求項8から11のいずれかに記載のパーソナルコンピュータ。
JP2004154637A 2003-08-29 2004-05-25 検索システム及び検索プログラム並びにパーソナルコンピュータ Withdrawn JP2005327221A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004154637A JP2005327221A (ja) 2003-08-29 2004-05-25 検索システム及び検索プログラム並びにパーソナルコンピュータ
EP04255067A EP1510948A3 (en) 2003-08-29 2004-08-23 Search system, search program, and personal computer
KR1020040067779A KR100681084B1 (ko) 2003-08-29 2004-08-27 검색 시스템 및 검색 프로그램을 기록한 기록 매체 및퍼스널 컴퓨터
CNA2004100572933A CN1591420A (zh) 2003-08-29 2004-08-27 检索系统和检索程序以及个人计算机
US10/929,116 US20050102280A1 (en) 2003-08-29 2004-08-27 Search system, search program, and personal computer

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003306807 2003-08-29
JP2004116794 2004-04-12
JP2004154637A JP2005327221A (ja) 2003-08-29 2004-05-25 検索システム及び検索プログラム並びにパーソナルコンピュータ

Publications (1)

Publication Number Publication Date
JP2005327221A true JP2005327221A (ja) 2005-11-24

Family

ID=34108598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004154637A Withdrawn JP2005327221A (ja) 2003-08-29 2004-05-25 検索システム及び検索プログラム並びにパーソナルコンピュータ

Country Status (5)

Country Link
US (1) US20050102280A1 (ja)
EP (1) EP1510948A3 (ja)
JP (1) JP2005327221A (ja)
KR (1) KR100681084B1 (ja)
CN (1) CN1591420A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10073927B2 (en) 2010-11-16 2018-09-11 Microsoft Technology Licensing, Llc Registration for system level search user interface
US10346478B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Extensible search term suggestion engine
US10346479B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Facilitating interaction with system level search user interface

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974962B2 (en) * 2005-01-06 2011-07-05 Aptiv Digital, Inc. Search engine for a video recorder
JP2007257369A (ja) * 2006-03-23 2007-10-04 Fujitsu Ltd 情報検索装置
JP2010136067A (ja) * 2008-12-04 2010-06-17 Sony Corp データ処理装置、データ処理方法、及び、プログラム
EP2472418A1 (en) * 2011-01-04 2012-07-04 Axel Springer Digital TV Guide GmbH Apparatus and method for managing a personal channel
US8701019B2 (en) 2011-03-24 2014-04-15 Facebook, Inc. Presenting question and answer data in a social networking system
US20130103668A1 (en) * 2011-10-21 2013-04-25 Telcordia Technologies, Inc. Question conversion for information searching
US20130151347A1 (en) * 2011-12-09 2013-06-13 Robert Michael Baldwin Structured Questions in a Social Networking System
CN108595191B (zh) * 2018-04-27 2021-09-14 京东方科技集团股份有限公司 一种应用安装方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
KR100234271B1 (ko) * 1997-07-15 1999-12-15 윤종용 이동 검색 엔진을 이용한 실시간 정보검색 방법
US6442540B2 (en) * 1997-09-29 2002-08-27 Kabushiki Kaisha Toshiba Information retrieval apparatus and information retrieval method
US7107548B2 (en) * 1998-10-28 2006-09-12 Yahoo! Inc. Method of controlling an internet browser interface and a controllable browser interface
US6928448B1 (en) * 1999-10-18 2005-08-09 Sony Corporation System and method to match linguistic structures using thesaurus information
US7043531B1 (en) * 2000-10-04 2006-05-09 Inetprofit, Inc. Web-based customer lead generator system with pre-emptive profiling
KR100452024B1 (ko) * 2001-01-08 2004-10-08 한용운 자연어 질의 응답 검색 엔진 및 검색 방법
US20050079477A1 (en) * 2001-11-01 2005-04-14 Automatic E-Learning, Llc Interactions for electronic learning system
US6983481B2 (en) * 2002-07-25 2006-01-03 International Business Machines Corporation Apparatus and method for blocking television commercials with a content interrogation program
US20050033641A1 (en) * 2003-08-05 2005-02-10 Vikas Jha System, method and computer program product for presenting directed advertising to a user via a network

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10073927B2 (en) 2010-11-16 2018-09-11 Microsoft Technology Licensing, Llc Registration for system level search user interface
US10346478B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Extensible search term suggestion engine
US10346479B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Facilitating interaction with system level search user interface

Also Published As

Publication number Publication date
KR100681084B1 (ko) 2007-02-08
CN1591420A (zh) 2005-03-09
US20050102280A1 (en) 2005-05-12
EP1510948A3 (en) 2005-08-24
EP1510948A2 (en) 2005-03-02
KR20050021880A (ko) 2005-03-07

Similar Documents

Publication Publication Date Title
US9135295B2 (en) Methods and systems for automated searching
US6658408B2 (en) Document information management system
US9489450B2 (en) Method and apparatus for responding to an inquiry
US7703037B2 (en) Searchable task-based interface to control panel functionality
US9239884B2 (en) Electronic document processing with automatic generation of links to cited references
CA2643754C (en) Searching for commands to execute in applications
US7890506B2 (en) User interface control apparatus and method thereof
US9195754B2 (en) Expansion of search result information
US20050228635A1 (en) Method for describing existing data by a natural language and program for that
JP7231190B2 (ja) 情報提供システム、及び、情報提供制御方法
JP2005327221A (ja) 検索システム及び検索プログラム並びにパーソナルコンピュータ
US20060241995A1 (en) Task-based interface with underlying extensible framework
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20030120779A1 (en) Method for performing a search, and computer program product and user interface for same
JP4469817B2 (ja) 文書検索システム及びプログラム
WO2001095151A1 (fr) Dispositif de transfert de donnees
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002014751A (ja) オンラインヘルプシステム
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006146458A (ja) ドキュメント検索装置及びドキュメント検索プログラム
JP2023009021A (ja) 情報処理装置
JPH11296525A (ja) データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置
KR101182255B1 (ko) 정보 액세스 지원을 위한 방법 및 이를 위한 기록매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070510

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070921