JP6905724B1 - Information provision system and information provision method - Google Patents
Information provision system and information provision method Download PDFInfo
- Publication number
- JP6905724B1 JP6905724B1 JP2021011128A JP2021011128A JP6905724B1 JP 6905724 B1 JP6905724 B1 JP 6905724B1 JP 2021011128 A JP2021011128 A JP 2021011128A JP 2021011128 A JP2021011128 A JP 2021011128A JP 6905724 B1 JP6905724 B1 JP 6905724B1
- Authority
- JP
- Japan
- Prior art keywords
- search
- document
- information
- information providing
- search key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
【課題】文書を検索するにあたり、他の文書との関連性をもって文書の重要度を判定し検索対象文書のインデックス登録を取捨選択することなくインデックスの肥大化を大幅に抑制でき、検索処理を優れたパフォーマンスで行うことができる情報提供システムを提供する。【解決手段】情報提供システム100Aは、ユーザ端末2に情報としての検索キーを取得するための検索キー取得部11と、検索キーから対象情報を特定するための対象情報特定部12と、文書における目次を含む文書構造と目次項目に対するキーワードとのデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されたインデックスを用い、検索キーから得られたキーワードに基づいて検索処理を行う検索処理部13と、対象情報と検索処理結果との組み合わせによって得られた検索結果を出力する検索結果出力部14と、検索結果とリンクするリンクリストから選択的に文書の実データを出力可能な文書出力部15とを備える。【選択図】図3PROBLEM TO BE SOLVED: To significantly suppress index bloat without selecting index registration of a document to be searched by determining the importance of the document in relation to other documents when searching a document, and excellent in search processing. Provide an information provision system that can be performed with good performance. An information providing system 100A includes a search key acquisition unit 11 for acquiring a search key as information on a user terminal 2, a target information identification unit 12 for specifying target information from the search key, and a document. Search processing that prepares as many data sets of document structure including table of contents and keywords for table of contents items as the number of document patterns, and performs search processing based on the keywords obtained from the search key using the index created for each document pattern. Document output that can output the actual data of the document selectively from the search result output unit 14 that outputs the search result obtained by combining the target information and the search processing result, and the link list linked to the search result. A unit 15 is provided. [Selection diagram] Fig. 3
Description
本発明は、情報提供システム及び情報提供方法に関するものである。 The present invention relates to an information providing system and an information providing method.
従来から、例えば、インターネット上に存在する情報を検索するためには、Google(登録商標)やYahoo!(登録商標)をはじめとした情報提供システムが利用されている。これらの情報提供システムは、ユーザ端末から入力して取得された単語等の取得情報に基づいて、検索対象となる文書等の情報を、全文検索で抽出する全文検索方式である。 Conventionally, for example, in order to search for information existing on the Internet, Google (registered trademark) or Yahoo! Information provision systems such as (registered trademark) are used. These information providing systems are full-text search methods that extract information such as documents to be searched by full-text search based on acquired information such as words input from a user terminal.
このような全文検索方式の情報提供システムでは、単純に大量の文書等を対象にした全文検索を行うことでは現実的な性能が得られないので、検索処理を高速に実行するために、検索するためのインデックスを事前に作成しておく全文検索方式が広く用いられている。インデックスとは、単語または文節などの部分文字列を、その部分文字列が出現する文書に対応付けるデータ構造のことである。インデックスに格納させる部分文字列は、所謂見出し語であり、通常、インデックスには文書そのものではなく、文書IDのような形で文書を特定する情報だけが記録される。 In such a full-text search type information providing system, it is not possible to obtain realistic performance by simply performing a full-text search targeting a large number of documents, etc., so a search is performed in order to execute the search process at high speed. A full-text search method in which an index for this is created in advance is widely used. An index is a data structure that associates a substring such as a word or phrase with a document in which the substring appears. The substring to be stored in the index is a so-called headword, and usually, not the document itself but only the information that identifies the document in the form of a document ID is recorded in the index.
例えば、特許文献1には、インデックスを用いて検索を行う検索装置が開示されている。この特許文献1に開示された検索装置では、見出し語とその見出し語を含む文書との対応関係を記憶するインデックスと、インデックス管理手段と、文書検索手段とを備えている。そして、インデックス管理手段は、検索対象文書集合への第1の文書の登録時、第1の文書に含まれる語のうち、インデックスに既に見出し語として登録されている語については、第1の文書の見出し語としてインデックスに登録し、検索インデックスに見出し語として未だ登録されていない語については、第1の文書を引用する別の第2の文書について検索対象文書集合への登録要求があった時点で第1の文書の見出し語としてインデックスに登録する。そのうえで、文書検索手段は、検索要求時、インデックスから検索キーワードに一致する見出し語を含む文書を検索する。
For example,
このような構成なので、特許文献1に開示された検索装置では、他の文書から引用されないような重要でない文書のみに現れる語は見出し語としてインデックスに登録しないという簡便な処理により、重要でない文書によってインデックスが肥大化することの防止を図っている。
With such a configuration, in the search device disclosed in
しかしながら、この特許文献1に開示された従来技術は、検索対象文書集合に登録しようとする文書に含まれる語が検索インデックスに登録されておらず、かつ、他の文書からも引用されない場合、検索インデックスには登録されず、当該文書は検索不可になる。
However, the prior art disclosed in
そこで本発明は、上述した問題点に鑑みて案出されたものであり、その目的とするところは、文書を検索するにあたり、他の文書との関連性をもって文書の重要度を判定し検索対象文書のインデックス登録を取捨選択することなくインデックスの肥大化を大幅に抑制でき、検索処理を優れたパフォーマンスで行うことができる情報提供システム、及び情報提供方法を提供することにある。 Therefore, the present invention has been devised in view of the above-mentioned problems, and the purpose of the present invention is to determine the importance of a document in relation to other documents when searching for a document. It is an object of the present invention to provide an information providing system and an information providing method capable of significantly suppressing the bloat of an index without selecting the index registration of a document and performing a search process with excellent performance.
本発明に係る情報提供システムは、ユーザ端末から取得した情報に基づき、文書の検索を行う情報提供システムであって、前記ユーザ端末に前記情報としての検索キーを取得するための検索キー取得手段と、前記検索キー取得手段から取得された検索キーから対象情報を特定するための対象情報特定手段と、文書における目次を含む文書構造と目次項目に対するキーワードとのデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されたインデックスを用い、前記検索キー取得手段から取得された検索キーから得られたキーワードに基づいて検索処理を行う検索処理手段と、前記対象情報特定手段で特定された対象情報と、前記検索処理手段による検索処理結果と、の組み合わせによって得られた検索結果を出力する検索結果出力手段と、前記検索結果出力手段で出力された検索結果とリンクするリンクリストから選択的に文書の実データを出力可能な文書出力手段と、を備えることを特徴とする。 The information providing system according to the present invention is an information providing system that searches a document based on information acquired from a user terminal, and serves as a search key acquisition means for acquiring a search key as the information on the user terminal. , Prepare as many data sets as the number of document patterns, the target information identification means for specifying the target information from the search key acquired from the search key acquisition means, the document structure including the table of contents in the document, and the keywords for the table of contents items. , A search processing means that performs a search process based on a keyword obtained from a search key acquired from the search key acquisition means using an index created for each document pattern, and a target specified by the target information specifying means. Selectively from the search result output means that outputs the search result obtained by combining the information and the search processing result by the search processing means, and the link list that links to the search result output by the search result output means. It is characterized by including a document output means capable of outputting actual data of a document.
本発明に係る情報提供方法は、ユーザ端末から取得した情報に基づき、文書の検索を行う情報提供方法であって、前記ユーザ端末に前記情報としての検索キーを取得する検索キー取得工程と、前記検索キー取得工程で取得された検索キーから対象情報を特定する対象情報特定工程と、文書における目次を含む文書構造と目次項目に対するキーワードとのデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されたインデックスを用い、前記検索キー取得工程で取得された検索キーから得られたキーワードに基づいて検索処理を行う検索処理工程と、前記対象情報特定工程で特定された対象情報と、前記検索処理工程による検索処理結果と、の組み合わせによって得られた検索結果を出力する検索結果出力工程と、前記検索結果出力工程で出力された検索結果とリンクするリンクリストから選択した文書の実データを出力する文書出力工程と、を備えることを特徴とする。 The information providing method according to the present invention is an information providing method for searching a document based on information acquired from a user terminal, and includes a search key acquisition step of acquiring a search key as the information in the user terminal, and the above-mentioned. Prepare as many data sets as the number of document patterns for the target information identification process that specifies the target information from the search key acquired in the search key acquisition process, the document structure including the table of contents in the document, and the keywords for the table of contents items, and for each document pattern. A search processing step of performing a search process based on a keyword obtained from a search key acquired in the search key acquisition step using the index created in the above, a target information specified in the target information specifying step, and the above. The actual data of the document selected from the link list linked to the search result output process that outputs the search result obtained by combining the search processing result by the search processing process and the search result output in the search result output process. It is characterized by including a document output process for output.
本発明によれば、文書を検索するにあたり、他の文書との関連性をもって文書の重要度を判定し検索対象文書のインデックス登録を取捨選択することなくインデックスの肥大化を大幅に抑制でき、検索処理を優れたパフォーマンスで行うことができる。 According to the present invention, when a document is searched, the importance of the document is determined in relation to other documents, and the index bloat can be significantly suppressed without selecting the index registration of the search target document, and the search can be performed. Processing can be performed with excellent performance.
以下、本発明の実施形態について、図面を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1実施形態]
先ず、図1〜図4を用いて、本発明の第1実施形態に係る情報提供システム100Aについて説明する。図1は、第1実施形態に係る情報提供システム100A全体の概略構成を示す模式図である。
[First Embodiment]
First, the
(情報提供システム100Aの構成)
本発明の第1実施形態に係る情報提供システム100Aは、図1に示すように、一例として、計測器Xを使用する技術者等のユーザUに利用される場合について説明する。情報提供システム100Aは、例えば、ユーザUが検索を行うことにより、計装機器Xのマニュアル等の文書をユーザUに提供できる。これにより、ユーザUは、計装機器Xのマニュアル等の文書を参照することができる。
(Configuration of
As shown in FIG. 1, the
図1に示すように、情報提供システム100Aは、情報提供装置1を備える。情報提供装置1は、インターネット等の通信網Nを介してユーザ端末2及びサーバSと接続されている。
As shown in FIG. 1, the
<情報提供装置1>
図2は、情報提供装置1の構成の一例を示す模式図である。情報提供装置1は、筐体10と、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、保存部104と、I/F105〜107とを備える。各構成101〜107は、内部バス110により接続されるパーソナルコンピュータ(PC)であり、ユーザUが利用するユーザ端末2側へ通信網Nを介してサービスを提供するホストコンピュータである。
<
FIG. 2 is a schematic diagram showing an example of the configuration of the
CPU101は、情報提供装置1全体を制御する。ROM102は、CPU101の動作コードを格納する。RAM103は、CPU101の動作時に使用される作業領域である。保存部104は、後述する、対象情報特定用データベース16、検索処理用データベース17、及び検索結果出力用データベース18等の各種情報が保存される(図3を参照)。保存部104としては、例えばHDD(Hard Disk Drive)のほか、SSD(solid state drive)等が用いられる。
The
I/F105は、通信網Nを介してユーザ端末2等との各種情報の送受信を行うためのインターフェースである。I/F106は、入力部108との各種情報の送受信を行うためのインターフェースである。入力部108としては、例えばキーボードが用いられ、情報提供システム100Aによるサービスを提供するホスト側は、入力部108を介して、情報提供装置1のメンテナンス等を行う。I/F107は、出力部109との各種情報の送受信を行うためのインターフェースである。出力部109は、保存部104に保存された各種情報、又は情報提供装置1の処理状況等を出力する。出力部109としては、ディスプレイが用いられている。
The I /
なお、情報提供システム100Aの機能は、情報提供装置1において、CPU101が、RAM103を作業領域として、保存部104等に記憶されたプログラムを実行することにより実現される。また、情報提供システム100Aの機能は、例えば人工知能により制御されてもよい。ここで、「人工知能」は、いかなる周知の人工知能技術に基づくものであってもよい。
The function of the
<ユーザ端末2>
ユーザ端末2は、図1に示すように、情報提供装置1と同様に、パーソナルコンピュータ(PC)であり、ホストコンピュータである情報提供装置1から通信網Nを介してユーザUがサービスを受けるクライアントコンピュータである。
<
As shown in FIG. 1, the
ユーザ端末2は、一例として、計測器Xを使用する技術者等のユーザUの端末である。ユーザ端末2は、文字情報の入力を行うためのキーボード11A、音声情報の入力を行うためのマイクロホン11B、画像情報の入力を行うためのWebカメラ11Cと、出力部としてのディスプレイ21と、マウス22とを備え、不図示のインターフェースによって通信網Nに接続されている。
As an example, the
なお、画像情報の入力を行うためのWebカメラ11Cは、ホロレンズ(登録商標)等のHMD(ヘッドマウントディスプレイ)等を代わりに用いてもよい。また、ユーザ端末2は、パーソナルコンピュータ(PC)に限定されず、この他、携帯電話(携帯端末)、スマートフォン、タブレット型端末、ウェアラブル端末、IoT(Internet of Things)デバイス等の電子機器のほか、あらゆる電子機器で具現化されたものが用いられてもよい。ユーザ端末2は、例えば通信網Nを介して情報提供装置1と接続されるほか、例えば情報提供装置1と直接接続されてもよい。ユーザUは、ユーザ端末2を用いて、情報提供装置1で検索を行うほか、例えば情報提供装置1の制御も行えるようにしてもよい。
The Web camera 11C for inputting image information may use an HMD (head-mounted display) such as a holo lens (registered trademark) instead. The
また、ユーザ端末2と情報提供装置1とは、いずれもパーソナルコンピュータ(PC)であるが、情報提供装置1には、複数のユーザ端末2の検索要求に対応できるように処理能力のより高いものを用いるのが好ましい。
Further, although the
<サーバS>
サーバSには、ストレージS1に、ユーザUのユーザ端末2に提供される計装機器Xのマニュアル等の文書の実データが記憶されている(図3を参照)。なお、通信網Nを用いない場合は、ユーザUのユーザ端末2に提供される計装機器Xのマニュアル等の文書の実データを、例えば情報提供装置1の保存部104等に記憶させてもよい。
<Server S>
In the server S, the actual data of a document such as a manual of the instrumentation device X provided to the
図3は、情報提供システム100Aの構成を示す模式図である。図4は、第1実施形態に係る情報提供方法を示すフローチャートである。情報提供システム100Aは、ユーザ端末2が有する検索キー取得部11と、情報提供装置1が有する、対象情報特定部12と、検索処理部13と、検索結果出力部14と、文書出力部15と、を備えている。
FIG. 3 is a schematic diagram showing the configuration of the
<検索キー取得部11>
検索キー取得部11は、具体的には、ユーザ端末2におけるキーボード11A、マイクロホン11B、又はWebカメラ11Cのいずれかである。検索キーを文字情報取得方式で取得する場合は、キーボード11Aによって文字入力で検索キーを入力し、文字情報として取得される。検索キーを音声情報取得方式で取得する場合は、マイクロホン11Bによる音声入力で検索キーを入力することによって、音声情報として取得される。なお、音声情報取得方式で取得された音声情報は、ユーザ端末2内で不図示の音声情報/文字情報変換手段によって文字情報に変換される。検索キーを画像情報取得方式で取得する場合は、Webカメラ11Cによる画像情報を、不図示の情報提供装置1又はユーザ端末2に内蔵された画像認識人工知能の認識結果によって文字情報に変換することによって検索キーとして取得される。或いは、検索キーを画像情報取得方式で取得する場合は、Webカメラ11Cによる画像入力で検索キーを入力することによって、画像情報として取得されるようにしてもよい。
<Search
Specifically, the search
具体的には、例えば、ユーザUが、検索キーとして、計装機器Xの名称、及び型番X1、或いはこれに操作方法等の広義の文言や各種操作シーンを表す狭義の文言(シーン名)、或いは計装機器Xの画像等を含めたものを、キーボード11A、マイクロホン11B、又はWebカメラ11Cで入力すると、文字情報又は画像情報として取得された検索キーは、ユーザ端末2から、通信網Nを介して、情報提供装置1における対象情報特定部12へ送られる(検索キー取得工程S11)。
Specifically, for example, the user U uses the name of the instrumentation device X and the model number X1 as a search key, or a broad wording such as an operation method or a narrow wording (scene name) representing various operation scenes. Alternatively, when an image including an image of the instrumentation device X is input by the
ここで、検索キー取得工程S11における検索キーの取得方式は、キーボード11Aによる文字情報取得方式、マイクロホン11Bによる音声情報取得方式、及びWebカメラ11Cによる画像情報取得方式の単一の取得方式に限定されない。例えば、Webカメラ11Cによる画像情報取得方式だけでは、計装機器Xの型番X1等が写り込まなかったりして、情報が不足する場合は、この不足する情報を、キーボード11Aによる文字情報取得方式やマイクロホン11Bによる音声情報取得方式で補うことができる。すなわち、キーボード11Aによる文字情報取得方式、マイクロホン11Bによる音声情報取得方式、及びWebカメラ11Cによる画像情報取得方式を単一でなく複合して用いてもよい。
Here, the search key acquisition method in the search key acquisition step S11 is not limited to a single acquisition method of the character information acquisition method by the
<対象情報特定部12>
対象情報特定部12は、情報提供装置1の内部に設けられており、同じく情報提供装置1の内部に設けられた対象情報特定用データベース16と接続されている。対象情報特定用データベース16内には、検索キー取得部11から送られてきた検索キーを特定するための対象情報のリストが記憶されている。なお、対象情報特定用データベース16内に記憶される対象情報のリストは、予めあれば、それらを流用してもよいし、新たに発生したものは、自動又は手動で作成し、追加してもよい。
<Target
The target
具体的には、対象情報特定部12は、検索キー取得部11から送られてきた文字情報又は画像情報として取得された検索キーに対応する対象情報を、対象情報特定用データベース16内の対象情報のリストから探し出し、その対象情報と紐付けする処理を行う。そして、検索キー取得部11から取得された検索キーと、対象情報特定部12で特定された対象情報と、は、検索処理部13へ送られる(対象情報特定工程S12)。
Specifically, the target
<検索処理部13>
検索処理部13は、情報提供装置1の内部に設けられており、同じく情報提供装置1の内部に設けられた検索処理用データベース17と接続されている。検索処理用データベース17内には、検索処理に用いるためのインデックスが記憶されている。
<
The
検索処理用データベース17内に記憶されるインデックスは、文書における目次を含む文書構造と目次項目に対するキーワード(タグ・メタ情報)のデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されている。具体的には、文書パターン毎に、目次項目に対するキーワードをインデックスとすることができる。文書パターンが同じ文書は、内容も類似しているので、キーワードも略共通である。それ故に、文書パターン毎のキーワードをインデックスとすることができるのである。
The index stored in the
ここで、キーワードは、目次項目に対応する文書の本文から不図示の抽出部によって抽出される。その抽出手法は、論文、オープンソースなライブラリ等の既存の文書の単語重要度抽出手法を利用してもよいし、手動で行ってもよい。 なお、データ内の画像等非構造情報のキーワードは、アノテーション作業を行い、抽出すればよい。 Here, the keyword is extracted from the text of the document corresponding to the table of contents item by an extraction unit (not shown). The extraction method may be a word importance extraction method of an existing document such as a treatise or an open source library, or may be performed manually. The keywords of non-structural information such as images in the data may be extracted by performing annotation work.
このインデックスの作成方法は、特に業務等に使用される文書(例えばマニュアル等の文書)は、現在では既に略完成段階にあり、ブランドやグレードが異なっていても、もはや文書構造は、略同じものが殆どであり、文書パターンも数パターンしかないことから、そこに着眼し、独自に考えついたものである。例えば、同じ対象に対する文書が1000冊あったとしても、文書パターンの数も、大抵2,3冊程度の文書となることが分かった。すなわち、インデックスはサンプリングされたものとなり、従来技術に比して、大幅に少量のインデックスとなる。なお、文書パターンの違いは、例えば、目次項目に、全ての文章等が記載されているものと、目次項目には、大まかな文章が記載され、その下側に追加の詳細や注釈等の文章が記載されているものと、の違い程度であることが多い。 As for the method of creating this index, documents used for business (for example, documents such as manuals) are already in the almost completed stage, and even if the brands and grades are different, the document structure is almost the same. In most cases, there are only a few document patterns, so I focused on that and came up with my own ideas. For example, even if there are 1000 documents for the same subject, it was found that the number of document patterns is usually about 2 or 3 documents. That is, the index is sampled, and the index is significantly smaller than that of the prior art. The difference between the document patterns is that, for example, the table of contents item contains all the sentences, and the table of contents item contains rough sentences, and additional details and annotations are written below the table of contents. Is often the difference from the one described.
検索処理部13は、この大幅に少量とされたインデックスを用い、検索キー取得部11から取得された検索キーから得られたキーワード(タグ・メタ情報)に基づいて検索処理を行う。そして、検索処理部13は、対象情報特定部12で特定された対象情報と、検索処理部13による検索処理結果を、検索結果出力部14へ送る(検索処理工程S13)。
The
<検索結果出力部14>
検索結果出力部14は、情報提供装置1の内部に設けられており、同じく情報提供装置1の内部に設けられた検索結果出力用データベース18と接続されている。検索結果出力用データベース18内には、対象情報特定部12で特定された対象情報と、検索処理部13による検索処理結果と、の組み合わせによってヒットして得られた検索結果に対応した文書の実データのリンクリストのリンク情報のみが記憶されている。そして、検索結果出力部14は、通信網Nを介して、ユーザ端末2のディスプレイ21に、この検索結果のリンクリストを出力して表示させる。具体的には、計装機器Xのマニュアル等の文書の実データのリンクリストを出力して表示させる(検索結果出力工程S14)。
<Search
The search
<文書出力部15>
文書出力部15は、情報提供装置1の内部に設けられており、通信網Nを介して、サーバS内のストレージS1と接続されている。そして、文書出力部15は、ユーザUが、マウス22等を用い、検索結果のリンクリストのうちのいずれかを選択すると、指令を出し、ユーザ端末2のディスプレイ21に、選択された文書の実データを出力して表示させる(文書出力工程S15)。
<
The
なお、文書出力部15によって出力可能な文書の実データは、文書テキストのみでなく、文書テキストに、イラスト、画像データ、動画データ、及び音声データ等が添付又はリンクされているコンテンツも含む。
The actual data of the document that can be output by the
また、第1実施形態に係る情報提供システム100Aで検索される対象は、計装機器Xのみに限定されないことを、再度、付言する。例えば、第1実施形態に係る情報提供システム100Aは、「リンゴ」のようなより単純なものから、「治療困難な心臓疾患の治療方法」のようなより高度なものまで、略全てのものを検索対象とすることができる。
Further, it is added again that the target searched by the
第1実施形態に係る情報提供システム100Aによれば、文書における目次を含む文書構造と目次項目に対するキーワードとのデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されたインデックスを用い、検索キー取得部11から取得された検索キーから得られたキーワードに基づいて検索処理を行う検索処理部13を備えている。これにより、代表となるキーワードのみでインデックスが作成されるので、文書を検索するにあたり、他の文書との関連性をもって文書の重要度を判定し検索対象文書のインデックス登録を取捨選択することなくインデックスの肥大化を大幅に抑制でき、検索処理を優れたパフォーマンスで行うことができる情報提供システム100Aを提供することができる。
According to the
また、この情報提供システム100Aでは、検索キー取得部11からユーザ端末2に取得される検索キーは、少なくとも、文字情報取得方式、音声情報取得方式、及び画像情報取得方式のうち、何れか、或いはこれらの複合の取得方式で取得される。このため、様々なユーザUや様々なシチュエーションに対応することができ、使い勝手がよい。
Further, in the
また、この情報提供システム100Aでは、文書出力部15によって出力可能な文書の実データは、文書テキストのみでなく、文書テキストに、イラスト、画像データ、動画データ及び音声データのうち、少なくとも何れか一が添付又はリンクされているコンテンツも含む。このため、様々なコンテンツの提供が可能となり、適切な情報の取得及び提供を効率的に行うことが可能となる。
Further, in the
また、この情報提供システム100Aでは、情報提供装置1の内部に、対象情報特定部12に接続され、対象情報のリストが記憶された対象情報特定用データベース16と、検索処理部13に接続され、インデックスが記憶された検索処理用データベース17と、検索結果出力部14に接続され、検索結果とリンクするリンクリストが記憶された検索結果出力用データベース18と、を備える。このため、情報提供システム100Aの構成の多くが、情報提供装置1の内部に備えてあるので、メンテナンスやシステムの更新等を容易に行うことができる。
Further, in the
さらに、この情報提供システム100Aでは、文書出力部15から出力可能な文書の実データは、通信網Nを介して接続されたストレージS1に記憶されている。このため、より多くの適切な情報の取得及び提供を行うことが可能となる。
Further, in the
[第2実施形態]
次に、図5を用いて、本発明の第2実施形態に係る情報提供システム100Bについて説明する。図5は、第2実施形態に係る情報提供システム100Bの構成を示す模式図である。上述の第1実施形態に係る情報提供システム100Aと相違する点は、主に、選択結果記録部20を更に備えたことなので、その点について主に説明し、同一構成は同一符号を付し、説明を省略する。
[Second Embodiment]
Next, the
この情報提供システム100Bでは、情報提供装置1の内部に、検索結果出力部14によって出力された検索結果で必要な文書が選択されたか否かの選択結果を記録するための選択結果記録部20を更に備え、選択結果記録部20に記録された選択結果を、検索処理部13にフィードバックするフィードバック機構を有することが、第1実施形態に係る情報提供システム100Aと異なる。
In this
ここで、この情報提供システム100Bは、情報提供装置1の内部において、保存部104等に選択結果記録部20の領域が設けられ、保存部104等に記憶された選択結果記録部20に記録された選択結果を、検索処理部13にフィードバックするフィードバック機構を含めたプログラムを実行することにより実現される。
Here, in the
この第2実施形態に係る情報提供システム100Bでは、第1実施形態に係る情報提供システム100Aとは異なり、上記したフィードバック機構を有する。このため、この情報提供システム100Bでは、フィードバック結果が、検索結果出力部14でのフィルタリング、レコメンド、及び優先順位処理等に反映されるので、使用される度に検索精度を高めることができる。
The
[第3実施形態]
次に、図6を用いて、本発明の第3実施形態に係る情報提供システム100Cについて説明する。図6は、第3実施形態に係る情報提供システム100Cの構成を示す模式図である。上述の第1実施形態に係る情報提供システム100Aと相違する点は、主に、類似語解析部30を更に備えたことなので、その点について主に説明し、同一構成は同一符号を付し、説明を省略する。
[Third Embodiment]
Next, the
この情報提供システム100Cでは、情報提供装置1の内部において、検索キーの類義語を検索処理過程で含むための類義語解析部30を、検索処理部13に接続して、更に備えることが、第1実施形態に係る情報提供システム100Aと異なる。
In the
ここで、この情報提供システム100Cは、情報提供装置1の内部において、保存部104等に類義語解析部30の領域が設けられ、保存部104等に記憶された検索処理部13に接続された検索処理用データベース17に記憶されているインデックスではヒットしない検索キーも類義語解析部30から検索キーの類義語を検索処理部13に送る機能を含めたプログラムを実行することにより実現される。
Here, in the
この第3実施形態に係る情報提供システム100Cでは、第1実施形態に係る情報提供システム100Aとは異なり、情報提供装置1の内部において、類義語解析部30を更に備える。このため、この情報提供システム100Cでは、検索処理部13に接続された検索処理用データベース17に記憶されているインデックスではヒットしない検索キーも類義語解析部30から検索キーの類義語を検索処理部13に送ることによって、フォローすることができる。
Unlike the
[第4実施形態]
次に、図7を用いて、本発明の第4実施形態に係る情報提供システム100Dについて説明する。図7は、第4実施形態に係る情報提供システム100Dの構成を示す模式図である。上述の第1実施形態に係る情報提供システム100Aと相違する点は、主に、類似語解析部40を更に備えたことなので、その点について主に説明し、同一構成は同一符号を付し、説明を省略する。
[Fourth Embodiment]
Next, the
この情報提供システム100Dでは、ユーザ端末2の内部において、検索キーの類義語を検索処理過程で含むための類義語解析部40を、検索キー取得部11に接続して、更に備えることが、第1実施形態に係る情報提供システム100Aと異なる。
In the
ここで、この情報提供システム100Dは、ユーザ端末2の内部において、不図示の保存部等に類義語解析部40の領域が設けられ、対象情報特定部12へ送る前に、検索キーの類義語も検索キーに含めるプログラムを実行することにより実現される。
Here, in the
この第4実施形態に係る情報提供システム100Dでは、第1実施形態に係る情報提供システム100Aとは異なり、ユーザ端末2の内部において、類義語解析部40を更に備える。このため、この情報提供システム100Dでは、類義語解析部40により、対象情報特定部12へ送る前に、検索キーの類義語も検索キーに含めることができ、検索キーが、検索処理部13におけるインデックスでヒットしない確率を大幅に低減することができる。
Unlike the
本発明の実施形態を説明したが、実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although embodiments of the present invention have been described, the embodiments are presented as examples and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other embodiments, and various omissions, replacements, and changes can be made without departing from the gist of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are also included in the scope of the invention described in the claims and the equivalent scope thereof.
100A〜D 情報提供システム
11 検索キー取得部(検索キー取得手段)
11A キーボード(検索キー取得手段)
11B マイクロホン(検索キー取得手段)
11C Webカメラ(検索キー取得手段)
12 対象情報特定部(対象情報特定手段)
13 検索処理部(検索処理手段)
14 検索結果出力部(検索結果出力手段)
15 文書出力部(文書出力手段)
16 対象情報特定用データベース
17 検索処理用データベース
18 検索結果出力用データベース
S1 ストレージ
20 選択結果記録部(選択結果記録手段)
30 類義語解析部(類義語解析手段)
40 類義語解析部(類義語解析手段)
2 ユーザ端末
N 通信網
S11 検索キー取得工程
S12 対象情報特定工程
S13 検索処理工程
S14 検索結果出力工程
S15 文書出力工程
100A to D
11A keyboard (search key acquisition means)
11B microphone (search key acquisition method)
11C Web camera (search key acquisition means)
12 Target information identification unit (target information identification means)
13 Search processing unit (search processing means)
14 Search result output unit (search result output means)
15 Document output unit (document output means)
16 Target
30 Synonym analysis department (synonym analysis means)
40 Synonym Analysis Department (Synonym Analysis Means)
2 User terminal N Communication network S11 Search key acquisition process S12 Target information identification process S13 Search processing process S14 Search result output process S15 Document output process
Claims (9)
前記ユーザ端末に前記情報としての検索キーを取得するための検索キー取得手段と、
前記検索キー取得手段から取得された検索キーから対象情報を特定するための対象情報特定手段と、
文書における目次を含む文書構造と目次項目に対するキーワードとのデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されたインデックスを用い、前記検索キー取得手段から取得された検索キーから得られたキーワードに基づいて検索処理を行う検索処理手段と、
前記対象情報特定手段で特定された対象情報と、前記検索処理手段による検索処理結果と、の組み合わせによって得られた検索結果を出力する検索結果出力手段と、
前記検索結果出力手段で出力された検索結果とリンクするリンクリストから選択的に文書の実データを出力可能な文書出力手段と、を備えること
を特徴とする情報提供システム。 An information providing system that searches for documents based on the information acquired from the user terminal.
A search key acquisition means for acquiring a search key as the information on the user terminal, and
Target information identifying means for identifying target information from the search key acquired from the search key acquiring means, and
Data sets of the document structure including the table of contents in the document and the keywords for the table of contents items are prepared for the number of document patterns, and the index created for each document pattern is used and obtained from the search key acquired from the search key acquisition means. A search processing means that performs search processing based on the keywords
A search result output means that outputs a search result obtained by combining the target information specified by the target information specifying means and the search processing result by the search processing means.
An information providing system including a document output means capable of selectively outputting actual document data from a link list linked to a search result output by the search result output means.
を特徴とする請求項1記載の情報提供システム。 The search key acquired from the search key acquisition means to the user terminal is acquired by at least one of a character information acquisition method, a voice information acquisition method, and an image information acquisition method, or a combination of these acquisition methods. The information providing system according to claim 1, wherein the information providing system is characterized by the above.
前記選択結果記録手段に記録された選択結果を、前記検索処理手段にフィードバックすること
を特徴とする請求項1又は2記載の情報提供システム。 Further provided with a selection result recording means for recording the selection result of whether or not the necessary document is selected in the search result output by the search result output means.
The information providing system according to claim 1 or 2, wherein the selection result recorded in the selection result recording means is fed back to the search processing means.
を特徴とする請求項1又は2記載の情報提供システム。 The information providing system according to claim 1 or 2, wherein a synonym analysis means for including a synonym of a search key in a search processing process is further provided by connecting to the search processing means.
を特徴とする請求項1又は2記載の情報提供システム。 The information providing system according to claim 1 or 2, wherein a synonym analysis means for including a synonym of a search key in a search processing process is further provided by connecting to the search key acquisition means.
を特徴とする請求項1〜5の何れか1項記載の情報提供システム。 The actual data of the document that can be output by the document output means is not only the document text, but also the content in which at least one of illustration, image data, video data, and audio data is attached or linked to the document text. The information providing system according to any one of claims 1 to 5, wherein the information providing system includes.
前記検索処理手段に接続され、インデックスが記憶された検索処理用データベースと、
前記検索結果出力手段に接続され、検索結果とリンクするリンクリストが記憶された検索結果出力用データベースと、を更に備えること
を特徴とする請求項1〜6の何れか1項記載の情報提供システム。 A target information identification database connected to the target information identification means and storing a list of target information,
A search processing database connected to the search processing means and storing an index,
The information providing system according to any one of claims 1 to 6, further comprising a search result output database connected to the search result output means and storing a link list linked to the search result. ..
を特徴とする請求項1〜7の何れか1項記載の情報提供システム。 The information providing system according to any one of claims 1 to 7, wherein the actual data of the document that can be output from the document output means is stored in the storage connected via the communication network.
前記ユーザ端末に前記情報としての検索キーを取得する検索キー取得工程と、
前記検索キー取得工程で取得された検索キーから対象情報を特定する対象情報特定工程と、
文書における目次を含む文書構造と目次項目に対するキーワードとのデータセットを文書パターンの数だけ用意し、文書パターン毎に作成されたインデックスを用い、前記検索キー取得工程で取得された検索キーから得られたキーワードに基づいて検索処理を行う検索処理工程と、
前記対象情報特定工程で特定された対象情報と、前記検索処理工程による検索処理結果と、の組み合わせによって得られた検索結果を出力する検索結果出力工程と、
前記検索結果出力工程で出力された検索結果とリンクするリンクリストから選択した文書の実データを出力する文書出力工程と、を備えること
を特徴とする情報提供方法。 It is an information providing method that searches for documents based on the information acquired from the user terminal.
A search key acquisition process for acquiring a search key as the information on the user terminal, and
A target information specifying process for specifying target information from the search key acquired in the search key acquisition process, and a target information specifying process.
Data sets of the document structure including the table of contents in the document and the keywords for the table of contents items are prepared for the number of document patterns, and the index created for each document pattern is used and obtained from the search key acquired in the search key acquisition process. A search processing process that performs search processing based on the keywords
A search result output process that outputs a search result obtained by combining the target information specified in the target information specifying process and the search processing result by the search processing process.
An information providing method including a document output process for outputting actual data of a document selected from a link list linked to a search result output in the search result output process.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021011128A JP6905724B1 (en) | 2021-01-27 | 2021-01-27 | Information provision system and information provision method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021011128A JP6905724B1 (en) | 2021-01-27 | 2021-01-27 | Information provision system and information provision method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6905724B1 true JP6905724B1 (en) | 2021-07-21 |
JP2022114721A JP2022114721A (en) | 2022-08-08 |
Family
ID=76918255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021011128A Active JP6905724B1 (en) | 2021-01-27 | 2021-01-27 | Information provision system and information provision method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6905724B1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063332A (en) * | 2003-08-19 | 2005-03-10 | Fujitsu Ltd | Information system coordination device, and coordination method |
JP2014235619A (en) * | 2013-06-03 | 2014-12-15 | 株式会社プリマジェスト | Image information processing apparatus and image information processing method |
JP2020160494A (en) * | 2019-03-25 | 2020-10-01 | 富士ゼロックス株式会社 | Information processing apparatus, document management system and program |
-
2021
- 2021-01-27 JP JP2021011128A patent/JP6905724B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005063332A (en) * | 2003-08-19 | 2005-03-10 | Fujitsu Ltd | Information system coordination device, and coordination method |
JP2014235619A (en) * | 2013-06-03 | 2014-12-15 | 株式会社プリマジェスト | Image information processing apparatus and image information processing method |
JP2020160494A (en) * | 2019-03-25 | 2020-10-01 | 富士ゼロックス株式会社 | Information processing apparatus, document management system and program |
Also Published As
Publication number | Publication date |
---|---|
JP2022114721A (en) | 2022-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11853334B2 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
US8200695B2 (en) | Database for uploading, storing, and retrieving similar documents | |
US8341175B2 (en) | Automatically finding contextually related items of a task | |
US8370376B2 (en) | Multimedia object retrieval from natural language queries | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
US11907669B2 (en) | Creation of component templates based on semantically similar content | |
JP2010073114A6 (en) | Image information retrieving apparatus, image information retrieving method and computer program therefor | |
US10078672B2 (en) | Search device, search method, and computer program product | |
JP6165955B1 (en) | Method and system for matching images and content using whitelist and blacklist in response to search query | |
WO2011091442A1 (en) | System and method for optimizing search objects submitted to a data resource | |
JP2015525929A (en) | Weight-based stemming to improve search quality | |
US11429792B2 (en) | Creating and interacting with data records having semantic vectors and natural language expressions produced by a machine-trained model | |
US20230334079A1 (en) | Methods and systems for reuse of data item fingerprints in generation of semantic maps | |
WO2021188214A1 (en) | Intelligent ranking of search results | |
US10650191B1 (en) | Document term extraction based on multiple metrics | |
JPH1145267A (en) | Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device | |
JP2011133928A (en) | Retrieval device, retrieval system, retrieval method, and computer program for retrieving document file stored in storage device | |
CN117421389A (en) | Intelligent model-based technical trend determination method and system | |
JP6905724B1 (en) | Information provision system and information provision method | |
JP4544047B2 (en) | Web image search result classification presentation method and apparatus, program, and storage medium storing program | |
JP7029204B1 (en) | Technical survey support equipment, technical survey support methods, and technical survey support programs | |
KR101592670B1 (en) | Apparatus for searching data using index and method for using the apparatus | |
JP7272540B2 (en) | Information provision system, information provision method, and data structure | |
JP2011248827A (en) | Cross-lingual information searching method, cross-lingual information searching system and cross-lingual information searching program | |
NL2025417B1 (en) | Intelligent Content Identification and Transformation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210127 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210127 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210420 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210519 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6905724 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |