JP2008250893A - Information retrieval device, information retrieval method and its program - Google Patents

Information retrieval device, information retrieval method and its program Download PDF

Info

Publication number
JP2008250893A
JP2008250893A JP2007094464A JP2007094464A JP2008250893A JP 2008250893 A JP2008250893 A JP 2008250893A JP 2007094464 A JP2007094464 A JP 2007094464A JP 2007094464 A JP2007094464 A JP 2007094464A JP 2008250893 A JP2008250893 A JP 2008250893A
Authority
JP
Japan
Prior art keywords
keyword
information
question sentence
search
important
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007094464A
Other languages
Japanese (ja)
Other versions
JP5332128B2 (en
Inventor
Norihiko Sakamoto
憲彦 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007094464A priority Critical patent/JP5332128B2/en
Publication of JP2008250893A publication Critical patent/JP2008250893A/en
Application granted granted Critical
Publication of JP5332128B2 publication Critical patent/JP5332128B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To retrieve optimal information for learning a teaching material from the question content of a learner on the teaching material. <P>SOLUTION: This information retrieval device 1 for retrieving the information for acquiring an answer to a question from a question sentence on predetermined first information acquired from a server; reads the question sentence (S11); extracts a first keyword by analyzing a morpheme (S12); reads a document of the first information; extracts a second keyword by analyzing the morpheme; executes weighting processing on the second keyword; determines a weight value of indicating significance of the respective second keywords; selects a keyword of high significance from the weight value: sets the selected keyword to an important keyword; generates a retrieval expression from a combination of the first keyword and the important keyword (S13); and outputs the document (a WEB page) for acquiring the answer to the question by the generated retrieval expression (S14). <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、情報検索装置、情報検索方法およびそのプログラムに関し、特に、電子化された教材を用いて学習を行うWEBベースの学習システムにおいて、学習者の質問内容からその教材の学習に最適な情報、すなわち質問に対する回答を得るための情報を検索可能にする情報検索装置、情報検索方法およびそのプログラムに関する。   The present invention relates to an information search apparatus, an information search method, and a program thereof, and in particular, in a WEB-based learning system that performs learning using an electronic teaching material, information that is optimal for learning the teaching material from the contents of a question of a learner That is, the present invention relates to an information search apparatus, an information search method, and a program for enabling search for information for obtaining an answer to a question.

今日、コンピュータネットワークの拡大とその進歩に伴い、情報を入手したい時、インターネットで公開されている情報の中から所望の情報をキーワードなどを使って検索可能にするサーチエンジンが広く利用されている。サーチエンジンは、WWWなどで公開されている情報の全文を貯えておき、キーワードによって検索する全文検索型と、カテゴリー別に分類されているディレクトリ型の2種類に大別できる。最近では、ディレクトリ型のサーチエンジンにも検索機能が搭載されるようになってきている。   2. Description of the Related Art Today, with the expansion and advancement of computer networks, search engines that can search for desired information using keywords or the like from information published on the Internet when information is desired are widely used. Search engines store the full text of information published on the WWW or the like, and can be broadly classified into two types: a full text search type that searches by keywords and a directory type that is classified by category. Recently, a search function has been installed in a directory-type search engine.

電子化された教材を用いて学習を行うWEBベースの学習システムにおいても、情報の入手にキーワードによる検索が必須である。WEBベースの学習システムは、学習者からの質問を受け付ける機能を持つものが一般的であるが、質問に対する回答は講師が手作業により作成する必要がある。このため、コストが掛かり、またその回答を得るまでに時間が掛かる。講師が回答を作成する代わりに、学習者自身がWEB上のサーチエンジンを用いて検索し回答を得ることはできるものの、所望の情報を得るためサーチエンジンに入力する、キーワードから構成される検索式を適切に作成して回答を得ることは困難である。   Even in a WEB-based learning system in which learning is performed using an electronic teaching material, a keyword search is essential for obtaining information. A WEB-based learning system generally has a function of accepting a question from a learner, but an answer to the question needs to be manually created by an instructor. For this reason, it costs and it takes time to obtain the answer. A search formula consisting of keywords that the learner can search and obtain answers by using a search engine on the WEB instead of the instructor creating an answer, but is input to the search engine to obtain desired information It is difficult to obtain an answer by properly creating

また、WEBベースの学習システムにおいて、学習者の意欲を保つためには、疑問点に対して即座のレスポンスが必要であり、メールや掲示版では遅い。チャットを利用することで即時性は保てるが、チャット利用者に即座に対応するため常に講師が待機する必要があり、コストが掛かる。学習者は、疑問点の解決のため、サーチエンジンを用いて、ファイルやWEBページを検索することはできるが、一般的にサーチエンジンの利用者にとって、所望の情報を得るためサーチエンジンに入力するのに適したキーワードから構成される検索式を作成することは難しく、1つの検索キーワードだけ入力して検索する場合が多い。この場合、一度に大量のWEBページが検索され、有効な関連WEBページを得るのは困難である。   In addition, in the WEB-based learning system, in order to keep the learner's motivation, an immediate response to the question point is necessary, and it is slow in the mail and the posted version. Immediateness can be maintained by using the chat, but in order to respond immediately to the chat user, the instructor must always be on standby, which is costly. A learner can search a file or a web page using a search engine to solve a question, but generally, a search engine user inputs information to the search engine to obtain desired information. It is difficult to create a search expression composed of keywords suitable for the search, and it is often the case that only one search keyword is input for search. In this case, a large number of WEB pages are searched at a time, and it is difficult to obtain a valid related WEB page.

また、従来のWEBベースの学習システムにおいて、利用者の入力したテキスト文(文書)から、カテゴリーを判別し、検索結果を絞り込む技術はあるが、事前の準備が必要であり、コストが掛かる。   In addition, in the conventional WEB-based learning system, there is a technique for discriminating a category from a text sentence (document) input by a user and narrowing down a search result. However, preparation in advance is necessary and cost is increased.

しかるに、特許文献1に記載の情報検索システムは、情報ネットワーク上の情報を検索する検索装置と、原文と該原文に関するユーザからの質問とに基づいて検索装置に対する検索要求を行う検索要求装置と、を含む情報検索システムにおいて、検索装置は、原文を指定する原文指定部と、学習者の質問文から検索キーワードを抽出するキーワード抽出部と、その検索キーワードに基づいて質問の質問属性を指定する質問属性指定部と、指定された質問属性に基づいて検索装置による検索対象となる範囲を絞り込むことに利用できる単語の単語属性を指定し、原文からその単語属性に属する単語を抽出し、抽出した単語を検索キーワードへの追加キーとする追加キー抽出部と、追加キーが抽出された場合にその追加キーを検索キーワードに追加し、検索装置に対し質問に基づいた検索要求を作成し、検索要求を原文から抽出された追加キーに関連付ける関連付け部とを有する。   However, the information search system described in Patent Document 1 includes a search device that searches for information on an information network, a search request device that makes a search request to the search device based on the original text and a question from the user regarding the original text, In the information search system including the search device, the search device includes an original text specifying unit that specifies the original text, a keyword extracting unit that extracts the search keyword from the learner's question text, and a question that specifies the question attribute of the question based on the search keyword Specify the word attribute of the word that can be used to narrow down the range to be searched by the search device based on the attribute specification unit and the specified question attribute, extract the word belonging to the word attribute from the original sentence, and extract the extracted word And an additional key extractor that uses as an additional key to the search keyword, and when the additional key is extracted, the additional key is added to the search keyword. And, having an association unit to search device to create a search request based on the query, associating the search request to add key extracted from the original.

端的に言えば、特許文献1は、質問文から抽出された検索キーワードに基づいて指定された質問属性に基づき検索範囲を絞り込むための単語属性を指定し、原文から該単語属性に属する単語を抽出し、抽出した単語を検索キーワードに加えて検索を行う技術を開示したものである。   In short, Patent Document 1 specifies a word attribute for narrowing a search range based on a question attribute specified based on a search keyword extracted from a question sentence, and extracts a word belonging to the word attribute from the original sentence. Then, a technique for performing a search by adding the extracted word to a search keyword is disclosed.

特開2005−11149号公報(明細書の[請求項1]、段落番号[0002]、[0004]、[0007]〜[0009]、[0014]、[00015]および図面の[図1]参照)。JP 2005-11149 A (see [Claim 1], paragraph numbers [0002], [0004], [0007] to [0009], [0014], [00015] of the specification and [FIG. 1] of the drawings) ).

しかしながら、上記特許文献1に開示の情報検索システムおよび検索要求装置は、原文から単語属性に属する単語を抽出し、抽出した単語を検索キーワードに加えて検索式を求めているので、学習者の質問文および/または原文の記載によっては重要でない検索キーワードが求められてしまい、所望のキーワードを抽出できず、十分な絞込みができないという問題がある。
また、上記特許文献1に記載の発明では、学習者に何等の操作、意識をさせることなく、すなわち自動的に、質問に対する回答を得ることはできないという問題がある。
However, since the information search system and the search request device disclosed in Patent Document 1 extract words belonging to word attributes from the original text and add the extracted words to the search keywords to obtain a search formula, Depending on the description of the sentence and / or the original sentence, an unimportant search keyword is required, and there is a problem that a desired keyword cannot be extracted and cannot be narrowed down sufficiently.
Further, the invention described in Patent Document 1 has a problem that an answer to a question cannot be obtained automatically without causing the learner to perform any operation or consciousness.

本発明は、上記問題を解決するためになされたものであり、情報に関する質問内容からその質問に回答するのに最適な情報を検索する情報検索装置、情報検索方法およびそのプログラムの提供、より具体的には、教材に関する学習者の質問内容からその教材の学習に最適な十分に絞り込んだ情報を自動的に検索する情報検索装置、情報検索方法およびそのプログラムの提供を目的とする。   The present invention has been made to solve the above-described problem, and provides an information search apparatus, an information search method, and a program therefor for searching for optimum information for answering the question from the contents of the question about the information, and more specifically. Specifically, it is an object of the present invention to provide an information search apparatus, an information search method, and a program for automatically searching for information sufficiently narrowed down optimal for learning of a learning material from the contents of a learner's question regarding the learning material.

上記目的を達成する本発明による情報検索プログラムは、学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索プログラムであって、コンピュータ装置を、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、学習者からの質問文の入力を受け付ける質問文受付手段と、前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、前記出力手段から出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、して機能させることを特徴とする。   An information search program according to the present invention that achieves the above object generates information for searching for information related to a question sentence in accordance with a question sentence input from a computer on the learner side, and searches for the information using the keyword A search program, an output means for outputting a first learning area extracted from a learning material composed of a plurality of learning areas divided into a plurality of learning areas to the learner terminal, and receiving a question sentence from the learner A question sentence receiving means, a first keyword extracting means for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence receiving means, and the first learning region output from the output means Stored important keywords to be added to the first keyword for searching for information on the question sentence A second keyword extracting means for extracting the important keyword as a second keyword for searching with reference to a key word definition table; and searching for information on the question sentence using both the first keyword and the second keyword. It is made to function as a search means which performs.

上記情報検索プログラムは、さらに、前記コンピュータ装置を、前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、として機能させることを特徴とする。   In the information search program, the computer device further performs a morphological analysis on each of a plurality of learning regions constituting the teaching material, and determines an importance from an appearance frequency and extracts a keyword extracted as the important keyword. It is made to function as an important word definition table production | generation means which produces | generates a word definition table.

上記目的を達成する本発明による情報検索方法は、学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索方法であって、コンピュータ装置が、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力ステップと、学習者からの質問文の入力を受け付ける質問文受付ステップと、前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出ステップと、前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出ステップと、前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索ステップと、を行うことを特徴とする。   The information search method according to the present invention that achieves the above object generates information for searching for information related to the question sentence according to the question sentence input from the computer on the learner side, and searches for the information using the keyword. A search method, wherein the computer device outputs an output step of outputting a first learning area extracted from a learning material composed of a plurality of learning areas to a learner terminal, and accepts an input of a question sentence from the learner A question sentence receiving step, a first keyword extracting step for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence receiving means, and the first learning region output in the output step Of important keywords to be added to the first keyword for searching for information on the question sentence. A second keyword extracting step of referring to the important word definition table to extract the important keyword as a second keyword for search; and searching for information on the question sentence using both the first keyword and the second keyword. And a search step for performing.

上記情報検索方法は、さらに、前記コンピュータ装置が、前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成ステップ、を行うこと特徴とする。   In the information search method, the computer device further performs a morphological analysis on each of a plurality of learning regions constituting the teaching material, and determines the importance based on the appearance frequency as the important keyword. An important word definition table generation step for generating a word definition table is performed.

上記目的を達成する本発明による情報検索装置は、学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索装置であって、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、学習者からの質問文の入力を受け付ける質問文受付手段と、前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、を備えることを特徴とする。   An information search apparatus according to the present invention that achieves the above object generates information for searching for information related to a question sentence in accordance with a question sentence input from a computer on a learner side, and searches for the information using the keyword. An output means for outputting a first learning area extracted from a learning material composed of a plurality of divided learning areas to a learner terminal, and a question sentence receiving means for receiving an input of a question sentence from the learner First keyword extraction means for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence reception means, and among the keywords in the first learning region output in the output step , Referring to an important word definition table storing important keywords to be added to the first keyword for searching for information on the question sentence. Second keyword extracting means for extracting a keyword required as a second keyword for search; and search means for searching for information on the question sentence using both the first keyword and the second keyword. It is characterized by.

上記情報検索装置は、さらに、前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、を備えること特徴とする。   The information search apparatus further performs a morphological analysis on each of a plurality of learning regions constituting the teaching material, and generates the important word definition table using keywords extracted by determining importance from appearance frequencies as the important keywords. And an important word definition table generating means.

本発明の情報検索装置、情報検索方法およびそのプログラムによれば、学習者は検索式を意識せずに教材の学習内容についての質問文を入力することが可能となり、かつ教材の学習内容に沿った学習者が真に必要とする最適な情報を自動的に検索することが可能となる。   According to the information search device, the information search method, and the program of the present invention, the learner can input a question sentence about the learning content of the learning material without being aware of the search formula, and in accordance with the learning content of the learning material. It is possible to automatically search for the optimum information that the learner really needs.

図1は本発明の情報検索装置のブロック構成図である。図1の一点鎖線の上側に示す本発明の情報検索装置1は、サーバであり、図1の一点鎖線の下側に示す、検索エンジンとしてのサーバ18および学習者側のパーソナルコンピュータ(学習者PC)19とネットワーク17を介して通信可能に接続され、学習者と情報検索装置1との間でWEBベースの学習を行う装置である。情報検索装置1は、相互にバスライン10を介して接続されるCPU11、学習者からの質問文の入力を受け付ける質問文受付手段であるマウスやキーボード等の入力装置12、メモリ13、ハードディスク14、ディスプレイ15およびネットワーク17を介してサーバ18および学習者PC19と通信する通信ユニット16を有する。   FIG. 1 is a block diagram of an information search apparatus according to the present invention. The information search device 1 of the present invention shown above the one-dot chain line in FIG. 1 is a server. The server 18 as a search engine and a personal computer on the learner side (learner PC) shown below the one-dot chain line in FIG. ) 19 and a network 17 are communicably connected to each other and perform a WEB-based learning between the learner and the information retrieval apparatus 1. The information search apparatus 1 includes a CPU 11 connected to each other via a bus line 10, an input device 12 such as a mouse and a keyboard, which is a question sentence receiving means for receiving an input of a question sentence from a learner, a memory 13, a hard disk 14, The communication unit 16 communicates with the server 18 and the learner PC 19 via the display 15 and the network 17.

メモリ13には、CPU11を第1キーワード抽出手段131、第2キーワード抽出手段132、検索手段133および重要語定義テーブル生成手段134として機能させるためのプログラムが格納されている。   The memory 13 stores a program for causing the CPU 11 to function as the first keyword extraction unit 131, the second keyword extraction unit 132, the search unit 133, and the keyword definition table generation unit 134.

通信ユニット16は、複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末(学習者PC)19に出力する出力手段としての機能も有する。   The communication unit 16 also has a function as an output unit that outputs a first learning area extracted from a learning material composed of a plurality of learning areas to a learner terminal (learner PC) 19.

第1キーワード抽出手段は、質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する。
第2キーワード抽出手段は、出力手段から出力された第1学習領域におけるキーワードのうち、質問文に関する情報の検索のために第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して重要キーワードを検索のための第2キーワードとして抽出する。
The first keyword extracting means extracts a first keyword for search by performing morphological analysis on the question sentence received by the question sentence receiving means.
The second keyword extracting means refers to an important word definition table storing important keywords to be added to the first keyword for searching for information on the question sentence among the keywords in the first learning area output from the output means. An important keyword is extracted as a second keyword for search.

検索手段は、第1キーワードと第2キーワードの双方を用いて質問文に関する情報の検索を行う。
重要語定義テーブル生成手段は、教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを重要キーワードとして重要語定義テーブルを生成する。
The search means searches for information related to the question sentence using both the first keyword and the second keyword.
The important word definition table generating means performs a morphological analysis on each of a plurality of learning areas constituting the teaching material, and generates an important word definition table using the extracted keywords by determining the importance from the appearance frequency.

ハードディスク14には、学習者が質問する学習対象の教材の文書を格納する教材用テキストファイル群141および文書を自立語(名詞、代名詞、動詞、形容詞、形容動詞、副詞、接続詞および感動詞)に分けるために用いる形態素解析辞書ファイル142が格納される。   In the hard disk 14, the text file for teaching material 141 storing documents of learning materials to be learned, which the learner asks, and the document as independent words (nouns, pronouns, verbs, adjectives, adjective verbs, adverbs, conjunctions, and verbs). A morphological analysis dictionary file 142 used for dividing is stored.

情報検索装置1は、通信ユニット16、ネットワーク17を介して学習対象となる主文書を含む複数の文書をサーバ18から受信し、教材用テキストファイル群141に格納する。サーバ18から受信した複数の文書は、受信後、直接メモリ13に書込んでもよい。本発明の実施形態では、学習対象となる主文書を含む複数の文書はサーバ18に格納されサーバ18から情報検索装置1に送信されるが、他の実施形態として複数の文書はサーバ18以外のコンピュータから送信された情報あるいは自身で作成した情報を情報検索装置1内に格納してもよい。   The information search apparatus 1 receives a plurality of documents including a main document to be learned from the server 18 via the communication unit 16 and the network 17 and stores them in the text file group 141 for teaching materials. The plurality of documents received from the server 18 may be directly written into the memory 13 after being received. In the embodiment of the present invention, a plurality of documents including a main document to be learned are stored in the server 18 and transmitted from the server 18 to the information search apparatus 1. However, in another embodiment, the plurality of documents are other than the server 18. Information transmitted from a computer or information created by itself may be stored in the information search apparatus 1.

次いで、情報検索装置1は、形態素解析辞書ファイル142を用いて各文書をそれぞれ形態素解析し自立語を取出し、各文書をそれぞれ解析し自立語の重要度を算出し、各文書における自立語の重要度の中から少なくとも一つの自立語を重要キーワードとして選択する。   Next, the information retrieval apparatus 1 uses the morphological analysis dictionary file 142 to analyze each document, extract independent words, analyze each document, calculate the importance of the independent words, and calculate the importance of the independent words in each document. At least one independent word is selected from the degrees as an important keyword.

図2は学習対象の文書に関する質問の回答を得るのに適切な文書を提示する基本手順を示すフローチャートである。
ステップS1で、学習者PC19から通信ユニット16を介して入力された図3に示す学習対象の文書に関する質問文を読取る。
FIG. 2 is a flowchart showing a basic procedure for presenting an appropriate document for obtaining an answer to a question regarding a document to be learned.
In step S1, the question text relating to the learning target document shown in FIG. 3 input from the learner PC 19 via the communication unit 16 is read.

ステップS2で、ステップS1で入力した質問文を形態素解析し質問文内のキーワードを取出す。
ステップS3で、学習者が現在参照中の文書を形態素解析し該文書内のキーワードを取出す。現在参照中の文書は、学習者PC19と通信して得るか、質問文の読取り時に読取る。
In step S2, the question sentence input in step S1 is subjected to morphological analysis and a keyword in the question sentence is taken out.
In step S3, a morphological analysis is performed on a document that the learner is currently referring to, and a keyword in the document is extracted. The currently referenced document is obtained by communicating with the learner PC 19 or read when reading the question sentence.

ステップS4で、ステップS2で質問文から取出したキーワードとステップS3で参照中の文書から取出したキーワードとを組合わせて、所望の情報を得るためサーチエンジンに入力するキーワードで構成される検索式を生成する。
ステップS5で、ステップS4で生成した検索式で検索を実行し、質問に対する回答を得るための文書情報(WEBページ)を学習者に出力する。
In step S4, a search expression composed of keywords input to the search engine to obtain desired information is obtained by combining the keywords extracted from the question sentence in step S2 and the keywords extracted from the document being referred to in step S3. Generate.
In step S5, a search is executed using the search formula generated in step S4, and document information (WEB page) for obtaining an answer to the question is output to the learner.

図3は教材の主文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面30の具体例を示す図であり、図4は教材の主文書の関連文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面40の具体例を示す図である。図3および図4の上段に示す文書は、法律入門の教材に関するものであり、学習者による学習者PC19の操作によりサーバ18から受信され情報検索装置1のハードディスク14内の教材用テキストファイル群141に格納される。主文書は知的財産権に関し、関連文書は独占禁止法に関する。各文書はそれぞれ別の記載内容を有する。以下、各文書中に………で示す部分は、記載内容を省略していることを示す。   FIG. 3 is a diagram showing a specific example of the display screen 30 in which the description content of the main document of the teaching material is displayed in the upper portion and the important keywords extracted are displayed in the lower portion, and FIG. 4 is the description content of the related document in the main document of the teaching material. It is a figure which shows the specific example of the display screen 40 which displays on the upper stage and displays the important keyword taken out in the lower stage. The documents shown in the upper part of FIG. 3 and FIG. 4 are related to teaching materials for introductory laws, and are received from the server 18 by the learner's operation of the learner PC 19 and the text file group 141 for teaching materials in the hard disk 14 of the information search device 1 Stored in The main document is related to intellectual property rights and the related document is related to antitrust law. Each document has a different description. In the following, in each document, the portion indicated by... Indicates that the description is omitted.

図3および図4において、上段に示すディスプレイ画面30および40は、下段左側に、各文書を形態素解析して取出した自立語のうち名詞を抜き出した結果のキーワード(名詞)および各キーワードの重み(重要度)の算出結果を示し、下段右側に、算出したキーワードの重要度の中から選択した重要度の高い重要キーワードを示す。   3 and 4, the display screens 30 and 40 shown in the upper part are displayed on the left side of the lower part as keywords (nouns) obtained as a result of extracting nouns from independent words extracted by morphological analysis of each document and weights of the keywords ( (Importance level) is calculated, and on the lower right side, a high importance keyword selected from the calculated keyword importance levels is shown.

図3および図4は、それぞれ法律入門の教材であり、主文書および関連文書の記載内容と、形態素解析結果、すなわちキーワード(名詞、重み)および重要キーワードの取出し結果をそれぞれ示す。重みは、図3に示す文書31と図4に示す文書41とに出現するキーワード(ここでは名詞類)に対して、tf/idf値など統計処理で一般に用いられる重みの値を算出して用いる。重みの値が高いキーワードを重要キーワードとしてメモリ13に記憶する。   FIG. 3 and FIG. 4 are teaching materials for introductory laws, respectively, showing the contents of the main document and related documents, and the morphological analysis results, that is, the keywords (nouns, weights) and important keyword extraction results. As for the weight, a weight value generally used in statistical processing such as tf / idf value is calculated and used for keywords (in this case, nouns) appearing in the document 31 shown in FIG. 3 and the document 41 shown in FIG. . A keyword having a high weight value is stored in the memory 13 as an important keyword.

なお、図3および図4に示す重みは、主文書と関連文書とに出現するキーワード(ここでは名詞)に対して、tf/idf値など統計処理で一般に用いられる重みを算出して求めたものである。   The weights shown in FIGS. 3 and 4 are obtained by calculating weights generally used in statistical processing such as tf / idf values for keywords (in this case, nouns) appearing in the main document and related documents. It is.

図5はキーワードテーブルを示す図であり、(A)は図3に示す教材の主文書におけるキーワードテーブルを示す図であり、(B)は図4に示す教材の主文書の関連文書におけるキーワードテーブルを示す図である。図5の(A)および(B)に示す例では、キーワードの重みが6.0以上のキーワードが重要キーワードに設定されている。この重要キーワードは、図中値1で示され、重要キーワードとみなされないものは値0で示される。それゆえ、このキーワードテーブルは重要語定義テーブルと称する。   FIG. 5 is a diagram showing a keyword table, (A) is a diagram showing a keyword table in the main document of the learning material shown in FIG. 3, and (B) is a keyword table in a related document of the main document of the learning material shown in FIG. FIG. In the example shown in FIGS. 5A and 5B, a keyword having a keyword weight of 6.0 or more is set as an important keyword. This important keyword is indicated by a value 1 in the figure, and an important keyword that is not regarded as an important keyword is indicated by a value 0. Therefore, this keyword table is referred to as an important word definition table.

この重要キーワードは、通信ユニット16から学習者PC19に出力された現在参照中の文書(第1学習領域)におけるキーワードのうち、質問文に関する情報の検索のために第1キーワードに加えるべき重要キーワードである。第2キーワード抽出手段は、重要語定義テーブルを参照して重要キーワードを検索のための第2キーワードとして抽出する。   This important keyword is an important keyword that should be added to the first keyword in order to search for information related to the question sentence, among the keywords in the currently referenced document (first learning area) output from the communication unit 16 to the learner PC 19. is there. The second keyword extracting means extracts an important keyword as a second keyword for searching with reference to the important word definition table.

重要語定義テーブル生成手段は、教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して重要度の値の高いキーワードを重要キーワードとして抽出可能にする重要語定義テーブルを生成する。   The important word definition table generation means performs morphological analysis on each of the plurality of learning areas constituting the teaching material, and determines the importance from the appearance frequency so that a keyword having a high importance value can be extracted as an important keyword. Generate a word definition table.

図6は学習対象の文書に関する質問の回答を得るのに適切な重要キーワードを加味した文書を提示する手順を示すフローチャートである。ここで、適切な文書とは所定の学習対象の文書に関する質問に対する回答を得るためのWEBページを意味する。   FIG. 6 is a flowchart showing a procedure for presenting a document in which important keywords suitable for obtaining an answer to a question regarding a document to be learned are added. Here, an appropriate document means a WEB page for obtaining an answer to a question regarding a predetermined document to be learned.

ステップS11で、学習者PC19から通信ユニット16を介して入力された図3に示す学習対象の文書に関する質問文を読取る。
ステップS12で、ステップS11で入力した質問文を形態素解析し質問文内のキーワードを取出す。
In step S11, the question text relating to the learning target document shown in FIG. 3 input from the learner PC 19 via the communication unit 16 is read.
In step S12, the question sentence input in step S11 is subjected to morphological analysis and a keyword in the question sentence is taken out.

ステップS13で、ステップS12で取出したキーワードと学習対象の文書の重要キーワードであって、学習対象の文書に関連する学習者が現在参照中の図4に示す文書とを組合わせて、所望の情報を得るためサーチエンジンに入力するキーワードで構成される検索式を生成する。現在参照中の文書は、学習者PC19と通信して得るか、質問文の読取り時に読取る。
ステップS14で、ステップS13で生成した検索式で検索を実行し、質問に対する回答を得るための文書(WEBページ)を学習者に出力する。
In step S13, desired information is obtained by combining the keyword extracted in step S12 with the important keyword of the document to be learned and the document shown in FIG. In order to obtain a search expression, a search expression composed of keywords input to a search engine is generated. The currently referenced document is obtained by communicating with the learner PC 19 or read when reading the question sentence.
In step S14, a search is executed using the search formula generated in step S13, and a document (WEB page) for obtaining an answer to the question is output to the learner.

図7は、学習者が学習対象の文書に関連する文書を参照中に質問文を入力し、質問文の形態素解析を行っている所の画面70を示す図である。図7において、図6のステップS11で学習者が図4に示す文書を参照中に入力した質問文を図7の上段に示し、図6のステップS12で質問文の形態素解析した結果を図7の下段左側に示し、キーワードを取出した結果を図7の下段右側に示す。   FIG. 7 is a diagram illustrating a screen 70 where a learner inputs a question sentence while referring to a document related to a document to be learned and performs a morphological analysis of the question sentence. 7, the question text input by the learner while referring to the document shown in FIG. 4 in step S11 in FIG. 6 is shown in the upper part of FIG. 7, and the result of the morphological analysis of the question text in step S12 in FIG. The result of keyword extraction is shown on the lower right side of FIG.

学習者は図4に示す独占禁止法の文書を参照しており、独占禁止法の違反摘発事例を知りたいのであるが、質問文から取出されたキーワードは、「違反」、「摘発」および「事例」の3語だけである。これら3語を検索キーワードとして用いても、独占禁止法の違反または摘発の事例を検索することは困難である。   The learner is referring to the antitrust law document shown in FIG. 4 and wants to know examples of violations of the antitrust law. The keywords extracted from the question text are “violation”, “detection” and “ There are only three words "example". Even if these three words are used as search keywords, it is difficult to search for violations of antitrust laws or cases of detection.

図8は質問文から取出されたキーワードを用いて検索した検索結果を示す図である。図8に示す検索結果の画面80は、質問文から取出されたキーワード、「違反」、「摘発」および「事例」の3語による検索結果は独占禁止法の違反または摘発の事例を含む文書情報(WEBページ)として不十分であることが示される。   FIG. 8 is a diagram showing a search result searched using a keyword extracted from a question sentence. The search result screen 80 shown in FIG. 8 is a document information including a keyword extracted from a question sentence, “violation”, “detection”, and “example” of three words, including a case of violation of antitrust law or an example of detection. (WEB page) is insufficient.

図9は、本発明により学習者が学習対象の文書に関する質問内容からその学習に最適な文書を取得している所の画面90を示す図である。図9において、学習者が入力した質問文から取出されたキーワードを左上に示し、質問文の入力時に開いていた教材の文書、すなわち図4に示す文書に対応して予めメモリ13に格納された重要キーワードを右上に示し、質問文から取出されたキーワードと重要キーワードとを組合わせた例を下段に示す。   FIG. 9 is a diagram showing a screen 90 where the learner has acquired the optimum document for learning from the question content related to the document to be learned according to the present invention. In FIG. 9, the keywords extracted from the question text entered by the learner are shown in the upper left, and stored in advance in the memory 13 corresponding to the teaching material document opened when the question text was entered, that is, the document shown in FIG. An important keyword is shown in the upper right, and an example in which the keyword extracted from the question sentence and the important keyword are combined is shown in the lower part.

図9に示されるように、図6のステップS13で、「違反」、「摘発」、「事例」、「メーカ」、「値段」、「競争」および「独占」をAND条件で検索式を生成することにより、独占禁止法の違反または摘発の事例を含む文書を検索結果の上位に得ることができることが判る。   As shown in FIG. 9, in step S13 of FIG. 6, a search expression is generated with AND conditions for “violation”, “detection”, “example”, “manufacturer”, “price”, “competition”, and “exclusive”. By doing so, it can be seen that documents including violations of antitrust laws or cases of detection can be obtained at the top of the search results.

図10は学習者が入力した質問文から取出されたキーワードと質問文の入力時に開いていた教材の文書に対応する重要キーワードとを組合わせたキーワードを用いて検索した検索結果を示す図である。図10に示す検索結果の画面100は、独占禁止法の違反または摘発の事例を含む文書情報(WEBページ)として十分であることが示される。   FIG. 10 is a diagram showing a search result obtained by searching using a keyword obtained by combining a keyword extracted from a question sentence input by a learner and an important keyword corresponding to a teaching material document opened when the question sentence is input. . The search result screen 100 shown in FIG. 10 is shown to be sufficient as document information (WEB page) including examples of violation of the antitrust law or detection.

図11は図1に示す情報検索装置を用いて、複数の文書における各重要キーワードを取得する処理を示すフローチャートである。本フローチャートにおける処理は、学習者が質問文を入力しその回答を得る前に行う事前の準備段階における処理である。この処理を事前に行うことで、質問文の入力後における処理の時間を短縮できる。   FIG. 11 is a flowchart showing a process of acquiring each important keyword in a plurality of documents using the information search apparatus shown in FIG. The processing in this flowchart is processing in a preliminary preparation stage that is performed before the learner inputs a question sentence and obtains an answer thereto. By performing this process in advance, the processing time after inputting the question text can be shortened.

ステップS101で、教材を構成する複数の文書を登録する。すなわち、学習者PC19からの入力操作により学習対象となる主文書と主文書の関連文書を含む複数の文書を通信ユニット16を介して受信し、ハードディスク14内のテキストファイル群141に格納する。主文書は質問文から抽出されたキーワードを元に検索された文書であることが好ましい。また、主文書の関連文書は質問文から抽出されたキーワードを元に検索された文書であることが好ましい。   In step S101, a plurality of documents constituting the teaching material are registered. That is, a plurality of documents including a main document to be learned and related documents of the main document are received via the communication unit 16 by an input operation from the learner PC 19 and stored in the text file group 141 in the hard disk 14. The main document is preferably a document searched based on a keyword extracted from a question sentence. The related document of the main document is preferably a document searched based on a keyword extracted from the question sentence.

ステップS102で、ステップS101で格納した各文書を形態素解析しキーワードを取出す。
ステップS310で、キーワードテーブルを参照する。図5を用いて先に説明したキーワードテーブル(重要語定義テーブル)は、キーワード(本実施形態では名詞のキーワードと各キーワードの重み)および各キーワードが重要キーワードであるか否かの判定値を一覧表示するものである。
In step S102, each document stored in step S101 is subjected to morphological analysis and a keyword is extracted.
In step S310, the keyword table is referenced. The keyword table (important word definition table) described above with reference to FIG. 5 is a list of keywords (in this embodiment, noun keywords and weights of each keyword) and determination values as to whether or not each keyword is an important keyword. To display.

キーワードテーブルの作成に際し、各文書に出現するキーワードに対しそれぞれtf/idf値など統計処理し、キーワードの重み(重要度)を算出する。より詳しくは、主文書と主文書の関連文書とを比較し、出現する名詞に対し重みを示す尺度である情報利得(Information Gain)や tf-idf 値を計算する。情報利得や tf-idf 値は、他の文書には出現せずにその文書にだけ出現する語(キーワード)ほど大きい。tf-idf 値とは、キーワード抽出対象の文書から文書を代表するキーワードを抽出したときのキーワードの出現頻度を示す指標である。本実施形態では、一般的に用いられる tf-idf 値を算出して重要度を示す指標とする。   When creating the keyword table, statistical processing such as tf / idf values is performed for each keyword appearing in each document, and the weight (importance) of the keyword is calculated. More specifically, the main document and a related document of the main document are compared, and an information gain or tf-idf value that is a scale indicating the weight for the appearing noun is calculated. The information gain and tf-idf value are larger for words (keywords) that appear only in that document, not in other documents. The tf-idf value is an index indicating the appearance frequency of a keyword when a keyword representing the document is extracted from the keyword extraction target document. In this embodiment, a commonly used tf-idf value is calculated and used as an index indicating the importance.

ステップS104で、文書毎に重要度の高いキーワードを選択し、重要キーワードとしてメモリ13に保存する。   In step S104, a keyword having a high importance is selected for each document and stored in the memory 13 as an important keyword.

以上説明した本発明の実施形態は、図2に示すフローチャートのステップS1〜S5の処理および図6に示すフローチャートのステップS11〜S14の処理を実行する手順を例に挙げて説明したが、他の実施形態として、例えば図11に示すフローチャートのステップS101〜S104の処理を予め実行しておくことにより、ステップS101〜S104の処理を予め実行するので事前の準備は必要であるが、学習対象の文書の形態素解析およびキーワードの抽出が事前に実行されるので、図6に示すフローチャートのステップS13の処理時間を短縮できる。   The embodiment of the present invention described above has been described by taking as an example the procedure of executing steps S1 to S5 in the flowchart shown in FIG. 2 and steps S11 to S14 in the flowchart shown in FIG. As an embodiment, for example, the processing of steps S101 to S104 in the flowchart shown in FIG. 11 is executed in advance, so that the processing of steps S101 to S104 is executed in advance. Since the morphological analysis and keyword extraction are executed in advance, the processing time of step S13 in the flowchart shown in FIG. 6 can be shortened.

(付記1)
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索プログラムであって、
コンピュータ装置を、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、
学習者からの質問文の入力を受け付ける質問文受付手段と、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、
前記出力手段から出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、
して機能させることを特徴とする情報検索プログラム。
(Appendix 1)
An information search program for generating a keyword for searching for information related to the question sentence according to a question sentence input from a learner's computer and searching for the information by the keyword,
Computer equipment,
Output means for outputting to the learner terminal the first learning area extracted from the learning material composed of a plurality of learning areas;
A question sentence receiving means for receiving input of a question sentence from a learner;
First keyword extraction means for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence reception means;
Of the keywords in the first learning area outputted from the output means, the important keywords are referenced with reference to an important word definition table storing important keywords to be added to the first keywords for searching for information on the question sentence. Second keyword extracting means for extracting as a second keyword for search;
Search means for searching for information relating to the question sentence using both the first keyword and the second keyword;
An information retrieval program characterized by functioning.

(付記2)
前記コンピュータ装置を、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、
として機能させることを特徴とする付記1に記載の情報検索プログラム。
(Appendix 2)
Said computer device,
Important word definition table generating means for performing morphological analysis on each of a plurality of learning regions constituting the teaching material, generating the important word definition table using the keyword extracted by determining the importance from the appearance frequency as the important keyword,
The information search program according to appendix 1, wherein the information search program is made to function as:

(付記3)
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索方法であって、
コンピュータ装置が、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力ステップと、
学習者からの質問文の入力を受け付ける質問文受付ステップと、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出ステップと、
前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出ステップと、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索ステップと、
を行うことを特徴とする情報検索方法。
(Appendix 3)
An information search method for generating a keyword for searching for information related to the question sentence according to a question sentence input from a learner's computer and searching for the information by the keyword,
Computer equipment
An output step of outputting to the learner terminal the first learning area extracted from the learning material composed of a plurality of learning areas;
A question acceptance step for accepting input of a question from a learner;
A first keyword extracting step of extracting a first keyword for search by performing morphological analysis on the question sentence received by the question sentence receiving means;
Of the keywords in the first learning area output in the output step, the important keywords are referenced with reference to an important word definition table storing important keywords to be added to the first keywords for retrieval of information on the question sentence. A second keyword extraction step of extracting as a second keyword for search;
A search step of searching for information related to the question sentence using both the first keyword and the second keyword;
An information retrieval method characterized by:

(付記4)
前記コンピュータ装置が、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成ステップ、
を行うこと特徴とする付記3に記載の情報検索方法。
(Appendix 4)
The computer device is
An important word definition table generating step of generating a keyword definition table using the keyword extracted by performing morphological analysis for each of a plurality of learning regions constituting the teaching material, judging the importance from the appearance frequency as the important keyword,
The information search method according to supplementary note 3, wherein:

(付記5)
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索装置であって、
コンピュータ装置が、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、
学習者からの質問文の入力を受け付ける質問文受付手段と、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、
前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、
を備えたことを特徴とする情報検索装置。
(Appendix 5)
An information search device that generates a keyword for searching for information related to the question sentence according to a question sentence input from a learner's computer and searches for the information using the keyword,
Computer equipment
Output means for outputting to the learner terminal the first learning area extracted from the learning material composed of a plurality of learning areas;
A question sentence receiving means for receiving input of a question sentence from a learner;
First keyword extraction means for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence reception means;
Of the keywords in the first learning area output in the output step, the important keywords are referenced with reference to an important word definition table storing important keywords to be added to the first keywords for searching for information on the question sentence. Second keyword extracting means for extracting as a second keyword for search;
Search means for searching for information related to the question sentence using both the first keyword and the second keyword;
An information retrieval apparatus comprising:

(付記6)
前記コンピュータ装置が、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、
を備えたこと特徴とする付記5に記載の情報検索装置。
(Appendix 6)
The computer device is
Important word definition table generating means for performing morphological analysis on each of a plurality of learning regions constituting the teaching material, generating the important word definition table using the keyword extracted by determining the importance from the appearance frequency as the important keyword,
The information search device according to appendix 5, characterized by comprising:

(付記7)
種々の情報を格納するサーバに接続され、該サーバから取得した所定の第1情報に関する質問文から質問に対する回答を得るための情報を検索する情報検索装置であって、
学習者側のコンピュータから受信した前記質問文を読取り、形態素解析して第1キーワードを抽出する第1抽出手段と、
前記第1情報および該第1情報に関連する第2情報の各文書をそれぞれ読取り、形態素解析して第2キーワードを抽出する第2抽出手段と、
前記各文書に出現する前記第2キーワードについて重み付け処理を行い、各第2キーワードの重要度を示す重み値を求め、該重み値から重要度の高いキーワードを選択し、選択したキーワードを前記各文書に対する重要キーワードにそれぞれ設定する設定手段と、
前記第1キーワードと前記第2情報の文書に対する重要キーワードの組合せから検索式を生成する検索式生成手段と、
を備えることを特徴とする情報検索装置。
(Appendix 7)
An information search device that is connected to a server that stores various information and searches for information for obtaining an answer to a question from a question sentence related to predetermined first information acquired from the server,
First extraction means for reading the question sentence received from the computer on the learner side and extracting a first keyword by performing morphological analysis;
Second extraction means for reading each document of the first information and the second information related to the first information, and extracting a second keyword by morphological analysis;
The second keyword appearing in each document is weighted, a weight value indicating the importance of each second keyword is obtained, a keyword having a high importance is selected from the weight value, and the selected keyword is assigned to each document. Setting means to set each of the important keywords for,
Search expression generation means for generating a search expression from a combination of important keywords for the document of the first keyword and the second information;
An information retrieval apparatus comprising:

(付記8)
前記第2情報の文書は、前記第1キーワードを元に検索された文書である、
付記7に記載の情報検索装置。
(付記9)
前記第1情報の文書は、前記第1キーワードを元に検索された文書である、
付記7に記載の情報検索装置。
(Appendix 8)
The document of the second information is a document searched based on the first keyword.
The information search device according to appendix 7.
(Appendix 9)
The document of the first information is a document searched based on the first keyword.
The information search device according to appendix 7.

(付記10)
種々の情報を格納するサーバから取得した所定の第1情報に関する質問文から質問に対する回答を得るための情報を検索する情報検索方法であって、
学習者側のコンピュータから受信した前記質問文を読取り、形態素解析して第1キーワードを抽出する第1抽出ステップと、
前記第1情報および該第1情報に関連する第2情報の各文書をそれぞれ読取り、形態素解析して第2キーワードを抽出する第2抽出ステップと、
前記各文書に出現する前記第2キーワードについて重み付け処理を行い、各第2キーワードの重要度を示す重み値を求め、該重み値から重要度の高いキーワードを選択し、選択したキーワードを前記各文書に対する重要キーワードにそれぞれ設定する設定ステップと、
前記第1キーワードと前記第2情報の文書に対する重要キーワードの組合せから検索式を生成する検索式生成ステップと、
備えたことを特徴とする情報検索方法。
(Appendix 10)
An information search method for searching for information for obtaining an answer to a question from a question sentence related to predetermined first information acquired from a server storing various information,
A first extraction step of reading the question sentence received from the computer on the learner side and extracting a first keyword by morphological analysis;
A second extraction step of reading each document of the first information and second information related to the first information, and extracting a second keyword by morphological analysis;
The second keyword appearing in each document is weighted, a weight value indicating the importance of each second keyword is obtained, a keyword having a high importance is selected from the weight value, and the selected keyword is assigned to each document. Setting steps for each important keyword for,
A search expression generation step of generating a search expression from a combination of important keywords for the document of the first keyword and the second information;
An information retrieval method characterized by comprising.

(付記11)
種々の情報を格納するサーバから取得した所定の第1情報に関する質問文から質問に対する回答を得るための情報を検索するための情報検索プログラムであって、
コンピュータに、
学習者側のコンピュータから受信した前記質問文を読取り、形態素解析して第1キーワードを抽出する第1抽出ステップと、
前記第1情報および該第1情報に関連する第2情報の各文書をそれぞれ読取り、形態素解析して第2キーワードを抽出する第2抽出ステップと、
前記各文書に出現する前記第2キーワードについて重み付け処理を行い、各第2キーワードの重要度を示す重み値を求め、該重み値から重要度の高いキーワードを選択し、選択したキーワードを前記各文書に対する重要キーワードにそれぞれ設定する設定ステップと、
前記第1キーワードと前記第2情報の文書に対する重要キーワードの組合せから検索式を生成する検索式生成ステップと、
を実行させることを特徴とする情報検索プログラム。
(Appendix 11)
An information search program for searching for information for obtaining an answer to a question from a question sentence regarding predetermined first information acquired from a server storing various information,
On the computer,
A first extraction step of reading the question sentence received from the computer on the learner side and extracting a first keyword by morphological analysis;
A second extraction step of reading each document of the first information and second information related to the first information, and extracting a second keyword by morphological analysis;
The second keyword appearing in each document is weighted, a weight value indicating the importance of each second keyword is obtained, a keyword having a high importance is selected from the weight value, and the selected keyword is assigned to each document. Setting steps for each important keyword for,
A search expression generation step of generating a search expression from a combination of important keywords for the document of the first keyword and the second information;
An information retrieval program characterized by causing

本発明の情報検索装置のブロック構成図である。It is a block block diagram of the information search device of this invention. 学習対象の文書に関する質問の回答を得るのに適切な文書を提示する基本手順を示すフローチャートである。It is a flowchart which shows the basic procedure which presents a suitable document for obtaining the answer of the question regarding the document of learning object. 教材の主文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面30の具体例を示す図である。It is a figure which shows the specific example of the display screen 30 which displays the description content of the main document of a teaching material on the upper stage, and displays the important keyword taken out on the lower stage. 教材の主文書の関連文書の記載内容を上段に表示し取出された重要キーワードを下段に表示するディスプレイ画面40の具体例を示す図である。It is a figure which shows the specific example of the display screen 40 which displays the description content of the related document of the main document of learning materials on the upper stage, and displays the important keyword taken out on the lower stage. キーワードテーブルを示す図であり、(A)は図3に示す教材の主文書におけるキーワードテーブルを示す図であり、(B)は図4に示す教材の主文書の関連文書におけるキーワードテーブルを示す図である。4A and 4B are diagrams illustrating a keyword table, in which FIG. 3A is a diagram illustrating a keyword table in the main document of the teaching material illustrated in FIG. 3, and FIG. 4B is a diagram illustrating a keyword table in a related document of the main document of the teaching material illustrated in FIG. It is. 学習対象の文書に関する質問の回答を得るのに適切な重要キーワードを加味した文書を提示する手順を示すフローチャートである。It is a flowchart which shows the procedure of showing the document which considered the important keyword suitable for obtaining the answer of the question regarding the document of learning object. 学習者が学習対象の文書に関連する文書を参照中に質問文を入力し、質問文の形態素解析を行っている所の画面を示す図である。It is a figure which shows the screen of the place where the learner inputs a question sentence while referring to the document relevant to the document of learning object, and is performing the morphological analysis of a question sentence. 質問文から取出されたキーワードを用いて検索した検索結果を示す図である。It is a figure which shows the search result searched using the keyword taken out from the question sentence. 本発明により学習者が学習対象の文書に関する質問内容からその学習に最適な文書を取得している所の画面を示す図である。It is a figure which shows the screen of the place where the learner is acquiring the optimal document for the learning from the question content regarding the document of learning object by this invention. 学習者が入力した質問文から取出されたキーワードと質問文の入力時に開いていた教材の文書に対応する重要キーワードとを組合わせたキーワードを用いて検索した検索結果を示す図である。It is a figure which shows the search result searched using the keyword taken out from the question sentence which the learner input, and the keyword which combined the important keyword corresponding to the document of the teaching material opened when the question sentence was input. 図1に示す情報検索装置を用いて、複数の文書における各重要キーワードを取得する処理を示すフローチャートである。It is a flowchart which shows the process which acquires each important keyword in a some document using the information search device shown in FIG.

符号の説明Explanation of symbols

1 情報検索装置
10 バスライン
11 CPU
12 入力装置
13 メモリ
14 ハードディスク
15 ディスプレイ
16 通信ユニット
17 ネットワーク
18 サーバ
30、40、70、80、90、100 ディスプレイ画面(画面)
131 第1キーワード抽出手段
132 第2キーワード抽出手段
133 検索手段
134 重要語定義テーブル生成手段
141 教材用テキストファイル群
142 形態素解析辞書ファイル
1 Information Retrieval Device 10 Bus Line 11 CPU
12 Input device 13 Memory 14 Hard disk 15 Display 16 Communication unit 17 Network 18 Server 30, 40, 70, 80, 90, 100 Display screen (screen)
131 First keyword extraction means 132 Second keyword extraction means 133 Search means 134 Important word definition table generation means 141 Text file group for teaching materials 142 Morphological analysis dictionary file

Claims (6)

学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索プログラムであって、
コンピュータ装置を、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、
学習者からの質問文の入力を受け付ける質問文受付手段と、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、
前記出力手段から出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、
して機能させることを特徴とする情報検索プログラム。
An information search program for generating a keyword for searching for information related to the question sentence according to a question sentence input from a learner's computer and searching for the information by the keyword,
Computer equipment,
Output means for outputting to the learner terminal the first learning area extracted from the learning material composed of a plurality of learning areas;
A question sentence receiving means for receiving input of a question sentence from a learner;
First keyword extraction means for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence reception means;
Of the keywords in the first learning area outputted from the output means, the important keywords are referenced with reference to an important word definition table storing important keywords to be added to the first keywords for searching for information on the question sentence. Second keyword extracting means for extracting as a second keyword for search;
Search means for searching for information relating to the question sentence using both the first keyword and the second keyword;
An information retrieval program characterized by functioning.
前記コンピュータ装置を、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、
として機能させることを特徴とする請求項1に記載の情報検索プログラム。
Said computer device,
Important word definition table generating means for performing morphological analysis on each of a plurality of learning regions constituting the teaching material, generating the important word definition table using the keyword extracted by determining the importance from the appearance frequency as the important keyword,
The information search program according to claim 1, wherein the information search program is made to function as:
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索方法であって、
コンピュータ装置が、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力ステップと、
学習者からの質問文の入力を受け付ける質問文受付ステップと、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出ステップと、
前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出ステップと、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索ステップと、
を行うことを特徴とする情報検索方法。
An information search method for generating a keyword for searching for information related to the question sentence according to a question sentence input from a learner's computer and searching for the information by the keyword,
Computer equipment
An output step of outputting to the learner terminal the first learning area extracted from the learning material composed of a plurality of learning areas;
A question acceptance step for accepting input of a question from a learner;
A first keyword extracting step of extracting a first keyword for search by performing morphological analysis on the question sentence received by the question sentence receiving means;
Of the keywords in the first learning area output in the output step, the important keywords are referenced with reference to an important word definition table storing important keywords to be added to the first keywords for retrieval of information on the question sentence. A second keyword extraction step of extracting as a second keyword for search;
A search step of searching for information related to the question sentence using both the first keyword and the second keyword;
An information retrieval method characterized by:
前記コンピュータ装置が、
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成ステップ、
を行うことを特徴とする請求項3に記載の情報検索方法。
The computer device is
An important word definition table generating step of generating a keyword definition table using the keyword extracted by performing morphological analysis for each of a plurality of learning regions constituting the teaching material, judging the importance from the appearance frequency as the important keyword,
The information retrieval method according to claim 3, wherein:
学習者側のコンピュータから入力された質問文に応じて該質問文に関する情報を検索するためのキーワードを生成し該キーワードにより前記情報を検索する情報検索装置であって、
複数に区分された学習領域から構成される教材から抽出した第1学習領域を学習者端末に出力する出力手段と、
学習者からの質問文の入力を受け付ける質問文受付手段と、
前記質問文受付手段で受け付けた質問文を形態素解析して検索のための第1キーワードを抽出する第1キーワード抽出手段と、
前記出力ステップで出力された前記第1学習領域におけるキーワードのうち、前記質問文に関する情報の検索のために前記第1キーワードに加えるべき重要キーワードを格納した重要語定義テーブルを参照して該重要キーワードを検索のための第2キーワードとして抽出する第2キーワード抽出手段と、
前記第1キーワードと前記第2キーワードの双方を用いて前記質問文に関する情報の検索を行う検索手段と、
を備えることを特徴とする情報検索装置。
An information search device that generates a keyword for searching for information related to the question sentence according to a question sentence input from a learner's computer and searches for the information using the keyword,
Output means for outputting to the learner terminal the first learning area extracted from the learning material composed of a plurality of learning areas;
A question sentence receiving means for receiving input of a question sentence from a learner;
First keyword extraction means for extracting a first keyword for search by morphological analysis of the question sentence received by the question sentence reception means;
Of the keywords in the first learning area output in the output step, the important keywords are referenced with reference to an important word definition table storing important keywords to be added to the first keywords for retrieval of information on the question sentence. Second keyword extracting means for extracting as a second keyword for search;
Search means for searching for information relating to the question sentence using both the first keyword and the second keyword;
An information retrieval apparatus comprising:
前記教材を構成する複数の学習領域の各々に対し形態素解析を行い、出現頻度から重要度を判断して抽出したキーワードを前記重要キーワードとして前記重要語定義テーブルを生成する重要語定義テーブル生成手段、
を備えること特徴とする請求項5に記載の情報検索装置。
Important word definition table generating means for performing morphological analysis on each of a plurality of learning regions constituting the teaching material, generating the important word definition table using the keyword extracted by determining the importance from the appearance frequency as the important keyword,
The information search apparatus according to claim 5, further comprising:
JP2007094464A 2007-03-30 2007-03-30 Information retrieval apparatus, information retrieval method and program thereof Expired - Fee Related JP5332128B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007094464A JP5332128B2 (en) 2007-03-30 2007-03-30 Information retrieval apparatus, information retrieval method and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007094464A JP5332128B2 (en) 2007-03-30 2007-03-30 Information retrieval apparatus, information retrieval method and program thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013100838A Division JP2013178808A (en) 2013-05-13 2013-05-13 Information retrieval device, information retrieval method, and program thereof

Publications (2)

Publication Number Publication Date
JP2008250893A true JP2008250893A (en) 2008-10-16
JP5332128B2 JP5332128B2 (en) 2013-11-06

Family

ID=39975719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007094464A Expired - Fee Related JP5332128B2 (en) 2007-03-30 2007-03-30 Information retrieval apparatus, information retrieval method and program thereof

Country Status (1)

Country Link
JP (1) JP5332128B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9128982B2 (en) 2010-12-23 2015-09-08 Nhn Corporation Search system and search method for recommending reduced query
WO2021107330A1 (en) * 2019-11-29 2021-06-03 삼성전자주식회사 Electronic device and method for controlling electronic device
US11126783B2 (en) 2019-09-20 2021-09-21 Fujifilm Business Innovation Corp. Output apparatus and non-transitory computer readable medium

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269237A (en) * 1997-03-27 1998-10-09 Hitachi Ltd Document browsing system
JPH1125108A (en) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd Automatic extraction device for relative keyword, document retrieving device and document retrieving system using these devices
JPH1145253A (en) * 1997-07-25 1999-02-16 Just Syst Corp Information retrieval device and computer readable recording medium for recording program for making computer function as the same device
JPH11272709A (en) * 1998-03-19 1999-10-08 Ntt Data Corp File retrieval system
JP2004005322A (en) * 2002-03-27 2004-01-08 Fujitsu Ltd Optimal question presenting method and optimal question presentation system
JP2004029387A (en) * 2002-06-26 2004-01-29 Oki Electric Ind Co Ltd Education system
JP2004178421A (en) * 2002-11-28 2004-06-24 Ricoh Co Ltd Document retrieval device, method for retrieving document, program, and recording medium
JP2004334803A (en) * 2003-05-12 2004-11-25 Shin Etsu Polymer Co Ltd Document retrieval device
JP2005063185A (en) * 2003-08-13 2005-03-10 Toshiba Corp Document retrieval system, question-answering system, and document retrieval method
JP2006072881A (en) * 2004-09-06 2006-03-16 Asuya Eto Document management system and document management method
JP2006106970A (en) * 2004-10-01 2006-04-20 Canon Inc Information retrieval device, information retrieval method and computer program

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269237A (en) * 1997-03-27 1998-10-09 Hitachi Ltd Document browsing system
JPH1125108A (en) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd Automatic extraction device for relative keyword, document retrieving device and document retrieving system using these devices
JPH1145253A (en) * 1997-07-25 1999-02-16 Just Syst Corp Information retrieval device and computer readable recording medium for recording program for making computer function as the same device
JPH11272709A (en) * 1998-03-19 1999-10-08 Ntt Data Corp File retrieval system
JP2004005322A (en) * 2002-03-27 2004-01-08 Fujitsu Ltd Optimal question presenting method and optimal question presentation system
JP2004029387A (en) * 2002-06-26 2004-01-29 Oki Electric Ind Co Ltd Education system
JP2004178421A (en) * 2002-11-28 2004-06-24 Ricoh Co Ltd Document retrieval device, method for retrieving document, program, and recording medium
JP2004334803A (en) * 2003-05-12 2004-11-25 Shin Etsu Polymer Co Ltd Document retrieval device
JP2005063185A (en) * 2003-08-13 2005-03-10 Toshiba Corp Document retrieval system, question-answering system, and document retrieval method
JP2006072881A (en) * 2004-09-06 2006-03-16 Asuya Eto Document management system and document management method
JP2006106970A (en) * 2004-10-01 2006-04-20 Canon Inc Information retrieval device, information retrieval method and computer program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ハディアナ アナ: "コラボレーションに基づく非同期型Q&A支援システムの構築", FIT2002 情報科学技術フォーラム 情報技術レターズ, vol. 1, JPN6011067973, 13 September 2002 (2002-09-13), pages 249 - 250, ISSN: 0002573289 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9128982B2 (en) 2010-12-23 2015-09-08 Nhn Corporation Search system and search method for recommending reduced query
US11126783B2 (en) 2019-09-20 2021-09-21 Fujifilm Business Innovation Corp. Output apparatus and non-transitory computer readable medium
WO2021107330A1 (en) * 2019-11-29 2021-06-03 삼성전자주식회사 Electronic device and method for controlling electronic device

Also Published As

Publication number Publication date
JP5332128B2 (en) 2013-11-06

Similar Documents

Publication Publication Date Title
US9348872B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US20100185600A1 (en) Apparatus and method for integration search of web site
JP2010055159A (en) Information retrieval device, information retrieval method, and program
JP4859779B2 (en) Hazardous content evaluation assigning apparatus, program and method
US6668251B1 (en) Rendering discriminator members from an initial set of result data
JP2017134787A (en) Device, program, and method for analyzing topic evaluation in multiple areas
JP5136910B2 (en) Information analysis apparatus, information analysis method, information analysis program, and search system
JP6025487B2 (en) Forensic analysis system, forensic analysis method, and forensic analysis program
JP5151368B2 (en) Information processing apparatus and information processing program
WO2014203573A1 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
JP5332128B2 (en) Information retrieval apparatus, information retrieval method and program thereof
JP2010055155A (en) Server device, information processing method, and program
JP5179564B2 (en) Query segment position determination device
Bakar The development of an integrated corpus for Malay language
US8176031B1 (en) System and method for manipulating database search results
JP6131983B2 (en) Information retrieval apparatus, information retrieval method and program thereof
JP5364529B2 (en) Dictionary registration device, document label determination system, and dictionary registration program
JP7238411B2 (en) Information processing device and program
JP2013178808A (en) Information retrieval device, information retrieval method, and program thereof
JP4496797B2 (en) Document management apparatus and method
JP5843235B2 (en) WEB information processing apparatus, WEB information processing method, and program
JP2005339419A (en) Web page evaluation system and web page evaluation method
JP2004030021A (en) Document processor and processing method
JP2009059290A (en) Device, method, and program for supporting preparation of foreign language document
JP2012243130A (en) Information retrieval device, method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130715

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees