JP2017208047A - Information search method, information search apparatus, and program - Google Patents

Information search method, information search apparatus, and program Download PDF

Info

Publication number
JP2017208047A
JP2017208047A JP2016101928A JP2016101928A JP2017208047A JP 2017208047 A JP2017208047 A JP 2017208047A JP 2016101928 A JP2016101928 A JP 2016101928A JP 2016101928 A JP2016101928 A JP 2016101928A JP 2017208047 A JP2017208047 A JP 2017208047A
Authority
JP
Japan
Prior art keywords
question
question sentence
search
coordinates
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016101928A
Other languages
Japanese (ja)
Inventor
淳史 大塚
Atsushi Otsuka
淳史 大塚
久子 浅野
Hisako Asano
久子 浅野
松尾 義博
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016101928A priority Critical patent/JP2017208047A/en
Publication of JP2017208047A publication Critical patent/JP2017208047A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information search apparatus capable of allowing a user to search information matching an information request without requesting the user to consider on a search query.SOLUTION: An information search apparatus 100 performs a series of processing including: extracting feature quantity of each of question sentences based on contents of plural question sentences which are written in a natural language included in question collection; calculating display coordinates for displaying question sentences on a screen based on the feature quantity extracted from the question sentences; displaying each of question sentences on the screen according to the display coordinates; when receiving specified coordinates on the screen, calculating the distance between the display coordinates of the respective question sentences and the specified coordinates; generating a search query based on a keyword which is included in a question sentence the calculated distance of which satisfies a predetermined condition; and inputting the generated search query to a search engine to display a search result relevant to the search query.SELECTED DRAWING: Figure 3

Description

本発明は、テキストを対象とする情報検索方法、情報検索装置、及びプログラムに関する。   The present invention relates to an information search method, an information search device, and a program for text.

Web検索に代表される情報検索システムでは、例えばユーザが検索ウインドウに入力したキーワード組(以降、「検索クエリ」という)に対してキーワードマッチ等の処理を行い、検索クエリに適合する文書を検索している。しかし、キーワードマッチを用いた検索処理の場合には、検索クエリのキーワードと文書内のキーワードが完全一致していなくてはならず、検索の再現率(Recall)が低下してしまうという問題が発生することがある。そこで、検索クエリ中に含まれるキーワードを拡張して増加させ、ユーザが検索ウインドウに入力した検索クエリを、より幅広い文書にマッチさせるクエリ拡張技術等が開示されている(特許文献1、2)。   In an information search system represented by a Web search, for example, keyword matching or the like is performed on a keyword set (hereinafter referred to as “search query”) entered by a user in a search window to search for a document that matches the search query. ing. However, in the case of search processing using keyword matching, the keyword of the search query must match the keyword in the document completely, and there is a problem that the recall rate (Recall) of the search decreases. There are things to do. Thus, there has been disclosed a query expansion technique or the like that expands and increases keywords included in a search query and matches a search query input by a user in a search window with a wider range of documents (Patent Documents 1 and 2).

また、検索の再現率を向上させる方法と共に、情報検索のインタフェースを改善し、より簡単な操作で情報検索を行う方法についても広く研究が進められている。例えば、2次元平面を用いて視覚的に情報検索をしやすくする方法が開示されている(非特許文献1)。   In addition to methods for improving retrieval recall, research is also being conducted on methods for improving information retrieval interfaces and performing information retrieval with simpler operations. For example, a method for facilitating visually searching for information using a two-dimensional plane is disclosed (Non-Patent Document 1).

特開2010−123036号公報JP 2010-123036 A 特開2013−45182号公報JP2013-45182A

林大策、福原知宏、佐藤哲司著、「情報整理を支援する対話型検索インタフェースの提案と評価」、第4回データ工学と情報マネジメントに関するフォーラム DEIM Forum 2012論文集、電子情報通信学会、E7-1、2012Daisaku Hayashi, Tomohiro Fukuhara, Tetsuji Sato, “Proposal and Evaluation of Interactive Search Interface to Support Information Arrangement”, 4th Forum on Data Engineering and Information Management DEIM Forum 2012 Proceedings, IEICE, E7-1, 2012

上記に示したように、Web検索に代表される情報検索システムでは、例えばユーザが検索ウインドウに検索クエリを入力することによって所望の情報を取得する。   As described above, in an information search system represented by Web search, for example, a user acquires desired information by inputting a search query in a search window.

しかしながら、所望の情報を取得するために検索ウインドウに検索クエリを入力するという行為は、情報検索が不慣れなユーザによっては困難を伴う場合が多い。   However, the act of inputting a search query in the search window in order to obtain desired information is often difficult for a user who is unfamiliar with information search.

これは第1に、情報検索を行う場合、ユーザは自らが知りたいことである情報要求を明確に定義する必要があるためである。情報要求が漠然とした状態や、何を調べればよいかわからない状態では、ユーザは検索クエリをどのように作成したらよいかわからなくなることがある。第2に、仮にユーザが情報要求を明確に理解している場合であっても、情報要求を満たす検索結果を得るための検索クエリを作成することが難しいという事情がある。   First, when performing an information search, the user needs to clearly define an information request that he wants to know. If the information request is vague or you do not know what to look for, the user may not know how to create a search query. Second, even if the user clearly understands the information request, it is difficult to create a search query for obtaining a search result that satisfies the information request.

本発明は、上記の事情を鑑みて成されたものであり、ユーザ自らが検索クエリを検討することなく、情報要求に適合する情報を検索することができる情報検索方法、情報検索装置、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and an information search method, an information search apparatus, and a program that enable a user to search for information that meets an information request without considering a search query. The purpose is to provide.

上記の目的を達成するために本発明に係る情報検索方法は、質問集に含まれる自然言語で記述された複数の質問文の内容に基づいて、前記質問文の各々の特徴量を抽出し、前記質問文の各々について、前記質問文から抽出した前記特徴量に基づいて、前記質問文を画面上に表示する際の表示座標を計算し、前記質問文の各々を、前記画面上の前記計算された表示座標に表示し、ユーザ操作によって指定された、前記画面上の指定座標を受け付けた場合、前記質問文の各々について計算された表示座標と、前記指定座標との距離を計算し、前記計算された距離が予め定めた条件を満たす前記質問文に含まれるキーワードに基づいて、検索クエリを生成し、前記生成された検索クエリを検索エンジンに入力し、前記検索エンジンによって検索された前記検索クエリに対する検索結果を表示する。   In order to achieve the above object, the information search method according to the present invention extracts each feature amount of the question sentence based on the contents of a plurality of question sentences described in a natural language included in the question collection, For each of the question sentences, based on the feature amount extracted from the question sentence, a display coordinate when displaying the question sentence on the screen is calculated, and each of the question sentences is calculated on the screen. When the designated coordinates on the screen specified by the user operation are received, the display coordinates calculated for each of the question sentences and the distance between the designated coordinates are calculated, Based on a keyword included in the question sentence in which the calculated distance satisfies a predetermined condition, a search query is generated, the generated search query is input to a search engine, and searched by the search engine. Displaying search results for the search query.

本発明に係る情報検索装置は、質問集に含まれる自然言語で記述された複数の質問文の内容に基づいて、前記質問文の各々の特徴量を抽出する特徴量抽出部と、前記質問文の各々について、前記特徴量抽出部で前記質問文から抽出した前記特徴量に基づいて、前記質問文を画面上に表示する際の表示座標を計算する座標計算部と、前記質問文の各々を、前記座標計算部で計算された前記画面上の表示座標に表示する表示部と、ユーザ操作によって指定された、前記画面上の指定座標を受け付けた場合、前記質問文の各々について、前記座標計算部で計算された表示座標と、前記指定座標との距離を計算する距離計算部と、前記距離計算部で計算された距離が予め定めた条件を満たす前記質問文に含まれるキーワードに基づいて、検索クエリを生成するクエリ生成部と、前記クエリ生成部で生成された検索クエリを検索エンジンに入力し、前記検索エンジンによって検索された前記検索クエリに対する検索結果を取得する情報検索部と、を含んで構成され、前記表示部は、前記情報検索部で取得した前記検索クエリに対する検索結果を前記画面上に表示する。   The information search apparatus according to the present invention includes a feature amount extraction unit that extracts each feature amount of the question sentence based on the contents of a plurality of question sentences described in a natural language included in the question collection, and the question sentence A coordinate calculation unit that calculates display coordinates when displaying the question sentence on the screen based on the feature amount extracted from the question sentence by the feature amount extraction unit, and each of the question sentences. When receiving the display coordinates displayed on the display coordinates calculated by the coordinate calculation section and the specified coordinates specified by the user operation on the screen, the coordinate calculation is performed for each of the question sentences. A distance calculation unit that calculates a distance between the display coordinates calculated by the unit and the designated coordinates, and a keyword included in the question sentence that satisfies a predetermined condition for the distance calculated by the distance calculation unit, Search query And an information search unit that inputs a search query generated by the query generation unit to a search engine and obtains a search result for the search query searched by the search engine. The display unit displays a search result for the search query acquired by the information search unit on the screen.

本発明に係る情報検索方法のプログラムは、情報検索方法の各ステップをコンピュータに実行させる。   A program for an information search method according to the present invention causes a computer to execute each step of the information search method.

以上説明したように、本発明の情報検索方法、情報検索装置、及びプログラムによれば、ユーザ自らが検索クエリを検討することなく、情報要求に適合する情報を検索することができる、という効果が得られる。   As described above, according to the information search method, information search apparatus, and program of the present invention, there is an effect that the user can search for information that meets the information request without considering the search query. can get.

検索画面の構成例を示す図である。It is a figure which shows the structural example of a search screen. 検索画面の表示例を示す図である。It is a figure which shows the example of a display of a search screen. 情報検索装置の構成例を示す概略図である。It is the schematic which shows the structural example of an information search device. 情報検索装置における座標情報作成処理ルーチンの処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process of the coordinate information creation process routine in an information search device. 情報検索装置における情報検索処理ルーチンの処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process of the information search process routine in an information search device.

以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、以下では、同じ働きを担う構成要素又は処理には全図面を通して同じ符号を付与し、重複する説明を適宜省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following description, the same reference numerals are given to the components or processes having the same functions throughout the drawings, and the repeated description is omitted as appropriate.

図1に、本実施の形態に係る情報検索装置100の検索画面50の構成例を示す。検索画面50は、カテゴリ選択領域51、質問表示領域52、及び検索結果表示領域53を含み、情報検索装置100で取り扱われる各種情報を表示すると共に、例えばユーザが操作するマウスの指定位置をポインタで表示し、ユーザがマウスをクリックした位置を受け付ける検索インタフェースとして機能する。   FIG. 1 shows a configuration example of a search screen 50 of the information search apparatus 100 according to this embodiment. The search screen 50 includes a category selection area 51, a question display area 52, and a search result display area 53. The search screen 50 displays various types of information handled by the information search apparatus 100, and for example, designates a designated position of a mouse operated by a user with a pointer. It functions as a search interface that displays and accepts the position where the user clicked the mouse.

カテゴリ選択領域51は、質問表示領域52をカテゴリ毎に切り替えるための領域であり、例えばカテゴリ毎にタブが配置される。図1の例では、カテゴリ選択領域51に3つのタブ51A〜51Cが配置されており、ユーザがマウスで何れかのタブをクリックすることで、クリックしたタブに対応付けられたカテゴリに関する質問文が質問表示領域52に表示される。   The category selection area 51 is an area for switching the question display area 52 for each category. For example, a tab is arranged for each category. In the example of FIG. 1, three tabs 51 </ b> A to 51 </ b> C are arranged in the category selection area 51, and when the user clicks one of the tabs with the mouse, a question sentence regarding the category associated with the clicked tab is displayed. It is displayed in the question display area 52.

ここで、カテゴリとは、例えば複数の項目を一定の基準に基づいて分類した際の区分であり、本実施の形態では、後述するように、複数の質問文がカテゴリ毎に分類されている。   Here, the category is, for example, a classification when a plurality of items are classified based on a certain standard, and in this embodiment, a plurality of question sentences are classified for each category as will be described later.

質問表示領域52は、カテゴリ選択領域51で選択されたカテゴリに関する質問文が表示される領域である。ユーザが、質問表示領域52のうち、自分が抱える情報要求に近い内容を示していると思われる質問文が表示されている近辺の領域をマウスでクリックすることで、検索結果表示領域53に、マウスでクリックした領域に応じた質問文に対する検索結果が表示される。   The question display area 52 is an area in which a question text related to the category selected in the category selection area 51 is displayed. When the user clicks a region in the vicinity of the question display area 52 where a question sentence that seems to indicate the content close to the information request held by the user is displayed, the search result display area 53 The search result for the question sentence corresponding to the area clicked with the mouse is displayed.

例えば、図2に示すように、カテゴリ選択領域51に「PC」、「野球」、及び「音楽」の3つのカテゴリが用意され、ユーザによって「PC」のカテゴリが選択された場合について説明する。   For example, as shown in FIG. 2, a case where three categories “PC”, “baseball”, and “music” are prepared in the category selection area 51 and the category “PC” is selected by the user will be described.

この場合、質問表示領域52には、PC、すなわちパーソナルコンピュータに関する質問文が表示される。ユーザは、自分が抱える情報要求に近い内容を示していると思われる質問文が表示されている領域にマウスのポインタ54を移動し、マウスをクリックする。なお、質問表示領域52に自分が抱える情報要求に近い内容を示す質問文が表示されていない場合、ユーザは、自分が抱える情報要求に比較的似ている質問文がより集中している近辺の領域にマウスのポインタ54を移動し、マウスをクリックする。   In this case, in the question display area 52, a question text relating to a PC, that is, a personal computer is displayed. The user moves the mouse pointer 54 to an area where a question sentence that seems to indicate content close to the information request held by the user is displayed, and clicks the mouse. In addition, when the question sentence which shows the content close | similar to the information request | requirement which he owns is not displayed on the question display area 52, the user is the vicinity of the question sentence which is comparatively similar to the information request | requirement which he owns. Move the mouse pointer 54 to the area and click the mouse.

例えばユーザが、「仕事で使うノートパソコンで、できれば軽いものがいい」との情報要求を漠然と持っている場合、図2に示す質問表示領域52には、当該情報要求そのものを示す質問文は存在しない。しかし、図2に示す質問表示領域52には、ユーザの情報要求に関連する「ノートPCが重い」という質問文と、「仕事で使えるノートがほしい」という質問文が表示されているため、ユーザはこれらの質問文が表示されている近辺の領域にポインタ54を移動し、マウスをクリックする。この場合、検索結果表示領域53には、「ノートPCが重い」という質問文と、「仕事で使えるノートがほしい」という質問文と、の主に2つの質問文に関連した検索結果が表示されることになる。   For example, when a user has an information request that “a notebook computer used for work should be light, if possible,” vaguely, a question sentence indicating the information request itself exists in the question display area 52 shown in FIG. do not do. However, in the question display area 52 shown in FIG. 2, a question message “notebook is heavy” and a question message “I want a notebook that can be used at work” related to the user's information request are displayed. Moves the pointer 54 to an area in the vicinity where these question sentences are displayed, and clicks the mouse. In this case, the search result display area 53 displays search results mainly related to two question sentences, a question sentence “notebook is heavy” and a question sentence “I want a notebook that can be used at work”. Will be.

なお、図2に示すように、質問表示領域52に表示される各々の質問文は、質問文の重要度に応じて文字の大きさが異なるように表示される場合がある。   In addition, as shown in FIG. 2, each question sentence displayed in the question display area 52 may be displayed so that the size of a character differs according to the importance of the question sentence.

以降、例えば図2に示すような検索画面50を表示し、ユーザがクリックした質問表示領域52の領域に応じた質問文に基づく検索結果を検索結果表示領域53に表示する情報検索装置100について説明する。   Hereinafter, for example, the information search apparatus 100 that displays the search screen 50 as shown in FIG. 2 and displays the search result based on the question sentence corresponding to the area of the question display area 52 clicked by the user in the search result display area 53 will be described. To do.

<システム構成>
図3は、本実施の形態に係る情報検索装置100のシステム構成例を示す図である。情報検索装置100は、CPUと、RAMと、後述する座標情報作成処理ルーチン及び情報検索処理ルーチンを実行するためのプログラムを記憶したROMと、を備えたコンピュータで構成され、機能的には次に示すように構成されている。
<System configuration>
FIG. 3 is a diagram illustrating a system configuration example of the information search apparatus 100 according to the present embodiment. The information retrieval apparatus 100 is composed of a computer including a CPU, a RAM, and a ROM that stores a program for executing a coordinate information creation processing routine and an information retrieval processing routine, which will be described later. It is configured as shown.

情報検索装置100は、入力部10、演算部20、記憶部30、及び表示部40を備え、演算部20は、座標情報作成部20A及び情報検索部20Bを備える。   The information search device 100 includes an input unit 10, a calculation unit 20, a storage unit 30, and a display unit 40. The calculation unit 20 includes a coordinate information creation unit 20A and an information search unit 20B.

上記のような構成を備える情報検索装置100の入力部10には、例えば自然言語で記述された複数の質問文を含む質問集、及びユーザによってマウスがクリックされた際のポインタ54で指し示された検索画面50上の座標、すなわち「指定座標」が入力される。   The input unit 10 of the information search apparatus 100 having the above configuration is pointed by a question collection including a plurality of question sentences written in, for example, a natural language, and a pointer 54 when the user clicks the mouse. The coordinates on the search screen 50, that is, “designated coordinates” are input.

なお、質問集は自然言語で記述された質問文を含むテキスト集合であればどのようなものであってもよく、質問文の内容、及び質問集の収集方法に制限はない。例えば、Webの質問回答サイトに投稿された質問文を用いたり、ホームページ等のよくある質問(Frequently Asked Questions:FAQ)に記載された質問文を用いたりすることができる。なお、この場合、質問集に含まれる質問文を、質問文の趣旨を逸脱しない範囲で加工してもよい。例えば、質問文が長文である場合や、質問文の表現が一般的に用いられている表現と異なる場合には、不要な文節や単語の除去、或いは単語の置き換え等の加工を行ってもよい。質問文の加工方法に特に制限はなく、例えば質問文の構文解析結果に基づいて自動的に質問文を加工してもよく、或いは、ユーザに質問文を加工させるようにしてもよい。   The question collection may be any text set including a question sentence written in a natural language, and there are no restrictions on the contents of the question sentence and the method of collecting the question collection. For example, a question sentence posted on a Web question answering site can be used, or a question sentence described in a frequently asked question (FAQ) such as a home page can be used. In this case, the question sentences included in the question collection may be processed within a range not departing from the spirit of the question sentences. For example, when the question sentence is a long sentence, or when the expression of the question sentence is different from a commonly used expression, processing such as removal of unnecessary clauses or words or replacement of words may be performed. . There is no particular limitation on the method for processing the question sentence. For example, the question sentence may be automatically processed based on the syntax analysis result of the question sentence, or the question sentence may be processed by the user.

入力部10は、質問集を受け付けた場合、受け付けた質問集を座標情報作成部20Aに通知する。   When receiving the question collection, the input unit 10 notifies the coordinate information creation unit 20A of the accepted question collection.

座標情報作成部20Aは、入力部10から受け付けた質問集に基づいて、質問集に含まれる各々の質問文の質問表示領域52における表示座標、及び質問文を質問表示領域52に表示する場合における、各々の質問文の文字の大きさを規定する質問文スコアを作成する。   Based on the question collection received from the input unit 10, the coordinate information creation unit 20 </ b> A displays the display coordinates of each question sentence included in the question collection in the question display area 52 and the question sentence in the question display area 52. Then, a question sentence score that defines the character size of each question sentence is created.

そのため、座標情報作成部20Aは、カテゴリ分割部21、特徴量抽出部22、及び座標計算部23を備える。   Therefore, the coordinate information creation unit 20A includes a category division unit 21, a feature amount extraction unit 22, and a coordinate calculation unit 23.

カテゴリ分割部21は、入力部10から受け付けた質問集に含まれる各々の質問文の内容に基づいて、質問集に含まれる質問文の各々をカテゴリ毎に分割する。   The category division unit 21 divides each question sentence included in the question collection for each category based on the contents of each question sentence included in the question collection received from the input unit 10.

なお、質問文をカテゴリに分割する方法に制限はなく、公知のカテゴリ分割方法を用いることができる。例えば、質問集の収集元で質問文に予め付与されているカテゴリ情報をそのまま用いてもよいし、質問集に対してK-平均アルゴリズムやWard法等の公知のクラスタリングアルゴリズムを適用し、質問文をカテゴリ毎に分割するようにしてもよい。ただし、カテゴリ分割部21は、必ずしも質問文の各々をカテゴリ毎に分割するわけではない。例えば、収集した質問文の数が比較的少ない場合や、質問文が1つの話題に集中している場合等には、質問文の各々が予め1つのカテゴリに含まれるとみなして、以降の処理を実行する。   In addition, there is no restriction | limiting in the method of dividing | segmenting a question sentence into a category, A well-known category division method can be used. For example, the category information previously assigned to the question sentence at the collection source of the question collection may be used as it is, or a known clustering algorithm such as a K-average algorithm or Ward method is applied to the question collection, May be divided into categories. However, the category division unit 21 does not necessarily divide each question sentence into categories. For example, when the number of collected question sentences is relatively small or when the question sentences are concentrated on one topic, it is assumed that each question sentence is included in one category in advance, and the subsequent processing Execute.

特徴量抽出部22は、カテゴリ毎に、カテゴリ分割部21で当該カテゴリに分割された各々の質問文に基づいて、各々の質問文から特徴量を抽出する。   For each category, the feature amount extraction unit 22 extracts a feature amount from each question sentence based on each question sentence divided into the categories by the category division unit 21.

なお、質問文からの特徴量の抽出方法に制限はなく、公知の特徴量抽出方法を用いることができる。例えば、質問文に対して形態素解析を行って質問文を形態素に分割し、質問文における形態素の出現分布をbag-of-words形式に基づく特徴ベクトルとして表したものを質問文の特徴量としてもよい。また、ニューラルネットワークを用いて質問文に含まれる各々の形態素の意味ベクトルを作成し、質問文に出現する全ての形態素の意味ベクトルを重心計算などの処理で合成した合成ベクトルを質問文の特徴量としてもよい。   In addition, there is no restriction | limiting in the extraction method of the feature-value from a question sentence, A well-known feature-value extraction method can be used. For example, morphological analysis is performed on a question sentence, the question sentence is divided into morphemes, and the morpheme occurrence distribution in the question sentence is expressed as a feature vector based on the bag-of-words format as the feature amount of the question sentence. Good. In addition, a semantic vector of each morpheme included in the question sentence is created using a neural network, and a synthesized vector obtained by synthesizing the semantic vectors of all the morphemes that appear in the question sentence by processing such as centroid calculation is used. It is good.

座標計算部23は、カテゴリ毎に、特徴量抽出部22で各々の質問文から抽出した特徴量に基づいて、質問表示領域52における、当該カテゴリに分割された各々の質問文の表示位置を規定する表示座標を計算する。   For each category, the coordinate calculation unit 23 defines the display position of each question sentence divided into the category in the question display area 52 based on the feature amount extracted from each question sentence by the feature amount extraction unit 22. Calculate the display coordinates.

質問表示領域52は2次元で表される領域であるため、座標計算部23では、特徴量抽出部22で質問文から抽出した特徴量の次元数を2次元に圧縮する処理を行う。   Since the question display area 52 is an area represented in two dimensions, the coordinate calculation unit 23 performs a process of compressing the number of dimensions of the feature amount extracted from the question sentence by the feature amount extraction unit 22 into two dimensions.

具体的には、各々の質問文から抽出された特徴量が3次元以上のベクトルで表される場合、座標計算部23は、特徴量に対してベクトルの次元圧縮アルゴリズムを適用する。   Specifically, when the feature amount extracted from each question sentence is expressed by a vector of three or more dimensions, the coordinate calculation unit 23 applies a vector dimension compression algorithm to the feature amount.

なお、特徴量に対する次元圧縮方法に制限はなく、公知の次元圧縮方法を用いることができる。例えば特異値分解やトピックモデルを用いて、特徴量をそのまま2次元に圧縮して得られるベクトルの座標を質問表示領域52の範囲に正規化することで、質問表示領域52における質問文の表示座標を計算してもよい。また、多次元尺度構成法(Multi Dimensional Scaling:MDS)を用いて特徴量から対応する質問文の類似度を計算し、類似度が高い質問文ほど近接して質問表示領域52に表示するように、質問表示領域52における質問文の表示座標を計算するようにしてもよい。   In addition, there is no restriction | limiting in the dimension compression method with respect to a feature-value, A well-known dimension compression method can be used. For example, the coordinates of the question text in the question display area 52 can be obtained by normalizing the coordinates of the vector obtained by directly compressing the feature quantity into two dimensions using the singular value decomposition and the topic model. May be calculated. In addition, the degree of similarity of the corresponding question sentence is calculated from the feature amount using a multi-dimensional scaling method (Multi Dimensional Scaling: MDS), and a question sentence having a higher degree of similarity is displayed closer to the question display area 52. The question text display coordinates in the question display area 52 may be calculated.

なお、座標計算部23は、質問表示領域52における質問文の表示座標の他、質問文の重要度に応じて、質問表示領域52に表示される質問文の文字の大きさを規定する値、すなわち、質問文スコアを計算してもよい。   In addition to the display coordinates of the question sentence in the question display area 52, the coordinate calculation unit 23 defines a character size of the question sentence displayed in the question display area 52 according to the importance of the question sentence. That is, the question sentence score may be calculated.

質問文の重要度の算出方法に制限はなく、公知の算出方法を用いることができる。例えば、座標計算部23は、質問表示領域52における各質問文の表示座標を要素とするデータ集合に対してAffinity Propagation等のクラスタリングアルゴリズムを適用して、表示座標の各々を複数のクラスタに分割する。その際、座標計算部23は、各クラスタを代表する特徴的な質問文、すなわちクラスタ中心となる質問文をクラスタ毎に設定する。そして、座標計算部23は、設定したクラスタ中心となる質問文の質問文スコアに予め定めた値を加算して、図2に示したように、クラスタ中心となる質問文の文字の大きさを他の質問文より大きく表示させるようにしてもよい。   There is no limitation on the method of calculating the importance level of the question sentence, and a known calculation method can be used. For example, the coordinate calculation unit 23 applies a clustering algorithm such as Affinity Propagation to a data set whose elements are display coordinates of each question sentence in the question display area 52, and divides each display coordinate into a plurality of clusters. . At that time, the coordinate calculation unit 23 sets a characteristic question sentence representing each cluster, that is, a question sentence at the center of each cluster for each cluster. Then, the coordinate calculation unit 23 adds a predetermined value to the question sentence score of the set question sentence at the center of the cluster, and determines the character size of the question sentence at the center of the cluster as shown in FIG. You may make it display larger than another question sentence.

また、例えば、座標計算部23は、予め定めたキーワード抽出ルールに従って、各々の質問文からキーワードを抽出し、質問文スコアを計算してもよい。なお、座標計算部23で使用するキーワード抽出ルールに特に制限はなく、自由に規定することができる。一般的には、名詞及び動詞等の自立語又は内容語となる形態素をキーワードとして質問文から抽出することが好ましい。   Further, for example, the coordinate calculation unit 23 may extract a keyword from each question sentence according to a predetermined keyword extraction rule and calculate a question sentence score. In addition, there is no restriction | limiting in particular in the keyword extraction rule used in the coordinate calculation part 23, It can prescribe | regulate freely. In general, it is preferable to extract morphemes, which are independent words or content words such as nouns and verbs, from keywords as keywords.

この場合、座標計算部23は、Term Frequency-Inverse Document Frequency(TF-IDF)法、又はBM25法などの重み算出方法を適用して、各質問文に含まれるキーワードの重みを算出する。そして、座標計算部23は、算出したキーワードの重みに基づいて、各質問文の重みを質問文スコアとして算出する。座標計算部23は、質問文スコアが大きいほど重要な質問文であるとみなし、質問文スコアが大きい質問文ほど質問文の文字の大きく表示させるようにしてもよい。   In this case, the coordinate calculation unit 23 applies a weight calculation method such as Term Frequency-Inverse Document Frequency (TF-IDF) method or BM25 method to calculate the weight of the keyword included in each question sentence. Then, the coordinate calculation unit 23 calculates the weight of each question sentence as a question sentence score based on the calculated keyword weight. The coordinate calculation unit 23 may consider that the question sentence is more important as the question sentence score is larger, and the question sentence having a larger question sentence score may be displayed in a larger size.

座標計算部23は、質問文の各々に質問文を一意に識別する質問文IDを対応付けると共に、質問文毎に質問文ID、表示座標、及び質問文スコアを対応付け、対応付けられた質問文ID、質問文、表示座標、及び質問文スコアを単位とするデータセットの各々を、記憶部30に予め設けられた質問集座標群DB30Aにカテゴリ毎に格納する。   The coordinate calculation unit 23 associates each question sentence with a question sentence ID that uniquely identifies the question sentence, associates the question sentence ID, the display coordinates, and the question sentence score with each question sentence, and associates the question sentence Each of the data sets having the ID, the question sentence, the display coordinates, and the question sentence score as a unit is stored for each category in the question collection coordinate group DB 30A provided in the storage unit 30 in advance.

なお、座標計算部23で質問文スコアを計算しない場合には、座標計算部23は、質問文ID、質問文、及び表示座標を単位とするデータセットの各々を、質問集座標群DB30Aにカテゴリ毎に格納する。また、座標情報作成部20Aにおいて質問文を形態素に分割した場合には、座標計算部23は、質問文に含まれる形態素及び各形態素の品詞に関する情報をデータセットに含めるようにしてもよい。更に、座標計算部23は、各カテゴリにカテゴリの内容を表す名称(カテゴリ名)を対応付けて質問集座標群DB30Aに格納するようにしてもよい。   When the coordinate calculation unit 23 does not calculate the question sentence score, the coordinate calculation unit 23 assigns each of the data sets having the question sentence ID, the question sentence, and the display coordinates as a category to the question collection coordinate group DB 30A. Store every time. When the coordinate information creation unit 20A divides the question sentence into morphemes, the coordinate calculation unit 23 may include information on the morpheme included in the question sentence and the part of speech of each morpheme in the data set. Further, the coordinate calculation unit 23 may associate each category with a name (category name) representing the content of the category and store it in the question collection coordinate group DB 30A.

そして、ユーザが情報検索装置100で情報検索を開始する際、表示部40は、カテゴリ選択領域51で選択されているカテゴリに対するデータセットの各々を質問集座標群DB30Aから取得して、質問表示領域52に表示する。この場合、表示部40は、選択されているカテゴリに対するデータセット毎に、質問表示領域52の表示座標に対応する位置に、質問文スコアに応じた文字の大きさで質問文を表示する。   When the user starts an information search with the information search device 100, the display unit 40 acquires each of the data sets for the category selected in the category selection area 51 from the question collection coordinate group DB 30A, and displays the question display area. 52. In this case, the display unit 40 displays a question sentence with a character size corresponding to the question sentence score at a position corresponding to the display coordinates of the question display area 52 for each data set corresponding to the selected category.

なお、表示部40は、質問表示領域52の大きさに合わせて表示座標を適切にスケーリングし、質問表示領域52に質問文を表示するようにしてもよい。   The display unit 40 may display the question text in the question display area 52 by appropriately scaling the display coordinates according to the size of the question display area 52.

一方、ユーザが、自分が抱える情報要求に近い内容を示していると思われる質問文の近辺にマウスのポインタ54を移動し、マウスをクリックすると、入力部10には、マウスをクリックして指定した位置に対応する座標、すなわち「指定座標」が入力される。   On the other hand, when the user moves the mouse pointer 54 to the vicinity of the question sentence that seems to indicate the content close to the information request held by the user and clicks the mouse, the input unit 10 is designated by clicking the mouse. Coordinates corresponding to the selected position, that is, “designated coordinates” are input.

入力部10は、指定座標を受け付けた場合、受け付けた指定座標を情報検索部20Bに通知する。   When receiving the designated coordinates, the input unit 10 notifies the information retrieval unit 20B of the received designated coordinates.

情報検索部20Bは、入力部10から受け付けた指定座標、及び質問集座標群DB30Aに格納される質問文の表示座標に基づいて検索クエリを生成し、生成した検索クエリを用いて検索エンジンで検索した検索結果を出力する。   The information search unit 20B generates a search query based on the designated coordinates received from the input unit 10 and the display coordinates of the question text stored in the question collection coordinate group DB 30A, and performs a search with a search engine using the generated search query. The search results are output.

そのため、情報検索部20Bは、距離計算部24、クエリ生成部25、及び情報検索部26を備える。   Therefore, the information search unit 20B includes a distance calculation unit 24, a query generation unit 25, and an information search unit 26.

距離計算部24は、入力部10から受け付けた指定座標、及び質問集座標群DB30Aに格納される質問文の表示座標に基づいて、指定座標と、カテゴリ選択領域51で選択中のカテゴリに含まれる質問文の表示座標と、の距離を、質問文毎に計算する。そして、距離計算部24は、カテゴリ選択領域51で選択中のカテゴリに含まれる質問文と、計算した距離と、を対応付け、例えば対応付けられた距離が短い順に、距離が対応付けられた質問文の各々をクエリ生成部25に出力する。   The distance calculation unit 24 is included in the designated coordinates and the category selected in the category selection area 51 based on the designated coordinates received from the input unit 10 and the display coordinates of the question text stored in the question collection coordinate group DB 30A. The distance from the display coordinates of the question sentence is calculated for each question sentence. Then, the distance calculation unit 24 associates the question text included in the category selected in the category selection area 51 with the calculated distance. For example, the questions in which the distances are associated in ascending order of the associated distances. Each sentence is output to the query generator 25.

なお、指定座標と質問文の表示座標との距離の算出方法に制限はなく、例えばユーグリッド距離又はコサイン距離等の公知の距離の計算アルゴリズムを用いることができる。また、質問文の代わりに質問文IDに計算した距離を対応付け、クエリ生成部25に出力するようにしてもよい。   In addition, there is no restriction | limiting in the calculation method of the distance of a designated coordinate and the display coordinate of a question sentence, For example, well-known distance calculation algorithms, such as a Eugrid distance or a cosine distance, can be used. Further, the calculated distance may be associated with the question sentence ID instead of the question sentence, and may be output to the query generation unit 25.

クエリ生成部25は、距離計算部24から受け付けた質問文及び距離に基づいて、対応付けられた距離が予め定めた条件を満たす質問文からキーワードを抽出して、検索クエリを生成する。   Based on the question sentence and distance received from the distance calculation part 24, the query generation part 25 extracts keywords from the question sentence that the associated distance satisfies a predetermined condition, and generates a search query.

クエリ生成部25には予め複数の検索クエリ生成方法が実装されており、クエリ生成部25は、例えばカテゴリ選択領域51で選択されたカテゴリの内容に応じて、適用する検索クエリ生成方法を決定することができる。   A plurality of search query generation methods are implemented in advance in the query generation unit 25, and the query generation unit 25 determines a search query generation method to be applied, for example, according to the content of the category selected in the category selection region 51. be able to.

クエリ生成部25は、例えば1つ目の検索クエリ生成方法として、指定座標からの距離が最も短い表示座標に対応する質問文からキーワードを抽出し、抽出したキーワードの各々を検索クエリとする方法を適用する。   For example, as a first search query generation method, the query generation unit 25 extracts a keyword from a question sentence corresponding to a display coordinate having the shortest distance from a designated coordinate, and uses each extracted keyword as a search query. Apply.

なお、クエリ生成部25で使用するキーワード抽出ルールに制限はなく、自由に規定することができる。一般的には、名詞及び動詞等の自立語又は内容語となる形態素をキーワードとして質問文から抽出する方法が用いられる。この場合、例えば座標情報作成部20Aで既に質問文を形態素に分割している場合には、その分割結果を用いることができる。   In addition, there is no restriction | limiting in the keyword extraction rule used in the query production | generation part 25, It can prescribe | regulate freely. Generally, a method is used in which morphemes that are independent words or content words such as nouns and verbs are extracted from a question sentence as keywords. In this case, for example, when the question text has already been divided into morphemes by the coordinate information creation unit 20A, the division result can be used.

また、クエリ生成部25は、2つ目の検索クエリ生成方法として、距離計算部24から受け付けた質問文のうち、対応する表示座標から指定座標までの距離が短い方から順にN個(N=1,2,3,・・・)の質問文を選択し、選択した質問文の各々から抽出したキーワードを検索クエリとする方法を適用する。   In addition, as a second search query generation method, the query generation unit 25 includes N pieces (N = N = in order from the shortest distance from the corresponding display coordinate to the designated coordinate among the question sentences received from the distance calculation unit 24. (1, 2, 3,...) Is selected, and a keyword extracted from each of the selected question sentences is used as a search query.

なお、Nの値は予め定めた値を用いてもよく、また、可変値であってもよい。例えば、指定座標から予め定めた距離以内に含まれる表示座標の各々に対応した質問文を全て選択することで、結果として可変するN個の質問文を選択するようにしてもよい。   Note that the value of N may be a predetermined value or a variable value. For example, by selecting all the question sentences corresponding to each of the display coordinates included within a predetermined distance from the designated coordinates, N question sentences that change as a result may be selected.

具体的には、クエリ生成部25は、選択したN個の質問文の各々から、予め定めたキーワード抽出ルールに従ってキーワードを抽出し、抽出したキーワードの各々から、検索クエリとして用いるキーワードを決定する。   Specifically, the query generation unit 25 extracts a keyword from each of the selected N question sentences according to a predetermined keyword extraction rule, and determines a keyword to be used as a search query from each of the extracted keywords.

検索クエリとして用いるキーワードの決定方法には様々な方法を用いることができるが、クエリ生成部25では、N個の質問文の各々から抽出したキーワードのうち、出現頻度が高く、且つ、指定座標との距離がより短い質問文に含まれるキーワードから順に検索クエリとして用いる。   Although various methods can be used as a method for determining a keyword used as a search query, the query generation unit 25 has a high appearance frequency among keywords extracted from each of the N question sentences, and has designated coordinates. Are used as search queries in order from the keyword included in the question sentence having a shorter distance.

また、2つ目の検索クエリ生成方法では、クエリ生成部25は、選択したN個の質問文の各々から抽出した各キーワードについて、(1)式を用いてキーワードkeywordのキーワードスコアScore(keyword)を計算し、キーワードスコアScoreが高い方から順にM個(M=1,2,3,・・・)のキーワードを検索クエリとして用いる。   In the second search query generation method, the query generation unit 25 uses the expression (1) for each keyword extracted from each of the selected N question sentences to obtain the keyword score Score (keyword) of the keyword keyword. And M keywords (M = 1, 2, 3,...) Are used as a search query in descending order of the keyword score Score.

ここで、df(keyword)は、N個の質問文におけるキーワードkeywordの出現頻度であり、tf(n,keyword)は、指定座標からの距離がn番目に近い表示座標に対応する質問文におけるキーワードkeywordの出現頻度である。   Here, df (keyword) is the appearance frequency of the keyword keyword in the N question sentences, and tf (n, keyword) is the keyword in the question sentence corresponding to the display coordinate whose distance from the specified coordinate is the nth closest. The frequency of occurrence of the keyword.

なお、Mの値は予め定めた値を用いてもよく、また、可変値であってもよい。例えば予め定めた値以上のキーワードスコアScoreを有するキーワードを選択することで、結果として可変するM個のキーワードを検索クエリとして用いるようにしてもよい。   Note that a predetermined value may be used as the value of M, or a variable value may be used. For example, by selecting a keyword having a keyword score Score equal to or higher than a predetermined value, M keywords that change as a result may be used as a search query.

そして、クエリ生成部25は、生成したM個のキーワードを含む検索クエリを情報検索部26に出力する。   Then, the query generation unit 25 outputs a search query including the generated M keywords to the information search unit 26.

情報検索部26は、クエリ生成部25から受け付けた検索クエリを図示しない検索エンジンに入力し、検索エンジンが情報検索部26から入力された検索クエリを用いて検索した検索結果を、検索エンジンから取得する。   The information search unit 26 inputs the search query received from the query generation unit 25 to a search engine (not shown), and obtains the search result searched by the search engine using the search query input from the information search unit 26 from the search engine. To do.

なお、情報検索部26が検索クエリを入力する検索エンジンは、例えば情報検索装置100とネットワークで接続される情報検索装置100とは異なる装置(外部装置)で動作する任意の検索システムにおける検索エンジンを用いることができる。この場合、情報検索部26は、当該検索エンジンを用いてWeb等を検索するために提供された検索用のインタフェース(Application Programming Interface:API)を用いて、検索エンジンを利用することができる。   The search engine to which the information search unit 26 inputs a search query is, for example, a search engine in an arbitrary search system that operates on a device (external device) different from the information search device 100 connected to the information search device 100 via a network. Can be used. In this case, the information search unit 26 can use the search engine by using a search interface (Application Programming Interface: API) provided for searching the Web or the like using the search engine.

そして、情報検索部26は、検索エンジンから取得した、検索クエリに対する検索結果を表示部40に出力する。   Then, the information search unit 26 outputs the search result for the search query acquired from the search engine to the display unit 40.

表示部40は、情報検索部26から受け付けた検索結果を、図1に示した検索結果表示領域53に表示する。   The display unit 40 displays the search result received from the information search unit 26 in the search result display area 53 shown in FIG.

以上により、ユーザがマウス等でクリックした質問表示領域52の領域から生成した検索クエリに基づく検索結果が、検索結果表示領域53に表示される。   As described above, the search result based on the search query generated from the question display area 52 clicked by the user with the mouse or the like is displayed in the search result display area 53.

<情報検索装置の作用>
次に、本実施の形態に係る情報検索装置100の作用について説明する。
<Operation of information retrieval device>
Next, the operation of the information search apparatus 100 according to this embodiment will be described.

情報検索装置100は、質問集を入力部10で受け付けると、受け付けた質問集を座標情報作成部20Aに通知する。そして、情報検索装置100は、CPUで図4に示す座標情報作成処理ルーチンを実行する。   When the information search apparatus 100 accepts the question collection by the input unit 10, the information search apparatus 100 notifies the coordinate information creation unit 20A of the accepted question collection. Then, the information retrieval apparatus 100 executes a coordinate information creation processing routine shown in FIG.

まず、ステップS100において、入力部10から受け付けた質問集に含まれる質問文の各々に対して公知のカテゴリ分割方法を適用し、質問文の各々をカテゴリ毎に分割する。そして、分割した質問文の各々とカテゴリを対応付け、例えば記憶部30に格納する。   First, in step S100, a known category dividing method is applied to each question sentence included in the question collection received from the input unit 10, and each question sentence is divided for each category. Then, each divided question sentence is associated with a category and stored in, for example, the storage unit 30.

ステップS102において、ステップS100で分割した質問文のカテゴリの中から、未選択のカテゴリを1つ選択する。なお、以降では、ステップS102で選択したカテゴリを、特に「注目カテゴリ」ということにする。   In step S102, one unselected category is selected from the categories of the question sentence divided in step S100. Hereinafter, the category selected in step S102 will be referred to as “attention category” in particular.

ステップS104において、ステップS102で選択した注目カテゴリに含まれる各々の質問文の中から、未選択の質問文を1つ選択する。なお、以降では、ステップS104で選択した質問文を、特に「注目質問文」ということにする。   In step S104, one unselected question sentence is selected from each question sentence included in the attention category selected in step S102. In the following, the question sentence selected in step S104 will be referred to as “attention question sentence”.

ステップS106において、ステップS104で選択した注目質問文に対して、上述した公知の特徴量抽出方法を用いて特徴量を抽出し、例えば記憶部30に格納する。   In step S <b> 106, feature amounts are extracted from the attention question sentence selected in step S <b> 104 using the above-described known feature amount extraction method and stored in the storage unit 30, for example.

ステップS108において、ステップS106で注目質問文から抽出した特徴量に対して上述した公知の次元圧縮方法を用いて、特徴量の次元数を2次元に圧縮する。そして、2次元に圧縮した特徴量の各要素を質問表示領域52の大きさに合わせて正規化し、正規化した特徴量の各要素を、質問表示領域52における注目質問文の表示座標として注目質問文と対応付け、記憶部30に格納する。   In step S108, the feature quantity extracted from the attention question sentence in step S106 is compressed into two dimensions using the known dimension compression method described above. Then, each element of the feature quantity compressed in two dimensions is normalized according to the size of the question display area 52, and each element of the normalized feature quantity is used as the attention question display coordinates in the question display area 52. It is associated with the sentence and stored in the storage unit 30.

ステップS110において、ステップS102で選択した注目カテゴリに含まれる全ての質問文をステップS104で選択したか否かを判定し、まだステップS104で選択されていない質問文が存在する場合には、ステップS104に移行する。そして、ステップS102で選択した注目カテゴリに含まれる質問文の中から未選択の質問文がなくなるまで、ステップS104で未選択の質問文を選択し、ステップS104〜S110を繰り返すことで、注目カテゴリに含まれる質問文の各々に、質問表示領域52における表示座標が対応付けられる。   In step S110, it is determined whether or not all question sentences included in the attention category selected in step S102 have been selected in step S104. If there is a question sentence that has not been selected in step S104, step S104 is performed. Migrate to Then, an unselected question sentence is selected in step S104 until no unselected question sentences are included in the question sentence included in the attention category selected in step S102, and steps S104 to S110 are repeated, so that the attention category is selected. Display coordinates in the question display area 52 are associated with each of the included question sentences.

一方、ステップS110の判定処理が肯定判定の場合には、ステップS112に移行する。   On the other hand, if the determination process in step S110 is affirmative, the process proceeds to step S112.

ステップS112において、ステップS108で計算した注目カテゴリにおける各質問文の表示座標の各々を要素とするデータ集合に対して、公知のクラスタリングアルゴリズムを適用し、各質問文の表示座標の各々を注目カテゴリ内で複数のクラスタに分割する。   In step S112, a known clustering algorithm is applied to the data set having each of the display coordinates of each question sentence in the attention category calculated in step S108 as an element, and each of the display coordinates of each question sentence is included in the attention category. To divide into multiple clusters.

ステップS114において、注目カテゴリに含まれる質問文の各々に質問文スコアを設定する。   In step S114, a question sentence score is set for each question sentence included in the target category.

具体的には、まず、注目カテゴリに含まれる質問文の各々の質問文スコアとして予め定めた値を設定する。   Specifically, first, a predetermined value is set as the question sentence score of each question sentence included in the attention category.

そして、ステップS112で分割した、注目カテゴリ内における複数のクラスタの各々に対して、クラスタに含まれる各質問文の表示座標の各々に基づいて、クラスタ中心となる質問文を設定する。なお、クラスタ中心の設定方法に制限はなく、例えば特定のクラスタに含まれる各質問文における表示座標の各々の平均値との距離が最も短い表示座標に対応する質問文を、上記特定のクラスタにおけるクラスタ中心としてもよい。   Then, for each of the plurality of clusters in the target category divided in step S112, a question sentence that is the center of the cluster is set based on each display coordinate of each question sentence included in the cluster. The cluster center setting method is not limited. For example, the question sentence corresponding to the display coordinate having the shortest distance from the average value of the display coordinates in each question sentence included in the specific cluster is displayed in the specific cluster. It may be the cluster center.

そして、クラスタ毎に、クラスタ中心に対応付けられた質問文の質問文スコアに所定の値を加算することで、クラスタ中心に対応付けられた質問文の質問文スコアが、クラスタ中心以外の質問文の質問文スコアより大きくなるようにする。したがって、例えば質問表示領域52に表示する質問文の文字を、質問文に対応付けられた質問文スコアの値が大きいほど大きく表示するようにすれば、注目カテゴリにおいてクラスタ中心に対応付けられた質問文の文字が、クラスタ中心以外の質問文の文字より大きく質問表示領域52に表示されることになる。   Then, for each cluster, by adding a predetermined value to the question sentence score of the question sentence associated with the cluster center, the question sentence score of the question sentence associated with the cluster center becomes a question sentence other than the cluster center. It should be larger than the question sentence score. Accordingly, for example, if the question text displayed in the question display area 52 is displayed larger as the value of the question text score associated with the question text increases, the question associated with the cluster center in the attention category. The character of the sentence is displayed in the question display area 52 larger than the character of the question sentence other than the cluster center.

したがって、ユーザは、質問文の文字の大きさに基づいて、質問表示領域52に表示された各々の質問文の中から特徴的な質問文を素早く把握することができ、情報検索装置100の操作性を向上させることができる。   Therefore, the user can quickly grasp a characteristic question sentence from each question sentence displayed in the question display area 52 based on the size of the character of the question sentence. Can be improved.

ステップS116において、注目カテゴリに含まれる質問文の各々に対して、質問文IDと、ステップS108で計算した表示座標と、ステップS114で設定した質問文スコアと、を対応付け、質問集座標群DB30Aにカテゴリ単位で格納する。   In step S116, the question sentence ID, the display coordinates calculated in step S108, and the question sentence score set in step S114 are associated with each of the question sentences included in the attention category, and the question collection coordinate group DB 30A. In category unit.

ステップS118において、ステップS100で分割した全てのカテゴリをステップS102で選択したか否かを判定し、まだステップS102で選択されていないカテゴリが存在する場合には、ステップS102に移行する。そして、ステップS100で分割したカテゴリの中から未選択のカテゴリがなくなるまで、ステップS102で未選択のカテゴリを選択し、ステップS102〜S118を繰り返すことで、質問文ID、質問文、表示座標、及び質問文スコアがそれぞれ対応付けられたデータセットの各々が、カテゴリ毎に質問集座標群DB30Aに格納される。   In step S118, it is determined whether or not all categories divided in step S100 have been selected in step S102. If there is a category that has not been selected in step S102, the process proceeds to step S102. Then, until there is no unselected category among the categories divided in step S100, an unselected category is selected in step S102, and steps S102 to S118 are repeated, whereby a question sentence ID, a question sentence, display coordinates, and Each of the data sets associated with the question sentence scores is stored in the question collection coordinate group DB 30A for each category.

以上の処理によって、図4に示す座標情報作成処理ルーチンが終了する。   With the above processing, the coordinate information creation processing routine shown in FIG. 4 ends.

次に、情報検索装置100で情報検索サービスをユーザに提供する場合、情報検索装置100は、CPUで図5に示す情報検索処理ルーチンを実行する。なお、情報検索処理ルーチンを実行するにあたり、ユーザは、カテゴリ選択領域51で特定のカテゴリを既に選択しているものとする。   Next, when the information search device 100 provides an information search service to the user, the information search device 100 executes an information search processing routine shown in FIG. In executing the information search processing routine, it is assumed that the user has already selected a specific category in the category selection area 51.

まず、ステップS200において、図4に示した座標情報作成処理ルーチンの実行によって質問集座標群DB30Aに格納されたデータセットの各々をカテゴリ毎に読み込み、ユーザがカテゴリ選択領域51で選択したカテゴリに含まれる質問文の各々を、検索画面50の質問表示領域52に表示する。この場合、質問文を、質問文の表示座標で表される位置に、質問文スコアに応じた文字の大きさで質問表示領域52に表示する。なお、上述したように、ここでは一例として、質問文スコアが大きいほど、質問表示領域52に表示する質問文の文字の大きさを大きく表示する。   First, in step S200, each of the data sets stored in the question collection coordinate group DB 30A is read for each category by executing the coordinate information creation processing routine shown in FIG. 4 and included in the category selected by the user in the category selection area 51. Each question sentence is displayed in the question display area 52 of the search screen 50. In this case, the question text is displayed in the question display area 52 at the position represented by the display coordinates of the question text in the size of the character corresponding to the question text score. As described above, as an example, the larger the question sentence score, the larger the character size of the question sentence displayed in the question display area 52 is displayed.

なお、ユーザがカテゴリ選択領域51で選択したカテゴリを、特に「選択カテゴリ」ということにする。   The category selected by the user in the category selection area 51 is particularly referred to as “selected category”.

ステップS202において、ユーザが質問表示領域52でマウスをクリックした際に情報検索装置100のオペレーションシステムから通知される指定座標の有無によって、質問表示領域52がクリックされたか否かを判定する。否定判定の場合には、ユーザがマウスで質問表示領域52をクリックするまで、ステップS202の処理を繰り返す。一方、肯定判定の場合にはステップS204に移行する。   In step S202, whether or not the question display area 52 is clicked is determined based on the presence or absence of designated coordinates notified from the operation system of the information search device 100 when the user clicks the mouse in the question display area 52. In the case of negative determination, the process of step S202 is repeated until the user clicks the question display area 52 with the mouse. On the other hand, if the determination is affirmative, the process proceeds to step S204.

ステップS204において、ステップS202でオペレーションシステムから通知された指定座標を記憶部30に格納する。   In step S204, the designated coordinates notified from the operation system in step S202 are stored in the storage unit 30.

ステップS206において、質問集座標群DB30Aを参照して、選択カテゴリに含まれる各々の質問文の中から、未選択の質問文を1つ選択する。   In step S206, referring to the question collection coordinate group DB 30A, one unselected question sentence is selected from each question sentence included in the selected category.

ステップS208において、ステップS206で選択した質問文に対応付けられた表示座標を質問集座標群DB30Aから取得する。   In step S208, display coordinates associated with the question sentence selected in step S206 are acquired from the question collection coordinate group DB 30A.

ステップS210において、ステップS204で取得した指定座標と、ステップS208で取得した質問文の表示座標と、の距離を計算する。既に説明したように、指定座標と質問文の表示座標との距離の算出方法に制限はなく、例えばユーグリッド距離又はコサイン距離等の公知の距離の計算アルゴリズムを用いて距離を計算する。   In step S210, the distance between the designated coordinates acquired in step S204 and the display coordinates of the question sentence acquired in step S208 is calculated. As already described, there is no limitation on the method of calculating the distance between the designated coordinates and the display coordinates of the question text, and the distance is calculated using a known distance calculation algorithm such as the Eugrid distance or the cosine distance.

計算した距離は、例えばステップS206で選択した質問文と対応付けて記憶部30に格納する。   The calculated distance is stored in the storage unit 30 in association with the question sentence selected in step S206, for example.

ステップS212において、選択カテゴリに含まれる全ての質問文をステップS206で選択したか否かを判定し、まだステップS206で選択されていない選択カテゴリ内の質問文が存在する場合には、ステップS206に移行する。そして、選択カテゴリに含まれる質問文の中から未選択の質問文がなくなるまで、ステップS206で未選択の質問文を選択し、ステップS206〜S212を繰り返すことで、選択カテゴリに含まれる質問文の各々に、ステップS210で指定座標との距離が対応付けられて記憶部30に格納される。   In step S212, it is determined whether or not all question sentences included in the selected category have been selected in step S206. If there are question sentences in the selected category that have not yet been selected in step S206, the process proceeds to step S206. Transition. Then, until there is no unselected question sentence from the question sentences included in the selected category, an unselected question sentence is selected in step S206, and steps S206 to S212 are repeated, whereby the question sentence included in the selected category is selected. Each of them is stored in the storage unit 30 in correspondence with the distance from the designated coordinates in step S210.

一方、ステップS212の判定処理が肯定判定の場合には、ステップS214に移行する。   On the other hand, if the determination process in step S212 is affirmative, the process proceeds to step S214.

ステップS214において、ステップS210で選択カテゴリに含まれる質問文の各々に対応付けられた距離に基づいて、選択カテゴリに含まれる質問文の中から質問文を選択する。そして、本ステップで選択した質問文からキーワードを抽出し、抽出したキーワードに基づいて、ステップS204で取得した指定座標に対応する検索クエリを生成する。   In step S214, a question sentence is selected from the question sentences included in the selected category based on the distance associated with each question sentence included in the selected category in step S210. Then, keywords are extracted from the question sentence selected in this step, and a search query corresponding to the designated coordinates acquired in step S204 is generated based on the extracted keywords.

例えば、上記の2つ目の検索クエリ生成方法を用いる場合には、選択カテゴリに含まれる各々の質問文のうち、ステップS210で質問文に対応付けられた距離が短い方から順にN個の質問文を選択する。そして、例えば上述したキーワード抽出ルールに従って、選択したN個の質問文からキーワードを抽出し、抽出したキーワードの各々に対して、(1)式を用いてキーワードスコアScoreをキーワード毎に計算する。そして、キーワードスコアScoreが高い方から順にM個のキーワードを検索クエリとして生成する。   For example, when the second search query generation method is used, N questions in order from the shortest distance associated with the question sentence in step S210 among the question sentences included in the selected category. Select a sentence. Then, for example, in accordance with the keyword extraction rules described above, keywords are extracted from the selected N question sentences, and for each of the extracted keywords, a keyword score Score is calculated for each keyword using equation (1). Then, M keywords are generated as search queries in descending order of the keyword score Score.

なお、上述したように、本ステップで実行する検索クエリの生成方法はこれに限られず、例えばステップS210で選択カテゴリに含まれる質問文の各々に対応付けられた距離のうち、最も短い距離に対応する質問文からキーワードを抽出し、抽出したキーワードの各々を検索クエリとしてもよい。   Note that, as described above, the search query generation method executed in this step is not limited to this, and for example, corresponds to the shortest distance among the distances associated with each question sentence included in the selected category in step S210. The keywords may be extracted from the question sentence to be searched, and each of the extracted keywords may be used as a search query.

ステップS216において、Web等を検索するために予め提供されたAPIを用いて、任意の検索システムにおける検索エンジンにステップS214で生成した検索クエリを入力し、当該検索クエリに対する検索結果を検索エンジンから取得する。   In step S216, the search query generated in step S214 is input to a search engine in an arbitrary search system using an API provided in advance for searching the Web or the like, and the search result for the search query is acquired from the search engine. To do.

ステップS218において、ステップS216で検索エンジンから取得した検索結果を検索画面50の検索結果表示領域53に表示する。   In step S218, the search result acquired from the search engine in step S216 is displayed in the search result display area 53 of the search screen 50.

なお、本実施の形態では、マウスを用いて質問表示領域52の質問文を指定する形態について説明したが、検索画面50を表示する表示装置にタッチパネルを取り付け、指等で質問文を指定するようにしてもよいことは言うまでもない。   In the present embodiment, a description has been given of an embodiment in which a question sentence in the question display area 52 is designated using a mouse. However, a touch panel is attached to a display device that displays the search screen 50, and a question sentence is designated with a finger or the like. Needless to say, you can.

以上の処理によって、図5に示す情報検索処理ルーチンが終了する。   With the above processing, the information retrieval processing routine shown in FIG. 5 is completed.

このように、本実施の形態に係る情報検索装置100は、収集した質問集に含まれる質問文を、質問表示領域52の質問文の特徴量に基づいた位置に表示し、ユーザが、自分が抱える情報要求に近い内容を示していると思われる質問文の近辺でマウスをクリックすることで指定座標を受け付ける。そして、情報検索装置100は、受け付けた指定座標、及び質問表示領域52における質問文の表示座標に基づいて検索クエリを自動的に生成し、生成した検索クエリを用いて検索エンジンで検索した検索結果を検索結果表示領域53に出力する。   As described above, the information search device 100 according to the present embodiment displays the question text included in the collected question collection at a position based on the feature amount of the question text in the question display area 52, and the user can The specified coordinates are accepted by clicking the mouse in the vicinity of the question sentence that seems to indicate the content close to the information request held. Then, the information search apparatus 100 automatically generates a search query based on the received designated coordinates and the display coordinates of the question text in the question display area 52, and the search result searched by the search engine using the generated search query. Is output to the search result display area 53.

したがって、情報検索装置100は、従来の検索エンジンを用いた検索方法のように、ユーザが検索エンジンの検索ウインドウに検索クエリを入力する必要がないため、検索クエリを検索ウインドウに入力して検索する場合に比べて、検索に係る操作性を向上させることができる。特に、大きさの関係から文字入力が比較的困難となりやすいスマートフォンやタブレット端末等の携帯端末での操作性の向上を図ることができる。   Therefore, unlike the conventional search method using a search engine, the information search apparatus 100 does not require the user to input a search query into the search window of the search engine. Compared to the case, the operability related to the search can be improved. In particular, it is possible to improve the operability of a mobile terminal such as a smartphone or a tablet terminal in which character input is relatively difficult due to the size.

また、情報検索装置100は、自分が抱える情報要求に近い内容を示していると思われる質問文の近辺をマウスでクリックするだけで、検索クエリを自動的に生成する。したがって、ユーザ自身では思いつくことが困難な検索クエリに対する検索結果を得ることができるため、ユーザが検索クエリを検討する場合に比べて、多様な情報を得ることができる。このように、ユーザ自身では思いつくことが困難な観点から情報要求に対応する内容を調べることができるため、特に、教育目的のアプリケーション等に本発明に係る情報検索方法を用いることができる。   In addition, the information search apparatus 100 automatically generates a search query by simply clicking the vicinity of a question sentence that seems to indicate content close to the information request that the information search apparatus has. Therefore, since it is possible to obtain a search result for a search query that is difficult for the user to come up with, it is possible to obtain a variety of information compared to when the user reviews the search query. As described above, since the content corresponding to the information request can be examined from the viewpoint that it is difficult for the user to come up with the information, the information retrieval method according to the present invention can be used particularly for an educational purpose application or the like.

また、情報検索装置100は、ユーザが質問表示領域52をマウスでクリックすることで、指定座標に応じた質問の検索結果を表示するため、ユーザが検索クエリを検索ウインドウに入力して検索する場合に比べて、高速、且つ、大量に情報を得ることができる。したがって、迅速な検索が要求されるコールセンターの検索端末等において、本発明に係る情報検索方法を用いることができる。   In addition, when the user clicks on the question display area 52 with the mouse, the information search apparatus 100 displays the search result of the question according to the designated coordinates. Compared to, it is possible to obtain a large amount of information at high speed. Therefore, the information search method according to the present invention can be used in a search terminal or the like of a call center that requires quick search.

また、情報検索装置100は、ユーザがクリックした領域の近辺に表示される複数の質問文に基づいて、検索クエリを自動的に生成することができる。したがって、質問表示領域52にユーザの情報要求に適した質問文がない場合であっても、ユーザが情報要求に類似すると思われる質問文の近辺をクリックすることによって、情報要求に適した検索結果を得ることができる。   Further, the information search device 100 can automatically generate a search query based on a plurality of question sentences displayed in the vicinity of the area clicked by the user. Therefore, even when there is no question sentence suitable for the user's information request in the question display area 52, when the user clicks in the vicinity of the question sentence that seems to be similar to the information request, the search result suitable for the information request Can be obtained.

更に、情報検索装置100では、質問文の重要度が高いほど質問表示領域52に表示する質問文の文字の大きさを大きくするため、同じ大きさの文字で質問文を表示する場合に比べて、ユーザは複数の質問文の中から特徴的な質問文を素早く把握することができる。   Furthermore, in the information search apparatus 100, the higher the importance of the question sentence, the larger the character size of the question sentence displayed in the question display area 52. Therefore, as compared with the case where the question sentence is displayed with the same size character. The user can quickly grasp a characteristic question sentence from a plurality of question sentences.

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   Note that the present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.

例えば、上述の情報検索装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   For example, the information search apparatus 100 described above has a computer system inside, but the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used. .

また、本願明細書中では、プログラムが予めROMにインストールされている実施形態を説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   In the specification of the present application, the embodiment in which the program is preinstalled in the ROM has been described. However, the program may be provided by being stored in a computer-readable recording medium.

10・・・入力部
20・・・演算部
20A・・・座標情報作成部
20B・・・情報検索部
21・・・カテゴリ分割部
22・・・特徴量抽出部
23・・・座標計算部
24・・・距離計算部
25・・・クエリ生成部
26・・・情報検索部
30・・・記憶部
40・・・表示部
50・・・検索画面
51・・・カテゴリ選択領域
52・・・質問表示領域
53・・・検索結果表示領域
100・・・情報検索装置
30A・・・質問集座標群DB
DESCRIPTION OF SYMBOLS 10 ... Input part 20 ... Operation part 20A ... Coordinate information creation part 20B ... Information search part 21 ... Category division part 22 ... Feature-value extraction part 23 ... Coordinate calculation part 24 ... distance calculation unit 25 ... query generation unit 26 ... information search unit 30 ... storage unit 40 ... display unit 50 ... search screen 51 ... category selection area 52 ... question Display area 53 ... Search result display area 100 ... Information search device 30A ... Question collection coordinate group DB

Claims (8)

質問集に含まれる自然言語で記述された複数の質問文の内容に基づいて、前記質問文の各々の特徴量を抽出し、
前記質問文の各々について、前記質問文から抽出した前記特徴量に基づいて、前記質問文を画面上に表示する際の表示座標を計算し、
前記質問文の各々を、前記画面上の前記計算された表示座標に表示し、
ユーザ操作によって指定された、前記画面上の指定座標を受け付けた場合、前記質問文の各々について計算された表示座標と、前記指定座標との距離を計算し、
前記計算された距離が予め定めた条件を満たす前記質問文に含まれるキーワードに基づいて、検索クエリを生成し、
前記生成された検索クエリを検索エンジンに入力し、
前記検索エンジンによって検索された前記検索クエリに対する検索結果を表示する
情報検索方法。
Based on the contents of a plurality of question sentences described in a natural language included in the collection of questions, each feature amount of the question sentence is extracted,
For each of the question sentences, based on the feature amount extracted from the question sentence, the display coordinates when displaying the question sentence on the screen are calculated,
Displaying each of the questions at the calculated display coordinates on the screen;
When the designated coordinates on the screen designated by the user operation are received, the distance between the display coordinates calculated for each of the question sentences and the designated coordinates is calculated,
Generating a search query based on a keyword included in the question sentence in which the calculated distance satisfies a predetermined condition;
Enter the generated search query into a search engine,
An information search method for displaying a search result for the search query searched by the search engine.
前記質問文の表示座標を計算する際に、前記質問文の内容に基づいて前記質問文の重要度を計算し、
前記質問文を表示する際に、前記質問文の重要度が高いほど前記画面上に表示される前記質問文の文字の大きさが大きくなるように、前記質問文を表示する
請求項1記載の情報検索方法。
When calculating the display coordinates of the question sentence, the importance of the question sentence is calculated based on the content of the question sentence,
The said question sentence is displayed so that the size of the character of the said question sentence displayed on the said screen may become large, so that the importance of the said question sentence is high when displaying the said question sentence. Information retrieval method.
前記質問文の各々の表示座標に基づいて、前記質問文の各々を複数のクラスタに分類し、
前記質問文を表示する際に、前記クラスタの各々においてクラスタ中心となる前記質問文の文字の大きさが、クラスタ中心ではない前記質問文の文字の大きさより大きくなるように、前記質問文を表示する
請求項2記載の情報検索方法。
Based on the display coordinates of each of the question sentences, classify each of the question sentences into a plurality of clusters,
When displaying the question sentence, the question sentence is displayed such that the size of the character of the question sentence that is the cluster center in each of the clusters is larger than the size of the character of the question sentence that is not the cluster center. The information search method according to claim 2.
前記質問文の内容に基づいて、前記質問文の各々の前記特徴量をカテゴリ毎に抽出し、
前記特徴量に基づいて、前記質問文を前記画面上に表示する際の表示座標をカテゴリ毎に計算し、
前記質問文の各々を、前記画面上の前記計算された表示座標にカテゴリ毎に表示する
請求項1〜請求項3の何れか1項に記載の情報検索方法。
Based on the content of the question sentence, the feature amount of each of the question sentences is extracted for each category,
Based on the feature amount, the display coordinates when displaying the question sentence on the screen are calculated for each category,
The information search method according to claim 1, wherein each of the question sentences is displayed for each category on the calculated display coordinates on the screen.
前記検索クエリを生成する際に、前記指定座標との距離が最も短い表示座標に表示される前記質問文に含まれるキーワードを含む前記検索クエリを生成する
請求項1〜請求項4の何れか1項に記載の情報検索方法。
5. The search query including a keyword included in the question sentence displayed at a display coordinate having a shortest distance from the designated coordinate is generated when generating the search query. The information search method described in the section.
前記検索クエリを生成する際に、前記指定座標との距離が、予め定めた閾値以内に含まれる前記質問文の各々に含まれる各キーワードに対して、前記指定座標との距離が前記閾値以内に含まれる前記質問文の各々における出現頻度が高く、且つ、前記指定座標との距離が短い前記質問文に含まれるキーワードほど、キーワードスコアが高くなるように、前記キーワードスコアを算出し、前記キーワードスコアが上位M個のキーワードを含む前記検索クエリを生成する
請求項1〜請求項4の何れか1項に記載の情報検索方法。
When generating the search query, the distance from the designated coordinate is within the threshold for each keyword included in each of the question sentences whose distance from the designated coordinate is within a predetermined threshold. The keyword score is calculated so that a keyword included in the question sentence having a higher appearance frequency in each of the included question sentences and having a shorter distance from the designated coordinates has a higher keyword score, and the keyword score The information search method according to any one of claims 1 to 4, wherein the search query includes the top M keywords.
質問集に含まれる自然言語で記述された複数の質問文の内容に基づいて、前記質問文の各々の特徴量を抽出する特徴量抽出部と、
前記質問文の各々について、前記特徴量抽出部で前記質問文から抽出した前記特徴量に基づいて、前記質問文を画面上に表示する際の表示座標を計算する座標計算部と、
前記質問文の各々を、前記座標計算部で計算された前記画面上の表示座標に表示する表示部と、
ユーザ操作によって指定された、前記画面上の指定座標を受け付けた場合、前記質問文の各々について、前記座標計算部で計算された表示座標と、前記指定座標との距離を計算する距離計算部と、
前記距離計算部で計算された距離が予め定めた条件を満たす前記質問文に含まれるキーワードに基づいて、検索クエリを生成するクエリ生成部と、
前記クエリ生成部で生成された検索クエリを検索エンジンに入力し、前記検索エンジンによって検索された前記検索クエリに対する検索結果を取得する情報検索部と、
を備え、
前記表示部は、前記情報検索部で取得した前記検索クエリに対する検索結果を前記画面上に表示する
情報検索装置。
A feature amount extraction unit that extracts each feature amount of the question sentence based on the contents of a plurality of question sentences described in a natural language included in the question collection;
For each of the question sentences, a coordinate calculation unit that calculates display coordinates when displaying the question sentence on the screen based on the feature amount extracted from the question sentence by the feature amount extraction unit;
A display unit for displaying each of the question sentences at display coordinates on the screen calculated by the coordinate calculation unit;
A distance calculation unit that calculates a distance between the display coordinates calculated by the coordinate calculation unit and the specified coordinates for each of the question texts when the specified coordinates on the screen specified by a user operation are received; ,
A query generation unit that generates a search query based on a keyword included in the question sentence in which the distance calculated by the distance calculation unit satisfies a predetermined condition;
An information search unit that inputs a search query generated by the query generation unit to a search engine and acquires a search result for the search query searched by the search engine;
With
The display unit displays a search result for the search query acquired by the information search unit on the screen.
請求項1〜請求項6の何れか1項に記載の情報検索方法の各ステップをコンピュータに実行させるためのプログラム。   The program for making a computer perform each step of the information search method of any one of Claims 1-6.
JP2016101928A 2016-05-20 2016-05-20 Information search method, information search apparatus, and program Pending JP2017208047A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016101928A JP2017208047A (en) 2016-05-20 2016-05-20 Information search method, information search apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016101928A JP2017208047A (en) 2016-05-20 2016-05-20 Information search method, information search apparatus, and program

Publications (1)

Publication Number Publication Date
JP2017208047A true JP2017208047A (en) 2017-11-24

Family

ID=60415051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016101928A Pending JP2017208047A (en) 2016-05-20 2016-05-20 Information search method, information search apparatus, and program

Country Status (1)

Country Link
JP (1) JP2017208047A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019106758A1 (en) * 2017-11-29 2019-06-06 三菱電機株式会社 Language processing device, language processing system and language processing method
JP2021082206A (en) * 2019-11-22 2021-05-27 株式会社エクサウィザーズ Feature extraction method, computer program and information processing device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019106758A1 (en) * 2017-11-29 2019-06-06 三菱電機株式会社 Language processing device, language processing system and language processing method
CN111373391A (en) * 2017-11-29 2020-07-03 三菱电机株式会社 Language processing device, language processing system, and language processing method
CN111373391B (en) * 2017-11-29 2023-10-20 三菱电机株式会社 Language processing device, language processing system, and language processing method
JP2021082206A (en) * 2019-11-22 2021-05-27 株式会社エクサウィザーズ Feature extraction method, computer program and information processing device

Similar Documents

Publication Publication Date Title
US11868386B2 (en) Method and system for sentiment analysis of information
JP5316158B2 (en) Information processing apparatus, full-text search method, full-text search program, and recording medium
US20180260860A1 (en) A computer-implemented method and system for analyzing and evaluating user reviews
EP1881428A1 (en) Searching for documents using relevance feedback
KR101873873B1 (en) Multimedia content search device through attribute information analysis and Method
US20210157977A1 (en) Display system, program, and storage medium
US20150205860A1 (en) Information retrieval device, information retrieval method, and information retrieval program
US20150088491A1 (en) Keyword extraction apparatus and method
WO2020208693A1 (en) Document information evaluation device, document information evaluation method, and document information evaluation program
WO2018058118A1 (en) Method, apparatus and client of processing information recommendation
JP6664599B2 (en) Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program
JP6772478B2 (en) Information retrieval program and information retrieval device
CN114116997A (en) Knowledge question answering method, knowledge question answering device, electronic equipment and storage medium
JP2017208047A (en) Information search method, information search apparatus, and program
JP6653833B1 (en) Document information evaluation device, document information evaluation method, and document information evaluation program
US20170293683A1 (en) Method and system for providing contextual information
JP2021086592A (en) Document information evaluation device and document information evaluation method, and document information evaluation program
CN110688559A (en) Retrieval method and device
JP2014235723A (en) Information presentation device, method and program
JP6163143B2 (en) Information providing apparatus, information providing method, and information providing program
JP4453440B2 (en) Visual information classification method and apparatus, program, and storage medium recording visual information classification program
CN112926297B (en) Method, apparatus, device and storage medium for processing information
KR20200085688A (en) Information providing method and apparatus using reserved word
JP5277090B2 (en) Link creation support device, link creation support method, and program
JP2019211884A (en) Information search system