JP2019114224A - Search method, search program and search device - Google Patents

Search method, search program and search device Download PDF

Info

Publication number
JP2019114224A
JP2019114224A JP2018091663A JP2018091663A JP2019114224A JP 2019114224 A JP2019114224 A JP 2019114224A JP 2018091663 A JP2018091663 A JP 2018091663A JP 2018091663 A JP2018091663 A JP 2018091663A JP 2019114224 A JP2019114224 A JP 2019114224A
Authority
JP
Japan
Prior art keywords
word
search
impression
score
axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018091663A
Other languages
Japanese (ja)
Other versions
JP7187816B2 (en
Inventor
高橋 潤
Jun Takahashi
潤 高橋
淳哉 斎藤
Junya Saito
淳哉 斎藤
哲典 田口
Tetsunori Taguchi
哲典 田口
上村 拓也
Takuya Kamimura
拓也 上村
村瀬 健太郎
Kentaro Murase
健太郎 村瀬
清司 大倉
Seiji Okura
清司 大倉
菊池 慎司
Shinji Kikuchi
慎司 菊池
中川 章
Akira Nakagawa
章 中川
福岡 俊之
Toshiyuki Fukuoka
俊之 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to US16/157,636 priority Critical patent/US11023474B2/en
Publication of JP2019114224A publication Critical patent/JP2019114224A/en
Application granted granted Critical
Publication of JP7187816B2 publication Critical patent/JP7187816B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a search method capable of properly evaluation of search result.SOLUTION: The search method is a search program to cause a computer to execute the steps of: identifying a group of search words on the basis of a query; acquiring a piece of search result aggregate data from search target data using the group of search words; extracting a first feature word group from the query; and displaying the search result aggregate data by using the first feature word group as an item.SELECTED DRAWING: Figure 12

Description

本発明は、検索方法、検索プログラム及び検索装置に関する。   The present invention relates to a search method, a search program and a search device.

従来から、ユーザにより入力されたクエリに基づく検索結果を、レーダチャートにより表示させるシステムが知られている。また、従来のシステムでは、例えば、レーダチャートを表示させる際に、ユーザにより入力されたクエリに基づく検索結果の集合から、軸となる項目(単語)を抽出することが知られている。   BACKGROUND Conventionally, there has been known a system for displaying a search result based on a query input by a user using a radar chart. Moreover, in the conventional system, for example, when displaying a radar chart, it is known to extract an axial item (word) from a set of search results based on a query input by a user.

特開2008−003869号公報JP, 2008-003869, A

従来の技術では、検索結果の集合からレーダチャートの軸となる単語を抽出しているため、ユーザにより入力されたクエリによっては、レーダチャートが適切な軸で表示されているにも関わらず、クエリと軸との対応関係が明確でない状況が生じうる。このような状況では、ユーザは、検索結果が自身の意図に適合したものであるか否かを速やかに評価することが困難である。   In the prior art, since the word used as the axis of a radar chart is extracted from the set of search results, depending on the query inputted by the user, the query is displayed even though the radar chart is displayed with an appropriate axis. Situations may arise where the correspondence between the axis and the axis is not clear. In such a situation, it is difficult for the user to quickly evaluate whether the search result conforms to his / her intention.

1つの側面では、本発明は、検索結果の評価を適切に行うことを目的としている。   In one aspect, the present invention aims to properly evaluate search results.

一つ態様では、コンピュータによる検索方法であって、該コンピュータが、クエリに基づき、検索語群を特定し、検索対象データより、前記検索語群を用いて検索結果集合データを取得し、前記クエリより、第1特徴語群を抽出し、前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる、検索方法である。   In one embodiment, in the search method by a computer, the computer specifies a search term group based on a query, acquires search result set data from the search target data using the search term group, and the query The first feature word group is extracted, and the search result set data is displayed using the first feature word group as an item.

上記各手順は、上記各手順を実現する機能部、各処理としても良く、各処理をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。   Each of the above procedures may be a functional unit that implements each of the above procedures, or each process, or may be a computer readable storage medium storing a program that causes a computer to execute each process.

検索結果の評価を適切に行うことができる。   It is possible to evaluate the search results appropriately.

第一の実施形態の検索システムのシステム構成の一例を示す図である。It is a figure showing an example of system configuration of a search system of a first embodiment. 第一の実施形態の検索装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of the search device of 1st embodiment. 第一の実施形態の検索装置の機能を説明する図である。It is a figure explaining the function of the search device of a first embodiment. インデックス生成部による処理を説明するフローチャートである。It is a flowchart explaining the process by an index generation part. インデックス生成部により生成されたインデックス情報の一例を示す図である。It is a figure which shows an example of the index information produced | generated by the index production | generation part. 第一の実施形態の印象語マップの一例を示す図である。It is a figure which shows an example of the impression word map of 1st embodiment. 印象空間学習部による処理を説明するフローチャートである。It is a flowchart explaining the process by an impression space learning part. 第一の実施形態の印象語スコアリストの一例を示す図である。It is a figure which shows an example of the impression word score list of 1st embodiment. 第一の実施形態の検索処理部の処理を説明するフローチャートである。It is a flowchart explaining the process of the search process part of 1st embodiment. 第一の実施形態の印象語スコア出力部及び軸決定部の処理を説明するフローチャートである。It is a flow chart explaining processing of an impression word score output part and axis determination part of a first embodiment. 印象語スコア出力部と軸決定部の処理を説明する図である。It is a figure explaining the process of an impression word score output part and an axis | shaft determination part. 第一の実施形態のレーダチャートの表示例を示す第一の図である。It is a 1st figure which shows the example of a display of the radar chart of 1st embodiment. 比較例となるレーダチャートの一例を示す図である。It is a figure which shows an example of the radar chart used as a comparative example. 第一の実施形態のレーダチャートの表示例を示す第二の図である。It is the 2nd figure which shows the indicatory example of the radar chart of 1st execution form. 第二の実施形態の検索装置の機能を説明する図である。It is a figure explaining the function of the search device of a second embodiment. 第二の実施形態の検索処理部の処理を説明するフローチャートである。It is a flowchart explaining the process of the search process part of 2nd embodiment. 第二の実施形態の軸決定部の処理を説明するフローチャートである。It is a flowchart explaining the process of the axis | shaft determination part of 2nd embodiment. 第三の実施形態の印象語マップにおけるスコアのばらつきについて説明する図である。It is a figure explaining the dispersion | variation in the score in the impression word map of 3rd embodiment. 第三の実施形態の検索装置の機能を説明する図である。It is a figure explaining the function of the search device of a third embodiment. 第三の実施形態の印象語マップの例を示す図である。It is a figure which shows the example of the impression word map of 3rd embodiment. 第三の実施形態の印象語スコアリストの一例を示す図である。It is a figure which shows an example of the impression word score list of 3rd embodiment. 第三の実施形態の検索処理部の処理を説明するフローチャートである。It is a flowchart explaining the process of the search process part of 3rd embodiment. 第三の実施形態の印象語スコア出力部、軸決定部の処理を説明するフローチャートである。It is a flowchart explaining the process of the impression word score output part of 3rd embodiment, and an axis | shaft determination part. 第三の実施形態の検索処理部による軸の候補の抽出を説明する図である。It is a figure explaining extraction of a candidate of an axis by a search processing part of a third embodiment. 第三の実施形態の表示例を示す第一の図である。It is a 1st figure which shows the example of a display of 3rd embodiment. 第三の実施形態の表示例を示す第二の図である。It is a 2nd figure which shows the example of a display of 3rd embodiment. 第四の実施形態の検索装置の機能を説明する図である。It is a figure explaining the function of the search device of a 4th embodiment. 第四の実施形態における軸の変更の処理を説明するフローチャートである。It is a flowchart explaining the process of the change of the axis | shaft in 4th embodiment. 軸の変更について説明する図である。It is a figure explaining change of an axis. 第五の実施形態の検索装置の機能を説明する図である。It is a figure explaining the function of the search device of a fifth embodiment. 第五の実施形態の補正リスト生成部の処理を説明するフローチャートである。It is a flowchart explaining the process of the correction list | wrist production | generation part of 5th embodiment. 第五の実施形態の補正リストの一例を示す図である。It is a figure which shows an example of the correction list | wrist of 5th embodiment. 第五の実施形態の印象語スコア出力部、軸決定部、スコア補正部の処理を説明するフローチャートである。It is a flowchart explaining the process of the impression word score output part of 5th embodiment, an axis | shaft determination part, and a score correction | amendment part. 第六の実施形態の概要を説明する図である。It is a figure explaining the outline | summary of 6th embodiment. 印象語のスコアの変更について説明する図である。It is a figure explaining change of a score of an impression word. 第六の実施形態の検索装置の機能を説明する図である。It is a figure explaining the function of the search device of a sixth embodiment. 第六の実施形態の検索処理部の処理を説明する第一のフローチャートである。It is a 1st flow chart explaining processing of a search processing part of a 6th embodiment. 第六の実施形態の検索処理部の処理を説明する第二のフローチャートである。It is a 2nd flow chart explaining processing of a search processing part of a sixth embodiment. 第六の実施形態の検索処理部の処理を説明する第三のフローチャートである。It is the 3rd flowchart which explains the processing of the search processing section of 6th embodiment. 第六の実施形態のスコアとスライダ値との対応付けを説明する図である。It is a figure explaining matching with a score of a 6th embodiment, and a slider value. 第六の実施形態の対応テーブルの一例を示す図である。It is a figure which shows an example of the corresponding | compatible table of 6th embodiment. 第六の実施形態の表示の一例を示す図である。It is a figure which shows an example of the display of 6th embodiment. 第六の実施形態の表示の他の例を示す図である。It is a figure which shows the other example of the display of 6th embodiment. 第七の実施形態のスコアとスライダ値との対応付けを説明する図である。It is a figure explaining matching with a score of a 7th embodiment, and a slider value. 第七の実施形態の検索処理部の処理を説明するフローチャートである。It is a flowchart explaining the process of the search process part of 7th embodiment. 第七の実施形態の対応テーブルの一例を示す図である。It is a figure which shows an example of the corresponding | compatible table of 7th embodiment.

(第一の実施形態)
以下に図面を参照して、第一の実施形態について説明する。図1は、第一の実施形態の検索システムのシステム構成の一例を示す図である。
(First embodiment)
The first embodiment will be described below with reference to the drawings. FIG. 1 is a diagram showing an example of a system configuration of a search system according to the first embodiment.

本実施形態の検索システム100は、検索装置200と、端末装置300とを有する。検索装置200と端末装置300とは、ネットワークを介して接続される。また、本実施形態の検索装置200は、検索装置200による検索処理の対象となる情報が格納された検索対象文書データベース400と通信を行う。本実施形態の検索対象文書データベース400に格納された情報とは、例えば、文書データ等のテキストデータである。   The search system 100 of the present embodiment includes a search device 200 and a terminal device 300. The search device 200 and the terminal device 300 are connected via a network. In addition, the search device 200 according to the present embodiment communicates with the search target document database 400 in which information to be searched for by the search device 200 is stored. The information stored in the search target document database 400 of the present embodiment is, for example, text data such as document data.

本実施形態の検索対象文書データベース400は、例えば、複数のデータベースを含んでも良い。また、本実施形態の検索対象文書データベース400は、検索システム100に含まれても良い。   The search target document database 400 of this embodiment may include, for example, a plurality of databases. Further, the search target document database 400 of the present embodiment may be included in the search system 100.

本実施形態の検索装置200は、端末装置300において、ユーザによってクエリが入力されると、入力されたクエリに基づき、検索対象文書データベース400を検索する。そして、検索装置200は、検索処理を行った結果として取得された検索結果を、レーダチャートによって、端末装置300に表示させる。尚、クエリとは、例えば、端末装置300や検索装置200のユーザが、検索要求を行う際に入力する単語・フレーズ(複合語)のことを示す。   In the terminal device 300, when a query is input by the user, the search device 200 according to the present embodiment searches the search target document database 400 based on the input query. Then, the search device 200 causes the terminal device 300 to display the search result acquired as a result of performing the search process, using a radar chart. The query indicates, for example, a word / phrase (compound word) input by the user of the terminal device 300 or the search device 200 when making a search request.

このとき、本実施形態の検索装置200は、端末装置300から入力されたクエリに基づき抽出された単語を軸としたレーダチャートを表示させる。   At this time, the search device 200 of the present embodiment displays a radar chart whose axis is the word extracted based on the query input from the terminal device 300.

本実施形態では、このように、ユーザにより入力されたクエリに基づき抽出された単語をレーダチャートの軸に用いることで、クエリとレーダチャートの軸との対応関係を明確にすることができる。したがって、本実施形態では、検索結果が自身の意図に適合したものであるか否かをユーザに容易に評価させることができる。このように、本実施形態によれば、検索結果の評価を適切に行うことができる。   In this embodiment, the correspondence between the query and the axis of the radar chart can be clarified by using the word extracted based on the query input by the user as the axis of the radar chart. Therefore, in the present embodiment, the user can easily evaluate whether the search result conforms to his / her intention. Thus, according to the present embodiment, it is possible to appropriately evaluate the search results.

本実施形態の検索装置200は、検索対象インデックス記憶部210と、印象語マップ記憶部220と、検索対象スコア記憶部230、検索処理部240と、を有する。   The search device 200 of the present embodiment includes a search target index storage unit 210, an impression word map storage unit 220, a search target score storage unit 230, and a search processing unit 240.

検索対象インデックス記憶部210は、検索対象文書データベース400に格納された各文書データと、各文書データに含まれる単語とを対応付けたインデックス情報を格納する。印象語マップ記憶部220は、単語と印象語との関連を示す印象語マップを格納する。検索対象スコア記憶部230は、検索対象文書データベース400に含まれる文書データについて、各文書データに含まれる単語と印象語との関連を示す印象語スコアリストを格納する。各記憶部の詳細は後述する。   The search target index storage unit 210 stores index information in which each document data stored in the search target document database 400 is associated with a word included in each document data. The impression word map storage unit 220 stores an impression word map indicating the association between words and impression words. The search target score storage unit 230 stores, for the document data included in the search target document database 400, an impression word score list indicating a relation between words included in each document data and an impression word. Details of each storage unit will be described later.

検索処理部240は、端末装置300からクエリの入力を受け付けると、検索対象インデックス記憶部210を参照して検索対象文書データベース400に対する検索を行い、検索結果としての文書データを取得する。以下の説明では、検索処理部240による検索処理により取得された検索結果を検索結果集合データと呼ぶ。   When the search processing unit 240 receives an input of a query from the terminal device 300, the search processing unit 240 searches the search target document database 400 with reference to the search target index storage unit 210, and acquires document data as a search result. In the following description, the search result acquired by the search processing by the search processing unit 240 is referred to as search result aggregate data.

また、検索処理部240は、印象語マップ記憶部220を参照して、クエリの内容と関連が強い印象語をレーダチャートの軸に選択し、検索結果集合データ毎のレーダチャートを端末装置300に表示させる。   In addition, the search processing unit 240 refers to the impression word map storage unit 220, selects an impression word strongly related to the content of the query as an axis of the radar chart, and transmits the radar chart for each search result aggregate data to the terminal device 300. Display.

尚、図1の例では、クエリは端末装置300から検索装置200に入力され、レーダチャートは端末装置300に表示されるものとしたが、これに限定されない。クエリは、検索装置200の有する入力装置等によって入力されても良いし、レーダチャートは、検索装置200の有する出力装置(ディスプレイ)等に表示されても良い。   Although the query is input from the terminal device 300 to the search device 200 and the radar chart is displayed on the terminal device 300 in the example of FIG. 1, the present invention is not limited to this. The query may be input by an input device or the like included in the search device 200, or the radar chart may be displayed on an output device (display) or the like included in the search device 200.

以下に、本実施形態の検索装置200について説明する。図2は、第一の実施形態の検索装置のハードウェア構成の一例を示す図である。   Below, the search device 200 of this embodiment is demonstrated. FIG. 2 is a diagram showing an example of the hardware configuration of the search device of the first embodiment.

本実施形態の検索装置200は、それぞれバスBで相互に接続されている入力装置21、出力装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26及びインターフェース装置27を含む情報処理装置である。   The search device 200 of this embodiment includes an input device 21, an output device 22, a drive device 23, an auxiliary storage device 24, a memory device 25, an arithmetic processing unit 26 and an interface device 27 mutually connected by a bus B. It is an information processing apparatus.

入力装置21は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等により実現される。出力装置22は、各種の情報の出力を行うためものであり、例えばディスプレイ等により実現される。インターフェース装置27は、LANカード等を含み、ネットワークに接続する為に用いられる。   The input device 21 is a device for inputting various information, and is realized by, for example, a keyboard, a pointing device, or the like. The output device 22 is for outputting various types of information, and is realized by, for example, a display or the like. The interface device 27 includes a LAN card and the like, and is used to connect to a network.

検索プログラムは、検索装置200を制御する各種プログラムの少なくとも一部である。検索プログラムは例えば記憶媒体28の配布やネットワークからのダウンロード等によって提供される。検索プログラムを記録した記憶媒体28は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。   The search program is at least a part of various programs that control the search device 200. The search program is provided, for example, by distributing the storage medium 28 or downloading from the network. The storage medium 28 storing the search program is a storage medium for optically, electrically or magnetically recording information such as a CD-ROM, flexible disk, magneto-optical disk, etc., information such as ROM, flash memory etc. Various types of storage media can be used, such as semiconductor memories that record electrically.

また、検索プログラムは、検索プログラムを記録した記憶媒体28がドライブ装置23にセットされると、記憶媒体28からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワークからダウンロードされた検索プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。   The search program is installed from the storage medium 28 to the auxiliary storage device 24 via the drive device 23 when the storage medium 28 storing the search program is set in the drive device 23. The search program downloaded from the network is installed in the auxiliary storage device 24 via the interface device 27.

補助記憶装置24は、インストールされた検索プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置25は、検索装置200の起動時に補助記憶装置24から検索プログラムを読み出して格納する。そして、演算処理装置26はメモリ装置25に格納された検索プログラムに従って、後述するような各種処理を実現している。   The auxiliary storage device 24 stores the installed search program and also stores necessary files, data and the like. The memory device 25 reads out and stores the search program from the auxiliary storage device 24 when the search device 200 is activated. The arithmetic processing unit 26 implements various processes as described later according to the search program stored in the memory unit 25.

本実施形態の端末装置300のハードウェア構成は、検索装置200と同様であるから、説明を省略する。尚、端末装置300は、例えば、タブレット型の端末装置や、スマートフォン等であっても良く、入力装置21と出力装置22との代わりに、タッチパネル等により実現される表示操作装置を有していても良い。   The hardware configuration of the terminal device 300 according to the present embodiment is the same as that of the search device 200, and thus the description thereof is omitted. The terminal device 300 may be, for example, a tablet type terminal device or a smartphone, and has a display operation device realized by a touch panel or the like instead of the input device 21 and the output device 22. Also good.

次に、図3を参照して、本実施形態の検索装置200の機能について説明する。図3は、第一の実施形態の検索装置の機能を説明する図である。   Next, functions of the search device 200 of the present embodiment will be described with reference to FIG. FIG. 3 is a diagram for explaining the function of the search device of the first embodiment.

本実施形態の検索装置200は、検索対象インデックス記憶部210、印象語マップ記憶部220、検索対象スコア記憶部230、検索処理部240を有する。   The search device 200 of the present embodiment includes a search target index storage unit 210, an impression word map storage unit 220, a search target score storage unit 230, and a search processing unit 240.

検索対象インデックス記憶部210には、インデックス情報211が格納されている。本実施形態のインデックス情報211は、後述するインデックス生成部247による事前処理によって作成される。   In the search target index storage unit 210, index information 211 is stored. The index information 211 of the present embodiment is created by pre-processing by an index creation unit 247 described later.

印象語マップ記憶部220には、印象語マップ221が格納されている。本実施形態の印象語マップ221は、検索装置200の管理者等によって、予め与えられたものである。   The impression word map storage unit 220 stores an impression word map 221. The impression word map 221 of the present embodiment is given in advance by the administrator of the search device 200 or the like.

検索対象スコア記憶部230には、印象語スコアリスト231が格納されている。印象語スコアリスト231は、後述する検索処理部240の処理によって作成される。   In the search target score storage unit 230, an impression word score list 231 is stored. The impression word score list 231 is created by the processing of the search processing unit 240 described later.

本実施形態の検索処理部240は、入力受付部241、解析部242、検索部243、印象語スコア出力部244、軸決定部245、出力部246、インデックス生成部247、印象空間学習部248を有する。検索処理部240の有する各部は、検索装置200の有する演算処理装置26が、メモリ装置25等に格納された検索プログラムを読み出して実行することで実現される。   The search processing unit 240 of the present embodiment includes an input reception unit 241, an analysis unit 242, a search unit 243, an impression word score output unit 244, an axis determination unit 245, an output unit 246, an index generation unit 247, and an impression space learning unit 248. Have. Each unit of the search processing unit 240 is realized by the arithmetic processing unit 26 of the search device 200 reading out and executing a search program stored in the memory device 25 or the like.

本実施形態の入力受付部241は、検索装置200に対する各種の入力を受け付ける。具体的には、入力受付部241は、検索装置200に対するクエリの入力を受け付ける。   The input receiving unit 241 of the present embodiment receives various inputs to the search device 200. Specifically, the input receiving unit 241 receives an input of a query on the search device 200.

本実施形態の解析部242は、キーワードや自然文に対し、単語の分割、係り受けの解析、意味の解析等を行う。具体的には、解析部242は、クエリに基づき検索語群を特定したり、検索対象文書データベース400から取得した検索結果の文書データから単語を特定したりする。つまり、本実施形態の解析部242は、クエリから検索語群を特定する特定部の機能を果たす。   The analysis unit 242 according to the present embodiment performs word division, dependency analysis, meaning analysis, and the like on keywords and natural sentences. Specifically, the analysis unit 242 specifies a search word group based on a query, and specifies a word from document data of a search result acquired from the search target document database 400. That is, the analysis unit 242 of the present embodiment functions as a specifying unit that specifies a search word group from a query.

本実施形態の検索部243は、検索対象インデックス記憶部210を参照して、解析部242により得られた検索語群を含む文書データを特定し、検索対象文書データベース400から、検索結果集合データを取得する。   The search unit 243 according to the present embodiment refers to the search target index storage unit 210 to specify the document data including the search term group obtained by the analysis unit 242, and searches the search result collection data from the search target document database 400. get.

印象語スコア出力部244は、クエリから得られた検索語群に含まれる各単語を、分散表現によってベクトルに変換する。そして、印象語スコア出力部244は、ベクトルに変換された各単語と、後述する変換モデル250とに基づき、検索語群と、印象語マップ221に含まれる印象語との関連の強さを示すスコアを出力する。   The impression word score output unit 244 converts each word included in the search word group obtained from the query into a vector by the distributed expression. Then, the impression word score output unit 244 indicates the strength of the association between the search word group and the impression words included in the impression word map 221 based on each word converted into a vector and the conversion model 250 described later. Output the score.

言い換えれば、印象語スコア出力部244は、ベクトルで表現された単語を、変換モデル250に対する入力として、この単語と、印象語マップ221に含まれる各印象語との関連の強さを示すスコアを出力する。   In other words, the impression word score output unit 244 uses, as an input to the conversion model 250, a word represented by a vector, a score indicating the strength of the association between this word and each impression word included in the impression word map 221. Output.

本実施形態の単語の分散表現による方法とは、別途与えられる大量の学習データを用いて各単語間の意味的な類似関係(類似度)を推定し、推定した単語間類似度と矛盾しないかたちで、あらかじめ定めた次元数のベクトル空間に各単語を配置することで、単語の意味をベクトルで表現する方法である。以下の説明では、単語の分散表現によって変換された、単語の意味を表現するベクトルを意味ベクトルと呼ぶ。   The method by the distributed expression of the word of this embodiment is a form which does not contradict the interword similarity degree which estimated the semantic similarity relation (similarity degree) between each word using a large amount of learning data given separately Then, by arranging each word in a vector space of a predetermined number of dimensions, the meaning of the word is represented by a vector. In the following description, a vector representing the meaning of a word converted by the distributed representation of the word is referred to as a meaning vector.

また、本実施形態の印象語とは、形容詞や形容動詞、副詞などの検索結果の印象を想起させる単語である。   Further, the impression word in the present embodiment is a word that evokes an impression of a search result such as an adjective, an adjective verb, or an adverb.

軸決定部245は、印象語スコア出力部244により出力された単語毎のスコアに応じて、検索結果を表示するためのレーダチャートの軸となる印象語を決定する。レーダチャートの軸とは、言い換えれば、検索結果集合データを表示する際の項目の一つである。   The axis determination unit 245 determines an impression word to be an axis of a radar chart for displaying a search result according to the score for each word output by the impression word score output unit 244. The axis of the radar chart is, in other words, one of the items when displaying the search result set data.

本実施形態の出力部246は、軸決定部245により決定された印象語を軸とした、検索結果集合データのレーダチャートを表示させる。   The output unit 246 of the present embodiment displays a radar chart of the search result collection data with the impression word determined by the axis determination unit 245 as an axis.

つまり、本実施形態の出力部246は、クエリに基づく検索語群による検索処理で取得された検索結果集合データを表示する際に、検索語群と関連の強さに応じて抽出された印象語を項目として表示させる。   That is, when the output unit 246 according to the present embodiment displays the search result set data acquired by the search processing using the search term group based on the query, the impression term extracted according to the strength of the relation with the search term group Is displayed as an item.

本実施形態のインデックス生成部247は、検索対象文書データベース400から、検索対象インデックス記憶部210に格納されたインデックス情報211を作成する。   The index generation unit 247 of the present embodiment generates the index information 211 stored in the search target index storage unit 210 from the search target document database 400.

印象空間学習部248は、検索対象文書データベース400に格納された検索対象の文書データと、印象語マップ記憶部220に格納された印象語マップ221とに基づき、変換モデル250を出力する。   The impression space learning unit 248 outputs the conversion model 250 based on the search target document data stored in the search target document database 400 and the impression word map 221 stored in the impression word map storage unit 220.

本実施形態のインデックス生成部247と印象空間学習部248の処理は、クエリが入力されてから行われる検索処理の事前処理として、予め行われていることが好ましい。   It is preferable that the processes of the index generation unit 247 and the impression space learning unit 248 of the present embodiment are performed in advance as pre-processing of search processing performed after a query is input.

以下に、本実施形態の事前処理について説明する。はじめに、図4及び図5を参照して、インデックス生成部247によるインデックス情報211の生成について説明する。   The pre-processing of this embodiment will be described below. First, generation of the index information 211 by the index generation unit 247 will be described with reference to FIGS. 4 and 5.

図4は、インデックス生成部による処理を説明するフローチャートである。   FIG. 4 is a flowchart illustrating processing by the index generation unit.

本実施形態のインデックス生成部247は、検索対象文書データベース400を参照し、検索対象文書データベース400に格納された文書データ毎に、ある単語が文書データに含まれるか否かを判定する(ステップS401)。   The index generation unit 247 according to the present embodiment refers to the search target document database 400 and determines, for each document data stored in the search target document database 400, whether a certain word is included in the document data (step S401). ).

尚、本実施形態では、検索対象文書データベース400に格納された各文書データに、文書データを特定するための識別情報として、文書IDが含まれるものとした。   In the present embodiment, each document data stored in the search target document database 400 includes the document ID as identification information for specifying the document data.

続いて、インデックス生成部247は、単語毎に、単語が含まれる文書データの集合を取得し、単語と、取得した文書データの数と、文書データを特定する識別情報である文書IDとを対応付けたインデックス情報211を生成し(ステップS402)、処理を終了する。   Subsequently, the index generation unit 247 acquires, for each word, a set of document data including the word, and associates the word, the number of acquired document data, and the document ID that is identification information for specifying the document data. The generated index information 211 is generated (step S402), and the process ends.

図5は、インデックス生成部により生成されたインデックス情報の一例を示す図である。図5(a)は、ステップS401の処理の結果として得られる中間データを示す図である。図5(b)は、インデックス情報211の一例を示す図である。   FIG. 5 is a diagram illustrating an example of the index information generated by the index generation unit. FIG. 5A illustrates intermediate data obtained as a result of the process of step S401. FIG. 5 (b) is a diagram showing an example of the index information 211.

本実施形態のインデックス生成部247は、例えば、文書データに、「これ」、「ペン」、「リンゴ」が含まれるとする。   For example, the index generation unit 247 according to the present embodiment assumes that the document data includes “this”, “pen”, and “apple”.

この場合、インデックス生成部247は、検索対象文書データベース400に格納された文書データ毎に、単語「これ」、「ペン」、「リンゴ」のそれぞれが、文書データに含まれるか否かを判定し、判定結果を示す中間データ205を保持する。   In this case, the index generation unit 247 determines, for each of the document data stored in the search target document database 400, whether each of the words "this", "pen", and "apple" is included in the document data. , Hold intermediate data 205 indicating the determination result.

図5(a)に示す中間データ205では、単語「これ」は、文書ID「1」の文書データと、文書ID「2」の文書データと、文書ID「N」の文書データに含まれることがわかる。また、単語「ペン」は、文書ID「1」の文書データに含まれることがわかる。また、単語「リンゴ」は、文書ID「2」の文書データに含まれることがわかる。   In the intermediate data 205 shown in FIG. 5A, the word “this” is included in the document data of the document ID “1”, the document data of the document ID “2”, and the document data of the document ID “N”. I understand. Further, it can be understood that the word "pen" is included in the document data of the document ID "1". Also, it is understood that the word "apple" is included in the document data of the document ID "2".

次に、インデックス生成部247は、各単語に、単語が含まれる文書データの数と、文書IDとを対応付けたインデックス情報211を生成する。   Next, the index generation unit 247 generates index information 211 in which the number of document data in which a word is included in each word is associated with the document ID.

図5(b)に示すインデックス情報211は、情報の項目として、キー、マッチ文書数、文書の配列を有する。項目「キー」の値は、文書データに含まれると推定される単語を示す。項目「マッチ文書数」の値は、キーとなる単語が含まれる文書データの数を示す。項目「文書の配列」の値は、キーとなる単語が含まれる文書データの文書IDを示す。尚、項目「文書の配列」の値に含まれる文書IDの数は、項目「マッチ文書数」の値と同数となる。   The index information 211 illustrated in FIG. 5B includes, as items of information, a key, the number of matched documents, and an arrangement of documents. The value of the item "key" indicates a word presumed to be included in the document data. The value of the item "number of matched documents" indicates the number of document data including a key word. The value of the item "arrangement of documents" indicates the document ID of the document data in which the key word is included. The number of document IDs included in the value of the item “arrangement of documents” is the same as the value of the item “number of matched documents”.

図5(b)のインデックス情報211では、単語「これ」を含む文書データの数は、239個であり、単語「これ」を含む文書データの文書IDは、文書ID「1」、「2」、・・・、「N」となる。   In the index information 211 of FIG. 5B, the number of document data including the word “this” is 239, and the document ID of the document data including the word “this” is the document ID “1”, “2”. , ..., "N".

本実施形態のインデックス生成部247は、以上のようにして、インデックス情報211を生成し、検索対象インデックス記憶部210に格納しておく。   As described above, the index generation unit 247 of the present embodiment generates the index information 211 and stores the index information 211 in the search target index storage unit 210.

次に、印象空間学習部248による処理の説明に先立ち、本実施形態の印象語マップ記憶部220に格納された印象語マップ221について説明する。   Next, prior to the description of the process by the impression space learning unit 248, the impression word map 221 stored in the impression word map storage unit 220 of the present embodiment will be described.

図6は、第一の実施形態の印象語マップの一例を示す図である。本実施形態の印象語マップ221は、例えば、検索システム100の管理者等により作成され、予め検索装置200に与えられる。より具体的には、印象語マップ221は、例えば、単語と印象語との関連の強さを回答させるアンケート等を多数の人に対して実施し、その結果に基づき作成されたものが、検索装置200に与えられていても良い。   FIG. 6 is a view showing an example of an impression word map of the first embodiment. The impression word map 221 of the present embodiment is created by, for example, the administrator of the search system 100 and is given to the search device 200 in advance. More specifically, the impression word map 221 carries out, for example, a questionnaire for answering the strength of the association between the word and the impression word to a large number of people, and the one created based on the result is retrieved It may be provided to the device 200.

本実施形態の印象語マップ221では、単語毎に、予め用意された印象語との関連の強さを示すスコア(値)が対応付けられている。尚、印象語マップ221に含まれる単語は、検索対象文書データベース400に格納された文書データに含まれると推定される任意の単語であって良い。   In the impression word map 221 of the present embodiment, a score (value) indicating the strength of the association with the impression word prepared in advance is associated with each word. The words included in the impression word map 221 may be any words presumed to be included in the document data stored in the search target document database 400.

また、本実施形態のスコアは、例えば、0から10までの値であり、スコアが「0」の場合は、単語と印象語との関連がなく、スコアが大きくなるほど、単語と印象語との関連が強いことを示す。   Further, the score of this embodiment is, for example, a value from 0 to 10, and when the score is “0”, there is no relation between the word and the impression word, and the larger the score, the more the word and the impression word Indicates that the relationship is strong.

図6に示す印象語マップ221では、印象語として、「プレミア」、「わいわい」、「隠れ家」、「ひっそり」、「ヘルシー」等が挙げられている。   In the impression word map 221 shown in FIG. 6, as the impression words, “premier”, “dew”, “hidden”, “hidden”, “healthy” and the like are mentioned.

例えば、印象語マップ221では、単語「デート」は、印象語「プレミア」との関連の強さを示すスコアは「9.21」であり、印象語「わいわい」との関連の強さを示すスコアは「3.23」である。   For example, in the impression word map 221, the word "date" has a score "9.21" indicating the strength of association with the impression word "premier", and indicates the strength of association with the impression word "delight". The score is "3.23".

したがって、単語「デート」は、印象語「わいわい」よりも、印象語「プレミア」との関連の方が強いことがわかる。   Therefore, it can be understood that the word "date" is more strongly associated with the impression word "premium" than the impression word "delight".

次に、図7を参照して、本実施形態の印象空間学習部248の処理について説明する。図7は、印象空間学習部による処理を説明するフローチャートである。   Next, processing of the impression space learning unit 248 of the present embodiment will be described with reference to FIG. 7. FIG. 7 is a flowchart illustrating processing by the impression space learning unit.

本実施形態の印象空間学習部248は、検索対象文書データベース400を参照し、検索対象文書データベース400に含まれる各文書データを入力として、各文書データに含まれる単語の分散表現を、教師なし学習する(ステップS701)。言い換えれば、印象空間学習部248は、各文書データに含まれる単語の意味ベクトルを内部的に保持する。   The impression space learning unit 248 of the present embodiment refers to the search target document database 400, receives each document data included in the search target document database 400, and performs unsupervised learning of the distributed expression of the words included in each document data. (Step S701). In other words, the impression space learning unit 248 internally holds the semantic vectors of the words included in each document data.

続いて、印象空間学習部248は、印象語マップ221を参照し、各単語の分散表現に対する、印象語マップ221に含まれる印象語に対応するスコアを教師あり学習する(ステップS702)。言い換えれば、印象空間学習部248は、印象語マップ221を参照して、各単語の意味ベクトルと、この単語と対応付けられた各印象語との関連の強さを示すスコアとの関係を機械学習しておく。   Subsequently, the impression space learning unit 248 refers to the impression word map 221, and supervised and learns the score corresponding to the impression word included in the impression word map 221 with respect to the distributed expression of each word (step S702). In other words, the impression space learning unit 248 refers to the impression word map 221 to machine the relationship between the semantic vector of each word and the score indicating the strength of association with each impression word associated with this word. I will learn.

続いて、印象空間学習部248は、学習した結果を変換モデル250として出力し、保持する(ステップS703)。つまり、本実施形態の変換モデル250は、分散表現によって得られた単語の意味ベクトルを入力とし、この単語と対応付けられた印象語毎のスコアを出力とするモデルである。   Subsequently, the impression space learning unit 248 outputs the learning result as the conversion model 250 and holds it (step S703). That is, the conversion model 250 of the present embodiment is a model that receives as input the semantic vector of a word obtained by distributed expression, and outputs as output a score for each impression word associated with this word.

以上が、インデックス生成部247よる事前処理と、印象空間学習部248による事前処理である。   The above is the pre-processing by the index generation unit 247 and the pre-processing by the impression space learning unit 248.

次に、図8を参照して、本実施形態の検索対象スコア記憶部230に格納された印象語スコアリスト231について説明する。   Next, with reference to FIG. 8, the impression word score list 231 stored in the search target score storage unit 230 of the present embodiment will be described.

図8は、印象語スコアリストの一例を示す図である。本実施形態の印象語スコアリスト231は、例えば、検索処理部240の解析部242と印象語スコア出力部244の処理によって得られるリストである。本実施形態の印象語スコアリスト231は、検索部243による検索結果を出力部246によりレーダチャートとして表示させる際に、参照される。   FIG. 8 is a diagram showing an example of an impression word score list. The impression word score list 231 of the present embodiment is, for example, a list obtained by the processing of the analysis unit 242 of the search processing unit 240 and the impression word score output unit 244. The impression word score list 231 of the present embodiment is referred to when the output unit 246 displays the search result of the search unit 243 as a radar chart.

印象語スコアリスト231は、検索対象文書データベース400に含まれる文書データの文書IDと、印象語スコアリスト231に含まれる各印象語との関連の強さを示すスコアを示している。尚、印象語スコアリスト231に含まれる印象語は、印象語マップ221に含まれる印象語と同様である。   The impression word score list 231 indicates the score indicating the strength of the association between the document ID of the document data included in the search target document database 400 and each impression word included in the impression word score list 231. The impression words included in the impression word score list 231 are the same as the impression words included in the impression word map 221.

本実施形態の検索処理部240は、例えば、解析部242により、検索対象文書データベース400に格納された文書データから単語を抽出する。そして、検索処理部240は、抽出された単語を、印象語スコア出力部244によって意味ベクトルとした後に変換モデル250へ入力し、単語毎に、各印象語との関連の強さを示すスコアを取得する。   For example, the search processing unit 240 of the present embodiment causes the analysis unit 242 to extract words from the document data stored in the search target document database 400. Then, the search processing unit 240 converts the extracted word into a semantic vector by the impression word score output unit 244 and then inputs it to the conversion model 250, and for each word, indicates a score indicating the strength of association with each impression word. get.

本実施形態の印象語スコアリスト231では、このスコアを文書IDと対応付けられた各印象語のスコアとしても良い。   In the impression word score list 231 of the present embodiment, this score may be a score of each impression word associated with the document ID.

このようにすれば、例えば、検索対象文書データベース400に格納された文書データから1つの単語が抽出された場合には、この単語と、各印象語との関連の強さを示すスコアが、この文書データと各印象語との関連の強さを示すスコアとなる。   In this way, for example, when one word is extracted from the document data stored in the search target document database 400, the score indicating the strength of the association between this word and each impression word is this score. It is a score indicating the strength of the association between the document data and each impression word.

また、例えば、文書データから複数の単語が抽出された場合、複数の単語について、各印象語との関連の強さを示すスコアが出力される。したがって、本実施形態では、各印象語について、複数の単語のスコアの最大値や平均値を求め、各印象語のスコアの最大値や平均値を、この文書データと各印象語との関連の強さを示すスコアとしても良い。   Also, for example, when a plurality of words are extracted from document data, a score indicating the strength of association with each impression word is output for the plurality of words. Therefore, in the present embodiment, for each impression word, the maximum value or the average value of the score of a plurality of words is determined, and the maximum value or the average value of the score for each impression word is determined as the relation between this document data and each impression word. It may be a score indicating strength.

具体的には、例えば、文書データから「デート」と「おいしい」という2つの単語が抽出されたとする。この場合、検索処理部240は、単語「デート」と、印象語マップ221に含まれる各印象語との関連の強さを示すスコアと、単語「おいしい」と、印象語マップ221に含まれる各印象語との関連の強さを示すスコアと、を取得する。   Specifically, for example, it is assumed that two words “date” and “delicious” are extracted from the document data. In this case, the search processing unit 240 adds a score indicating the strength of the association between the word "date" and each impression word included in the impression word map 221, the word "delicious", and each of the words included in the impression word map 221. Obtain a score indicating the strength of the association with the impression word.

そして、検索処理部240は、印象語毎に、単語「デート」と対応するスコアと、単語「おいしい」と対応するスコアとの最大値を求める。例えば、単語「デート」と印象語「プレミア」との関連の強さを示すスコアが9.21であり、単語「おいしい」と印象語「プレミア」との関連の強さを示すスコアが9.38であったとする。この場合、検索処理部240は、9.21と9.38における最大値9.38を、この文書データと、印象語「プレミア」との関連の強さを示すスコアとすれば良い。   Then, the search processing unit 240 obtains, for each impression word, the maximum value of the score corresponding to the word "date" and the score corresponding to the word "delicious". For example, the score showing the strength of the association between the word "date" and the impression word "premium" is 9.21, and the score showing the strength of the association between the word "delicious" and the impression word "premium" is 9. Suppose that it is 38. In this case, the search processing unit 240 may set the maximum value 9.38 at 9.21 and 9.38 as a score indicating the strength of the association between the document data and the impression word “premier”.

次に、図9を参照して、本実施形態の検索処理部240の処理について説明する。図9は、第一の実施形態の検索処理部の処理を説明するフローチャートである。   Next, processing of the search processing unit 240 according to the present embodiment will be described with reference to FIG. FIG. 9 is a flowchart for explaining the processing of the search processing unit of the first embodiment.

本実施形態の検索処理部240は、入力受付部241がクエリの入力を受け付けると、解析部242により、クエリから形態素解析等により検索語群を取得し、検索部243により、インデックス情報211を検索語群で検索し、検索語群と対応する文書IDを特定する(ステップS901)。尚、本実施形態では、ステップS901で特定された文書IDが示す文書データが、検索結果集合データとなる。   In the search processing unit 240 of this embodiment, when the input receiving unit 241 receives an input of a query, the analysis unit 242 acquires a search word group from the query by morphological analysis etc., and the search unit 243 searches the index information 211. The word group is searched, and the document ID corresponding to the search word group is specified (step S901). In the present embodiment, the document data indicated by the document ID identified in step S901 is the search result aggregation data.

続いて、検索処理部240は、印象語スコア出力部244により、入力されたクエリに基づき、クエリとの関連が明確な印象語を軸としてn個抽出し、軸決定部245によりα軸に設定する(ステップS902)。ステップS902における軸とは、レーダチャートの軸であり、検索結果集合データの属性とされる項目の一つである。ステップS902の処理の詳細は後述する。また、本実施形態のα軸は、クエリとの関連の強さを示すスコアの値が大きく、クエリとの関連が強く、対応関係が明確である、とされる印象語が設定される軸である。   Subsequently, the search processing unit 240 causes the impression word score output unit 244 to extract n pieces of impression words having a clear relation with the query based on the input query, and sets them as the α axis by the axis determination unit 245 (Step S902). The axis in step S902 is an axis of the radar chart, and is one of the items set as the attribute of the search result set data. Details of the process of step S902 will be described later. In addition, the α axis in this embodiment is an axis on which an impression word is set, in which the score value indicating the strength of the association with the query is large, the association with the query is strong, and the correspondence is clear. is there.

続いて、検索処理部240は、軸決定部245により、予め設定された単語をm個抽出し、β軸に設定する(ステップS903)。ここで、予め設定される単語は、例えば、印象語マップ221に含まれる印象語の中から選択されて設定されていても良い。また、予め設定される単語は、インデックス情報211に含まれる単語から選択されて設定されても良い。言い換えれば、予め設定された単語とは、検索結果集合データに含まれる単語であっても良い。   Subsequently, the search processing unit 240 causes the axis determination unit 245 to extract m preset words and set them as the β axis (step S903). Here, the words set in advance may be selected and set from among the impression words included in the impression word map 221, for example. Further, the words set in advance may be selected from the words included in the index information 211 and set. In other words, the preset word may be a word included in the search result set data.

また、本実施形態のβ軸とは、レーダチャートにおける全ての軸のうち、α軸以外の軸を示す。つまり、β軸は、α軸と比較して、クエリとの関連が強くない印象語が設定される軸と言える。   Further, the β-axis in the present embodiment indicates an axis other than the α-axis among all the axes in the radar chart. That is, it can be said that the β axis is an axis on which an impression word that is not strongly associated with the query is set as compared with the α axis.

続いて、出力部246は、α軸とβ軸とを出力軸とし(ステップS904)、出力部246により、ステップS901で検索部243が取得した文書IDが示す検索結果集合データをレーダチャートに描画し(ステップS905)、処理を終了する。   Subsequently, the output unit 246 sets the α axis and the β axis as output axes (step S904), and the output unit 246 draws the search result aggregate data indicated by the document ID acquired by the search unit 243 in step S901 on the radar chart. (Step S905), and the process ends.

次に、図10を参照して、図9のステップS902の処理について説明する。図10は、第一の実施形態の印象語スコア出力部及び軸決定部の処理を説明するフローチャートである。図10の処理は、印象語スコア出力部244と軸決定部245の処理を示している。   Next, the process of step S902 in FIG. 9 will be described with reference to FIG. FIG. 10 is a flowchart illustrating processing of an impression word score output unit and an axis determination unit according to the first embodiment. The process of FIG. 10 shows the processes of the impression word score output unit 244 and the axis determination unit 245.

本実施形態の印象語スコア出力部244は、ステップS901において取得した検索語群に含まれる各単語を、分散表現に変換する(ステップS1001)。言い換えれば、印象語スコア出力部244は、検索語群に含まれる各単語について、分散表現により意味ベクトルに変換する。   The impression word score output unit 244 of the present embodiment converts each word included in the search word group acquired in step S901 into a distributed expression (step S1001). In other words, the impression word score output unit 244 converts each word included in the search word group into a semantic vector by distributed expression.

続いて、印象語スコア出力部244は、変換モデル250を参照し、単語毎に、各印象語との関連の強さを示すスコアを取得する(ステップS1002)。言い換えれば、印象語スコア出力部244は、変換モデル250に対して、ステップS1001で求めた各単語の意味ベクトルを入力し、変換モデル250から出力された、各単語についての印象語毎のスコアを取得する。   Subsequently, the impression word score output unit 244 refers to the conversion model 250, and acquires, for each word, a score indicating the strength of association with each impression word (step S1002). In other words, the impression word score output unit 244 inputs the semantic vector of each word obtained in step S1001 to the conversion model 250, and outputs the score for each impression word for each word output from the conversion model 250. get.

続いて、軸決定部245は、各単語と対応する印象語毎のスコアの最大値を取得する(ステップS1003)。   Subsequently, the axis determination unit 245 acquires the maximum value of the score for each impression word corresponding to each word (step S1003).

続いて、軸決定部245は、印象語毎のスコアの最大値の上位n個と対応する印象語を、クエリと関連するα軸として抽出する(ステップS1004)。言い換えれば、軸決定部245は、印象語毎のスコアの最大値が大きい順に、n個の印象語を抽出し、α軸とする。   Subsequently, the axis determination unit 245 extracts impression words corresponding to the top n highest values of the score for each impression word as an α axis associated with the query (step S1004). In other words, the axis determination unit 245 extracts n impression words in descending order of the maximum value of the score for each impression word, and sets the n impression words as an α axis.

以下に、図11を参照して、本実施形態の印象語スコア出力部244と軸決定部245の処理を具体的に説明する。図11は、印象語スコア出力部と軸決定部の処理を説明する図である。   The processes of the impression word score output unit 244 and the axis determination unit 245 according to the present embodiment will be specifically described below with reference to FIG. FIG. 11 is a diagram for explaining the processing of the impression word score output unit and the axis determination unit.

図11では、ユーザにより入力されたクエリを「ひっそりとしたプレミアのレストラン」として説明する。   In FIG. 11, the query input by the user will be described as "a restaurant of a quiet premiere".

本実施形態の検索処理部240は、このクエリの入力を受け付けると、解析部242により、検索語群111を取得する。検索語群には、単語「ひっそり」、「プレミア」、「レストラン」が含まれる。   When the search processing unit 240 of the present embodiment receives the input of this query, the analysis unit 242 acquires the search word group 111. The search word group includes the words "hidden", "premium" and "restaurant".

次に検索処理部240は、印象語スコア出力部244により、検索語群111に含まれる各単語の意味ベクトル112を得る。   Next, the search processing unit 240 causes the impression word score output unit 244 to obtain the semantic vector 112 of each word included in the search word group 111.

図11に示す意味ベクトル112では、単語「ひっそり」、「プレミア」、「レストラン」のそれぞれが、ベクトルとして示される。   In the semantic vector 112 shown in FIG. 11, each of the words "hidden", "premier" and "restaurant" are shown as vectors.

印象語スコア出力部244は、意味ベクトル112が得られると、意味ベクトル112を、変換モデル250の入力として、各単語について、印象語マップ221に含まれる印象語毎のスコアを得る。図11では、検索語群に含まれる各単語と、印象語毎のスコアとを対応付けた情報を、単語毎印象語スコア113と呼ぶ。   When the semantic word 112 is obtained, the impression word score output unit 244 uses the semantic vector 112 as an input of the conversion model 250 to obtain a score for each impression word contained in the impression word map 221 for each word. In FIG. 11, information in which each word included in the search word group is associated with a score for each impression word is referred to as an impression word score 113 for each word.

次に、軸決定部245は、単語毎印象語スコア113から、印象語毎のスコアの最大値を取得する。   Next, the axis determination unit 245 acquires the maximum value of the score for each impression word from the impression word score 113 for each word.

例えば、単語毎印象語スコア113では、印象語「プレミア」に対して、単語「ひっそり」との関連の強さを示すスコアは3.49であり、単語「プレミア」との関連の強さを示すスコアは10.00(満点)であり、単語「レストラン」との関連の強さを示すスコアは7.95である。   For example, in the word-by-word impression word score 113, for the impression word "premier", the score indicating the strength of association with the word "hidden" is 3.49, and the association strength with the word "premier" The score shown is 10.00 (full mark), and the score showing the strength of association with the word "restaurant" is 7.95.

したがって、軸決定部245は、印象語「プレミア」のスコアの最大値として「10.00」を取得する。   Therefore, the axis determination unit 245 acquires “10.00” as the maximum value of the score of the impression word “premium”.

また、単語毎印象語スコア113では、印象語「ヘルシー」に対して、単語「ひっそり」との関連の強さを示すスコアは3.48であり、単語「プレミア」との関連の強さを示すスコアは8.33であり、単語「レストラン」との関連の強さを示すスコアは6.72である。   In addition, in the word impression word score 113, for the impression word "healthy", the score indicating the strength of the association with the word "hidden" is 3.48, and the association strength with the word "premium" The score shown is 8.33, and the score showing the strength of association with the word "restaurant" is 6.72.

したがって、軸決定部245は、印象語「ヘルシー」のスコアの最大値として「8.33」を取得する。   Therefore, the axis determination unit 245 acquires “8.33” as the maximum value of the score of the impression word “healthy”.

また、単語毎印象語スコア113では、印象語「隠れ家」に対して、単語「ひっそり」との関連の強さを示すスコアは9.38であり、単語「プレミア」との関連の強さを示すスコアは6.23であり、単語「レストラン」との関連の強さを示すスコアは3.46である。   In addition, in the word impression word score 113, the score indicating the strength of the association with the word "hidden" is 9.38 for the impression word "hidden", and the association strength with the word "premium" The score shown is 6.23 and the score showing the strength of the association with the word "restaurant" is 3.46.

したがって、軸決定部245は、印象語「隠れ家」のスコアの最大値として「9.38」を取得する。   Therefore, the axis determination unit 245 acquires “9.38” as the maximum value of the score of the impression word “hidden”.

本実施形態の軸決定部245は、このようにして取得した印象語毎のスコアの最大値を、クエリと対応した印象語スコアリスト114として保持しても良い。この印象語スコアリスト114は、例えば、後述するレーダチャートの表示の際に、参照されても良い。   The axis determination unit 245 of the present embodiment may hold the maximum value of the score for each impression word acquired in this manner as the impression word score list 114 corresponding to the query. The impression word score list 114 may be referred to, for example, when displaying a radar chart to be described later.

続いて、軸決定部245は、印象語スコアリスト114において、スコアの最大値が大きい印象語から順に、n個の印象語を抽出して、α軸とする。図11の例では、n=2としている。   Subsequently, the axis determination unit 245 extracts, in the impression word score list 114, n impression words in order from the impression word having the largest score maximum value, and sets it as an α axis. In the example of FIG. 11, n = 2.

印象語スコアリスト114において、スコアの最大値が最も大きい印象語は「プレミア」であり、次にスコアの最大値が大きい印象語は「隠れ家」である。   In the impression word score list 114, the impression word having the largest score maximum is "premier", and the impression word having the next largest score maximum is "hidden".

したがって、本実施形態の軸決定部245は、印象語「プレミア」と印象語「隠れ家」をレーダチャートのα軸に決定する。言い換えれば、軸決定部245は、印象語「プレミア」と印象語「隠れ家」とを、検索結果集合データを表示する際の項目とする。   Therefore, the axis determination unit 245 of the present embodiment determines the impression word “premium” and the impression word “hidden” as the α axis of the radar chart. In other words, the axis determination unit 245 sets the impression word “premium” and the impression word “hidden” as items for displaying the search result set data.

このように、本実施形態では、入力されたクエリから得られた検索語群に基づき、クエリと関連が強いされる印象語を抽出する。つまり、ここで抽出される印象語は、クエリから推定される内容の特徴を示す特徴語群(第1特徴語群)と言える。したがって、本実施形態の軸決定部245は、クエリから第1特徴語群を抽出する抽出部の機能を果たす。   As described above, in the present embodiment, based on the search word group obtained from the input query, the impression word to be associated with the query is extracted. That is, the impression word extracted here can be said to be a feature word group (first feature word group) indicating the feature of the content estimated from the query. Therefore, the axis determination unit 245 of the present embodiment functions as an extraction unit that extracts the first feature word group from the query.

また、本実施形態の軸決定部245は、単語毎印象語スコア113が取得されると、印象語毎のスコアの最大値に応じて、α軸とする印象語を決定するものとしたが、これに限定されない。軸決定部245は、例えば、単語毎印象語スコア113が取得されると、各印象語について、スコアを正規化した値が大きい順にn個の印象語を抽出しても良い。また、軸決定部245は、単語毎印象語スコア113が取得されると、各印象語について、スコアの平均値が大きい順にn個の印象語を抽出しても良い。   In addition, although the axis determination unit 245 according to the present embodiment determines the impression word to be the α axis according to the maximum value of the score for each impression word when the impression word score 113 for each word is acquired, It is not limited to this. For example, when the word-by-word impression word score 113 is acquired, the axis determination unit 245 may extract n impression words for each impression word in descending order of normalized score values. In addition, when the word-by-word impression word score 113 is acquired, the axis determination unit 245 may extract n impression words for each impression word in descending order of the average score value.

言い換えれば、本実施形態の印象語スコアリスト114において、各印象語と対応付けられる値は、単語毎印象語スコア113における印象語毎のスコアの最大値に限定されない。印象語スコアリスト114において、各印象語と対応付けられる値は、単語毎印象語スコア113における印象語毎のスコアを正規化した値であっても良いし、単語毎印象語スコア113における印象語毎のスコアの平均値であっても良い。   In other words, in the impression word score list 114 of the present embodiment, the value associated with each impression word is not limited to the maximum value of the score for each impression word in the word-by-word impression word score 113. In the impression word score list 114, the value associated with each impression word may be a value obtained by normalizing the score for each impression word in the word impression word score 113, or the impression word in the word impression word score 113 It may be the average value of each score.

また、本実施形態では、スコアと対応した印象語をα軸として抽出するものとしたが、これに限定されない。   Further, in the present embodiment, the impression word corresponding to the score is extracted as the α axis, but it is not limited to this.

軸決定部245は、例えば、印象語との関連の強さを示すスコアが最も大きい単語をα軸として抽出しても良い。   The axis determination unit 245 may extract, for example, the word with the largest score indicating the strength of the association with the impression word as the α axis.

例えば、軸決定部245は、印象語毎のスコアが大きい順に、印象語「プレミア」、「隠れ家」を抽出する。このとき、軸決定部245は、単語毎印象語スコア113において、印象語「隠れ家」との関連の強さを示すスコアが最も大きい単語「ひっそり」をα軸として抽出しても良い。   For example, the axis determination unit 245 extracts the impression words “premier” and “hidden” in descending order of the score for each impression word. At this time, the axis determination unit 245 may extract the word “hidden” having the largest score indicating the strength of association with the impression word “hidden” in the word-by-word impression word score 113 as the α axis.

このように、本実施形態では、ユーザが入力したクエリに含まれる検索語群から、単語の意味ベクトルを取得し、この意味ベクトルを変換モデル250の入力とする。そして、本実施形態では、変換モデル250の出力として、検索語群に含まれる単語毎に、複数の印象語との関連の強さを示すスコアを取得する。   Thus, in the present embodiment, the semantic vector of the word is acquired from the search word group included in the query input by the user, and this semantic vector is used as the input of the conversion model 250. Then, in the present embodiment, as the output of the conversion model 250, a score indicating the strength of the association with a plurality of impression words is acquired for each word included in the search word group.

したがって、本実施形態では、予め用意された単語以外の新たな単語がクエリに含まれていても、新たな単語と、複数の印象語との関連の強さを示すスコアを取得することができる。このため、本実施形態によれば、ユーザが入力するあらゆるクエリに対して、クエリとの関連が強く、対応関係が明確である、とされる印象語(項目)を用いて、検索結果を表示させることができる。   Therefore, in the present embodiment, even if a new word other than the word prepared in advance is included in the query, it is possible to obtain a score indicating the strength of the association between the new word and the plurality of impression words. . Therefore, according to the present embodiment, the search result is displayed using an impression word (item) in which the relationship with the query is strong and the correspondence is clear with respect to any query input by the user. It can be done.

次に、図12乃至図14を参照して、本実施形態の検索処理部240によるレーダチャートの表示について説明する。   Next, display of a radar chart by the search processing unit 240 of the present embodiment will be described with reference to FIGS. 12 to 14.

図12は、第一の実施形態のレーダチャートの表示例を示す第一の図である。図12に示す画面121は、入力されたクエリが「ひっそりとしたプレミアのレストラン」である場合の検索結果集合データとして得られた「○○レストラン」のレーダチャートを示している。   FIG. 12 is a first diagram showing a display example of the radar chart of the first embodiment. A screen 121 shown in FIG. 12 shows a radar chart of "○ ○ restaurant" obtained as the search result collection data in the case where the input query is "invisible premier restaurant".

尚、図12の例では、検索結果集合データの例として、「○○レストラン」のみを示しているが、これに限定されない。検索結果集合データとして、複数の検索結果が取得された場合には、画面121には、検索結果毎のレーダチャートが表示されても良い。   In the example of FIG. 12, only “XX restaurant” is shown as an example of the search result set data, but the present invention is not limited to this. When a plurality of search results are obtained as the search result collection data, a radar chart for each search result may be displayed on the screen 121.

また、図12の例では、検索結果集合データは、「○○レストラン」の説明文を示す文書データ等であっても良く、検索結果表示欄123に、「○○レストラン」の説明文が表示されても良い。   Further, in the example of FIG. 12, the search result set data may be document data or the like indicating the descriptive text of "○○ restaurant", and the explanatory text of "○○ restaurant" is displayed in the search result display column 123. It may be done.

また、本実施形態では、検索結果集合データに含まれる検索結果毎に、ランキングが付与されても良い。具体的には、本実施形態では、検索結果集合データ毎に、レーダチャートの軸毎の得点の合計点や、グラフで示される多角形の面積を、クエリと検索結果集合データとの関連の強さを示す値として算出し、この値が大きい順に、検索結果集合データにランキングを付与しても良い。   In the present embodiment, a ranking may be assigned to each search result included in the search result set data. Specifically, in the present embodiment, for each of the search result set data, the total score of the points for each axis of the radar chart and the area of the polygon shown by the graph are strongly related to the query and the search result set data. The search result set data may be ranked in descending order of the value.

つまり、本実施形態では、検索結果集合データは、クエリとの関連の強い順にランキングが付与される。本実施形態では、このようにランキングを付与することで、ユーザに対し、クエリと関連が強い検索結果から順に提示することができる。   That is, in the present embodiment, the search result set data is given ranking in descending order of the relation with the query. In this embodiment, by providing the ranking in this manner, it is possible to present the user in order from the search result having a strong relation with the query.

本実施形態の画面121には、クエリ表示欄122、検索結果表示欄123、検索結果表示欄124が含まれる。   The screen 121 of the present embodiment includes a query display field 122, a search result display field 123, and a search result display field 124.

クエリ表示欄122には、ユーザによって入力されたクエリが表示される。検索結果表示欄123には、検索結果集合データに含まれる検索結果と対応したレーダチャート125が表示される。レーダチャート125では、検索結果集合データと、レーダチャート125の軸とされた項目との関係性を示すグラフ126が表示されている。検索結果表示欄124には、レーダチャート125の軸毎の値を示す棒グラフ127が表示される。   The query display field 122 displays a query input by the user. In the search result display field 123, a radar chart 125 corresponding to the search result included in the search result set data is displayed. In the radar chart 125, a graph 126 showing the relationship between the search result set data and the item taken as the axis of the radar chart 125 is displayed. In the search result display field 124, a bar graph 127 indicating values for each axis of the radar chart 125 is displayed.

本実施形態のレーダチャート125は、α1軸、α2軸と、β1軸、β2軸、β3軸の5本の軸を有している。言い換えれば、レーダチャート125は、検索結果の「○○レストラン」を、クエリに基づき抽出された2つの印象語と、クエリにも基づき選択された印象語以外の3つの印象語と、を5つの項目として用いて表示している。   The radar chart 125 of the present embodiment has five axes of an α1 axis, an α2 axis, a β1 axis, a β2 axis, and a β3 axis. In other words, the radar chart 125 includes five search terms "○○ restaurant", two impression words extracted based on the query, and three impression words other than the impression word selected based on the query. It is displayed using as an item.

α1軸に対応する項目は「隠れ家」であり、α2軸に対応する項目は「プレミア」である。また、β1軸に対応する項目は「落ち着き」であり、β2軸に対応する項目は「ガッツリ」であり、β3軸に対応する項目は「ヘルシー」である。   The item corresponding to the α1 axis is a “hidden”, and the item corresponding to the α2 axis is a “premium”. Further, the item corresponding to the β1 axis is “calm”, the item corresponding to the β2 axis is “gatsuri”, and the item corresponding to the β3 axis is “healthy”.

ここで、α1軸とα2軸に対応する項目は、図9のステップS902で抽出された印象語である。つまり、α1軸とα2軸に対応する項目は、クエリとの関連が明確な印象語である。   Here, the items corresponding to the α1 axis and the α2 axis are the impression words extracted in step S902 of FIG. That is, the items corresponding to the α1 axis and the α2 axis are impression words having a clear relationship with the query.

また、β1軸、β2軸、β3軸に対応する項目は、図9のステップS903で設定された単語である。つまり、β1軸、β2軸、β3軸に対応する項目は、予め設定された単語である。   Further, the items corresponding to the β1 axis, the β2 axis, and the β3 axis are the words set in step S903 in FIG. That is, the items corresponding to the β1 axis, the β2 axis, and the β3 axis are preset words.

尚、図12の例では、β1軸、β2軸、β3軸に対応する項目は、印象語マップ221から選択された印象語としているが、これに限定されない。   In the example of FIG. 12, items corresponding to the β1 axis, β2 axis, and β3 axis are impression words selected from the impression word map 221, but the present invention is not limited thereto.

β1軸、β2軸、β3軸に対応する項目は、例えば、インデックス情報211から選択された単語であっても良い。つまり、β1軸、β2軸、β3軸に対応する項目は、検索結果集合データから抽出された単語であっても良い。ここで、検索結果集合データから抽出された単語とは、検索結果集合データの特徴を示す特徴語群(第2特徴語群)と言える。   Items corresponding to the β1 axis, the β2 axis, and the β3 axis may be, for example, words selected from the index information 211. That is, the items corresponding to the β1 axis, the β2 axis, and the β3 axis may be words extracted from the search result set data. Here, the words extracted from the search result set data can be said to be a feature word group (second feature word group) indicating the features of the search result set data.

したがって、本実施形態のレーダチャート125では、クエリから抽出された特徴語群と、検索結果集合データから抽出された特徴語群と、を項目として用いて検索結果集合データを表示させている。   Therefore, in the radar chart 125 of the present embodiment, the search result set data is displayed using the feature word group extracted from the query and the feature word group extracted from the search result set data as items.

ここで、本実施形態の検索処理部240において、レーダチャート125の各軸に対応する項目が決定された後の、出力部246によるグラフ126の表示について説明する。   Here, the display of the graph 126 by the output unit 246 after the item corresponding to each axis of the radar chart 125 is determined in the search processing unit 240 of the present embodiment will be described.

本実施形態の出力部246は、レーダチャート125の各軸に対応する項目が決まると、印象語スコアリスト231を参照する。   When an item corresponding to each axis of the radar chart 125 is determined, the output unit 246 of the present embodiment refers to the impression word score list 231.

そして、出力部246は、印象語スコアリスト231において、検索結果集合データとして取得された文書データの文書IDと対応する印象語毎のスコアのうち、項目とされた印象語と対応するスコアを取得し、レーダチャートにおける項目の値とする。   Then, the output unit 246 acquires, in the impression word score list 231, the score corresponding to the item of the impression word among the scores for each impression word corresponding to the document ID of the document data acquired as the search result collection data. And the value of the item in the radar chart.

例えば、検索結果集合データとして取得された文書データが、文書ID「1」の文書データであったとする。   For example, it is assumed that document data acquired as search result set data is document data of document ID “1”.

この場合、出力部246は、印象語スコアリスト231を参照し、文書ID「1」と対応する印象語毎のスコアのうち、α1軸と対応する項目とされた「隠れ家」と対応するスコア「9.2」を取得し、レーダチャート125におけるα1軸の値とする。また、出力部246は、文書ID「1」と対応する印象語毎のスコアのうち、α2軸と対応する項目とされた「プレミア」と対応するスコア「9.0」を取得し、レーダチャート125におけるα2軸の値とする。   In this case, the output unit 246 refers to the impression word score list 231 and, among the scores for each impression word corresponding to the document ID “1”, the score corresponding to “hidden” corresponding to the α1 axis. 9.2 ”is obtained, and is taken as the value of the α1 axis in the radar chart 125. Further, the output unit 246 acquires a score “9.0” corresponding to “premium”, which is an item corresponding to the α2 axis, of the score for each impression word corresponding to the document ID “1”, and the radar chart It is assumed that the value of α2 axis at 125 is obtained.

本実施形態の出力部246は、同様にして、印象語スコアリスト231から、β1軸〜β3の値を取得する。そして、出力部246は、各軸の値に基づき、グラフ126を表示させる。   Similarly, the output unit 246 of the present embodiment acquires values of the β1 axis to β3 from the impression word score list 231. Then, the output unit 246 displays the graph 126 based on the value of each axis.

尚、本実施形態の印象語スコアリスト231は、事前処理により生成されていても良い。また、印象語スコアリスト231は、検索部243による検索によって検索結果集合データが取得されたときに、検索結果集合データから、印象語毎のスコアを求めて印象語スコアリスト231に格納しても良い。   In addition, the impression word score list 231 of this embodiment may be produced | generated by pre-processing. In addition, even when the search result aggregation data is acquired by the search by the search unit 243, the impression word score list 231 obtains a score for each impression word from the search result aggregation data and stores it in the impression word score list 231. good.

検索結果集合データから印象語毎のスコアを求める場合、検索処理部240は、解析部242により、検索結果集合データから単語群を取得した後に、図10のステップS1001からステップS1003までの処理を実行すれば良い。そして、検索処理部240は、この処理を実行した結果である、印象語毎のスコアを、検索結果集合データを示す文書IDと対応付けて印象語スコアリスト231に格納すれば良い。   When obtaining a score for each impression word from the search result collection data, the search processing unit 240 executes the processing from step S1001 to step S1003 in FIG. 10 after the analysis unit 242 acquires the word group from the search result collection data. Just do it. Then, the search processing unit 240 may store the score for each impression word, which is the result of executing this process, in the impression word score list 231 in association with the document ID indicating the search result aggregation data.

本実施形態では、このように、レーダチャート125の軸を、クエリに基づき抽出された、クエリと関連の強い印象語とすることで、検索結果がユーザの意図したものであることをユーザに容易に判断させることができる。したがって、本実施形態によれば、検索システム100のユーザに対し、検索結果に対する納得感を提供することができる。   In this embodiment, it is easy for the user that the search result is intended by the user, by thus setting the axis of the radar chart 125 as a strong impression word related to the query extracted based on the query. It can be made to judge. Therefore, according to the present embodiment, it is possible to provide the user of the search system 100 with a sense of satisfaction with the search results.

以下に、図13を参照して、本実施形態を適用しない場合の比較例について説明する。図13は、比較例となるレーダチャートの一例を示す図である。   Hereinafter, a comparative example in the case where the present embodiment is not applied will be described with reference to FIG. FIG. 13 is a diagram showing an example of a radar chart as a comparative example.

図13に示す画面131は、入力されたクエリが表示されるクエリ表示欄132と、検索結果が表示される検索結果表示欄133と、レーダチャート134とが表示されている。   The screen 131 shown in FIG. 13 displays a query display field 132 in which the input query is displayed, a search result display field 133 in which search results are displayed, and a radar chart 134.

図13に示すレーダチャート134に示す軸1〜5に対応する項目は、検索結果として取得された「○○レストラン」と対応付けられた文書データの中から選択された単語である。   The items corresponding to the axes 1 to 5 shown in the radar chart 134 shown in FIG. 13 are words selected from the document data associated with the "OO restaurant" acquired as the search result.

例えば、軸1と対応する項目は「安い」であり、軸2と対応する項目は「解放感」であり、軸3と対応する項目は「個室あり」であり、軸4と対応する項目は「わいわい」であり、軸5と対応する項目は「ガッツリ」である。   For example, the item corresponding to axis 1 is "cheap", the item corresponding to axis 2 is "feeling free", the item corresponding to axis 3 is "with room", and the item corresponding to axis 4 is The item corresponding to the axis 5 is "guzzling".

この軸1〜5に対応する項目に対して、入力されたクエリは「ひっそりとしたプレミアのレストラン」である。   For the items corresponding to the axes 1 to 5, the input query is "hidden premier restaurant".

このため、例えば、軸4と対応する項目「わいわい」は、クエリから連想されにくい項目であり、クエリとの対応関係が明確でない。   For this reason, for example, the item "Dark" corresponding to the axis 4 is an item that is hard to be associated with a query, and the correspondence with the query is not clear.

このように、検索結果を示すレーダチャートにおいて、ユーザが入力したクエリから連想されにくい単語が項目として用いられた場合、ユーザは、この検索結果が自身の意図した内容のものであるか否かを容易に判断できず、検索結果に対して納得感が得られない。   Thus, in the radar chart showing the search results, when a word that is hard to be associated with a query input by the user is used as an item, the user determines whether the search results are of the content intended by the user. It is not easy to judge, and I can not get a sense of satisfaction with the search results.

これに対し、本実施形態では、クエリに基づき抽出された、クエリと関連が強い印象語を項目として用いたレーダチャートにより、検索結果集合データを表示させるため、検索結果の評価を適切に行うことができる。   On the other hand, in the present embodiment, the search results are appropriately evaluated in order to display the search result set data by using the radar chart using the impression word strongly related to the query as the item extracted based on the query. Can.

次に、図14を参照して、本実施形態のレーダチャートの表示例について、さらに説明する。図14は、第一の実施形態のレーダチャートの表示例を示す第二の図である。   Next, a display example of the radar chart of the present embodiment will be further described with reference to FIG. FIG. 14 is a second diagram showing a display example of the radar chart of the first embodiment.

図14に示す画面121Aでは、検索結果表示欄123Aと検索結果表示欄124Aとを含む。   The screen 121A shown in FIG. 14 includes a search result display field 123A and a search result display field 124A.

検索結果表示欄123Aに表示されるレーダチャート125Aには、グラフ126と、グラフ128とが表示される。   A graph 126 and a graph 128 are displayed on the radar chart 125A displayed in the search result display field 123A.

グラフ128は、クエリと、軸とされた項目と、の関係性を示すグラフである。グラフ128は、例えば、レーダチャート125Aのα1軸、α2軸と対応する項目を抽出する処理で取得された印象語スコアリスト114を参照して、表示されても良い(図11参照)。   The graph 128 is a graph showing the relationship between the query and the item taken as the axis. The graph 128 may be displayed, for example, with reference to the impression word score list 114 acquired by the process of extracting items corresponding to the α1 axis and the α2 axis of the radar chart 125A (see FIG. 11).

より具体的には、出力部246は、印象語スコアリスト114において、α1軸、α2、β1、β2、β3のそれぞれと対応する項目とされた印象語のスコアを取得し、各軸の値として、グラフ128を表示させても良い。   More specifically, the output unit 246 acquires the score of the impression word corresponding to each of the α1 axis, α2, β1, β2, and β3 in the impression word score list 114, and sets the score of each axis as a value , The graph 128 may be displayed.

また、画面121Aの検索結果表示欄124Aには、クエリの各軸の値を示す棒グラフ129が表示される。   Further, in the search result display field 124A of the screen 121A, a bar graph 129 indicating the value of each axis of the query is displayed.

本実施形態では、このように、レーダチャート125Aにおいて、検索結果集合データと軸とされた項目との関係を示すグラフ126と、クエリと軸とされた項目との関係を示すグラフ128とを表示させる。したがって、本実施形態によれば、ユーザに対して、検索結果集合データとクエリとの関連の度合いを容易に把握させることができる。   In this embodiment, the radar chart 125A displays the graph 126 showing the relationship between the search result set data and the item set as the axis and the graph 128 showing the relationship between the query and the item set as the axis. Let Therefore, according to the present embodiment, it is possible to make the user easily grasp the degree of association between the search result set data and the query.

(第二の実施形態)
以下に図面を参照して第二の実施形態について説明する。第二の実施形態は、軸βと対応する項目をクエリに基づき決定する点が、第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
Second Embodiment
The second embodiment will be described below with reference to the drawings. The second embodiment differs from the first embodiment in that items corresponding to the axis β are determined based on a query. Therefore, in the following description of the second embodiment, only differences from the first embodiment will be described, and for those having the same functional configuration as the first embodiment, the description of the first embodiment The same reference numerals as the reference numerals used in FIG.

図15は、第二の実施形態の検索装置の機能を説明する図である。本実施形態の検索装置200Aは、検索処理部240Aを有する。   FIG. 15 is a diagram for explaining the function of the search device of the second embodiment. The search device 200A of the present embodiment has a search processing unit 240A.

本実施形態の検索処理部240Aは、入力受付部241、解析部242、検索部243、印象語スコア出力部244、軸決定部245A、出力部246、インデックス生成部247、印象空間学習部248を有する。   The search processing unit 240A of this embodiment includes an input reception unit 241, an analysis unit 242, a search unit 243, an impression word score output unit 244, an axis determination unit 245A, an output unit 246, an index generation unit 247, and an impression space learning unit 248. Have.

本実施形態の軸決定部245Aは、印象語スコア出力部244により単語毎印象語スコア113を取得すると、単語毎印象語スコア113に含まれる印象語毎のスコアの最大値を示す印象語スコアリスト114を取得して保持する。そして、本実施形態の軸決定部245Aは、印象語スコアリスト114を参照して、レーダチャートの軸α及び軸βと対応する印象語を決定する。   When the axis determination unit 245A of the present embodiment acquires the word-by-word impression word score 113 by the impression word score output unit 244, the impression word score list indicating the maximum value of the score for each impression word included in the word-by-word impression word score 113 Get 114 and hold. Then, with reference to the impression word score list 114, the axis determination unit 245A of the present embodiment determines an impression word corresponding to the axis α and the axis β of the radar chart.

図16は、第二の実施形態の検索処理部の処理を説明するフローチャートである。図16のステップS1601の処理は、図9のステップS901の処理と同様であるから、説明を省略する。   FIG. 16 is a flowchart for explaining the processing of the search processing unit of the second embodiment. The process of step S1601 of FIG. 16 is the same as the process of step S901 of FIG.

続いて、検索処理部240Aは、印象語スコア出力部244により、入力されたクエリに基づき、クエリとの関連が明確な印象語を軸としてn個抽出し、軸決定部245Aにより印象語スコアリスト114を生成して保持し、α軸に設定する(ステップS1602)。   Subsequently, the search processing unit 240A causes the impression word score output unit 244 to extract n impression words based on the input query with an impression word clearly associated with the query as an axis, and the axis determination unit 245A performs an impression word score list 114 is generated and held, and is set to the α axis (step S1602).

続いて、軸決定部245Aは、クエリに基づき生成された印象語スコアリスト114を参照して、β軸と対応する項目をm個抽出し、β軸に設定する(ステップS1603)。ステップS1603の処理の詳細は後述する。   Subsequently, the axis determination unit 245A refers to the impression word score list 114 generated based on the query, extracts m items corresponding to the β axis, and sets the items as the β axis (step S1603). Details of the process of step S1603 will be described later.

図16のステップS1604とステップS1605の処理は、図9のステップS904とステップS905の処理と同様であるから、説明を省略する。   The processes in step S1604 and step S1605 in FIG. 16 are the same as the processes in step S904 and step S905 in FIG.

次に、図17を参照して、本実施形態の軸決定部245Aの処理について説明する。図17は、第二の実施形態の軸決定部の処理を説明するフローチャートである。図17の処理は、図16のステップS1603の処理の詳細を示している。   Next, processing of the axis determination unit 245A according to the present embodiment will be described with reference to FIG. FIG. 17 is a flowchart illustrating processing of the axis determination unit according to the second embodiment. The process of FIG. 17 shows the details of the process of step S1603 of FIG.

本実施形態の軸決定部245Aは、ステップS1602において印象語スコアリスト114が生成されると、印象語スコアリスト114から、印象語毎に対応付けられたスコアのうち、大きさが上位n+1番目からm番目までの各スコアと、各スコアと対応する印象語を抽出し、保持する(ステップS1701)。   When the impression word score list 114 is generated in step S1602, the axis determination unit 245A according to the present embodiment determines from the impression word score list 114 that among the scores associated with each impression word, the magnitudes from the top n + 1st Each score up to the m-th and the impression word corresponding to each score are extracted and held (step S1701).

続いて、軸決定部245Aは、検索結果集合データのうち、検索語群との一致度が高い順にz件の検索結果集合データを取得し、z件の検索結果集合データについて、印象語スコアリスト231を参照して、ステップS1701で保持された印象語と対応するスコアを取得する(ステップS1702)。   Subsequently, the axis determination unit 245A acquires z search result set data in the search result set data in descending order of the degree of matching with the search word group, and the impression word score list for the z search result set data Referring to 231, a score corresponding to the impression word held in step S1701 is acquired (step S1702).

以下に、ステップS1702の処理について説明する。本実施形態の軸決定部245Aは、ステップS1601による検索部243の検索により取得された検索結果集合データから、検索語群との一致度が高い順に、z件の検索結果集合データを取得する。検索語群との一致度とは、検索結果集合データに含まれる検索語群の数や、検索結果集合データにおける検索語群に含まれる各単語の出現頻度等によって、算出されても良い。また、一致度は、一般的に情報検索をする場合の一致度を用いても良い。   The process of step S1702 will be described below. The axis determination unit 245A of the present embodiment acquires z pieces of search result aggregate data from the search result aggregate data acquired by the search of the search unit 243 in step S1601 in descending order of the degree of matching with the search word group. The degree of coincidence with the search word group may be calculated based on the number of search word groups included in the search result set data, the appearance frequency of each word included in the search word group in the search result set data, and the like. Further, as the degree of coincidence, in general, the degree of coincidence in the information search may be used.

軸決定部245Aは、z件の検索結果集合データを取得すると、印象語スコアリスト231を参照し、各検索結果集合データの文書ID毎に、ステップS1701で保持された印象語と対応付けられたスコアを取得する。   When acquiring the z search result set data, the axis determination unit 245A refers to the impression word score list 231 and associates the document ID of each search result set data with the impression word held in step S1701. Get score.

例えば、ステップS1701において保持された印象語が、「ヘルシー」、「ひっそり」、「おしゃれ」、「わいわい」、「ガッツリ」、「落ち着き」であったとする。また、z件の検索結果集合データに、文書ID「2」の検索結果集合データが含まれたとする。   For example, it is assumed that the impression words held in step S1701 are "healthy", "hidden", "fashionable", "delight", "guzzling", and "calm". Further, it is assumed that search result set data of document ID “2” is included in the z search result set data.

この場合、軸決定部245Aは、ステップS1702において、印象語スコアリスト231を参照し、文書ID「2」と対応する印象語「ヘルシー」のスコアである9.53、印象語「ひっそり」のスコアである0.12、印象語「おしゃれ」のスコアである8.93を取得する(図8参照)。同様に、軸決定部245Aは、印象語、「わいわい」、「ガッツリ」、「落ち着き」についても、対応するスコアを取得する。   In this case, in step S1702, the axis determination unit 245A refers to the impression word score list 231 and scores 9.53 which is the score of the impression word "healthy" corresponding to the document ID "2", and the score of the impression word "hidden" 0.12, which is an impression word “fashionable” score of 8.93 is obtained (see FIG. 8). Similarly, the axis determination unit 245A also obtains corresponding scores for the impression words, "dew", "guzzling", and "calm".

本実施形態の軸決定部245Aは、z件の検索結果集合データ毎に、上述したように印象語毎のスコアを取得し、保持する。   The axis determination unit 245A of the present embodiment acquires and holds the score for each impression word as described above for each of the z search result set data.

続いて、軸決定部245Aは、ステップS1701で保持された印象語毎に、ステップS1702で取得された検索結果集合データ毎のスコアの分散を算出する(ステップS1703)。   Subsequently, the axis determination unit 245A calculates, for each of the impression words held in step S1701, the variance of the score for each of the search result set data acquired in step S1702 (step S1703).

続いて、軸決定部245Aは、ステップS1701で抽出された印象語を、スコアの分散の値によりソートし、分散の値が大きい印象語から順に、k個の印象語を抽出し、抽出された印象語をβ軸に設定する(ステップS1704)。ここで、k個とは、レーダチャートに設定される軸の数からnを減算した数であり、β軸の本数と同数である。   Subsequently, the axis determination unit 245A sorts the impression words extracted in step S1701 according to the value of the variance of the score, extracts k impression words in order from the impression word with the largest value of variance, and is extracted. An impression word is set to the β axis (step S1704). Here, k is a number obtained by subtracting n from the number of axes set in the radar chart, and is the same as the number of β axes.

このように、本実施形態の軸決定部245Aは、α軸と比較して、クエリとの関連の強さを示すスコアが小さい印象語の中から、検索結果集合データとの関連の強さにばらつきがある印象語を抽出し、β軸と対応する項目に設定している。   As described above, the axis determination unit 245A according to the present embodiment determines the strength of the association with the search result set data from among the impression words having a small score indicating the strength of association with the query as compared with the α axis. Impression words with variations are extracted and set in the item corresponding to the β axis.

本実施形態では、このようにしてβ軸の項目を設定することで、レーダチャートにおいて、各軸の値が近い値となることや、複数の検索結果集合データのレーダチャート同士が似たようなものとなることを抑制している。したがって、本実施形態によれば、検索結果の評価を適切に行い、検索結果集合データ毎のレーダチャートを表示させた際に、検索結果集合データ毎の特徴を捉えやすく表示させることができる。   In the present embodiment, by setting the items of the β axis in this manner, the values of the respective axes become close values in the radar chart, or the radar charts of a plurality of search result aggregate data are similar to each other. It is suppressed to become a thing. Therefore, according to this embodiment, when the search results are appropriately evaluated and the radar chart for each set of search result data is displayed, the feature for each set of search result data can be displayed easily.

(第三の実施形態)
以下に図面を参照して、第三の実施形態について説明する。第三の実施形態は、軸の決定の際に、単語と印象語との関連の強さを示すスコアを求める際に得られる分散も用いる点が、第一の実施形態と相違する。よって、以下の第三の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
Third Embodiment
The third embodiment will be described below with reference to the drawings. The third embodiment is different from the first embodiment in that it uses the variance obtained when determining the score indicating the strength of the association between the word and the impression word when determining the axis. Therefore, in the following description of the third embodiment, only differences from the first embodiment will be described, and for those having the same functional configuration as the first embodiment, the description of the first embodiment The same reference numerals as the reference numerals used in FIG.

はじめに、図18を参照して、後述する本実施形態の印象語マップの作成について説明する。   First, with reference to FIG. 18, creation of an impression word map of the present embodiment described later will be described.

本実施形態の印象語マップは、例えば、単語と印象語との関連の強さを示すスコアを回答させるアンケート等を多数の人に対して実施し、その結果に基づいて作成される。   The impression word map of the present embodiment is created based on the result of, for example, conducting a questionnaire or the like on which a score indicating the strength of association between a word and an impression word is answered for a large number of people.

より具体的には、本実施形態では、上述したアンケート結果等を収集し、単語と印象語との関連の強さを示すスコアの平均値や最大値等を、単語と印象語との関連を示すスコアとして、印象語マップに保持させる。   More specifically, in the present embodiment, the above-described questionnaire results and the like are collected, and the average value and the maximum value of the scores indicating the strength of the association between the word and the impression word are associated with the word and the impression word. The impression word map is made to hold as a score to show.

ところで、単語の中には、単語に対して、多くの人が関連が強いと感じる印象語と、人によって感じる関連の強さが異なる印象語とが存在するものがある。前者の印象語は、単語との関連の強さを示すスコアのばらつきが小さくなることが推測される。また、後者の印象語は、単語と印象語との関連の強さを示すスコアのばらつきが大きくなることが推測される。本実施形態では、この印象語毎のスコアのばらつきに着目した。   By the way, some words include an impression word that many people feel strongly related to the word, and an impression word that differs in the strength of relation felt by people. The former impression word is estimated to have less variation in score indicating the strength of association with the word. Also, in the latter impression word, it is estimated that the variation of the score indicating the strength of the association between the word and the impression word is large. In the present embodiment, attention was paid to the variation of the score for each impression word.

図18は、第三の実施形態の印象語マップにおけるスコアのばらつきについて説明する図である。図18(a)は、単語「天然」と印象語「美味しい」との関連の強さを示すスコアのばらつきを示す図である。図18(b)は、単語「天然」と、印象語「香りが良い」との関連の強さを示すスコアのばらつきを示す図である。   FIG. 18 is a diagram for explaining the variation of the score in the impression word map of the third embodiment. FIG. 18 (a) is a diagram showing the variation of the score showing the strength of the association between the word "natural" and the impression word "delicious". FIG. 18 (b) is a diagram showing variation in score indicating the strength of association between the word “natural” and the impression word “good smell”.

図18(a)、(b)において、横軸は、アンケートにおいて回答されたスコアの値を示す。尚、図18の例では、単語と印象語との関連の強さを示すスコアは、0〜5の間で回答されるものとし、スコアの値が大きいほど、アンケートの回答者が、単語と印象語との関連が強いと感じていることを示すものとした。   In FIG. 18 (a), (b), a horizontal axis shows the value of the score answered in the questionnaire. In the example of FIG. 18, the score indicating the strength of the association between the word and the impression word is assumed to be answered between 0 and 5, and the larger the score value, the answerer of the questionnaire becomes the word It indicates that I felt that I was strongly related to the impression word.

また、図18(a)、(b)において、縦軸は、アンケートに回答した全員の人数に対する、スコア毎の回答数の割合を示す。   Moreover, in FIG. 18 (a), (b), a vertical axis | shaft shows the ratio of the number of answers for every score with respect to the number of persons who answered the questionnaire.

図18(a)では、単語「天然」と、印象語「美味しい」との関連の強さについて、スコア「4」という回答数が最も多く、スコアの分布が単峰型である。つまり、図18(a)では、スコアのばらつきが小さいことがわかる。これは、多くの人が、単語「天然」と、印象語「美味しい」とは関連が強いと感じることを示している。   In FIG. 18A, regarding the strength of the association between the word “natural” and the impression word “delicious”, the number of answers with the score “4” is the largest, and the distribution of the score is unimodal. That is, in FIG. 18A, it can be seen that the variation in score is small. This indicates that many people feel that the word "natural" and the impression word "delicious" are closely related.

図18(b)では、単語「天然」と、印象語「香りが良い」との関連の強さについて、スコア「2」という回答数と、スコア「4」という回答数が多く、スコアの分布が双峰型である。つまり、図18(b)では、図18(a)と比較して、スコアのばらつきが大きいことがわかる。これは、単語「天然」と印象語「香りが良い」との関連の強さは、人によって感じ方が異なることを示している。   In FIG. 18 (b), with regard to the strength of the association between the word "natural" and the impression word "good smell", the number of responses with score "2" and the number of responses with score "4" are large, and the distribution of scores Is bimodal. That is, in FIG. 18B, it can be seen that the variation of the score is large as compared with FIG. 18A. This indicates that the strength of the association between the word "natural" and the impression word "good smell" indicates that people differ in how they feel.

本実施形態では、このような人による感じ方のばらつきを考慮し、例えば、単語と印象語との組み合わせ毎に、アンケートの回答結果として取得したスコアの平均値と、スコアのばらつきを示す値とを対応付けて、印象語マップに保持させる。   In the present embodiment, in consideration of such variations in the way of feeling by people, for example, for each combination of a word and an impression word, an average value of scores acquired as a result of answering a questionnaire and a value indicating the variation of scores Are associated and held in the impression word map.

図18の例では、単語「天然」と印象語「美味しい」との組み合わせでは、アンケートの回答として取得したスコアの平均値は、3.8であり、ばらつきを示す標準偏差は0.68である。したがって、本実施形態では、印象語マップにおいて、単語「天然」と印象語「美味しい」との関連の強さを示すスコア「3.8」と標準偏差「0.68」とを対応付けて保持する。   In the example of FIG. 18, in the combination of the word “natural” and the impression word “delicious”, the average value of the score obtained as the answer to the questionnaire is 3.8, and the standard deviation indicating variation is 0.68 . Therefore, in the present embodiment, in the impression word map, the score “3.8” indicating the strength of the association between the word “natural” and the impression word “delicious” is associated with the standard deviation “0.68” and held. Do.

また、図18の例では、単語「天然」と印象語「香りが良い」との組み合わせでは、アンケートの回答として取得したスコアの平均値は、3.25であり、ばらつきを示す標準偏差は1.16である。したがって、本実施形態では、印象語マップにおいて、単語「天然」と印象語「香りが良い」との関連の強さを示すスコア「3.25」と標準偏差「1.16」とを対応付けて保持する。   Further, in the example of FIG. 18, in the combination of the word “natural” and the impression word “good smell”, the average value of the score acquired as the answer of the questionnaire is 3.25, and the standard deviation indicating variation is 1 .16. Therefore, in the present embodiment, in the impression word map, the score “3.25” indicating the strength of the association between the word “natural” and the impression word “good smell” is associated with the standard deviation “1.16”. Hold.

本実施形態では、このようにして、スコアとスコアのばらつきとが対応付けられた印象語マップを用いることで、例えば、標準偏差が大きい印象語が軸とされた際に、この軸に代わる他の印象語を抽出することができる。言い換えれば、本実施形態では、単語との関連の強さの感じ方が人によって異なる印象語が軸として抽出された場合に、この印象語と入れ替えるための他の印象語を抽出し、ユーザに提示することができる。   In this embodiment, by using the impression word map in which the score and the variation of the score are associated in this manner, for example, when an impression word having a large standard deviation is taken as an axis, the other term is used instead of this axis. Impression words can be extracted. In other words, in the present embodiment, when an impression word different in how people feel the strength of association with a word is extracted as an axis, another impression word for replacing this impression word is extracted, and the user Can be presented.

したがって、本実施形態によれば、クエリに基づく検索語群による検索処理で取得された検索結果集合データを表示する際に、ユーザの意図を反映した印象語を、項目(軸)の候補として表示させることができる。   Therefore, according to the present embodiment, when displaying the search result collection data acquired by the search processing by the search word group based on the query, the impression word reflecting the user's intention is displayed as the candidate of the item (axis) It can be done.

以下に、本実施形態の検索装置について説明する。図19は、第三の実施形態の検索装置の機能を説明する図である。本実施形態の検索装置200Bは、インデックス記憶部210、印象語マップ記憶部220A、検索対象スコア記憶部230A、検索処理部240Bを有する。   Below, the search device of this embodiment is explained. FIG. 19 is a diagram for explaining the function of the search device of the third embodiment. The search device 200B of the present embodiment includes an index storage unit 210, an impression word map storage unit 220A, a search target score storage unit 230A, and a search processing unit 240B.

印象語マップ記憶部220Aには、印象語マップ221Aが格納されている。印象語マップ221Aは、印象語毎に、印象語と単語との関連を示すスコアと、スコアを取得する際に得られる標準偏差とが対応付けられている。印象語マップ221Aの詳細は後述する。   An impression word map 221A is stored in the impression word map storage unit 220A. In the impression word map 221A, for each impression word, a score indicating the association between the impression word and the word is associated with a standard deviation obtained when acquiring the score. Details of the impression word map 221A will be described later.

検索対象スコア記憶部230Aには、印象語スコアリスト231Aが格納されている。印象語スコアリスト231Aは、検索処理部240Bの処理によって作成される。印象語スコアリスト231Aの詳細は後述する。   An impression word score list 231A is stored in the search target score storage unit 230A. The impression word score list 231A is created by the processing of the search processing unit 240B. The details of the impression word score list 231A will be described later.

本実施形態の検索処理部240Bは、入力受付部241、解析部242、検索部243、印象語スコア出力部244A、軸決定部245A、出力部246、インデックス生成部247、印象空間学習部248A、候補通知部249を有する。   The search processing unit 240B of the present embodiment includes an input reception unit 241, an analysis unit 242, a search unit 243, an impression word score output unit 244A, an axis determination unit 245A, an output unit 246, an index generation unit 247, an impression space learning unit 248A, It has a candidate notification unit 249.

本実施形態の印象語スコア出力部244Aは、印象語マップ221Aと、後述する印象空間学習部248Aにより出力される変換モデル250Aと、に基づき、ベクトルで表現された単語と印象語との関連の強さを示すスコアと、スコアの標準偏差とを出力する。   The impression word score output unit 244A of the present embodiment is based on the impression word map 221A and a conversion model 250A outputted by the impression space learning unit 248A described later, and the word represented by the vector is related to the impression word. Output a score indicating strength and a standard deviation of the score.

本実施形態の軸決定部245Aは、印象語スコア出力部244Aにより出力された印象語毎のスコアと標準偏差とに基づき、検索結果を表示するためのレーダチャートの軸となる印象語と、この印象語と入れ替えることが可能な印象語とを出力する。尚、軸に決定さされた印象語と入れ替えることが可能な印象語を、軸の候補と呼ぶ。つまり、本実施形態の軸の候補となる印象語は、言い換えれば、クエリから推定される内容の特徴を示す特徴語群(第1特徴語群)の候補となる第3特徴語群である。   The axis determination unit 245A of this embodiment is an impression word that is an axis of a radar chart for displaying a search result based on the score and standard deviation for each impression word output from the impression word score output unit 244A, and Output impression words and possible impression words. An impression word that can be replaced with an impression word determined as an axis is called an axis candidate. That is, the impression word serving as the axis candidate in the present embodiment is, in other words, the third feature word group serving as the candidate for the feature word group (first feature word group) indicating the feature of the content estimated from the query.

本実施形態の印象空間学習部248Aは、検索対象文書データベース400に格納された検索対象の文書データと、印象語マップ221Aとに基づき、変換モデル250Aを出力する。尚、本実施形態の変換モデル250Aは、分散表現によって得られた単語の意味ベクトルを入力とし、この単語と対応付けられた印象語毎のスコアと、スコアの標準偏差とを出力とするモデルである。   The impression space learning unit 248A of the present embodiment outputs the conversion model 250A based on the search target document data stored in the search target document database 400 and the impression word map 221A. The conversion model 250A according to the present embodiment is a model which receives as input a semantic vector of a word obtained by distributed expression, and outputs a score for each impression word associated with the word and a standard deviation of the score. is there.

本実施形態の候補通知部249は、軸決定部245Aにより出力された軸の候補となる印象語を通知する。   The candidate notification unit 249 of the present embodiment notifies an impression word which is a candidate of an axis output by the axis determination unit 245A.

以下に、図20を参照して、本実施形態の印象語マップ221Aについて説明する。図20は、第三の実施形態の印象語マップの例を示す図である。   Hereinafter, the impression word map 221A of the present embodiment will be described with reference to FIG. FIG. 20 is a diagram showing an example of an impression word map of the third embodiment.

本実施形態の印象語マップ221Aは、予め作成されて検索装置200Bに与えられる。本実施形態の印象語マップ221Aは、単語毎に、予め用意された印象語との関連の強さを示すスコア(値)と、スコアのばらつきを示す標準偏差とが対応付けられている。   The impression word map 221A of the present embodiment is created in advance and given to the search device 200B. In the impression word map 221A of the present embodiment, the score (value) indicating the strength of the association with the impression word prepared in advance is associated with the standard deviation indicating the variation of the score for each word.

図20では、例えば、単語「レストラン」と印象語「わいわい」との関連の強さを示すスコアは1.6であり、標準偏差σは0.5である。また、単語「レストラン」と印象語「おなかいっぱい」との関連の強さを示すスコアは3.1であり、標準偏差σは1.7である。したがって、印象語「わいわい」と印象語「おなかいっぱい」では、印象語「わいわい」の方が、多くの人が単語「レストラン」と関連が強いと感じていることがわかる。   In FIG. 20, for example, the score indicating the strength of the association between the word “restaurant” and the impression word “delight” is 1.6, and the standard deviation σ is 0.5. Further, the score indicating the strength of the association between the word "restaurant" and the impression word "full" is 3.1 and the standard deviation σ is 1.7. Therefore, it can be understood that many people in the impression word "dew" and the impression word "french" feel that the relation between the word "restaurant" and the word "restaurant" is stronger.

尚、本実施形態では、単語と印象語との関連の強さを示すスコアのばらつきを示す値を標準偏差としたが、これに限定されない。単語と印象語との関連の強さを示すスコアのばらつきを示す値は、分散として保持されても良い。   In the present embodiment, the value indicating the variation of the score indicating the strength of the association between the word and the impression word is used as the standard deviation, but it is not limited to this. The value indicating the variation of the score indicating the strength of the association between the word and the impression word may be held as a variance.

次に、図21を参照して、本実施形態の印象語スコアリスト231Aについて説明する。   Next, with reference to FIG. 21, the impression word score list 231A of the present embodiment will be described.

図21は、第三の実施形態の印象語スコアリストの一例を示す図である。図21では、検索文書対象データベース400のうち飲食店等に関する文書データから得た印象語スコアリスト231Aの例を示している。また、印象語スコアリスト231Aは、予め作成されて検索装置200Bに与えられていても良い。   FIG. 21 is a diagram showing an example of an impression word score list according to the third embodiment. FIG. 21 shows an example of the impression word score list 231A obtained from the document data on the restaurant etc. in the search document target database 400. Further, the impression word score list 231A may be created in advance and given to the search device 200B.

印象語スコアリスト231Aは、文書データを特定する文書IDと、文書データが示す店舗の名称と、文書データの内容を示すテキストデータと、印象語スコアリスト231Aに含まれる各印象語との関連の強さを示すスコアと、が対応付けられている。尚、印象語スコアリスト231Aに含まれる印象語は、印象語マップ221Aに含まれる印象語と同様である。   Impression word score list 231A includes a document ID for specifying document data, a name of a store indicated by the document data, text data indicating the content of the document data, and an association between each impression word included in impression word score list 231A. A score indicating strength is associated with. The impression words included in the impression word score list 231A are the same as the impression words included in the impression word map 221A.

次に、図22を参照して、本実施形態の検索処理部240Bの処理について説明する。図22は、第三の実施形態の検索処理部の処理を説明するフローチャートである。   Next, processing of the search processing unit 240B of the present embodiment will be described with reference to FIG. FIG. 22 is a flowchart for explaining the processing of the search processing unit of the third embodiment.

本実施形態の検索処理部240Bは、解析部242により、クエリから形態素解析等により検索語群を取得し、検索部243により、インデックス情報211を検索語群で検索し、検索語群と対応する文書IDを特定する(ステップS2201)。   The search processing unit 240B according to the present embodiment causes the analysis unit 242 to acquire a search word group from the query by morphological analysis or the like, and the search unit 243 searches the index information 211 for the search word group and corresponds to the search word group The document ID is specified (step S2201).

続いて、検索処理部240Bは、印象語スコア出力部244Aにより、入力されたクエリに基づき、クエリとの関連が強いとされるn個の印象語を軸として抽出してα軸に設定し、さらに、軸の候補となる印象語を抽出する(ステップS2202)。ステップS2202の処理の詳細は後述する。   Subsequently, based on the input query, the search processing unit 240B extracts the n impression words considered to be strongly related to the query as an axis based on the input query, and sets the extracted word as an α axis, Further, an impression word which is a candidate for an axis is extracted (step S2202). Details of the process of step S2202 will be described later.

図22のステップS2203からステップS2205までの処理は、図9のステップS903からステップS905までの処理と同様であるから、説明を省略する。   The processing from step S2203 to step S2205 in FIG. 22 is the same as the processing from step S903 to step S905 in FIG.

ステップS2205において出力部246がレーダチャートを描画すると、検索処理部240Bは、候補通知部249により、ステップS2202において、軸の候補となる印象語が抽出されたか否かを判定する(ステップS2206)。ステップS2206において、該当する印象語が抽出されていない場合、検索処理部240Bは、処理を終了する。   When the output unit 246 draws a radar chart in step S2205, the search processing unit 240B determines whether or not an impression word which is a candidate for an axis is extracted in step S2202 by the candidate notification unit 249 (step S2206). In step S2206, when the corresponding impression word is not extracted, the search processing unit 240B ends the process.

ステップS2206において、該当する印象語が抽出された場合、候補通知部249は、ステップS2202で軸の候補として抽出された印象語を、レーダチャートが表示された画面に出力し、レーダチャートの軸と、軸の候補との入れ替えが可能であることを通知し(ステップS2207)、処理を終了する。   In step S2206, when the corresponding impression word is extracted, the candidate notification unit 249 outputs the impression word extracted as the axis candidate in step S2202 to the screen on which the radar chart is displayed, and the axis of the radar chart , And it is notified that replacement with the axis candidate is possible (step S2207), and the processing is ended.

次に、図23を参照して、図22のステップS2202の処理の詳細について説明する。図23は、第三の実施形態の印象語スコア出力部、軸決定部の処理を説明するフローチャートである。   Next, with reference to FIG. 23, the details of the process of step S2202 of FIG. 22 will be described. FIG. 23 is a flowchart illustrating processing of an impression word score output unit and an axis determination unit according to the third embodiment.

本実施形態の印象語スコア出力部244Aは、ステップS2201において取得した検索語群に含まれる各単語を、分散表現に変換する(ステップS2301)。   The impression word score output unit 244A of the present embodiment converts each word included in the search word group acquired in step S2201 into a distributed expression (step S2301).

続いて、印象語スコア出力部244Aは、変換モデル250Aを参照し、単語毎に、各印象語との関連の強さを示すスコアと標準偏差とを取得し(ステップS2302)、ステップS2303へ進む。言い換えれば、印象語スコア出力部244は、変換モデル250Aに対して、ステップS2301で求めた各単語の意味ベクトルを入力し、変換モデル250Aから出力された、各単語についての印象語毎のスコアと標準偏差とを取得する。   Subsequently, the impression word score output unit 244A refers to the conversion model 250A, acquires, for each word, a score indicating the strength of association with each impression word and a standard deviation (step S2302), and proceeds to step S2303. . In other words, the impression word score output unit 244 inputs the semantic vector of each word obtained in step S2301 to the conversion model 250A, and the score for each impression word for each word output from the conversion model 250A Get the standard deviation.

ステップS2303とステップS2304の処理は、図10のステップS1003とステップS1004の処理と同様であるから、説明を省略する。   The processes of step S2303 and step S2304 are the same as the processes of step S1003 and step S1004 of FIG.

ステップS2304に続いて、検索処理部240Bは、軸決定部245Aにより、ステップS2304で抽出された印象語の標準偏差の中に、標準偏差の値が閾値より大きい印象語が存在するか否かを判定する(ステップS2305)。   Subsequent to step S2304, search processing unit 240B causes axis determination unit 245A to determine whether or not the impression word whose value of the standard deviation is larger than the threshold exists in the standard deviation of the impression words extracted in step S2304. It determines (step S2305).

ステップS2305において、該当する印象語が存在しない場合、検索処理部240Bは、処理を終了し、ステップS2203へ進む。   In step S2305, when there is no corresponding impression word, the search processing unit 240B ends the process, and proceeds to step S2203.

ステップS2305において、該当する印象語が存在する場合、軸決定部245Aは、抽出された印象語から、標準偏差が閾値より大きい印象語を特定する(ステップS2306)。   In step S2305, when there is a corresponding impression word, the axis determination unit 245A specifies an impression word whose standard deviation is larger than the threshold from the extracted impression words (step S2306).

続いて、軸決定部245Aは、スコアの最大値が上位n+1位以降であり、且つ、スコアの最大値が、ステップS2306で特定された印象語のスコアの最大値から標準偏差を減算した値よりも大きい印象語をm個抽出する(ステップS2307)。   Subsequently, the axis determination unit 245A determines that the maximum score is at the top n + 1 or higher, and the maximum score is a value obtained by subtracting the standard deviation from the maximum score of the impression word specified in step S2306. Also, m large impression words are extracted (step S2307).

続いて、軸決定部245Aは、抽出したm個の印象語を、ステップS2306で特定した印象語と入れ替えが可能な軸の候補として保持し(ステップS2308)、ステップS2203へ進む。   Subsequently, the axis determination unit 245A holds the extracted m impression words as a candidate for an axis that can be replaced with the impression word specified in step S2306 (step S2308), and the process proceeds to step S2203.

以下に、図24を参照して、本実施形態の検索処理部240Bによる軸の候補の抽出について、具体的に説明する。図24は、第三の実施形態の検索処理部による軸の候補の抽出を説明する図である。   Hereinafter, extraction of axis candidates by the search processing unit 240B of this embodiment will be specifically described with reference to FIG. FIG. 24 is a diagram for explaining extraction of axis candidates by the search processing unit of the third embodiment.

図24では、「天然の素材や野菜を使うレストラン」というクエリが入力され、解析部242により検索語群111Aとして、「天然」、「素材」、「野菜」、「レストラン」が抽出された場合を示している。   In FIG. 24, the query “restaurant using natural materials and vegetables” is input, and “natural”, “material”, “vegetables”, and “restaurant” are extracted as the search word group 111A by the analysis unit 242 Is shown.

検索処理部240Bは、印象語スコア出力部244Aにより、検索語群111Aに含まれる各単語の意味ベクトルを取得して変換モデル250Aの入力とし、各単語について、印象語マップ221Aに含まれる印象語毎のスコアと標準偏差を得る。   The search processing unit 240B causes the impression word score output unit 244A to acquire the semantic vector of each word included in the search word group 111A and use it as the input of the conversion model 250A, and the impression word included in the impression word map 221A for each word. Get each score and standard deviation.

図24では、検索語群111Aに含まれる各単語と、印象語毎のスコアと標準偏差とを対応付けた情報を、単語毎印象語スコア113Aと呼ぶ。   In FIG. 24, information in which each word included in the search word group 111A is associated with the score and standard deviation for each impression word is referred to as a word-by-word impression word score 113A.

次に、軸決定部245Aは、単語毎印象語スコア113Aから、印象語毎のスコアの最大値を取得する。   Next, the axis determination unit 245A acquires the maximum value of the score for each impression word from the word impression word score 113A.

図24の単語毎印象語スコア113Aでは、印象語「美味しい」に対して、単語「レストラン」との関連の強さを示すスコアと標準偏差は3.4と±0.2であり、単語「野菜」との関連の強さを示すスコアと標準偏差は3.7と0.3である。また、単語「天然」との関連の強さを示すスコアと標準偏差は3.8と0.7であり、単語「素材」との関連の強さを示すスコアと標準偏差は3.2と0.5である。   In the word-by-word impression word score 113A of FIG. 24, the score indicating the strength of association with the word “restaurant” and the standard deviation are 3.4 and ± 0.2 with respect to the impression word “delicious”, and the word “ Scores and standard deviations indicating the strength of association with vegetables are 3.7 and 0.3. Moreover, the score and standard deviation which show the strength of association with the word "natural" are 3.8 and 0.7, and the score and standard deviation which show the strength of association with the word "material" are 3.2 and It is 0.5.

したがって、軸決定部245Aは、印象語「美味しい」のスコアの最大値として「3.8」を取得し、印象語「美味しい」の標準偏差として0.7を取得する。   Therefore, the axis determination unit 245A acquires “3.8” as the maximum value of the score of the impression word “delicious”, and acquires 0.7 as the standard deviation of the impression word “delicious”.

また、単語毎印象語スコア113Aでは、印象語「ヘルシー」に対して、単語「レストラン」との関連の強さを示すスコアと標準偏差は3.0と0.5であり、単語「野菜」との関連の強さを示すスコアと標準偏差は4.2と0.3である。また、単語「天然」との関連の強さを示すスコアと標準偏差は3.1と1.2であり、単語「素材」との関連の強さを示すスコアと標準偏差は3.0と0.7である。   In addition, in the word impression word score 113A, the score indicating the strength of association with the word "restaurant" and the standard deviation are 3.0 and 0.5 with respect to the impression word "healthy", and the word "vegetable" Scores and standard deviations indicating strength of association with are 4.2 and 0.3. Moreover, the score and standard deviation which show the strength of association with word "natural" are 3.1 and 1.2, and the score and standard deviation which show the strength of association with word "material" are 3.0 and It is 0.7.

したがって、軸決定部245Aは、印象語「ヘルシー」のスコアの最大値として「4.2」を取得し、印象語「ヘルシー」の標準偏差として0.3を取得する。   Therefore, the axis determination unit 245A acquires “4.2” as the maximum value of the score of the impression word “healthy”, and acquires 0.3 as the standard deviation of the impression word “healthy”.

本実施形態の軸決定部245Aは、このようにして取得した印象語毎のスコアの最大値と標準偏差とを、印象語スコアリスト114Aとして保持する。   The axis determination unit 245A of the present embodiment holds the maximum value and the standard deviation of the scores for each impression word acquired in this manner as the impression word score list 114A.

続いて、軸決定部245Aは、印象語スコアリスト114Aにおいて、スコアの最大値が大きい印象語から順に、n個の印象語を抽出して、α軸とする。図24の例では、n=3としている。   Subsequently, in the impression word score list 114A, the axis determination unit 245A extracts n impression words in order from the impression word having the largest score maximum value, and sets it as an α axis. In the example of FIG. 24, n = 3.

印象語スコアリスト114Aにおいて、スコアの最大値が最も大きい印象語は「ヘルシー」であり、次にスコアの最大値が大きい印象語は「美味しい」であり、その次にスコアの最大値が大きい印象語は「香りが良い」である。   In impression word score list 114A, the impression word with the largest score maximum is "healthy", the impression word with the next largest score maximum is "delicious", and the impression with the second largest score is the second largest impression. The word is "good smell".

したがって、本実施形態の軸決定部245Aは、印象語「ヘルシー」と印象語「美味しい」と印象語「香りが良い」をα軸に決定する。言い換えれば、軸決定部245Aは、印象語「ヘルシー」と印象語「美味しい」と印象語「香りが良い」とを、検索結果集合データを表示する際の項目とする。   Therefore, the axis determination unit 245A according to the present embodiment determines the impression word "healthy", the impression word "delicious", and the impression word "good smell" as the α axis. In other words, the axis determination unit 245A sets the impression word “healthy”, the impression word “delicious”, and the impression word “good smell” as items for displaying the search result set data.

さらに、本実施形態の軸決定部245Aは、印象語スコアリスト114Aを参照し、α軸として決定された印象語「ヘルシー」と印象語「美味しい」と印象語「香りが良い」のそれぞれの標準偏差が所定の閾値より大きいか否かを判定する。   Furthermore, the axis determination unit 245A of the present embodiment refers to the impression word score list 114A, and the standard for each of the impression word "healthy" and the impression words "delicious" and the impression words "good smell" determined as the α axis. It is determined whether the deviation is larger than a predetermined threshold.

ここでは、標準偏差に対する所定の閾値を1.0として説明する。尚、所定の閾値は、任意の値に設定することができる。   Here, it is assumed that the predetermined threshold for the standard deviation is 1.0. The predetermined threshold can be set to any value.

印象語スコアリスト114Aにおいて、印象語「ヘルシー」の標準偏差は0.3であり、印象語「美味しい」の標準偏差は0.7であり、両者とも所定の閾値以下である。   In the impression word score list 114A, the standard deviation of the impression word "healthy" is 0.3, and the standard deviation of the impression word "delicious" is 0.7, both of which are less than or equal to a predetermined threshold.

それに対して、印象語「香りが良い」の標準偏差は1.2であり、所定の閾値より大きい。これは、印象語「香りが良い」と、検索語群111Aに含まれる単語との関連の強さは、人によって感じ方が異なることを示している。   On the other hand, the standard deviation of the impression word "scented" is 1.2, which is greater than a predetermined threshold. This indicates that the strength of the association between the impression word “good smell” and the words included in the search word group 111A differs in how it is felt by people.

そこで、本実施形態では、印象語スコアリスト114Aを参照し、スコアが、上位n+1位以降であって、且つ、印象語「香りが良い」のスコア3.2から標準偏差1.2を減算した値である2.0以上の印象語を、スコアが大きい順にm個、軸の候補として抽出する。   Therefore, in the present embodiment, with reference to the impression word score list 114A, the standard deviation 1.2 is subtracted from the score 3.2 of the impression word "good smell" that is the top n + 1 or higher scores. Impression words of 2.0 or more, which are values, are extracted as m axis candidates in descending order of score.

図24の例では、m=2としている。よって、軸決定部245Aは、印象語スコアリスト114Aにおいて、スコアが上位4位以下であり、且つ、2.0以上の印象語を、スコアが大きい順に2個抽出する。   In the example of FIG. 24, m = 2. Therefore, in the impression word score list 114A, the axis determination unit 245A extracts two impression words having a score of 4 or less in the top rank and 2.0 or more in descending order of the score in the impression word score list 114A.

図24では、スコアが3.1の印象語「おなかいっぱい」と、スコアが2.8の印象語「おなかにやさしい」とが、軸の候補として抽出される。   In FIG. 24, an impression word “stomach full” with a score of 3.1 and an impression word “tummy friendly” with a score of 2.8 are extracted as axis candidates.

続いて、検索処理部240Bの出力部246は、検索結果集合データを表示する画面115において、印象語「ヘルシー」と印象語「美味しい」と印象語「香りが良い」とを、検索結果集合データを示す項目(軸)116として表示させる。また、出力部246は、各項目(軸)の値を示す棒グラフ117を画面115に表示させる。尚、図24の例で波、検索結果集合データとして、「京料理△△」が抽出された例を示している。   Subsequently, on the screen 115 displaying the search result collection data, the output unit 246 of the search processing unit 240B displays the impression word “healthy”, the impression word “delicious” and the impression words “good smell” as search result collection data Is displayed as an item (axis) 116 indicating. In addition, the output unit 246 causes the screen 115 to display a bar graph 117 indicating the value of each item (axis). In the example of FIG. 24, an example is shown in which “Kyoto dish ΔΔ” is extracted as the wave and the search result set data.

このとき、候補通知部249は、印象語「香りが良い」と対応付けて、この印象語を、軸の候補として抽出さたれ印象語「おなかいっぱい」又は印象語「おなかにやさしい」に変更することが可能であることを示す通知欄118を表示させる。   At this time, the candidate notification unit 249 associates this impression word with the impression word “good smell”, and changes this impression word as a candidate for the axis to the impression word “full belly” or the impression word “friendly for belly”. A notification field 118 indicating that it is possible is displayed.

本実施形態では、このように、通知欄118を表示させることで、例えば、ユーザが、検索語群111Aと、項目として表示された印象語「香りが良い」とは、関連していないと感じた場合等に、この項目を他の印象語に変更させることができる。また、本実施形態では、通知欄118を表示させることで、検索語群111Aと、印象語「香りが良い」とは関連していない、と感じるユーザに対し、ユーザの意図(感じ方)を反映させることが可能であることを知らせることができる。   In this embodiment, by displaying the notification column 118 in this manner, for example, the user feels that the search word group 111A and the impression word “good smell” displayed as an item are not related to each other. In such cases, this item can be changed to another impression word. Further, in the present embodiment, by displaying the notification column 118, the user's intention (how to feel) is presented to the user who feels that the search word group 111A is not related to the impression word “good smell”. It can be informed that it is possible to reflect.

以下に、図25及び図26を参照して、本実施形態の表示例について説明する。図25は、第三の実施形態の表示例を示す第一の図である。   Hereinafter, display examples of the present embodiment will be described with reference to FIGS. 25 and 26. FIG. FIG. 25 is a first diagram showing a display example of the third embodiment.

図25に示す画面115Aでは、検索結果集合データを示す軸(項目)116と、各軸(項目)の値を示す棒グラフ117と、印象語「香りが良い」の代わりとなる軸の候補の通知欄118に加え、クエリの各軸の値を示す棒グラフ119が表示されている。   In the screen 115A shown in FIG. 25, notification of axis candidates that represent the search result set data, bar graphs 117 showing the values of the respective axes (items), and axis words to be substituted for the impression word “good smell” In addition to the column 118, a bar graph 119 indicating the value of each axis of the query is displayed.

図26は、第三の実施形態の表示例を示す第二の図である。   FIG. 26 is a second diagram showing a display example of the third embodiment.

図26に示す画面115Bでは、検索結果集合データをレーダチャート130によって表示させている。   In the screen 115 B shown in FIG. 26, the search result aggregate data is displayed by the radar chart 130.

レーダチャート130には、グラフ117Aとグラフ119Aとが表示されている。グラフ117Aは、検索結果集合データと軸とされた項目との関係性を示しており、グラフ119Aは、クエリと軸とされた項目との関係性を示している。   The radar chart 130 displays a graph 117A and a graph 119A. The graph 117A shows the relationship between the search result set data and the item taken as the axis, and the graph 119A shows the relationship between the query and the item taken as the axis.

また、レーダチャート130では、α1軸を「ヘルシー」、α2軸を「美味しい」、α3軸を「香りが良い」としており、軸の候補として抽出された印象語「おなかいっぱい」、「おなかにやさしい」を、それぞれβ1軸、β2軸としている。   In radar chart 130, α1 axis is “healthy”, α2 axis is “delicious”, α3 axis is “scent”, and impression words extracted as axis candidates “full belly”, “tummy friendly” Are respectively taken as the β1 axis and the β2 axis.

このように、本実施形態では、レーダチャートを表示させる際に、軸の候補として抽出された印象語を、β軸としても良い。尚、本実施形態では、レーダチャートを表示させる際に、β軸は、第一及び第二の実施形態と同様の手法で決定し、α軸とされた印象語のうち、標準偏差が所定の閾値より大きい印象語と対応付けて、他の軸の候補を通知しても良い。   As described above, in the present embodiment, when displaying the radar chart, the impression word extracted as the axis candidate may be set as the β axis. In the present embodiment, when the radar chart is displayed, the β axis is determined by the same method as in the first and second embodiments, and the standard deviation of the impression words set as the α axis is a predetermined value. The candidate of another axis may be notified in association with the impression word larger than the threshold.

図26の画面115Bでは、例えば、レーダチャート130のβ軸を、例えば、クエリから抽出された検索語群111Aの中から抽出した単語とし、α3軸と対応付けて、通知欄118を表示されることになる。   In the screen 115B of FIG. 26, for example, with the β axis of the radar chart 130 as the word extracted from the search word group 111A extracted from the query, the notification column 118 is displayed in association with the α3 axis. It will be.

このように、本実施形態では、軸とされた印象語のスコアに一定以上のばらつきが存在する場合には、軸となり得る他の印象語をユーザに通知することで、ユーザの意図を反映した検索結果を表示させることができる。   As described above, in the present embodiment, in the case where the score of the impression word taken as the axis has a variation above a certain level, the user's intention is reflected by notifying the user of other impression words that may become the axis. Search results can be displayed.

(第四の実施形態)
以下に図面を参照して、第四の実施形態について説明する。第四の実施形態は、軸の候補として表示された印象語に対する選択を受けて、軸を変更する点が第三の実施形態と相違する。よって、以下の第四の実施形態の説明では、第三の実施形態との相違点についてのみ説明し、第三の実施形態と同様の機能構成を有するものには、第三の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
Fourth Embodiment
The fourth embodiment will be described below with reference to the drawings. The fourth embodiment is different from the third embodiment in that the axis is changed in response to the selection for the impression word displayed as the axis candidate. Therefore, in the following description of the fourth embodiment, only differences from the third embodiment will be described, and descriptions of the third embodiment will be given to those having the same functional configuration as the third embodiment. The same reference numerals as the reference numerals used in FIG.

図27は、第四の実施形態の検索装置の機能を説明する図である。本実施形態の検索装置200Cは、検索処理部240Cを有する。   FIG. 27 is a diagram for explaining the function of the search device of the fourth embodiment. The search device 200C of the present embodiment has a search processing unit 240C.

本実施形態の検索処理部240Cは、検索処理部240Bの有する各部に加え、軸変更部251を有する。   The search processing unit 240C of the present embodiment includes an axis changing unit 251 in addition to the units included in the search processing unit 240B.

本実施形態の軸変更部251は、例えば、端末装置300等において、軸と対応付けて表示された軸の候補の選択を受け付けると、出力部246に対し、選択に応じて軸を変更したグラフを表示させる。また、本実施形態の軸変更部251は、ユーザにより軸が指定されている場合には、軸の候補の選択を受け付けて、指定された軸以外の軸とされた印象語のうち、最もスコアが小さい印象語を、選択された軸の候補である印象語に変更する。   For example, when the axis changing unit 251 of the present embodiment receives the selection of the axis candidate displayed in association with the axis in the terminal device 300 or the like, the axis changing unit 251 changes the axis according to the selection to the output unit 246 Is displayed. In addition, when the axis is specified by the user, the axis changing unit 251 according to the present embodiment receives the selection of axis candidates, and among the impression words regarded as axes other than the specified axis, the score is the highest Change the small impression words into impression words that are candidates for the selected axis.

以下に、図28を参照して、本実施形態の検索処理部240Cの軸変更部251の処理について説明する。   The processing of the axis changing unit 251 of the search processing unit 240C of the present embodiment will be described below with reference to FIG.

図28は、第四の実施形態における軸の変更の処理を説明するフローチャートである。本実施形態の検索処理部240Cにおいて、軸変更部251は、軸の候補の通知において、候補された軸の選択を受け付けたか否かを判定する(ステップS2801)。ステップS2801において、選択を受け付けない場合、軸変更部251は、選択を受け付けるまで待機する。   FIG. 28 is a flow chart for explaining the process of changing the axis in the fourth embodiment. In the search processing unit 240C of the present embodiment, the axis changing unit 251 determines whether or not the selection of the candidate axis has been received in the notification of the axis candidate (step S2801). In step S2801, if the selection is not received, the axis changing unit 251 waits until the selection is received.

ステップS2801において、軸の選択を受け付けた場合、軸変更部251は、ユーザにより指定されている軸が存在するか否かを判定する(ステップS2802)。尚、ここでの指定とは、表示を維持させるための指定である。したがって、本実施形態では、指定された軸の表示は維持される。   If it is determined in step S2801 that axis selection has been received, the axis changing unit 251 determines whether there is an axis designated by the user (step S2802). The designation here is a designation for maintaining the display. Therefore, in the present embodiment, the display of the designated axis is maintained.

ステップS2802において、指定されている軸が存在する場合、軸変更部251は、ユーザに指定されていない軸(印象語)のうち、最もスコアの最大値が小さい軸を、選択された軸の候補に変更する(ステップS2803)。   In step S2802, when the designated axis exists, the axis changing unit 251 selects the axis with the smallest score maximum among the axes (impression words) not designated by the user as the selected axis candidate. To (step S2803).

また、ステップS2802において、指定されている軸が存在しない場合、軸変更部251は、表示されているグラフの軸のうち、最もスコアが低い軸を、選択された軸の候に変更する(ステップS2804)。   Further, in step S2802, when the designated axis does not exist, the axis changing unit 251 changes the axis with the lowest score among the axes of the displayed graph to the selected axis (step S2804).

ステップS2803、2804に続いて、軸変更部251は、出力部246に対して、軸を変更したグラフの表示を指示し(ステップS2805)、処理を終了する。   Following steps S2803 and 2804, the axis changing unit 251 instructs the output unit 246 to display the graph whose axis has been changed (step S2805), and the process ends.

以下に、図29を参照して、軸の変更について具体的に説明する。図29は、軸の変更について説明する図である。   The change of the axis will be specifically described below with reference to FIG. FIG. 29 is a diagram for explaining the change of the axis.

図29(a)では、検索結果集合データを表示する画面115に、α軸として抽出された印象語を指定するための指定欄292が表示された画面291を示している。   FIG. 29A shows a screen 291 in which a designation field 292 for designating an impression word extracted as an α axis is displayed on the screen 115 displaying search result set data.

図29(b)に示す画面291Aは、指定欄292における軸の指定が行われず、通知欄118において表示された軸の候補「おなかいっぱい」が選択された場合に、画面291から遷移する画面の例である。   In the screen 291A shown in FIG. 29B, the screen transition from the screen 291 is performed when the axis candidate “tomach full” displayed in the notification field 118 is selected without designation of the axis in the specification field 292. It is an example.

画面291において、軸116として抽出された印象語は、「ヘルシー」、「美味しい」、「香りが良い」である。ここで、通知欄118において、「おなかいっぱい」が選択されると、軸変更部251は、指定欄292における指定がないため、印象語「ヘルシー」、「美味しい」、「香りが良い」のうち、最もスコアの最大値が小さい印象語を、印象語「おなかいっぱい」に変更する(図24参照)。   The impression words extracted as the axis 116 on the screen 291 are “healthy”, “delicious”, and “good smell”. Here, when "full" is selected in the notification column 118, the axis changing unit 251 does not specify in the specification column 292, so among the impression words "healthy", "delicious", and "good smell". The impression word having the smallest maximum score value is changed to the impression word "full stomach" (see FIG. 24).

ここで、軸116の中で、最もスコアの最大値が小さい印象語は、「香りが良い」である。したがって、画面291Aでは、印象語「香りが良い」を印象語「おなかいっぱい」に変更した軸116Aが表示される。また、画面291Aでは、軸116Aに合わせた棒グラフ117Aが表示される。   Here, in the axis 116, the impression word having the smallest maximum score value is "good smell". Therefore, on the screen 291A, the axis 116A in which the impression word "good smell" is changed to the impression word "full" is displayed. Further, on the screen 291A, a bar graph 117A aligned with the axis 116A is displayed.

さらに、本実施形態では、画面291Aに、変更された印象語「香りが良い」と、通知欄118において軸の候補とされていた印象語「おなかにやさしい」とを、印象語「おかないっぱい」と入れ代えることができる軸の候補として、通知欄118Aに表示させる。   Furthermore, in the present embodiment, on the screen 291A, the modified impression word “good smell” and the impression word “friendly to the belly” which were considered as axis candidates in the notification column 118 As a candidate of the axis which can be replaced with "", it is displayed in the notification column 118A.

本実施形態では、このように、変更された軸を、軸の候補として通知するため、変更前のグラフを表示させたい場合には、通知欄118Aに表示された、変更された軸「香りが良い」を選択すれば良く、簡単に軸を変更する前の表示に戻すことができる。   In this embodiment, in order to notify the changed axis as a candidate of the axis in this way, when it is desired to display the graph before the change, the changed axis “scent displayed in the notification column 118A is If you select "Good", you can easily return to the display before changing the axis.

図29(C)に示す画面291Bは、画面291の指定欄292において、軸とされた印象語「香りが良い」が指定された状態で、軸の候補とされた印象語「おなかいっぱい」が選択された場合に、画面291から遷移する画面の例である。   In the screen 291B shown in FIG. 29C, in the state where the impression word "good smell" is selected in the designation column 292 of the screen 291, the impression word "full" is selected as a candidate for the axis. It is an example of the screen which changes from screen 291 when it is chosen.

画面291Bの指定欄292Aでは、印象語「香りが良い」を指定するチェックが表示されている。よって、画面291Bでは、印象語「香りが良い」は、軸として表示が維持される。   In the designation column 292A of the screen 291B, a check for designating an impression word "good smell" is displayed. Therefore, on the screen 291 B, the impression word “good smell” is maintained as an axis.

また、軸116のうち、印象語「香りが良い」以外の印象語で、最もスコアの最大値が小さい印象語は、「美味しい」である。したがって、画面291Bでは、印象語「美味しい」を印象語「おなかいっぱい」に変更した軸116Bが表示される。また、画面291Bでは、軸116Aに合わせた棒グラフ117Bが表示される。   In addition, among the axis 116, among the impression words other than the impression word "good smell", the impression word having the smallest maximum score value is "delicious". Therefore, on the screen 291B, the axis 116B in which the impression word "delicious" is changed to the impression word "full" is displayed. Further, on the screen 291B, the bar graph 117B aligned with the axis 116A is displayed.

さらに、画面291Bには、変更された印象語「美味しい」と、通知欄118において軸の候補とされていた印象語「おなかにやさしい」とを、印象語「おかないっぱい」と入れ代えることができる軸の候補として、通知欄118Bに表示させる。   Furthermore, on screen 291 B, the changed impression word “delicious” and the impression word “tummy-friendly”, which were considered as axis candidates in notification column 118, may be replaced with the impression word “full”. It is displayed in the notification column 118B as a possible axis candidate.

このように、本実施形態によれば、軸を変更する場合に、ユーザが指定した軸を維持することができる。   Thus, according to the present embodiment, when changing the axis, the axis specified by the user can be maintained.

尚、図29では、棒グラフの例を説明したが、レーダチャートが表示された画面においても、同様に軸の変更と指定された軸の維持を行うことができる。   In FIG. 29, although the example of the bar graph has been described, the change of the axis and the maintenance of the designated axis can be similarly performed also on the screen on which the radar chart is displayed.

(第五の実施形態)
以下に図面を参照して第五の実施形態について説明する。第五の実施形態は、軸が変更された場合に、この変更を受けて印象語マップのスコアを補正する点が第四の実施形態と相違する。よって、以下の第五の実施形態の説明では、第四の実施形態との相違点について説明し、第四の実施形態と同様の機能構成を有するものには、第四の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
Fifth Embodiment
The fifth embodiment will be described below with reference to the drawings. The fifth embodiment differs from the fourth embodiment in that, when the axis is changed, the score of the impression word map is corrected in response to the change. Therefore, in the following description of the fifth embodiment, differences from the fourth embodiment will be described, and in the description of the fourth embodiment, those having the same functional configuration as the fourth embodiment will be described. The same code as the used code is given and the explanation is omitted.

図30は、第五の実施形態の検索装置の機能を説明する図である。本実施形態の検索装置200Dは、インデックス記憶部210、印象語マップ記憶部220B、検索対象スコア記憶部230A、検索処理部240D、ユーザ情報記憶部270を有する。   FIG. 30 is a diagram for explaining the function of the search device of the fifth embodiment. The search device 200D of this embodiment includes an index storage unit 210, an impression word map storage unit 220B, a search target score storage unit 230A, a search processing unit 240D, and a user information storage unit 270.

本実施形態の印象語マップ記憶部220Bは、印象語マップ221Aと、補正リスト222とを格納する。補正リスト222は、印象語スコア出力部244Aにおいて取得されたスコアを補正する際に参照される。   The impression word map storage unit 220B of the present embodiment stores an impression word map 221A and a correction list 222. The correction list 222 is referred to when correcting the score acquired in the impression word score output unit 244A.

本実施形態の検索処理部240Dは、第四の実施形態の検索処理部240Cに加え、補正リスト生成部252と、スコア補正部253とを有する。   The search processing unit 240D of the present embodiment includes a correction list generation unit 252 and a score correction unit 253 in addition to the search processing unit 240C of the fourth embodiment.

補正リスト生成部252は、軸変更部251により軸が変更された場合に、軸の変更又は表示の維持に応じて、印象語スコア出力部244Aから出力されるスコアを補正するための補正リスト222を更新していく。補正リスト222の詳細は後述する。   When the axis is changed by the axis changing unit 251, the correction list generating unit 252 corrects the score output from the impression word score output unit 244A according to the change of the axis or the maintenance of the display. Will be updated. Details of the correction list 222 will be described later.

スコア補正部253は、印象語スコア出力部244Aにより出力されたスコアを、補正リスト222に基づいて補正する。   The score correction unit 253 corrects the score output by the impression word score output unit 244A based on the correction list 222.

本実施形態のユーザ情報記憶部270は、ユーザ情報271を格納している。ユーザ情報271は、検索装置200Dを含む検索システムを利用するユーザを認証するための情報である。具体的には、ユーザ情報271は、ユーザを識別するユーザIDと、パスワード等である。本実施形態のユーザ情報271は、予め検索装置200Dに与えられていても良い。   The user information storage unit 270 of the present embodiment stores user information 271. The user information 271 is information for authenticating a user who uses a search system including the search device 200D. Specifically, the user information 271 is a user ID for identifying a user, a password, and the like. The user information 271 of the present embodiment may be given to the search device 200D in advance.

次に、図31を参照して、本実施形態の補正リスト生成部252の処理について説明する。図31は、第五の実施形態の補正リスト生成部の処理を説明するフローチャートである。   Next, processing of the correction list generation unit 252 of the present embodiment will be described with reference to FIG. FIG. 31 is a flowchart for explaining the processing of the correction list generation unit of the fifth embodiment.

図31のステップS3101からステップS3105までの処理は、図28のステップS2801からステップS2805までの処理と同様であるから、説明を省略する。   The processing from step S3101 to step S3105 in FIG. 31 is the same as the processing from step S2801 to step S2805 in FIG.

検索処理部240Dは、軸の候補が変更されると、補正リスト生成部252により、変更を行ったユーザのユーザ情報と、軸の変更又は軸の指定に応じて、補正リスト222の更新を行い(ステップS3106)、処理を終了する。   When the axis candidate is changed, the search processing unit 240D causes the correction list generation unit 252 to update the correction list 222 according to the user information of the user who made the change and the change of the axis or the specification of the axis. (Step S3106), the process ends.

以下に、ステップS3106の処理について、さらに説明する。はじめに、軸を変更する際に、ユーザによる軸の指定が行われなかった場合について説明する。   The process of step S3106 will be further described below. First, the case where the user does not specify an axis when changing an axis will be described.

この場合、補正リスト生成部252は、変更の対象とされる軸を示す印象語と、この印象語のスコアから減算する値と、クエリから取得された検索語群と、ユーザ情報とを対応付けて、補正リスト222へ格納する。尚、変更の対象とされる軸を示す印象語とは、印象語スコア出力部244Aにより軸として抽出された印象語のうち、スコアの最大値が最も小さい印象語である。   In this case, the correction list generation unit 252 associates the impression word indicating the axis to be changed, the value to be subtracted from the score of the impression word, the search word group acquired from the query, and the user information. Then, the correction list 222 is stored. The impression word indicating the axis to be changed is the impression word having the smallest maximum score among the impression words extracted as the axis by the impression word score output unit 244A.

次に、軸を変更する際に、ユーザによる軸の指定が行われた場合について説明する。この場合、補正リスト生成部252は、ユーザにより指定された軸を示す印象語と、この印象語のスコアに加算する値と、クエリから取得された検索語群と、ユーザ情報とを対応付けて、補正リスト222へ格納する。   Next, the case where the user designates an axis when changing the axis will be described. In this case, the correction list generation unit 252 associates the impression word indicating the axis specified by the user, the value to be added to the score of the impression word, the search word group acquired from the query, and the user information. , And stored in the correction list 222.

以下に、図32を参照して、本実施形態の補正リスト222について説明する。図32は、第五の実施形態の補正リストの一例を示す図である。   The correction list 222 according to the present embodiment will be described below with reference to FIG. FIG. 32 is a diagram showing an example of the correction list according to the fifth embodiment.

本実施形態の補正リスト222は、情報の項目として、ユーザID、検索語群、変更点を有し、これらが対応付けられている。項目「ユーザID」の値は、ユーザを識別するためのユーザIDを示す。項目「検索語群」の値は、入力されたクエリから取得された検索語群を示す。項目「変更点」の値は、変更された印象語と、この印象語のスコアから減算される値、又は、ユーザに表示を維持する軸として指定された印象語と、この印象語のスコアに加算する値を示す。   The correction list 222 of the present embodiment has, as items of information, a user ID, a search word group, and a change point, and these are associated with each other. The value of the item "user ID" indicates a user ID for identifying the user. The value of the item “search term group” indicates a search term group acquired from the input query. The value of the item “changed point” is the impression word which has been changed, the value to be subtracted from the score of this impression word, or the impression word designated as the axis for maintaining the display to the user, and the score of this impression word. Indicates the value to be added.

以下の説明では、補正リスト222において、項目「ユーザID」の値と、その他の値とを含む情報を、補正情報と呼ぶ。また、以下の説明では、印象語のスコアに加算する値(第一の補正値)又は印象語のスコアから減算する値(第二の補正値)を、スコア補正値と呼ぶ。スコア補正値は、予め設定されて、補正リスト生成部252に保持されていても良い。   In the following description, in the correction list 222, information including the value of the item "user ID" and other values is referred to as correction information. In the following description, a value to be added to the score of the impression word (first correction value) or a value to be subtracted from the score of the impression word (second correction value) will be referred to as a score correction value. The score correction value may be set in advance and held in the correction list generation unit 252.

図32の例では、ユーザID「0001」を含む補正情報222−1では、項目「検索語群」の値が、「天然」、「素材」、「野菜」、「レストラン」であり、項目「変更点」の値が、「香りが良い」、「−0.1」である。   In the example of FIG. 32, in the correction information 222-1 including the user ID "0001", the values of the item "search word group" are "natural", "material", "vegetables" and "restaurant", and the item " The value of the change point is "good smell", "-0.1".

よって、補正情報222−1は、ユーザID「0001」のユーザが入力したクエリから取得された検索語群「天然」、「素材」、「野菜」、「レストラン」で検索を行った検索結果集合データを表示させた際に、軸とされた印象語「香りが良い」が他の印象語に変更されたことを示している。また、補正情報222−1は、このとき、ユーザによって、軸の中に、表示を維持するように指定された印象語がなく、印象語「香りが良い」からスコア補正値である「0.1」が減算されることを示している。   Therefore, the correction information 222-1 is a set of search results obtained by searching in the search word group "natural", "material", "vegetables" and "restaurant" acquired from the query input by the user of the user ID "0001". When the data is displayed, it is indicated that the impression word “good smell” taken as the axis has been changed to another impression word. In addition, at this time, the correction information 222-1 does not have an impression word designated to maintain the display in the axis by the user at this time, and the score word “0. It shows that 1 "is subtracted.

また、図32の補正情報222−2では、ユーザID「0002」のユーザが入力したクエリから取得された検索語群「がっつり」、「中華」で検索を行った検索結果集合データを表示させ際に、ユーザによって、軸のうち、印象語「おなかいっぱい」の表示を維持するように指定されたことを示す。また、補正情報222−2は、印象語「おなかいっぱい」のスコアにスコア補正値である「0.1」が加算されることを示している。   In addition, in the correction information 222-2 of FIG. 32, when displaying the search result aggregation data in which the search word group “Hatsutsuri” and “Chinese food” acquired from the query input by the user of the user ID “0002” are searched. Indicates that the user has specified that the display of the impression word “full stomach” is maintained by the user. Further, the correction information 222-2 indicates that the score correction value "0.1" is added to the score of the impression word "full".

次に、図33を参照して、本実施形態の印象語スコア出力部244A、軸決定部245A、スコア補正部253の処理について説明する。図33は、第五の実施形態の印象語スコア出力部、軸決定部、スコア補正部の処理を説明するフローチャートである。   Next, the processes of the impression word score output unit 244A, the axis determination unit 245A, and the score correction unit 253 according to the present embodiment will be described with reference to FIG. FIG. 33 is a flowchart illustrating processing of an impression word score output unit, an axis determination unit, and a score correction unit according to the fifth embodiment.

尚、本実施形態の検索装置200Dでは、ユーザがクエリを入力する前に、ユーザ情報の入力を受け付けて、ログイン処理が行われるものとした。   In addition, in the search device 200D of the present embodiment, before the user inputs the query, the input of the user information is accepted and the login process is performed.

図33のステップS3301とステップS3302の処理は、図23のステップS2301とステップS2302の処理と同様であるから、説明を省略する。   The processes of step S3301 and step S3302 of FIG. 33 are the same as the processes of step S2301 and step S2302 of FIG.

ステップS3302において、印象語毎のスコアと標準偏差を取得すると、スコア補正部253により、補正リスト222に、入力されたユーザIDを含む補正情報が存在するか否かを判定する(ステップS3303)。ステップS3303において、該当する補正情報が存在しない場合、検索処理部240Dは、後述するステップS3306へ進む。   In step S3302, when the score and standard deviation for each impression word are acquired, the score correction unit 253 determines whether or not correction information including the input user ID exists in the correction list 222 (step S3303). If there is no corresponding correction information in step S3303, the search processing unit 240D proceeds to step S3306 described later.

ステップS3303において、該当する補正情報が存在する場合、スコア補正部253は、該当する補正情報に、入力されたクエリから取得した検索語群と、検索語群が一致する補正情報が存在するか否かを判定する(ステップS3307)。ステップS3307において、該当する補正情報が存在しない場合、検索処理部240Dは、後述するステップS3306へ進む。   In step S3303, when the corresponding correction information exists, the score correction unit 253 determines whether or not the correction word in which the search word group acquired from the input query matches the search word group exists in the corresponding correction information. It is determined (step S3307). In step S3307, when there is no corresponding correction information, the search processing unit 240D proceeds to step S3306 described later.

ステップS3307において、該当する補正情報が存在する場合、スコア補正部253は、この補正情報の項目「変更点」の値を参照し、ステップS3302で取得した印象語毎のスコアを補正し(ステップS3305)、ステップS3306へ進む。   In step S3307, when the corresponding correction information exists, the score correction unit 253 corrects the score for each impression word acquired in step S3302 with reference to the value of the item “changed point” of the correction information (step S3305). ), Go to step S3306.

ステップS3306からステップS3311までの処理は、図23のステップS2303からステップS2308までの処理と同様であるから、説明を省略する。   The processing from step S3306 to step S3311 is the same as the processing from step S2303 to step S2308 in FIG.

以下に、図24を参照して、図33の処理を具体的に説明する。ここでは、例えば、ユーザID「0001」のユーザが、「天然の素材や野菜を使うレストラン」というクエリを入力し、検索語群111Aが取得された場合について説明する。   The process of FIG. 33 will be specifically described below with reference to FIG. Here, for example, the case where the user with the user ID “0001” inputs a query “restaurant using natural materials and vegetables” and the search word group 111A is acquired will be described.

この場合、検索処理部240Dは、印象語スコア出力部244Aにより、単語毎印象語スコア113Aを得る。このとき、スコア補正部253は、補正リスト222を参照し、ユーザID「0001」を含む補正情報が存在するか否かを判定する。   In this case, the search processing unit 240D obtains the impression word score 113A for each word by the impression word score output unit 244A. At this time, the score correction unit 253 refers to the correction list 222 and determines whether or not correction information including the user ID “0001” exists.

ここで、補正リスト222には、ユーザID「0001」を含む補正情報222−1が存在する(図32参照)。したがって、スコア補正部253は、補正情報222−1の項目「検索語群」の値と、入力さたれクエリから取得した検索語群111Aとが一致するか否かを判定する。   Here, correction information 222-1 including the user ID "0001" is present in the correction list 222 (see FIG. 32). Therefore, the score correction unit 253 determines whether the value of the item “search word group” of the correction information 222-1 matches the search word group 111A acquired from the input query.

ここでは、両者は一致するため、スコア補正部253は、補正情報222−1の項目「変更点」を参照し、単語毎印象語スコア113Aの印象語「香りが良い」と対応するスコアから0.1を減算する補正を行う。   Here, since both match each other, the score correction unit 253 refers to the item “changed point” of the correction information 222-1, and the score corresponding to the impression word “good smell” of the impression word score 113A for each word is 0 Make a correction to subtract 1.

このように、本実施形態では、ユーザが一度軸となる印象語を変更したり、表示を維持する印象語を指定した場合に、この操作の履歴を補正情報としてユーザ毎に保持しておく。そして、本実施形態では、クエリから取得される検索語群が一致する場合には、この補正情報を用いて印象語のスコアを補正することで、検索結果集合データを表示させる際の項目に、ユーザの意図を反映させることができる。   As described above, in the present embodiment, when the user once changes an impression word as an axis or specifies an impression word for which display is to be maintained, the history of this operation is held as correction information for each user. Then, in the present embodiment, when the search word group acquired from the query matches, the score of the impression word is corrected using this correction information to display the search result collection data as an item: The intention of the user can be reflected.

(第六の実施形態)
以下に図面を参照して第六の実施形態について説明する。第六の実施形態は、出力軸上で印象語のスコアを変更する操作を受け付けた際に、適切な数の検索結果集合データを表示させる点が、第一の実施形態と相違する。よって、以下の第六の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
Sixth Embodiment
The sixth embodiment will be described below with reference to the drawings. The sixth embodiment is different from the first embodiment in that an appropriate number of search result set data are displayed when an operation to change the score of an impression word is received on the output axis. Therefore, in the following description of the sixth embodiment, differences from the first embodiment will be described, and for those having the same functional configuration as the first embodiment, the description of the first embodiment will be given. The same code as the used code is given and the explanation is omitted.

図34は、第六の実施形態の表示例について説明する図である。図34に示す画面341では、複数の出力軸342と、複数の検索結果集合データ343とが表示されている。   FIG. 34 is a view for explaining a display example of the sixth embodiment. On the screen 341 shown in FIG. 34, a plurality of output axes 342 and a plurality of search result set data 343 are displayed.

画面341において、出力軸342は、入力されたクエリに基づく検索語群と関連が強いとされた印象語を示す。   In the screen 341, the output axis 342 shows an impression word strongly associated with a search word group based on the input query.

また、画面341では、出力軸342とされた印象語毎に、印象語のスコアを変更するためのスケール344とスライダ345とが表示される。本実施形態では、スケール344上でスライダ345を移動させ、スライダ345がスケール344上に予め設けられた目盛り上で停止すると、印象語のスコアが、スライダ345が停止した位置と対応する値に変更される。印象語のスコアが変更されると、検索結果集合データ343は、変更後のスコアを用いた検索結果となる。   Further, on the screen 341, a scale 344 and a slider 345 for changing the score of the impression word are displayed for each impression word set as the output axis 342. In the present embodiment, when the slider 345 is moved on the scale 344 and the slider 345 stops on the scale previously provided on the scale 344, the score of the impression word is changed to a value corresponding to the position where the slider 345 stopped. Be done. When the score of the impression word is changed, the search result set data 343 becomes a search result using the changed score.

尚、以下の説明では、スケール上のスライダは、目盛り上において停止するものとし、スケール上に付された目盛りをスライダ停止位置と呼ぶ。また、以下の説明では、スケールにおいてスライダ停止位置が示す値(目盛り)をスライダ値と表現することがある。   In the following description, the slider on the scale is assumed to stop on the scale, and the scale attached on the scale is called the slider stop position. In the following description, the value (scale) indicated by the slider stop position in the scale may be expressed as a slider value.

検索結果集合データ343は、検索処理により特定された文書IDが示す文書データである。画面341では、クエリと最も一致の度合いが高い文書データにおける、出力軸「プレミア」、「落ち着き」、「ガッツリ」のそれぞれのスコアと、複数の検索結果集合データとして抽出された他の文書データとして表示される。   The search result set data 343 is document data indicated by the document ID specified by the search process. In the screen 341, the score of each of the output axes "premium", "calminess", "guzzling" and the other document data extracted as a plurality of search result collection data in the document data having the highest degree of matching with the query Is displayed.

ここで、印象語のスコアが変更された場合の検索結果集合データの表示について説明する。印象語のスコアと対応する検索結果(検索結果集合データ)の数は、抽出された複数の検索結果集合データにおけるスコアの分布によって異なる。このため、スケール上でスライダを移動させてスコアの値を変更した場合、多数の検索結果集合データが抽出されたり、わずかな検索結果集合データしか抽出されなかったりする可能性がある。   Here, the display of the search result set data when the score of the impression word is changed will be described. The number of search results (search result set data) corresponding to the impression word score differs depending on the distribution of the scores in the plurality of extracted search result set data. Therefore, when the slider is moved on the scale to change the score value, a large number of search result set data may be extracted, or only a small number of search result set data may be extracted.

図35は、印象語のスコアの変更について説明する図である。図35(a)は、出力軸とされた印象語「落着き」、「ガッツリ」のそれぞれのスコアの分布を示す図である。図35(b)は、スライダが示すスコアと検索結果集合データの関係を示す図である。   FIG. 35 is a diagram for explaining the change of the score of the impression word. FIG. 35 (a) is a diagram showing the distribution of the score of each of the impression words "settling" and "guzzling" set as the output axis. FIG. 35 (b) is a diagram showing the relationship between the score indicated by the slider and the search result set data.

図35(a)に示すように、印象語「落着き」は、検索結果集合データに対するスコアの偏りが小さく、印象語「ガッツリ」は、検索結果集合データに対するスコアの偏りが大きい。   As shown in FIG. 35 (a), the impression word "decision" has a small bias in the score with respect to the search result set data, and the impression word "gatsy" has a large bias in the score with respect to the search result set data.

ここで、図35(b)に示すように、例えば、スケールの始点であるスライダ停止位置(スライダ値「0」)と、スケールの終点であるスライダ停止位置(スライダ値「6」)との間に、等間隔に5つのスライダ停止位置(スライダ値「1」〜「5」)を設け、各スライダ停止位置にスライダを合わせてスコアを変更する場合を考える。   Here, as shown in FIG. 35 (b), for example, between the slider stop position (slider value “0”) which is the start point of the scale and the slider stop position (slider value “6”) which is the end point of the scale Let us consider a case in which five slider stop positions (slider values “1” to “5”) are provided at equal intervals, and the slider is adjusted to each slider stop position to change the score.

この場合、印象語「落着き」は、スコアの偏りが小さいため、スライダをどのスライダ停止位置に合わせても、ある程度の数の検索結果集合データの数が出力される。   In this case, since the impression word "decision" has a small score deviation, a certain number of search result set data is output regardless of the slider stop position.

これに対し、印象語「ガッツリ」は、スコアの偏りが大きいため、スライダ停止位置によっては、検索結果集合データがまったく出力されなかったり、多数の検索結果集合データが出力されたりする可能性がある。言い換えれば、印象語「ガッツリ」は、スケール上でスライダを移動させてスコアを変更した場合に、検索結果集合データが適切に出力されない可能性がある。   On the other hand, because the impression word "gatsuri" has a large score bias, there is a possibility that search result set data may not be output at all or many search result set data may be output depending on the slider stop position. . In other words, there is a possibility that the search result set data may not be output properly when the impression word "gatsuri" moves the slider on the scale to change the score.

そこで、本実施形態では、出力軸とされた印象語のスコアの分布を算出し、スケールにおけるスライダ停止位置とスコアの分布に応じたスコアの変動幅とを対応付ける。言い換えれば、本実施形態によれば、出力軸毎に、スコアの変動幅と対応して表示される検索結果集合データの数が所定数となるように、スケールにおける各スライダ停止位置とスコアの変動幅とを対応づけて表示させる。尚、所定数とは、一定の数であっても良いし、所定の範囲内の数であっても良い。具体的には、スコアの変動幅に対応しで表示される検索結果集合データの数を10件としても良いし、8〜12件としても良い。   So, in this embodiment, distribution of the score of the impression word made into the output axis is calculated, and the slider stop position in a scale and the fluctuation range of the score according to distribution of a score are matched. In other words, according to the present embodiment, the variation of each slider stop position and score on the scale is made such that the number of search result set data displayed corresponding to the variation range of the score becomes a predetermined number for each output axis. Display the display in correspondence with the width. The predetermined number may be a fixed number or a number within a predetermined range. Specifically, the number of pieces of search result set data displayed corresponding to the fluctuation range of the score may be ten, or may be eight to twelve.

本実施形態では、この対応付けを行うことで、スケール上でスライダを移動させた際に、一定数の検索結果集合データを表示させることができる。   In this embodiment, by performing this association, it is possible to display a fixed number of search result aggregate data when moving the slider on the scale.

また、本実施形態によれば、出力軸(印象語)のスコアを変更し、変更後のスコアと対応する検索結果集合データをユーザに提示する。したがって、本実施形態によれば、例えば、クエリから推定されるスコアからユーザが望む情報が得られなかった場合等には、印象語のスコアを変更した新たな検索結果をユーザに提供することができる。   Further, according to the present embodiment, the score of the output axis (impression word) is changed, and search result aggregate data corresponding to the changed score is presented to the user. Therefore, according to the present embodiment, for example, when information desired by the user can not be obtained from the score estimated from the query, a new search result in which the score of the impression word is changed is provided to the user. it can.

以下に、図36を参照して、本実施形態の検索装置200Eの機能について説明する。
図36は、第六の実施形態の検索装置の機能を説明する図である。
The function of the search device 200E of this embodiment will be described below with reference to FIG.
FIG. 36 is a diagram for explaining the function of the search device of the sixth embodiment.

本実施形態の検索装置200Eは、検索対象インデックス記憶部210、印象語マップ記憶部220、検索対象スコア記憶部230A、検索処理部240Eを有する。   The search device 200E of the present embodiment includes a search target index storage unit 210, an impression word map storage unit 220, a search target score storage unit 230A, and a search processing unit 240E.

本実施形態の検索処理部240Eは、入力受付部241、解析部242、検索部243、印象語スコア出力部244、軸決定部245、出力部246A、インデックス生成部247、印象空間学習部248、スコア分布算出部260、スケール算出部261を有する。   The search processing unit 240E of the present embodiment includes an input reception unit 241, an analysis unit 242, a search unit 243, an impression word score output unit 244, an axis determination unit 245, an output unit 246A, an index generation unit 247, an impression space learning unit 248, A score distribution calculation unit 260 and a scale calculation unit 261 are included.

本実施形態のスコア分布算出部260は、軸決定部245により、出力軸に決定された印象語毎に、スコアの分布を算出する。より具体的には、スコア分布算出部260は、軸決定部245により、出力軸に決定された印象語毎に、印象語スコアリスト231Aにおけるスコアの分布を示すヒストグラムを生成する。   The score distribution calculation unit 260 of the present embodiment calculates the distribution of scores for each impression word determined to be the output axis by the axis determination unit 245. More specifically, the score distribution calculation unit 260 causes the axis determination unit 245 to generate a histogram indicating the distribution of scores in the impression word score list 231A for each impression word determined to be the output axis.

本実施形態のスケール算出部261は、スコア分布算出部260により算出されたスコアの分布に基づき、印象語のスコアを示すスケールに付されたスライダ停止位置と対応するスコアの変動幅を算出する。具体的には、スケール算出部261は、スライダ値にスコアの変動幅を対応付けた対応テーブル410を作成し、保持する。   The scale calculation unit 261 according to the present embodiment calculates a fluctuation range of the score corresponding to the slider stop position attached to the scale indicating the score of the impression word based on the distribution of the score calculated by the score distribution calculation unit 260. Specifically, the scale calculation unit 261 creates and holds the correspondence table 410 in which the slider value is associated with the fluctuation range of the score.

スコア分布算出部260、スケール算出部261の処理と、対応テーブル410の詳細は後述する。   The processes of the score distribution calculation unit 260 and the scale calculation unit 261 and the details of the correspondence table 410 will be described later.

本実施形態の出力部246Aは、対応テーブル410を参照して、検索結果集合データのレーダチャートを表示させる。   The output unit 246A of the present embodiment refers to the correspondence table 410 to display the radar chart of the search result set data.

以下に、図37を参照して、本実施形態の検索処理部240Eの処理について説明する。図37は、第六の実施形態の検索処理部の処理を説明する第一のフローチャートである。   The processing of the search processing unit 240E of the present embodiment will be described below with reference to FIG. FIG. 37 is a first flowchart illustrating processing of the search processing unit of the sixth embodiment.

図37のステップS3701からステップS3704までの処理は、図9のステップS901からステップS904までの処理と同様であるから、説明を省略する。   The processing from step S3701 to step S3704 in FIG. 37 is the same as the processing from step S901 to step S904 in FIG.

ステップS3704において、軸決定部245により、クエリとの関連が明確なn個の印象語が抽出されて、α軸に設定されると、検索処理部240Eは、スコア分布算出部260により、ステップS3701で特定された複数の検索結果集合データにおける出力軸(α軸)毎のスコアの分布を算出する(ステップS3705)。   In step S3704, when the axis determination unit 245 extracts n impression words having a clear relationship with the query and sets them on the α axis, the search processing unit 240E causes the score distribution calculation unit 260 to perform step S3701. The distribution of the score for each output axis (α axis) in the plurality of search result set data specified in (4) is calculated (step S3705).

続いて、検索処理部240Eは、スケール算出部261により、出力軸毎に、スライダ停止位置とスコアの変動幅とを対応付ける(ステップS3706)。   Subsequently, the search processing unit 240E causes the scale calculation unit 261 to associate the slider stop position with the fluctuation range of the score for each output axis (step S3706).

続いて、検索処理部240Eは、出力部246Aにより、α軸を設定したときの印象語のスコアをスケール上の初期値に設定する(ステップS3707)。   Subsequently, the search processing unit 240E causes the output unit 246A to set the score of the impression word when the α axis is set to an initial value on the scale (step S3707).

続いて、出力部246Aは、検索結果集合データを、出力軸となる印象語と対応するスケール及びスライダと共に描画し(ステップS3708)、処理を終了する。   Subsequently, the output unit 246A draws the search result set data together with the scale and the slider corresponding to the impression word serving as the output axis (step S3708), and ends the processing.

次に、図38を参照して、本実施形態のスコア分布算出部260の処理について説明する。図38は、第六の実施形態の検索処理部の処理を説明する第二のフローチャートである。図38では、図37のステップS3705の処理の詳細を示している。   Next, processing of the score distribution calculation unit 260 of the present embodiment will be described with reference to FIG. FIG. 38 is a second flowchart to explain the processing of the search processing unit of the sixth embodiment. FIG. 38 shows details of the process of step S3705 of FIG.

本実施形態のスコア分布算出部260は、軸決定部245によって決定された出力軸のうち、一つを選択し、他の出力軸のスコアを固定する(ステップS3801)。続いて、スコア分布算出部260は、選択した出力軸のスコアを変更する(ステップS3802)。尚、ここで、選択された出力軸のスコアは、所定間隔毎に増減されても良い。より具体的には、例えば、出力軸のスコアの最小値を0、最大値を10とした場合、スコアを0、1、2、・・・、10というように変更していく。   The score distribution calculation unit 260 according to the present embodiment selects one of the output axes determined by the axis determination unit 245, and fixes the scores of the other output axes (step S3801). Subsequently, the score distribution calculation unit 260 changes the score of the selected output axis (step S3802). Here, the score of the selected output axis may be increased or decreased at predetermined intervals. More specifically, for example, assuming that the minimum value of the score of the output axis is 0 and the maximum value is 10, the score is changed to 0, 1, 2,.

続いて、スコア分布算出部260は、選択された出力軸のスコアが変更された状態で、各出力軸のスコアと、検索結果集合データとして抽出された文書データと対応する各印象語のスコアとのベクトルマッチングを行う(ステップS3803)。具体的には、スコア分布算出部260は、コサイン類似度に基づくベクトルマッチングを行っても良い。尚、検索結果集合データとして、複数の文書データが抽出されているものとする。   Subsequently, in a state where the score of the selected output axis is changed, the score distribution calculation unit 260 calculates the score of each output axis, the score of each impression word corresponding to the document data extracted as the search result set data, Vector matching is performed (step S3803). Specifically, the score distribution calculation unit 260 may perform vector matching based on cosine similarity. It is assumed that a plurality of document data are extracted as search result set data.

続いて、スコア分布算出部260は、ベクトルマッチングの結果が所定の閾値以上となる文書IDを特定し、特定された文書IDの数を取得する(ステップS3804)。   Subsequently, the score distribution calculation unit 260 identifies a document ID for which the result of vector matching is equal to or greater than a predetermined threshold, and acquires the number of identified document IDs (step S3804).

続いて、スコア分布算出部260は、選択した出力軸のスコアを最小値から最大値まで変更したか否かを判定する(ステップS3805)。言い換えれば、スコア分布算出部260は、スコアの最小値から最大値までについて、所定の間隔毎に、ベクトルマッチングを行ったか否かを判定している。   Subsequently, the score distribution calculation unit 260 determines whether or not the score of the selected output axis has been changed from the minimum value to the maximum value (step S3805). In other words, the score distribution calculating unit 260 determines whether or not vector matching has been performed at predetermined intervals for the minimum value and the maximum value of the score.

ステップS3805において、スコアの最小値から最大値までについて所定の間隔毎にベクトルマッチングを行っていない場合、スコア分布算出部260は、ステップS3802に戻る。   In step S3805, when the vector matching is not performed at predetermined intervals for the minimum value and the maximum value of the score, the score distribution calculation unit 260 returns to step S3802.

ステップS3805において、スコア最小値から最大値までについて所定の間隔毎にベクトルマッチングを行った場合、スコア分布算出部260は、所定の間隔毎の文書IDの数から、ヒストグラムを生成する(ステップS3806)。   In step S3805, when vector matching is performed for each predetermined interval from the score minimum value to the maximum value, the score distribution calculation unit 260 generates a histogram from the number of document IDs for each predetermined interval (step S3806). .

続いて、スコア分布算出部260は、全ての出力軸について、ステップS3801からステップS3806までの処理を行ったか否かを判定する(ステップS3807)。尚、ここでは、スコア分布算出部260は、出力軸のうち、α軸について、ステップS3801からステップS3806までの処理を行ったか否かを判定しても良い。   Subsequently, the score distribution calculation unit 260 determines whether or not the processing from step S3801 to step S3806 has been performed for all output axes (step S3807). Here, the score distribution calculation unit 260 may determine whether or not the processing from step S3801 to step S3806 has been performed for the α axis among the output axes.

ステップS3807において、全ての出力軸について処理が行われていない場合、スコア分布算出部260は、ステップS3801に戻る。ステップS3807において、全ての出力軸について処理が行われると、スコア分布算出部260は、処理を終了する。   In step S3807, when the process is not performed on all the output axes, the score distribution calculating unit 260 returns to step S3801. When the process is performed on all the output axes in step S3807, the score distribution calculating unit 260 ends the process.

次に、図39を参照して、本実施形態のスケール算出部261の処理について説明する。図39は、第六の実施形態の検索処理部の処理を説明する第三のフローチャートである。図38では、図37のステップS3706の処理の詳細を示している。   Next, with reference to FIG. 39, the process of the scale calculation unit 261 of the present embodiment will be described. FIG. 39 is a third flowchart to explain the processing of the search processing unit of the sixth embodiment. FIG. 38 shows the details of the process of step S3706 of FIG.

本実施形態のスケール算出部261は、出力軸毎に、スコアの範囲(最小値から最大値まで)と、ヒストグラムと、ヒストグラムの生成に際して取得された文書IDの数Xを取得する(ステップS3901)。   The scale calculation unit 261 of the present embodiment acquires the score range (from the minimum value to the maximum value), the histogram, and the number X of document IDs acquired at the time of generation of the histogram for each output axis (step S3901) .

続いて、スケール算出部261は、出力軸毎に、スケール上に付されるスライダ値(目盛り)の数Nを取得する(ステップS3902)。   Subsequently, the scale calculation unit 261 acquires, for each output axis, the number N of slider values (scales) attached on the scale (step S3902).

続いて、スケール算出部261は、出力軸を選択し(ステップS3903)、スライダ値と対応する文書IDの数が、X/Nとなるように、対応テーブルを作成する(ステップS3904)。   Subsequently, the scale calculation unit 261 selects an output axis (step S3903), and creates a correspondence table such that the number of document IDs corresponding to the slider value becomes X / N (step S3904).

続いて、スケール算出部261は、全ての出力軸について、対応テーブルを作成したか否かを判定する(ステップS3905)。ステップS3905において、全ての出力軸に対して対応テーブルを作成していない場合、スケール算出部261は、ステップS3903に戻る。   Subsequently, the scale calculation unit 261 determines whether or not correspondence tables have been created for all output axes (step S3905). In step S3905, when the correspondence table has not been created for all output axes, the scale calculation unit 261 returns to step S3903.

ステップS3905において、全ての出力軸に対して対応テーブルを作成した場合、スケール算出部261は、処理を終了する。   If correspondence tables have been created for all output axes in step S3905, the scale calculation unit 261 ends the process.

ここで、図40を参照して、本実施形態のスコア分布算出部260とスケール算出部261の処理について具体的に説明する。図40は、第六の実施形態のスコアとスライダ値との対応付けを説明する図である。図40(a)は、ヒストグラムの一例を示す図であり、図40(b)はスコアとスライダ値との対応付けの例を示す図である。   Here, processing of the score distribution calculation unit 260 and the scale calculation unit 261 according to the present embodiment will be specifically described with reference to FIG. FIG. 40 is a diagram for explaining the correspondence between the score and the slider value according to the sixth embodiment. FIG. 40 (a) is a diagram showing an example of a histogram, and FIG. 40 (b) is a diagram showing an example of correspondence between a score and a slider value.

図40(a)では、横軸が出力軸「プレミア」のスコアを示しており、縦軸が、ベクトルマッチングの結果が閾値以上となった文書IDの数を示す。   In FIG. 40A, the horizontal axis indicates the score of the output axis "premium", and the vertical axis indicates the number of document IDs for which the result of vector matching is equal to or greater than the threshold.

出力軸「プレミア」では、図40(a)からわかるように、スコアの範囲が0〜10であり、スコアが2〜5の間は、対応する検索結果集合データが多数存在するが、スコアが8以上である場合や2未満である場合等には、対応する検索結果集合データは、ほぼ存在しない。   On the output axis "Premier", as shown in FIG. 40A, the score range is 0 to 10, and a large number of corresponding search result set data exists between the score and 2 to 5, but the score is When the number is 8 or more, the number is less than 2, etc., the corresponding search result set data is substantially nonexistent.

したがって、本実施形態では、出力軸「プレミア」を、スケールとして表示させる場合、スライダ値(目盛り)と、文書IDの数とを対応付ける。   Therefore, in the present embodiment, when the output axis "premium" is displayed as a scale, the slider value (scale) is associated with the number of document IDs.

図40(b)は、出力軸「プレミア」に関する対応テーブルの一例である。この場合、スライダ値「0」とスコア「0〜3.5」、スライダ値「1」と、スコア「3.5〜3.8」、スライダ値「2」と、スコア「3.8〜4.6」が対応付けられている。   FIG. 40 (b) is an example of the correspondence table on the output axis "premium". In this case, the slider value “0”, the score “0 to 3.5”, the slider value “1”, the score “3.5 to 3.8”, the slider value “2”, and the score “3.8 to 4 .6 "are associated with each other.

つまり、出力軸「プレミア」のスケールにおいて、スライダがスライダ値「0」の位置とされた場合には、抽出された検索結果集合データのうち、印象語「プレミア」のスコアが0〜3.5となる文書IDと対応する文書データが表示される。また、出力軸「プレミア」のスケールにおいて、スライダがスライダ値「1」の位置とされた場合には、抽出された検索結果集合データのうち印象語「プレミア」のスコアが3.5〜3.8となる文書IDと対応する文書データが表示される。   That is, when the slider is positioned at the slider value "0" on the scale of the output axis "premium", the score of the impression word "premium" in the extracted search result set data is 0 to 3.5. The document data corresponding to the document ID that is displayed is displayed. When the slider is positioned at the slider value “1” on the scale of the output axis “premium”, the score of the impression word “premium” in the extracted search result set data is 3.5 to 3. Document data corresponding to the document ID of 8 is displayed.

このように、本実施形態では、出力軸のスケールに付されるスライダ値とスコアの変動幅とを対応づけることで、スライダがスケール上のどのスライダ値で停止されても、出力される検索結果集合データの数を同等とすることができる。本実施形態では、出力軸全てについて、この対応付けを行い、対応テーブル410として保持する。   As described above, in the present embodiment, by associating the slider value attached to the scale of the output axis with the fluctuation range of the score, the search result output even if the slider is stopped at any slider value on the scale The number of aggregate data can be made equal. In the present embodiment, this correspondence is performed for all the output axes, and held as the correspondence table 410.

図41は、第六の実施形態の対応テーブルの一例を示す図である。図41に示す対応テーブル410では、出力軸「プレミア」、「隠れ家」、「ヘルシー」のそれぞれについて、スライダ値とスコアの変動幅とが対応付けられている。   FIG. 41 is a diagram showing an example of the correspondence table of the sixth embodiment. In the correspondence table 410 shown in FIG. 41, the slider value is associated with the fluctuation range of the score for each of the output axes "premium", "hidden", and "healthy".

対応テーブル410では、スライダ値「0」に対して、出力軸「プレミア」はスコア「0〜3.5」が対応付けられており、出力軸「隠れ家」ではスコア「0〜2.8」が対応付けられており、出力軸「ヘルシー」ではスコア「0〜2.9」が対応付けられている。   In the correspondence table 410, for the slider value "0", the score "0 to 3.5" is associated with the output axis "premium", and the score "0 to 2.8" is associated with the output axis "hidden" In the output axis “healthy”, scores “0 to 2.9” are associated.

また、対応テーブル410では、スライダ値「1」に対して、出力軸「プレミア」はスコア「3.5〜3.8」が対応付けられており、出力軸「隠れ家」ではスコア「2.8〜3.6」が対応付けられており、出力軸「ヘルシー」ではスコア「2.9〜3.2」が対応付けられている。   In the correspondence table 410, the output axis "premium" is associated with the score "3.5 to 3.8" with the slider value "1", and the output axis "hidden" has a score "2.8". .About.3.6 "are associated, and on the output axis" healthy ", scores" 2.9 to 3.2 "are associated.

図42は、第六の実施形態の表示の一例を示す図である。図42に示す画面421は、例えば、端末装置300等に表示される。   FIG. 42 is a diagram showing an example of display of the sixth embodiment. The screen 421 illustrated in FIG. 42 is displayed on, for example, the terminal device 300 or the like.

画面421には、入力欄422と、結果表示欄423とが表示される。入力欄422は、クエリを入力するためのクエリ入力欄424と、検索要求を行う検索ボタン425と、各出力軸と対応した複数のスケール426とが表示されている。複数のスケール426上には、それぞれにスライダ426aが表示されており、スケール上でスライダを移動させることで、対応する出力軸のスコアが変更される。   In the screen 421, an input field 422 and a result display field 423 are displayed. The input field 422 displays a query input field 424 for entering a query, a search button 425 for making a search request, and a plurality of scales 426 corresponding to each output axis. Sliders 426a are respectively displayed on the plurality of scales 426, and moving the sliders on the scales changes the score of the corresponding output axis.

結果表示欄423には、クエリ入力欄424に入力されたクエリに基づき特定された文書データが検索結果集合データとして表示される。図42の例では、検索結果として、検索結果集合データ427、428、429が表示される。   In the result display field 423, document data specified based on the query input in the query input field 424 is displayed as search result collection data. In the example of FIG. 42, search result set data 427, 428, 429 are displayed as search results.

本実施形態では、複数のスケール426の少なくとも何れかにおいて、スライダ426aが操作されてスコアが変更されると、スコアの変更に伴って、結果表示欄423に表示される検索結果集合データも変更される。   In the present embodiment, when the slider 426a is operated and the score is changed in at least one of the plurality of scales 426, the search result set data displayed in the result display column 423 is also changed along with the change of the score. Ru.

このように、本実施形態では、クエリに基づく検索語群から推定された印象語のスコアを変更して検索を行う際に、印象語のスコアの変更に応じて適切な数の検索結果集合データを表示させることができる。   As described above, in the present embodiment, when performing a search by changing the score of the impression word estimated from the search word group based on the query, an appropriate number of search result set data is provided according to the change of the score of the impression word. Can be displayed.

尚、本実施形態では、印象語のスコアを変更するための表示形態として、スライダ値が付されたスケール上でスコアを変更する形態を説明したが、表示形態はこれに限定されない。本実施形態では、スコアの変更を受け付け、変更後のスコアと対応する検索結果集合データを表示させる形態であれば、どのような表示態様であっても良い。例えば、スコアを入力する入力欄を設け、この入力欄に対するスコアの入力によって、印象語のスコアの変更を受け付けるものとしても良い。   In the present embodiment, as the display form for changing the score of the impression word, the form in which the score is changed on the scale to which the slider value is attached has been described, but the display form is not limited thereto. In the present embodiment, any display mode may be used as long as it is a mode in which change in the score is accepted and search result aggregate data corresponding to the changed score is displayed. For example, an input field for inputting a score may be provided, and a change in the score of an impression word may be accepted by inputting the score in this input field.

また、本実施形態では、スコアの分布に偏りがある場合には、スライダで選択される範囲を限定したり、スケールの表示態様をスコアの分布に合わせた色合いで表示させても良い。   Further, in the present embodiment, when the distribution of scores is biased, the range selected by the slider may be limited, or the display mode of the scale may be displayed in a color matching the distribution of the scores.

図43は、第六の実施形態の表示の他の例を示す図である。図43(a)では、スライダで選択される範囲が限定されたスライダの表示例を示しており、図43(b)は、スコアの分布に合わせた色合いでスケールを表示させた場合の表示例を示している。   FIG. 43 is a diagram showing another example of the display of the sixth embodiment. FIG. 43 (a) shows a display example of the slider in which the range selected by the slider is limited, and FIG. 43 (b) shows a display example in the case where the scale is displayed with the color matching the distribution of the score. Is shown.

図43(a)では、出力軸「プレミア」と対応するスケール431−1、出力軸「隠れ家」と対応するスケール431−2、出力軸「ヘルシー」と対応するスケール431−3が表示されている。   In FIG. 43A, a scale 431-1 corresponding to the output axis "premium", a scale 431-2 corresponding to the output axis "hidden", and a scale 431-3 corresponding to the output axis "healthy" are displayed. .

スケール431−1では、スライダで選択することができない選択不可領域432−1と、スライダで選択することができる選択領域433−1とが含まれる。この場合、スケール431−1は、選択不可領域432−1が示すスコアの範囲には、検索結果集合データが存在せず、選択領域433−1が示すスコアの範囲に検索結果集合データが分布していることを示している。   The scale 431-1 includes a non-selectable area 432-1 which can not be selected by the slider, and a selection area 433-1 which can be selected by the slider. In this case, the scale 431-1 has no search result set data in the range of the score indicated by the non-selectable area 432-1, and the search result set data is distributed in the range of the score indicated by the selection area 433-1. Show that.

この場合、スケール算出部261は、選択領域433−1のどの位置がスライダに選択されたとしても、出力される検索結果集合データの数が同じか、又はほぼ同数となるようにすれば良い。   In this case, the scale calculation unit 261 may set the number of search result set data to be output to be the same or almost the same regardless of which position of the selection region 433-1 is selected by the slider.

同様に、スケール431−2には、選択不可領域432−2と選択領域433−2とが含まれ、スケール431−3には、選択不可領域432−3と選択領域433−3とが含まれる。   Similarly, the scale 431-2 includes the non-selectable area 432-2 and the selection area 433-2, and the scale 431-3 includes the non-selection area 432-3 and the selection area 433-3. .

尚、スケール431−1、431−2、431−3において、選択不可領域432−1、432−2、432−3は、選択領域433−1、433−2、433−3と異なる態様で表示されも良い。   In the scales 431-1, 431-2 and 431-3, the non-selectable areas 432-1, 432-2, and 432-3 are displayed in a mode different from the selected areas 433-1, 433-2, and 433-3. It is good.

本実施形態では、図43(a)のように、スケールの表示態様によって、スライダにより選択されるスコアの範囲が限定されていることをユーザに視認させることができる。   In the present embodiment, as shown in FIG. 43A, the user can visually recognize that the range of the score selected by the slider is limited by the display mode of the scale.

図43(b)では、出力軸「プレミア」と対応するスケール434−1、出力軸「隠れ家」と対応するスケール434−2、出力軸「ヘルシー」と対応するスケール434−3が表示されている。   In FIG. 43 (b), the scale 434-1 corresponding to the output axis "premium", the scale 434-2 corresponding to the output axis "hidden", and the scale 434-3 corresponding to the output axis "healthy" are displayed. .

図43(b)の例では、各スケールにおける選択領域435−1、435−2、435−3において、検索結果集合データの数が多い範囲から領域から順に、赤色の濃度を高くして表示させている。   In the example of FIG. 43 (b), in the selection areas 435-1, 435-2, and 435-3 in each scale, the red density is increased and displayed in order from the area having a large number of search result set data. ing.

本実施形態では、このようにスケールを表示させることで、ユーザに対して、検索結果集合データの数が多く存在しているスコアの範囲を視認させることができる。この場合、ユーザは、他の検索結果集合データを表示させたい場合には、濃い赤色の領域をスライダで選択すれば良い。   In this embodiment, by displaying the scale in this manner, it is possible to make the user visually recognize the range of the score in which a large number of search result set data exist. In this case, the user may select a dark red area with the slider when it is desired to display other search result set data.

このように、本実施形態によれば、検索結果集合データを表示させる際の項目となる印象語と、クエリとの関連の強さを示すスコアを変更した場合でも、適切な数の検索結果集合データを出力することができる。   As described above, according to the present embodiment, an appropriate number of search result sets are obtained even when the score indicating the strength of the association with the impression word serving as the item when displaying the search result set data is changed. Data can be output.

(第七の実施形態)
以下に図面を参照して第七の実施形態について説明する。第七の実施形態は、スライダ値と対応づけるスコアの範囲を限定する点が、第六の実施形態と相違する。よって、以下の第七の実施形態の説明では、第六の実施形態との相違点について説明し、第六の実施形態と同様の機能構成を有するものには、第六の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
Seventh Embodiment
The seventh embodiment will be described below with reference to the drawings. The seventh embodiment is different from the sixth embodiment in that the range of the score to be associated with the slider value is limited. Therefore, in the following description of the seventh embodiment, the differences from the sixth embodiment will be described, and for those having the same functional configuration as the sixth embodiment, the sixth embodiment will be described. The same code as the used code is given and the explanation is omitted.

図44は、第七の実施形態のスコアとスライダ値との対応付けを説明する図である。   FIG. 44 is a diagram for explaining the correspondence between the score and the slider value according to the seventh embodiment.

図44では、横軸が出力軸「プレミア」のスコアを示しており、縦軸が、ベクトルマッチングの結果が閾値以上となった文書IDの数を示す。また、図44の例では、出力軸「プレミア」のスコアの初期値は「6」である。初期値は、クエリと最も関連が強いとされた文書IDと対応する印象語「プレミア」のスコアである。   In FIG. 44, the horizontal axis indicates the score of the output axis "premium", and the vertical axis indicates the number of document IDs for which the result of vector matching is equal to or greater than the threshold. Further, in the example of FIG. 44, the initial value of the score of the output axis "premium" is "6". The initial value is the score of the impression word “premier” corresponding to the document ID most strongly associated with the query.

そこで、図44の例では、初期値を中心とした所定の範囲Hをスコアの範囲として、スライダ値と、スコアの変動幅とを対応づける。尚、所定の範囲Hは、予め設定されるものであって良い。   So, in the example of FIG. 44, the slider value and the fluctuation range of a score are matched by making the predetermined range H centering on an initial value into the range of a score. The predetermined range H may be set in advance.

具体的には、本実施形態では、スコアの最小値を「4」、最大値「8」として、スコア「4〜8」の範囲を、スケール上で表現する。   Specifically, in the present embodiment, the minimum value of the score is “4” and the maximum value is “8”, and the range of the scores “4 to 8” is expressed on the scale.

図45は、第七の実施形態の検索処理部の処理を説明するフローチャートである。本実施形態のスケール算出部261は、出力軸毎に、スコアの範囲(最小値から最大値まで)と、ヒストグラムと、ヒストグラムの生成に際して取得された文書IDの数Xを取得する(ステップS4501)。   FIG. 45 is a flowchart for explaining the processing of the search processing unit of the seventh embodiment. The scale calculation unit 261 of the present embodiment acquires the score range (from the minimum value to the maximum value), the histogram, and the number X of document IDs acquired at the time of generation of the histogram for each output axis (step S4501) .

続いて、スケール算出部261は、出力軸毎に、予め設定された所定の範囲のスコアと対応する検索結果集合データの数Yを取得する(ステップS4502)。   Subsequently, the scale calculation unit 261 acquires, for each output axis, the number Y of search result aggregate data corresponding to the score of the predetermined range set in advance (step S4502).

図45のステップS4503とステップS4504の処理は、図39のステップS3902とステップS3903の処理と同様であるから説明を省略する。   The processes of steps S4503 and S4504 of FIG. 45 are the same as the processes of steps S3902 and S3903 of FIG.

続いて、スケール算出部261は、選択された出力軸について、スライダ値と対応する文書IDの数が、Y/Nとなるように、対応テーブルを作成する(ステップS4505)。   Subsequently, the scale calculation unit 261 creates a correspondence table such that the number of document IDs corresponding to the slider value is Y / N for the selected output axis (step S4505).

図45のステップS4506の処理は、図39のステップS3905の処理と同様であるから説明を省略する。   The processing in step S4506 in FIG. 45 is the same as the processing in step S3905 in FIG.

図46は、第七の実施形態の対応テーブルの一例を示す図である。図46に示す対応テーブル460では、スライダ値0〜5に対して、スコア4〜8が対応づけられている。   FIG. 46 is a diagram showing an example of the correspondence table of the seventh embodiment. In the correspondence table 460 illustrated in FIG. 46, scores 4 to 8 are associated with slider values 0 to 5, respectively.

よって、本実施形態では、出力軸「プレミア」のスケールにおいて、スライダ値0〜5まで移動させても、スコアが4未満又はスコアが8より大きい検索結果集合データは出力されない。   Therefore, in the present embodiment, even if the slider value is moved to 0 to 5 on the scale of the output axis "premium", the search result set data having a score less than 4 or a score greater than 8 is not output.

本実施形態では、このように、スライダ値と対応づけるスコアの範囲を限定することで、入力されたクエリと関連の低い検索結果集合データが出力されることを抑制できる。   In this embodiment, by thus limiting the range of the score to be associated with the slider value, it is possible to suppress the output of search result set data having a low association with the input query.

開示の技術では、以下に記載する付記のような形態が考えられる。
(付記1)
コンピュータによる検索方法であって、該コンピュータが、
クエリに基づき、検索語群を特定し、
検索対象データより、前記検索語群を用いて検索結果集合データを取得し、
前記クエリより、第1特徴語群を抽出し、
前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる、検索方法。
(付記2)
前記検索結果集合データから第2特徴語群を抽出し、
前記検索結果集合データを、前記第1特徴語群及び前記第2特徴語群を項目として用いて表示させる、付記1記載の検索方法。
(付記3)
前記検索語群に含まれる単語毎に、印象語群に含まれる各印象語と前記単語との関連の強さを示す値と、前記関連の強さを示す値のばらつきを示す値とを取得し、
前記第1特徴語群に、前記ばらつきを示す値が閾値より大きい印象語が含まれる場合に、前記第1特徴語群の候補となる第3特徴語群を通知する、付記1記載の検索方法。
(付記4)
前記ばらつきを示す値が閾値より大きい印象語と、前記第3特徴語群とを対応付けて表示させる、付記3記載の検索方法。
(付記5)
前記検索語群に含まれる単語を分散表現によりベクトルに変換し、
前記ベクトルが入力されると、印象語群と、前記印象語群に含まれる各印象語と前記単語との関連の強さを示す値と、を出力する変換モデルにより、前記検索語群に含まれる単語毎に、前記各印象語との関連の強さを示す値を取得し、
前記印象語群から、前記単語毎の前記関連の強さを示す値に応じて、前記第1特徴語群を抽出する、付記1乃至4の何れか一項に記載の検索方法。
(付記6)
前記第1特徴語群は、
前記印象語群に含まれる印象語のうち、前記単語毎の前記関連の強さを示す値の最大値が大きい印象語から順に、所定個数抽出された印象語である、付記5記載の検索方法。
(付記7)
前記印象語群から、
前記第1特徴語群以外の第2特徴語群を抽出し、前記検索結果集合データを、前記第1特徴語群及び前記第2特徴語群を項目として用いて表示させる、付記5又は6記載の検索方法。
(付記8)
前記印象語群に含まれる印象語のうち、前記第1特徴語群として抽出された印象語よりも、前記単語毎の前記関連の強さを示す値の最大値が小さい印象語を抽出し、
抽出された前記印象語のうち、前記単語毎の前記関連の強さを示す値の分散が大きい印象語から順に所定個数抽出された印象語を、前記第2特徴語群とする、付記7記載の検索方法。
(付記9)
前記検索対象データに含まれる文書データ毎に、前記文書データに含まれる単語群を特定し、
前記単語群に含まれる単語から変換されたベクトルと、前記変換モデルと、に基づき、前記単語毎に、前記各印象語との関連の強さを示す値を取得し、
前記単語毎の前記各印象語との関連の強さを示す値から、前記文書データと前記各印象語との関連の強さを示す値を取得し、
前記文書データが前記検索結果集合データとして取得されると、前記文書データと前記各印象語との関連の強さを示す値を参照し、前記文書データと、前記第1特徴語群とされた印象語との関連の強さを示す値を、前記項目の値として表示させる、付記5乃至8の何れか一項に記載の検索方法。
(付記10)
前記ばらつきを示す値は、前記関連の強さを示す値の標準偏差であり、
前記第3特徴語群は、
前記印象語群のうち、前記第1特徴語群以外の印象語であって、前記関連の強さを示す値が、前記標準偏差が所定の閾値より大きい印象語の前記関連の強さを示す値から前記標準偏差を減算した値より大きくした値となる印象語である、付記9記載の検索方法。
(付記11)
前記第3特徴語群に含まれる印象語の選択を受け付け、
前記検索結果集合データを、前記第1特徴語群のうち、前記標準偏差が所定の閾値以下の印象語と、前記第3特徴語群から選択された前記印象語と、を項目として用いて表示させる、付記10記載の検索方法。
(付記12)
前記第1特徴語群において、表示を維持させる指定がされた印象語が存在する場合、
前記指定された印象語と、前記第3特徴語群から選択された前記印象語と、を前記項目に含める、付記11記載の検索方法。
(付記13)
前記表示を維持させる印象語を指定する操作を受け付けて、前記表示を維持させる印象語と、各単語との関連の強さを示す値を補正するための第一の補正値と、を対応付けて記憶部に保持させ、
前記第3特徴語群から印象語を選択する操作を受け付けて、前記第3特徴語群から選択された印象語と、各単語との関連の強さを示す値を補正する第二の補正値と、を対応付けて記憶部に保持させる、付記12記載の検索方法。
(付記14)
前記第1特徴語群として抽出された印象語毎に、
複数の前記検索結果集合データに対し、前記検索結果集合データと前記印象語との関連の強さを示す値の分布を算出し、
前記分布に基づき、前記印象語との関連の強さを示す値の変動幅と対応する前記検索結果集合データの数が所定数となるように、前記印象語との関連の強さを示す値を示すスケールを表示させる、付記5乃至13の何れか一項に記載の検索方法。
(付記15)
前記スケールには、前記印象語との関連の強さを示す値の変更を受け付けるスライダが共に表示されており、
前記スケールにおいて前記スライダが停止する位置と、前記印象語との関連の強さを示す値の変動幅とを対応付ける、付記14記載の検索方法。
(付記16)
前記単語毎の前記関連の強さを示す値の最大値を初期値とし、
前記スケールにおいて、前記初期値と対応する位置に前記スライダを表示させる、付記15記載の検索方法。
(付記17)
前記分布に基づき、
前記印象語との関連の強さを示す値の範囲の一部と、前記検索結果集合データの数とを対応付ける、付記14乃至16の何れか一項に記載の検索方法。
(付記18)
クエリに基づき、検索語群を特定し、
検索対象データより、前記検索語群を用いて検索結果集合データを取得し、
前記クエリより、第1特徴語群を抽出し、
前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる、処理を、コンピュータに実行させる検索プログラム。
(付記19)
クエリに基づき、検索語群を特定する特定部と、
検索対象データより、前記検索語群を用いて検索結果集合データを取得する検索部と、
前記クエリより、第1特徴語群を抽出する抽出部と、
前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる出力部と、を有する検索装置。
In the disclosed technology, forms such as those described below can be considered.
(Supplementary Note 1)
A computer-based search method comprising:
Identify search terms based on the query,
The search result set data is obtained from the search target data using the search word group,
The first feature word group is extracted from the query,
A search method, wherein the search result set data is displayed using the first feature word group as an item.
(Supplementary Note 2)
Extracting a second feature word group from the search result set data;
The search method according to appendix 1, wherein the search result set data is displayed using the first feature word group and the second feature word group as items.
(Supplementary Note 3)
For each word included in the search word group, a value indicating the strength of the association between each impression word included in the impression word group and the word and a value indicating the variation in the value indicating the strength of the association are acquired And
The search method according to appendix 1, wherein, when the first feature word group includes an impression word whose value indicating the variation is larger than a threshold value, a third feature word group to be a candidate of the first feature word group is notified. .
(Supplementary Note 4)
The search method according to Appendix 3, wherein an impression word having a value indicating variation is larger than a threshold and the third feature word group are displayed in association with each other.
(Supplementary Note 5)
Convert the words contained in the search word group into vectors by distributed expression,
When the vector is input, the search word group is included according to a conversion model that outputs an impression word group and a value indicating the degree of association between each impression word included in the impression word group and the word. Obtain a value indicating the strength of association with each impression word for each
The search method according to any one of Appendices 1 to 4, wherein the first feature word group is extracted from the impression word group according to a value indicating the strength of the association for each word.
(Supplementary Note 6)
The first feature word group is
The search method according to appendix 5, wherein among the impression words included in the impression word group, the impression words extracted a predetermined number of in order from the impression word having the largest maximum value of the value indicating the strength of the association for each word .
(Appendix 7)
From the impression word group,
The second feature word group other than the first feature word group is extracted, and the search result set data is displayed using the first feature word group and the second feature word group as items, How to search for
(Supplementary Note 8)
Among the impression words included in the impression word group, an impression word having a smaller maximum value of the value indicating the strength of the association for each word is extracted than the impression word extracted as the first feature word group,
An impression word extracted a predetermined number of times in order from an impression word with a large distribution of a value indicating the strength of the relation among the words among the extracted impression words is set as the second feature word group, How to search for
(Appendix 9)
For each document data included in the search target data, a word group included in the document data is specified;
Based on the vector converted from the words included in the word group and the conversion model, a value indicating the strength of association with each impression word is acquired for each of the words,
The value indicating the degree of association between the document data and each impression word is acquired from the value indicating the degree of association between the word and the impression word.
When the document data is acquired as the search result set data, the document data and the first feature word group are referred to with reference to a value indicating the strength of the association between the document data and each of the impression words. The search method according to any one of appendices 5 to 8, wherein a value indicating the strength of association with an impression word is displayed as the value of the item.
(Supplementary Note 10)
The value indicating the variation is a standard deviation of the value indicating the strength of the association,
The third feature word group is
An impression word other than the first feature word group in the impression word group, wherein a value indicating the strength of the relation indicates the strength of the relation of an impression word whose standard deviation is larger than a predetermined threshold value. The search method according to appendix 9, wherein the impression word is a value obtained by subtracting the standard deviation from a value.
(Supplementary Note 11)
Accepting a selection of impression words included in the third feature word group,
The search result set data is displayed using, as items of the first feature word group, an impression word whose standard deviation is equal to or less than a predetermined threshold and the impression word selected from the third feature word group The search method according to appendix 10.
(Supplementary Note 12)
In the first feature word group, when there is an impression word specified to maintain the display,
15. The search method according to appendix 11, wherein the item includes the designated impression word and the impression word selected from the third feature word group.
(Supplementary Note 13)
An operation for specifying an impression word for maintaining the display is received, and the impression word for maintaining the display is associated with a first correction value for correcting a value indicating the strength of association with each word Storage in the storage unit,
A second correction value for correcting a value indicating the degree of association between an impression word selected from the third feature word group and each word upon receiving an operation to select an impression word from the third feature word group 15. The search method according to appendix 12, wherein the storage unit associates and holds in the storage unit.
(Supplementary Note 14)
For each impression word extracted as the first feature word group,
Calculating a distribution of values indicating strength of association between the search result set data and the impression word with respect to a plurality of the search result set data;
A value indicating the degree of association with the impression word such that the number of search result set data corresponding to the variation range of the value indicating the degree of association with the impression word is the predetermined number based on the distribution 15. The search method according to any one of appendices 5 to 13, displaying a scale indicating.
(Supplementary Note 15)
The scale also displays a slider that receives a change in value indicating the strength of association with the impression word,
The search method according to claim 14, wherein a position at which the slider stops in the scale is associated with a fluctuation range of a value indicating strength of association with the impression word.
(Supplementary Note 16)
The maximum value of the value indicating the strength of the association for each word is taken as an initial value,
15. The search method according to appendix 15, wherein the slider is displayed at a position corresponding to the initial value on the scale.
(Supplementary Note 17)
Based on the above distribution,
The search method according to any one of appendices 14 to 16, wherein part of a range of values indicating strength of association with the impression word is associated with the number of search result set data.
(Appendix 18)
Identify search terms based on the query,
The search result set data is obtained from the search target data using the search word group,
The first feature word group is extracted from the query,
A search program for causing a computer to execute processing for displaying the search result set data using the first feature word group as an item.
(Appendix 19)
An identification unit that identifies a search word group based on a query;
A search unit that acquires search result collection data from the search target data using the search word group;
An extraction unit that extracts a first feature word group from the query;
An output unit for displaying the search result set data using the first feature word group as an item.

本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。   The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes are possible without departing from the scope of the claims.

100 検索システム
111 検索語群
112 意味ベクトル
113 単語毎印象語スコア
114、231印象語スコアリスト
200、200A 検索装置
210 検索対象インデックス記憶部
211 インデックス情報
220 印象語マップ記憶部
221 印象語マップ
222 補正リスト
230 検索対象スコア記憶部
231 印象語スコアリスト
240、240A 検索処理部
241 入力受付部
242 解析部
243 検索部
244 印象語スコア出力部
245 軸決定部
246 出力部
249 候補通知部
250、250A 変換モデル
251 軸変更部
252 補正リスト生成部
253 スコア補正部
300 端末装置
100 Search System 111 Search Word Group 112 Meaning Vector 113 Impression Word Score for Each Word 114, 231 Impression Word Score List 200, 200A Search Device 210 Search Target Index Storage Unit 211 Index Information 220 Impression Word Map Storage Unit 221 Impression Word Map 222 Correction List 230 search target score storage unit 231 impression word score list 240, 240A search processing unit 241 input reception unit 242 analysis unit 243 search unit 244 impression word score output unit 245 axis determination unit 246 output unit 249 candidate notification unit 250, 250A conversion model 251 Axis change unit 252 Correction list generation unit 253 Score correction unit 300 Terminal device

Claims (12)

コンピュータによる検索方法であって、該コンピュータが、
クエリに基づき、検索語群を特定し、
検索対象データより、前記検索語群を用いて検索結果集合データを取得し、
前記クエリより、第1特徴語群を抽出し、
前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる、検索方法。
A computer-based search method comprising:
Identify search terms based on the query,
The search result set data is obtained from the search target data using the search word group,
The first feature word group is extracted from the query,
A search method, wherein the search result set data is displayed using the first feature word group as an item.
前記検索結果集合データから第2特徴語群を抽出し、
前記検索結果集合データを、前記第1特徴語群及び前記第2特徴語群を項目として用いて表示させる、請求項1記載の検索方法。
Extracting a second feature word group from the search result set data;
The search method according to claim 1, wherein the search result set data is displayed using the first feature word group and the second feature word group as items.
前記検索語群に含まれる単語毎に、印象語群に含まれる各印象語と前記単語との関連の強さを示す値と、前記関連の強さを示す値のばらつきを示す値とを取得し、
前記第1特徴語群に、前記ばらつきを示す値が閾値より大きい印象語が含まれる場合に、前記第1特徴語群の候補となる第3特徴語群を通知する、請求項1記載の検索方法。
For each word included in the search word group, a value indicating the strength of the association between each impression word included in the impression word group and the word and a value indicating the variation in the value indicating the strength of the association are acquired And
The search according to claim 1, wherein, when the first feature word group includes an impression word whose value indicating the variation is larger than a threshold value, a search is made for a third feature word group to be a candidate for the first feature word group. Method.
前記ばらつきを示す値が閾値より大きい印象語と、前記第3特徴語群とを対応付けて表示させる、請求項3記載の検索方法。   The search method according to claim 3, wherein an impression word having a value indicating the variation is larger than a threshold and the third feature word group are displayed in association with each other. 前記検索語群に含まれる単語を分散表現によりベクトルに変換し、
前記ベクトルが入力されると、印象語群と、前記印象語群に含まれる各印象語と前記単語との関連の強さを示す値と、を出力する変換モデルにより、前記検索語群に含まれる単語毎に、前記各印象語との関連の強さを示す値を取得し、
前記印象語群から、前記単語毎の前記関連の強さを示す値に応じて、前記第1特徴語群を抽出する、請求項1乃至4の何れか一項に記載の検索方法。
Convert the words contained in the search word group into vectors by distributed expression,
When the vector is input, the search word group is included according to a conversion model that outputs an impression word group and a value indicating the degree of association between each impression word included in the impression word group and the word. Obtain a value indicating the strength of association with each impression word for each
The search method according to any one of claims 1 to 4, wherein the first feature word group is extracted from the impression word group according to a value indicating the strength of the association for each word.
前記印象語群から、
前記第1特徴語群以外の第2特徴語群を抽出し、前記検索結果集合データを、前記第1特徴語群及び前記第2特徴語群を項目として用いて表示させる、請求項5記載の検索方法。
From the impression word group,
The second feature word group other than the first feature word group is extracted, and the search result set data is displayed using the first feature word group and the second feature word group as items. retrieval method.
前記印象語群に含まれる印象語のうち、前記第1特徴語群として抽出された印象語よりも、前記単語毎の前記関連の強さを示す値の最大値が小さい印象語を抽出し、
抽出された前記印象語のうち、前記単語毎の前記関連の強さを示す値の分散が大きい印象語から順に所定個数抽出された印象語を、前記第2特徴語群とする、請求項6記載の検索方法。
Among the impression words included in the impression word group, an impression word having a smaller maximum value of the value indicating the strength of the association for each word is extracted than the impression word extracted as the first feature word group,
The second feature word group includes, as the second feature word group, impression words extracted a predetermined number of impression words sequentially from the impression word having the largest variance of the value indicating the strength of the association among the extracted impression words. Search method described.
前記第1特徴語群として抽出された印象語毎に、
複数の前記検索結果集合データに対し、前記検索結果集合データと前記印象語との関連の強さを示す値の分布を算出し、
前記分布に基づき、前記印象語との関連の強さを示す値の変動幅と対応する前記検索結果集合データの数が所定数となるように、前記印象語との関連の強さを示す値を示すスケールを表示させる、請求項5乃至7の何れか一項に記載の検索方法。
For each impression word extracted as the first feature word group,
Calculating a distribution of values indicating strength of association between the search result set data and the impression word with respect to a plurality of the search result set data;
A value indicating the degree of association with the impression word such that the number of search result set data corresponding to the variation range of the value indicating the degree of association with the impression word is the predetermined number based on the distribution The search method according to any one of claims 5 to 7, wherein a scale indicating is displayed.
前記スケールには、前記印象語との関連の強さを示す値の変更を受け付けるスライダが共に表示されており、
前記スケールにおいて前記スライダが停止する位置と、前記印象語との関連の強さを示す値の変動幅とを対応付ける、請求項8記載の検索方法。
The scale also displays a slider that receives a change in value indicating the strength of association with the impression word,
The search method according to claim 8, wherein a position at which the slider stops on the scale is associated with a fluctuation range of a value indicating strength of association with the impression word.
前記単語毎の前記関連の強さを示す値の最大値を初期値とし、
前記スケールにおいて、前記初期値と対応する位置に前記スライダを表示させる、請求項9記載の検索方法。
The maximum value of the value indicating the strength of the association for each word is taken as an initial value,
The search method according to claim 9, wherein the slider is displayed at a position corresponding to the initial value on the scale.
クエリに基づき、検索語群を特定し、
検索対象データより、前記検索語群を用いて検索結果集合データを取得し、
前記クエリより、第1特徴語群を抽出し、
前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる、処理を、コンピュータに実行させる検索プログラム。
Identify search terms based on the query,
The search result set data is obtained from the search target data using the search word group,
The first feature word group is extracted from the query,
A search program for causing a computer to execute processing for displaying the search result set data using the first feature word group as an item.
クエリに基づき、検索語群を特定する特定部と、
検索対象データより、前記検索語群を用いて検索結果集合データを取得する検索部と、
前記クエリより、第1特徴語群を抽出する抽出部と、
前記検索結果集合データを、前記第1特徴語群を項目として用いて表示させる出力部と、を有する検索装置。
An identification unit that identifies a search word group based on a query;
A search unit that acquires search result collection data from the search target data using the search word group;
An extraction unit that extracts a first feature word group from the query;
An output unit for displaying the search result set data using the first feature word group as an item.
JP2018091663A 2017-10-13 2018-05-10 Search method, search program and search device Active JP7187816B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/157,636 US11023474B2 (en) 2017-10-13 2018-10-11 Search method and search device

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2017199753 2017-10-13
JP2017199753 2017-10-13
JP2018002822 2018-01-11
JP2018002822 2018-01-11

Publications (2)

Publication Number Publication Date
JP2019114224A true JP2019114224A (en) 2019-07-11
JP7187816B2 JP7187816B2 (en) 2022-12-13

Family

ID=67222707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018091663A Active JP7187816B2 (en) 2017-10-13 2018-05-10 Search method, search program and search device

Country Status (1)

Country Link
JP (1) JP7187816B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021064252A (en) * 2019-10-16 2021-04-22 富士通株式会社 Document processing program, document processing method, and document processing apparatus
JP2021174449A (en) * 2020-04-30 2021-11-01 株式会社Access Retrieval system, retrieval method, and program
WO2024042635A1 (en) * 2022-08-24 2024-02-29 日本電気株式会社 Information processing device, related word output method, and related word output program
WO2024042634A1 (en) * 2022-08-24 2024-02-29 日本電気株式会社 Information processing device, related word detection method, and related word detection program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011913A (en) * 2005-07-04 2007-01-18 Sharp Corp Music piece managing device and information display method
JP2007219722A (en) * 2006-02-15 2007-08-30 Just Syst Corp Document retrieval server and document retrieval method
JP2008242604A (en) * 2007-03-26 2008-10-09 Toshiba Corp Web document browsing device, method and program
JP2014089570A (en) * 2012-10-30 2014-05-15 Toshiba Corp Sensibility retrieval device, method and program
JP2017091205A (en) * 2015-11-10 2017-05-25 富士ゼロックス株式会社 Information processor and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007011913A (en) * 2005-07-04 2007-01-18 Sharp Corp Music piece managing device and information display method
JP2007219722A (en) * 2006-02-15 2007-08-30 Just Syst Corp Document retrieval server and document retrieval method
JP2008242604A (en) * 2007-03-26 2008-10-09 Toshiba Corp Web document browsing device, method and program
JP2014089570A (en) * 2012-10-30 2014-05-15 Toshiba Corp Sensibility retrieval device, method and program
JP2017091205A (en) * 2015-11-10 2017-05-25 富士ゼロックス株式会社 Information processor and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中谷 文彦: "柔軟なWebコンテンツ検索のためのレーダーチャート検索システムの提案", 電子情報通信学会 第19回データ工学ワークショップ論文集 [ONLINE], JPN6022001584, 7 April 2008 (2008-04-07), ISSN: 0004849147 *
林 大策: "情報整理を支援する対話型検索インタフェースの提案と評価", 第4回データ工学と情報マネジメントに関するフォーラム論文集 (第10回日本データベース学会年次大会), JPN6022001582, 30 August 2012 (2012-08-30), ISSN: 0004849146 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021064252A (en) * 2019-10-16 2021-04-22 富士通株式会社 Document processing program, document processing method, and document processing apparatus
JP7295429B2 (en) 2019-10-16 2023-06-21 富士通株式会社 Document processing program, document processing method and document processing device
JP2021174449A (en) * 2020-04-30 2021-11-01 株式会社Access Retrieval system, retrieval method, and program
JP7414633B2 (en) 2020-04-30 2024-01-16 株式会社Access Search system, search method, and program
WO2024042635A1 (en) * 2022-08-24 2024-02-29 日本電気株式会社 Information processing device, related word output method, and related word output program
WO2024042634A1 (en) * 2022-08-24 2024-02-29 日本電気株式会社 Information processing device, related word detection method, and related word detection program

Also Published As

Publication number Publication date
JP7187816B2 (en) 2022-12-13

Similar Documents

Publication Publication Date Title
US11222167B2 (en) Generating structured text summaries of digital documents using interactive collaboration
US20200327172A1 (en) System and method for processing contract documents
JP3981734B2 (en) Question answering system and question answering processing method
US9836511B2 (en) Computer-generated sentiment-based knowledge base
JP5154832B2 (en) Document search system and document search method
JP2019114224A (en) Search method, search program and search device
CN109101533B (en) Automated reading comprehension
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
US20140229476A1 (en) System for Information Discovery & Organization
Kestemont et al. Weigh your words—memory-based lemmatization for Middle Dutch
JP6254629B2 (en) Scoring assistance system
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
WO2015139497A1 (en) Method and apparatus for determining similar characters in search engine
JP2019067433A (en) Subject provision system
JP2020135891A (en) Methods, apparatus, devices and media for providing search suggestions
JP2022184827A (en) Text processing apparatus, method, device, and computer-readable storage medium
US20120317141A1 (en) System and method for ordering of semantic sub-keys
Pilz et al. The identification of spelling variants in English and German historical texts: Manual or automatic?
JP2013016036A (en) Document component generation method and computer system
Pribadi et al. Semantic recommender system based on semantic similarity using fasttext and word mover’s distance
JP6942759B2 (en) Information processing equipment, programs and information processing methods
CN111694930A (en) Dynamic knowledge hotspot evolution and trend analysis method
KR101506757B1 (en) Method for the formation of an unambiguous model of a text in a natural language
JP2021072035A (en) Workshop support system and workshop support method
WO2014170965A1 (en) Document processing method, document processing device, and document processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221114

R150 Certificate of patent or registration of utility model

Ref document number: 7187816

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150