JP2016134124A - Tag application method, tag application system, program, and query/response retrieval method - Google Patents

Tag application method, tag application system, program, and query/response retrieval method Download PDF

Info

Publication number
JP2016134124A
JP2016134124A JP2015010177A JP2015010177A JP2016134124A JP 2016134124 A JP2016134124 A JP 2016134124A JP 2015010177 A JP2015010177 A JP 2015010177A JP 2015010177 A JP2015010177 A JP 2015010177A JP 2016134124 A JP2016134124 A JP 2016134124A
Authority
JP
Japan
Prior art keywords
tag
document
answer
user
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015010177A
Other languages
Japanese (ja)
Other versions
JP6388212B2 (en
Inventor
菜々美 藤原
Nanami Fujiwara
菜々美 藤原
堀井 則彰
Noriaki Horii
則彰 堀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2015010177A priority Critical patent/JP6388212B2/en
Publication of JP2016134124A publication Critical patent/JP2016134124A/en
Application granted granted Critical
Publication of JP6388212B2 publication Critical patent/JP6388212B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a tag application method making it possible to apply a tag, which is used to retrieve a response document that meets a predetermined standard concerning a user who performs retrieval or an object of retrieval, at the time of retrieving the response document relevant to a user's query.SOLUTION: A tag application method in accordance with the present invention is a tag application method to be implemented in a tag application system that applies a tag, which is used to retrieve a response, to a response document signifying a response to a user's query. A tag adjustment document for use in adjusting a topic, which is applied as a tag to the response document, according to a predetermined standard concerning a user who performs retrieval or an object of retrieval is selected. The topic indicating the response document and the selected tag adjustment document is extracted from the response document and selected tag adjustment document. The extracted topic is applied as the tag, which meets the predetermined standard, to the response document.SELECTED DRAWING: Figure 1

Description

本発明は、ユーザからの質問に対する回答を構成する回答文書に対して、回答を検索するためのタグを付与するためのタグ付与方法に関する。   The present invention relates to a tag assigning method for assigning a tag for searching for an answer to an answer document constituting an answer to a question from a user.

近年、FAQ(Frequently Asked Questions)などに基づく質問回答システムが開発されている。質問回答システムとは、特定の分野や種類に対する質問をユーザが自然文で入力し、それに対してシステムが適当な回答を返すコンピュータシステムのことをいう。一般に、質問回答システムにおいて、回答対象となる文書群をデータベースに記憶しておく。   In recent years, a question answering system based on FAQ (Frequently Asked Questions) has been developed. The question answering system is a computer system in which a user inputs a question about a specific field or type in a natural sentence, and the system returns an appropriate answer to the question. Generally, in a question answering system, a group of documents to be answered is stored in a database.

このような質問回答システムにおいては、膨大な回答文書の中から、ユーザの意図に適した回答を適切に検索することが必要となる。これを実現するための一手段として、質問キーワードに関する多数のコメント文章を潜在的なトピックグループに分類した上で、トピックグループに含まれる文章群と類似する回答文を対応付ける技術が開示されている(例えば、特許文献1参照)。   In such a question answering system, it is necessary to appropriately search for an answer suitable for the user's intention from a large number of answer documents. As one means for realizing this, a technique is disclosed in which a large number of comment sentences relating to a question keyword are classified into potential topic groups, and an answer sentence similar to a sentence group included in the topic group is associated ( For example, see Patent Document 1).

また、膨大な回答文書の中から、ユーザの意図に適した回答を適切に検索するための他の手段として、回答文書に予め検索タグを付与しておくことがある。検索タグとは回答文書の内容を適切に表す語のことであり、ユーザの質問文の中に検索タグが含まれていれば、該当する回答をユーザに提示する。これにより、膨大な文書群に対する検索精度を向上させる。   In addition, as another means for appropriately searching for an answer suitable for the user's intention from a large number of answer documents, a search tag may be assigned in advance to the answer document. The search tag is a word that appropriately represents the contents of the answer document. If the search tag is included in the user's question sentence, the corresponding answer is presented to the user. This improves the search accuracy for a huge document group.

検索タグの付与において、膨大な文書群のタグ付けを人手で行うには多くのコストがかかるため、文書を特徴付ける語を自動的に抽出するような、自動検索タグ付与も検討されている(例えば、非特許文献1参照)。   In adding search tags, it takes a lot of cost to manually tag a large number of documents. Therefore, automatic search tag addition that automatically extracts words characterizing a document is also being considered (for example, Non-Patent Document 1).

特開2013−143066号公報JP 2013-143066 A

加藤 亮、吉川大弘、古橋武「潜在的ディリクレ配分法を利用した文書への自動タグ付与に関する検討」、人工知能学会全国大会論文集 28、1−4、人工知能学会 2014年5月1日Ryo Kato, Daihiro Yoshikawa, Takeshi Furuhashi “Study on Automatic Tagging of Documents Using Potential Dirichlet Allocation Method”, Proceedings of National Conference of the Japanese Society for Artificial Intelligence 28, 1-4, Japan Society for Artificial Intelligence May 1, 2014

しかし、自動検索タグ付与においては、質問の対象(すなわち、回答の検索対象)に対するユーザの知識レベルや、回答の検索対象に応じて適切なタグ付与ができるよう、さらなる改良が求められている。   However, in the automatic search tagging, further improvements are required so that appropriate tagging can be performed according to the user's knowledge level with respect to the question target (that is, the answer search target) and the answer search target.

上記課題を解決するために、本発明に係るタグ付与方法は、ユーザからの質問に対する回答を構成する回答文書に対して、回答を検索するためのタグを付与するタグ付与装置が行うタグ付与方法であって、前記回答文書に対してタグとして付与するトピックを、前記検索を行うユーザまたは前記検索の対象に関する所定の基準により調整するためのタグ調整文書を選択し、前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出し、前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与する。   In order to solve the above-mentioned problem, a tag assignment method according to the present invention is a tag assignment method performed by a tag assignment device for assigning a tag for searching for an answer to an answer document constituting an answer to a question from a user. And selecting a tag adjustment document for adjusting a topic to be assigned as a tag to the answer document according to a predetermined criterion related to a user who performs the search or the search target, and the answer document and the selected document A topic representing the answer document and the selected tag adjustment document is extracted from the tag adjustment document, and the extracted topic is assigned to the answer document as a predetermined reference tag.

本構成によれば、回答文書に対して、質問するユーザや、回答の検索対象(例えば、家電製品の機能に関する質問における家電製品)に関する所定の基準(例えば、家電製品に対するユーザの知識レベルや、家電製品の新機種に搭載された機能であるか旧機種に搭載された機能であるか)に応じた検索タグを付与することが可能となる。その結果、ユーザからの質問に対して、質問するユーザの知識レベルや、回答の検索対象に応じて適切な回答文書を検索することが可能となる。   According to this configuration, for a reply document, a user who asks a question, a predetermined criterion (for example, a user's knowledge level for a home appliance, It is possible to attach a search tag according to whether it is a function installed in a new model of home appliances or a function installed in an old model. As a result, an appropriate answer document can be searched for a question from the user according to the knowledge level of the questioning user and the search target of the answer.

本発明の実施の形態に係る質問回答システムの全体構成の一例を示す図である。It is a figure which shows an example of the whole structure of the question answering system which concerns on embodiment of this invention. 本発明の実施の形態に係る制御サーバ1の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the control server 1 which concerns on embodiment of this invention. 本発明の実施の形態に係るタグ付与サーバ2の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the tag provision server 2 which concerns on embodiment of this invention. 本発明の実施の形態に係る質問回答サーバ3の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the question answering server 3 which concerns on embodiment of this invention. 本発明の実施の形態に係る操作端末4の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the operating terminal 4 which concerns on embodiment of this invention. 本発明の実施の形態に係る質問回答システムの一連の処理の一例を示すシーケンス図である。It is a sequence diagram which shows an example of a series of processes of the question answering system which concerns on embodiment of this invention. 本発明の実施の形態に係るサーバ選択処理の手順の一例を示すフローチャートである。It is a flowchart which shows an example of the procedure of the server selection process which concerns on embodiment of this invention. 本発明の実施の形態に係る文書選択処理の手順の一例を示すフローチャートである。It is a flowchart which shows an example of the procedure of the document selection process which concerns on embodiment of this invention. 本発明の実施の形態に係るタグ抽出/紐付け処理の手順の一例を示すフローチャートである。It is a flowchart which shows an example of the procedure of the tag extraction / linking process which concerns on embodiment of this invention. 本発明の実施の形態に係る本実施形態によるタグ調整文書決定テーブルの一例を示す図である。It is a figure which shows an example of the tag adjustment document determination table by this embodiment which concerns on embodiment of this invention. 本発明の実施の形態に係る表示画面の一例を示す図である。It is a figure which shows an example of the display screen which concerns on embodiment of this invention. 本発明の実施の形態に係る表示画面の他の例を示す図である。It is a figure which shows the other example of the display screen which concerns on embodiment of this invention. 本発明の実施の形態に係る回答データベース5のデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the reply database 5 which concerns on embodiment of this invention. 本発明の実施の形態に係るタグ調整文書データベース6のデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the tag adjustment document database 6 which concerns on embodiment of this invention. 本発明の実施の形態に係るトピックモデルによるタグ付与の実験結果の一例を示す図である。It is a figure which shows an example of the experiment result of tag provision by the topic model which concerns on embodiment of this invention.

(本発明の基礎となった知見)
本発明者は、タグ付けされた回答文書を検索することによりユーザの質問に回答する質問回答システムについて詳細に検討した。その結果、前述した従来技術では、ある質問に対する回答を検索する際に、質問の対象(すなわち、回答の検索対象)に対するユーザの知識レベルや回答の検索対象に応じて適切な回答文が返答されない場合があるという課題を見出した。この点について、検索対象に対するユーザの知識レベル(習熟度)の違いを例として説明する。
(Knowledge that became the basis of the present invention)
The inventor has studied in detail a question answering system that answers a user's question by searching for tagged answer documents. As a result, in the above-described conventional technology, when searching for an answer to a certain question, an appropriate answer sentence is not returned according to the knowledge level of the user for the question target (that is, the answer search target) or the answer search target. I found a problem that there was a case. This will be described by taking the difference in the user's knowledge level (skill level) with respect to the search target as an example.

例えば、ある回答文書に「アクセス、LAN、プロキシサーバ」と検索タグがついていた場合、ネットワーク技術に関する知識レベルの高いユーザが質問しうる「プロキシサーバを設定したい」という質問に対しては、質問中に含まれる「プロキシサーバ」という言葉が検索タグの一つと一致するため、この回答文書を検索し、回答文書の内容に基づく返答をすることができるのに対し、ネットワーク技術に関する知識レベルの低いユーザが質問しうる「インターネットの接続方法が知りたい」という質問に対しては、質問中に含まれるいずれの言葉も検索タグと一致しないため、この回答文書を検索することができず、ひいてはこの回答文書の内容に基づく返答をすることができないという課題が生じる。   For example, if a certain answer document has a search tag of “access, LAN, proxy server”, a question about “I want to set a proxy server” that a user with a high level of knowledge about network technology can ask Because the word “proxy server” included in the URL matches one of the search tags, users who have a low level of knowledge about network technology can search for this answer document and respond based on the contents of the answer document. Cannot answer this question because the search tag does not match any words included in the question. There arises a problem that a reply based on the content of the document cannot be made.

このような課題を解決するために、本発明に係るタグ付与方法は、ユーザからの質問に対する回答を構成する回答文書に対して、回答を検索するためのタグを付与するタグ付与装置が行うタグ付与方法であって、前記回答文書に対してタグとして付与するトピックを、前記検索を行うユーザまたは前記検索の対象に関する所定の基準により調整するためのタグ調整文書を選択し、前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出し、前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与する。   In order to solve such a problem, the tag assignment method according to the present invention is a tag performed by a tag assignment device that assigns a tag for searching for an answer to an answer document that constitutes an answer to a question from a user. A method for providing a tag adjustment document for adjusting a topic to be added as a tag to the answer document according to a predetermined criterion related to a user who performs the search or the search target, and the answer document and the answer document A topic representing the answer document and the selected tag adjustment document is extracted from the selected tag adjustment document, and the extracted topic is assigned to the answer document as a predetermined reference tag.

これにより、回答文書に対して、質問の対象(すなわち、回答の検索対象)に対するユーザの知識レベルや回答の検索対象に関する所定の基準に応じて適切な検索タグを付与することが可能となる。   As a result, it is possible to attach an appropriate search tag to the answer document according to the user's knowledge level with respect to the question target (that is, the answer search target) and the predetermined criteria regarding the answer search target.

また、前記所定の基準は、検索の対象に対するユーザの習熟度または知識レベルが高いかあるいは低いかであることとしてもよい。   The predetermined criterion may be whether the user's proficiency level or knowledge level with respect to the search target is high or low.

これにより、回答文書に対して、検索対象に対するユーザの習熟度または知識レベルを基準として適切な検索タグを付与することが可能となる。   This makes it possible to assign an appropriate search tag to the answer document based on the user's proficiency level or knowledge level for the search target.

また、前記検索の対象は製品であり、前記回答文書は当該製品の取り扱いを説明する文書の少なくとも一部であることとしてもよい。   The search target may be a product, and the answer document may be at least a part of a document explaining handling of the product.

これにより、製品の取り扱いに関して、ユーザの習熟度または知識レベルを基準として適切な検索タグを付与することが可能となる。   Thereby, it becomes possible to assign an appropriate search tag with respect to the handling of the product based on the user's proficiency level or knowledge level.

また、前記検索の対象に対する習熟度または知識レベルが低いユーザよる検索に用いるタグを付与するための前記タグ調整文書として、一般知識に関する文書を選択することとしてもよい。   Further, a document relating to general knowledge may be selected as the tag adjustment document for assigning a tag used for a search by a user having a low proficiency level or knowledge level with respect to the search target.

また、前記一般知識に関する文書とは、辞典、教科書、ニュース、ブログ、または短文投稿サービスのうち少なくとも1つであることとしてもよい。   The general knowledge document may be at least one of a dictionary, textbook, news, blog, or short text posting service.

これにより、回答文書に対して、電子機器の機能を説明する文書よりも平易な言葉が記述された文書を用いて、知識レベルが低いユーザに適したタグを付与することが可能となる。   Thereby, it is possible to attach a tag suitable for a user with a low knowledge level to a response document using a document in which simpler words are described than a document explaining the function of the electronic device.

また、前記検索の対象に対する習熟度または知識レベルが高いユーザよる検索に用いるタグを付与するための前記タグ調整文書として、専門知識に関する文書を選択することとしてもよい。   Moreover, it is good also as selecting the document regarding expert knowledge as the said tag adjustment document for providing the tag used for the search by the user with a high skill level or knowledge level with respect to the said object of search.

また、前記専門知識に関する文書とは、工事取り付け専門書、取扱説明書、学術専門書、社内文書、または営業情報のうち少なくとも1つであることとしてもよい。   Further, the document related to the specialized knowledge may be at least one of a construction installation technical manual, an instruction manual, an academic technical book, an in-house document, or sales information.

これにより、回答文書に対して、電子機器の機能を説明する文書よりも高度な言葉が記述された文書を用いて、知識レベルが低いユーザに適したタグを付与することが可能となる。   Thereby, it is possible to give a tag suitable for a user having a low knowledge level to a response document using a document in which a higher level of words is described than a document explaining the function of the electronic device.

また、前記検索の対象は製品であり、前記所定の基準は、当該製品の新機能に関する情報であるか旧機能に関する情報であるかのいずれか一方であることとしてもよい。   The search target may be a product, and the predetermined criterion may be information on a new function or information on an old function of the product.

これにより、製品の機能に関する回答文書に対して、製品の新機能に関する情報であるか旧機能に関する情報であるかのいずれかを基準として適切な検索タグを付与することが可能となる。   This makes it possible to attach an appropriate search tag to the answer document related to the product function based on either the information related to the new function of the product or the information related to the old function.

また、前記回答文書は、前記製品の機能を説明する文書の少なくとも一部であり、前記タグ調整文書は、当該製品より新機種または旧機種の機能を説明する文書の少なくとも一部であることとしてもよい。   The answer document is at least a part of a document explaining the function of the product, and the tag adjustment document is at least a part of a document explaining a function of a new model or an old model from the product. Also good.

これにより、新機種に搭載された機能に関する文書、あるいは旧機種に搭載されていた機能に関する文書をもとに、製品の新機能に関する情報であるか旧機能に関する情報であるかのいずれかを基準として適切な検索タグを付与することが可能となる。   As a result, based on the document on the function installed in the new model or the document on the function installed in the old model, it is based on either the information on the new function of the product or the information on the old function. As a result, an appropriate search tag can be assigned.

また、前記検索の対象は製品であり、前記所定の基準は、当該製品の上位機種に関する情報であるか下位機種に関する情報であるかのいずれか一方であることとしてもよい。   The search target may be a product, and the predetermined reference may be information related to a higher model or a lower model of the product.

これにより、製品の機能に関する回答文書に対して、製品の上位機種に関する情報であるか下位機種に関する情報であるかのいずれかを基準として適切な検索タグを付与することが可能となる。   Accordingly, it is possible to attach an appropriate search tag to the answer document regarding the function of the product on the basis of either the information regarding the higher model of the product or the information regarding the lower model.

また、前記回答文書は、前記製品の機能を説明する文書の少なくとも一部であり、前記タグ調整文書は、当該製品より上位機種または下位機種の機能を説明する文書の少なくとも一部であることとしてもよい。   The answer document is at least a part of a document explaining the function of the product, and the tag adjustment document is at least a part of a document explaining a function of a higher model or a lower model than the product. Also good.

これにより、上位機種に搭載された機能に関する文書、あるいは下位機種に搭載されていた機能に関する文書をもとに、製品の上位機種に関する情報であるか下位機種に関する情報であるかのいずれかを基準として適切な検索タグを付与することが可能となる。   As a result, based on the document on the function installed in the higher model or the document on the function installed in the lower model, it is based on either the information on the higher model of the product or the information on the lower model. As a result, an appropriate search tag can be assigned.

また、前記タグとして付与するキーワードの抽出は、文書を構成するトピックを自動で抽出するためのトピックモデルを用い、各文書の特徴を抽出することにより行うこととしてもよい。   In addition, the extraction of keywords assigned as tags may be performed by extracting features of each document using a topic model for automatically extracting topics that constitute the document.

また、前記トピックモデルは、LDA(Latent Dirichlet Allocation)、LSI(Latent Semantic Indexing)、またはPLSA(Probabilistic Latent Semantic Analysis)の少なくとも1つであることとしてもよい。   In addition, the topic model may be at least one of LDA (Lent Dielectric Allocation), LSI (Lent Semantic Indexing), or PLSA (Probabilistic Latin Semantic Analysis).

これにより、トピックモデルを用いて、回答文書およびタグ調整文書から、検索タグとして用いるキーワードを抽出することが可能となる。   Thereby, it is possible to extract a keyword used as a search tag from the answer document and the tag adjustment document using the topic model.

また、前記回答文書への前記タグの付与は、前記トピックモデルから得られた複数のタグ群の中で、最も多く回答文書を含むタグ群を選択することにより行うこととしてもよい。   The tag may be assigned to the answer document by selecting a tag group including the most answer documents from among a plurality of tag groups obtained from the topic model.

これにより、回答文書とタグ調整文書から抽出されたキーワードのうち、最も適したものを検索タグとして付与することが可能となる。   This makes it possible to assign the most suitable keyword extracted from the answer document and the tag adjustment document as a search tag.

また、前記タグ調整文書の選択は、前記ユーザの行動履歴に基づいて行うこととしてもよい。   The tag adjustment document may be selected based on the user's action history.

これにより、ユーザの行動履歴をもとにユーザの知識レベル等を判定し、知識レベルに応じたタグ調整文書を選択することが可能となる。   As a result, the user's knowledge level and the like can be determined based on the user's behavior history, and a tag adjustment document corresponding to the knowledge level can be selected.

また、本発明に係る質問検索方法は、検索対象の文書群からユーザの質問に適合する回答文書を検索する質問回答システムが行う質問検索方法であって、前記検索を行うユーザまたは前記検索の対象に関する所定の基準を判定し、前記所定の基準に基づき、前記回答文書に対してタグとして付与するトピックを調整するためのタグ調整文書を選択し、前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出し、前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与し、前記ユーザの質問からキーワードを抽出し、当該キーワードと合致するタグが付与された前記回答文書を検索する。   The question search method according to the present invention is a question search method performed by a question answering system for searching for an answer document that matches a user's question from a group of documents to be searched, the user performing the search or the search target A predetermined criterion for determining a tag adjustment document for adjusting a topic to be assigned as a tag to the answer document based on the predetermined criterion, and selecting from the answer document and the selected tag adjustment document , Extracting a topic representing the answer document and the selected tag adjustment document, assigning the extracted topic to the answer document as a predetermined reference tag, extracting a keyword from the user's question, The answer document to which a tag matching the keyword is assigned is searched.

これにより、回答文書に対して、質問の対象(すなわち、回答の検索対象)に対するユーザの知識レベルや回答の検索対象に関する所定の基準に応じて適切な検索タグを付与した上で、ユーザの質問に適した回答文書を検索することが可能となる。   As a result, an appropriate search tag is given to the answer document according to the user's knowledge level for the question target (that is, the answer search target) and the predetermined criteria regarding the answer search target, and then the user's question It is possible to search for an answer document suitable for.

なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることも出来る。   Note that each of the embodiments described below shows a specific example of the present invention. Numerical values, shapes, components, steps, order of steps and the like shown in the following embodiments are merely examples, and are not intended to limit the present invention. In addition, among the constituent elements in the following embodiments, constituent elements that are not described in the independent claims indicating the highest concept are described as optional constituent elements. In all the embodiments, the contents can be combined.

(実施の形態)
以下、本発明の実施形態について、図面を参照しながら説明する。なお、本発明の実施の形態は、下記の実施例になんら限定されること無く、本発明の技術的範囲に属する限り、種々の形態をとり得る。
(Embodiment)
Hereinafter, embodiments of the present invention will be described with reference to the drawings. The embodiments of the present invention are not limited to the following examples, and can take various forms as long as they belong to the technical scope of the present invention.

図1は、本実施の形態における質問回答システムの全体構成の一例を示す図である。
質問回答システムは、制御サーバ1、タグ付与サーバ2、質問回答サーバ3、操作端末4、回答データベース5、タグ調整文書データベース6、ネットワーク7を備える。
FIG. 1 is a diagram showing an example of the overall configuration of the question answering system in the present embodiment.
The question answering system includes a control server 1, a tag assignment server 2, a question answering server 3, an operation terminal 4, an answer database 5, a tag adjustment document database 6, and a network 7.

制御サーバ1は、タグ付与サーバ2と質問回答サーバ3と操作端末4とデータの送受信を行う機能を有する。例えば、操作端末4から得られた入力に対して、タグ付与サーバ2または質問回答サーバ3のうち、処理を行うサーバを選択する。制御サーバ1の詳細な構成は後述する。   The control server 1 has a function of transmitting / receiving data to / from the tag assignment server 2, the question answering server 3, and the operation terminal 4. For example, for the input obtained from the operation terminal 4, the server to be processed is selected from the tag assignment server 2 or the question answering server 3. The detailed configuration of the control server 1 will be described later.

タグ付与サーバ2は、制御サーバ1と回答データベース5とタグ調整文書データベース6の各々とデータの送受信を行う機能を有する。例えば、操作端末4から入力されたユーザの検索対象に対する知識レベルの情報を受信し、タグ調整文書データベース6から、ユーザの知識レベルを加味したタグ調整文書を選択するなどの処理を行う。ここでの検索対象とは、例えば、製品、システムまたはアプリケーションプログラムの使い方、故障に関する情報などである。また、検索対象は、サービスや金融商品、文書等を含め、有形無形の商材であってもよい。ここで、製品とは、家庭用電気機器、情報通信機器、自動車、家具をはじめとして、取り扱いに説明を要する物品を指す。また、知識レベルとは、その検索対象に対して、ユーザが持っている知識の量、習熟度などを表すものである。ここに挙げたもの以外でも、ユーザの質問に対しての回答が用意できるものであればこれに限らない。以降、「ユーザの検索対象に対する知識レベル」は、「知識レベル」と表記することとする。タグ付与サーバ2の詳細な構成は後述する。   The tag assignment server 2 has a function of transmitting / receiving data to / from each of the control server 1, the answer database 5, and the tag adjustment document database 6. For example, the information of the knowledge level with respect to the search target of the user input from the operation terminal 4 is received, and processing such as selecting a tag adjustment document taking into account the user's knowledge level from the tag adjustment document database 6 is performed. The search target here is, for example, usage of a product, system or application program, information on a failure, or the like. The search target may be tangible and intangible merchandise including services, financial products, documents, and the like. Here, the product refers to articles that require explanation for handling, such as household electrical equipment, information communication equipment, automobiles, and furniture. The knowledge level represents the amount of knowledge, proficiency, etc. that the user has for the search target. Anything other than those listed here is not limited as long as an answer to a user's question can be prepared. Hereinafter, the “knowledge level for the search target of the user” is referred to as “knowledge level”. The detailed configuration of the tag assignment server 2 will be described later.

質問回答サーバ3は、制御サーバ1と回答データベース5とデータの送受信を行う機能を有する。例えば、質問回答サーバ3は、制御サーバ1から入力されたユーザの質問を受信し、回答データベース5の内容を検索するなどの処理を行う。質問回答サーバ3の詳細な構成は後述する。   The question / answer server 3 has a function of transmitting / receiving data to / from the control server 1 and the answer database 5. For example, the question answering server 3 receives a user question input from the control server 1 and performs processing such as searching the contents of the answer database 5. The detailed configuration of the question answering server 3 will be described later.

操作端末4は、スマートフォンやタブレット端末、専用表示機器端末、パーソナルコンピュータ(PC)、又はテレビなどである。ここに挙げたもの以外でも、ユーザとデータのやりとりができる端末であれば何でもよい。端末の操作は、タッチパネルによる入力、画像や動画による入力、音声による入力、キーボードによる入力などが想定される。   The operation terminal 4 is a smartphone, a tablet terminal, a dedicated display device terminal, a personal computer (PC), a television, or the like. Any terminal other than those listed here can be used as long as it can exchange data with the user. The operation of the terminal is assumed to be input using a touch panel, input using an image or moving image, input using sound, input using a keyboard, and the like.

回答データベース5は、タグ付与サーバ2および質問回答サーバ3とデータのやりとりを行う。ここには質問に対する回答を構成する文書である回答文書が保持される。質問対象としては、例えば、製品、システムまたはアプリケーションプログラムの使い方や故障相談などが挙げられ、QAを提示することでユーザの質問に回答する。なお、これは一例であり、質問とそれに対する回答が用意できるものであれば、これに限らない。また、データの保存形式の一例として、XML(Extensible Markup Language)形式などが挙げられるが、データを構造的に保持できるものであれば、これに限らない。図12はXML形式の一例であるが、回答となる文書とともに自動的に抽出されたタグ保存されている。   The answer database 5 exchanges data with the tag assignment server 2 and the question answer server 3. Here, an answer document which is a document constituting an answer to the question is held. Examples of questions to be asked include how to use a product, system, or application program, and trouble consultation, and answer a user's question by presenting a QA. This is only an example, and the present invention is not limited to this as long as a question and an answer to the question can be prepared. An example of the data storage format is an XML (Extensible Markup Language) format, but is not limited to this as long as the data can be structurally held. FIG. 12 shows an example of an XML format, in which tags extracted automatically together with a document to be answered are stored.

なお、以後の説明において、回答文書のことをタグ付け対象文書と称することもあるが、同じものを意味する。   In the following description, the answer document is sometimes referred to as a tagging target document, but it means the same thing.

タグ調整文書データベース6は、タグ付与サーバ2とのデータのやりとりを行う。ここには、タグ付け対象文書にタグを付ける際、タグの語を所定の基準により調整するための文書であるタグ調整文書が保持される。ここで、所定の基準とは、質問を行う(すなわち、質問に対する回答を検索する)ユーザや質問対象(すなわち、回答の検索対象)に関する基準をいう。所定の基準がユーザの知識レベルである場合、タグ調整文書として、例えば、一般知識(辞典、教科書、ニュース、ブログ(Weblogの略)、Twitter(登録商標)のような短文投稿サービスなど)を有する文書、また、高度な専門知識(工事取り付け専門書、取扱説明書、学術専門書、社内文書、営業情報など)を有する文書が保持される。なお、辞典とは、例えばWikipediaのようなインターネット上の辞典や、書籍としての辞典の両者を指すものである。これらは一例であり、文書であればこれに限らない。また、データの保存形式の一例として、XML(Extensible Markup Language)形式などが挙げられるが、データを構造的に保持できるものであれば、これに限らない。   The tag adjustment document database 6 exchanges data with the tag assignment server 2. Here, a tag adjustment document, which is a document for adjusting a tag word according to a predetermined standard when a tag is added to a tagging target document, is held. Here, the predetermined standard refers to a standard regarding a user who asks a question (that is, searches for an answer to the question) and a question target (that is, a search target of the answer). When the predetermined standard is the user's knowledge level, the tag adjustment document has, for example, general knowledge (a dictionary, textbook, news, blog (abbreviation of Weblog), short text posting service such as Twitter (registered trademark), etc.). Documents and documents having high expertise (construction installation manuals, instruction manuals, academic technical books, in-house documents, sales information, etc.) are retained. The dictionary refers to both a dictionary on the Internet such as Wikipedia and a dictionary as a book. These are only examples, and are not limited to this as long as they are documents. An example of the data storage format is an XML (Extensible Markup Language) format, but is not limited to this as long as the data can be structurally held.

ネットワーク7は、制御サーバ1、操作端末4が接続される。接続方法の一例として、有線、無線によるLAN接続などが挙げられるが、各構成要素を通信可能に接続するものであれば、これに限らない。   The network 7 is connected to the control server 1 and the operation terminal 4. An example of the connection method is wired or wireless LAN connection, but is not limited to this as long as each component is connected to be communicable.

図2は、本実施の形態における制御サーバ1の構成の一例を示すブロック図である。   FIG. 2 is a block diagram showing an example of the configuration of the control server 1 in the present embodiment.

図2に示されるように、制御サーバ1は、入力検出部101、処理選択部102、制御部103、通信部104を備える。   As illustrated in FIG. 2, the control server 1 includes an input detection unit 101, a process selection unit 102, a control unit 103, and a communication unit 104.

入力検出部101は、操作端末4を通じてユーザからの入力を検出する。   The input detection unit 101 detects an input from the user through the operation terminal 4.

処理選択部102は、ユーザの入力に対し、タグ付与サーバ2または質問回答サーバ3のうち、処理を行うサーバを選択する部分である。例えば、「知識レベル:1」といった、基準を意味する情報を取得した場合、タグ付与サーバ2での処理を選択し、「エアコンの効きが悪い」といった、質問を意味する情報を取得した場合、質問回答サーバ3での処理を選択する。   The process selection unit 102 is a part that selects a server to be processed from the tag assignment server 2 or the question answering server 3 in response to a user input. For example, when information indicating a standard such as “knowledge level: 1” is acquired, processing in the tagging server 2 is selected, and information indicating a question such as “ineffectiveness of air conditioner” is acquired. A process in the question answering server 3 is selected.

制御部103は、処理選択部102で選択されたサーバに処理を行うコマンドを送信する。   The control unit 103 transmits a command for processing to the server selected by the processing selection unit 102.

通信部104は、タグ付与サーバ2、質問回答サーバ3、および操作端末4とそれぞれ通信する。   The communication unit 104 communicates with the tag assignment server 2, the question answering server 3, and the operation terminal 4.

図3は、本実施の形態におけるタグ付与サーバ2の構成の一例を示すブロック図である。   FIG. 3 is a block diagram showing an example of the configuration of the tag assignment server 2 in the present embodiment.

図3に示されるように、タグ付与サーバ2は、基準取得部201、文書選択部202、形態素解析部203、ベクトル生成部204、タグ自動生成部205、タグ紐付け部206、通信部207、形態素解析器208、回答データベース5、タグ調整文書データベース6を備える。   As shown in FIG. 3, the tag assignment server 2 includes a reference acquisition unit 201, a document selection unit 202, a morpheme analysis unit 203, a vector generation unit 204, a tag automatic generation unit 205, a tag association unit 206, a communication unit 207, A morphological analyzer 208, an answer database 5, and a tag adjustment document database 6 are provided.

基準取得部201は、例えばユーザの知識レベルといったような、タグ調整文書を選択するための基準となる情報を取得する。基準となる情報は、質問を行うユーザの入力により取得してもよく、自動で取得してもよい。例えば、基準となる情報がユーザの知識レベルである場合、ユーザの質問履歴などからユーザの知識レベルを自動で判定して取得することができる。   The reference acquisition unit 201 acquires information serving as a reference for selecting a tag adjustment document such as a user knowledge level. The reference information may be acquired by an input of a user who makes a question, or may be acquired automatically. For example, when the reference information is the user's knowledge level, the user's knowledge level can be automatically determined and acquired from the user's question history or the like.

文書選択部202は、タグ調整文書データベース6から、基準となる情報に適したタグ調整文書を、回答データベース5からタグ付け対象文書を選択する。例えば、ユーザの知識レベルを基準とする場合、図10に示すような、ユーザの知識レベルとタグ調整文書の難易度を対応させるテーブルを参照し、タグ調整文書を選択する。なお、図10に示した数値やタグ調整文書は一例であり、これに限らない。また、これらのタグ調整文書の決定方法は一例であり、これに限らない。たとえば、なんらかの数式に基づいてタグ調整文書を選択しても構わないし、機械学習などのアルゴリズムを用いて統計的に選択するようなにしてもよい。   The document selection unit 202 selects a tag adjustment document suitable for reference information from the tag adjustment document database 6 and a tag target document from the response database 5. For example, when the user knowledge level is used as a reference, a tag adjustment document is selected with reference to a table as shown in FIG. 10 that associates the user knowledge level with the difficulty level of the tag adjustment document. Note that the numerical values and the tag adjustment document illustrated in FIG. 10 are examples, and the present invention is not limited thereto. Further, these tag adjustment document determination methods are merely examples, and are not limited thereto. For example, the tag adjustment document may be selected based on some mathematical formula, or may be selected statistically using an algorithm such as machine learning.

形態素解析部203は、文書選択部202から文書を受け取り、形態素解析器208を介して文書の形態素解析を行う部分である。形態素解析とは、文書を意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文書の要素のうち、意味を持つ最小の単位のことである。形態素解析部203において文書は、各語に対して品詞情報を持ったデータとなる。   The morpheme analysis unit 203 is a part that receives a document from the document selection unit 202 and performs morpheme analysis of the document via the morpheme analyzer 208. Morphological analysis is a technique for dividing a document into meaningful words and discriminating parts of speech and contents using a dictionary. A “morpheme” is the smallest meaningful unit of document elements. In the morphological analysis unit 203, the document is data having part-of-speech information for each word.

ベクトル生成部204は、形態素解析部203で形態素解析された文書を受け取り、文書をベクトルで表現する部分である。この際、形態素解析部203から品詞付きの情報が得られるため、特定の品詞のみを採用してもよい。さらに、TF−IDF(Term Frequency − Inverse Document Frequency)により、特定の文書だけに出現頻度の高い語に重みを付けても構わない。重み付けに関しては一例であり、ここに挙げたもの以外の手法を用いても構わない。   The vector generation unit 204 is a part that receives the document subjected to the morphological analysis by the morphological analysis unit 203 and expresses the document as a vector. At this time, since information with a part of speech is obtained from the morphological analysis unit 203, only a specific part of speech may be employed. Further, words having a high appearance frequency may be weighted only for a specific document by TF-IDF (Term Frequency-Inverse Document Frequency). The weighting is an example, and methods other than those listed here may be used.

タグ自動生成部205は、回答文書とタグ調整文書から、これらの文書を表わすトピックを抽出することにより、タグを生成する。文書を表わすトピックの抽出には、トピックモデルを用いることができる。トピックモデルとは、データに隠れた潜在的なトピックを統計的に推定するモデルのことである。具体的には、LDA(Latent Dirichlet Allocation)や、LSI(Latent Semantic Indexing)、PLSA(Probabilistic Latent Semantic Analysis)などが挙げられるが、その文書を表すトピックを抽出できるものであれば、これに限らない。   The tag automatic generation unit 205 generates a tag by extracting topics representing these documents from the answer document and the tag adjustment document. A topic model can be used to extract a topic representing a document. A topic model is a model that statistically estimates potential topics hidden in data. Specifically, there are LDA (Lent Dirichlet Allocation), LSI (Lentent Semantic Indexing), PLSA (Probabilistic Latin Semantic Analysis), etc., but not limited to this as long as the topic representing the document can be extracted. .

タグ紐付け部206は、トピックモデルより抽出された複数のトピック(タグ群)の中から、回答文書を最も特徴付けるトピックをタグとして紐付ける。   The tag association unit 206 associates, as a tag, a topic that characterizes the answer document most among a plurality of topics (tag group) extracted from the topic model.

形態素解析器208は、形態素解析部203とデータのやりとりを行う。例えば、オープンソースの形態素解析エンジン「MeCab」を用いることができる。さらに、このエンジンによれば、形態素の品詞も解析することができる。例えば、形態素ごとに、「名詞」「動詞」・・・などである。なお、必ずしも形態素解析をする必要はなく、形態素解析部203、および形態素解析器208を通さず、用意されたキーワード辞書などを参照し、文書中の語を抽出する機構を用いてもよい。例えば、「エアコンの温度設定の方法」という文書に対して語を抽出する場合、「エアコン」「温度」「設定」「方法」がキーワード辞書に登録されていれば、それらの語を抽出するというものである。これらは一例であり、語を抽出できる手法であればこれに限らない。   The morpheme analyzer 208 exchanges data with the morpheme analyzer 203. For example, an open source morphological analysis engine “MeCab” can be used. Furthermore, according to this engine, the part of speech of a morpheme can also be analyzed. For example, “noun”, “verb”, etc. for each morpheme. Note that it is not always necessary to perform morpheme analysis, and a mechanism for extracting words in a document by referring to a prepared keyword dictionary or the like without passing through the morpheme analysis unit 203 and the morpheme analyzer 208 may be used. For example, when extracting words for a document “air conditioner temperature setting method”, if “air conditioner”, “temperature”, “setting”, and “method” are registered in the keyword dictionary, those words are extracted. Is. These are merely examples, and the method is not limited to this as long as the method can extract words.

通信部207は、制御サーバ1、回答データベース5および、タグ調整文書データベース6とそれぞれ通信する。   The communication unit 207 communicates with the control server 1, the answer database 5, and the tag adjustment document database 6.

図4は、本実施の形態における質問回答サーバ3の構成の一例を示すブロック図である。   FIG. 4 is a block diagram showing an example of the configuration of the question answering server 3 in the present embodiment.

図4に示されるように、質問回答サーバ3は、質問入力部301、形態素解析部302、キーワード抽出部303、質問検索部304、通信部305、形態素解析器306、回答データベース5を備える。   As shown in FIG. 4, the question / answer server 3 includes a question input unit 301, a morpheme analysis unit 302, a keyword extraction unit 303, a question search unit 304, a communication unit 305, a morpheme analyzer 306, and an answer database 5.

質問入力部301は、操作端末4から入力されたユーザの質問を受け取る。   The question input unit 301 receives a user question input from the operation terminal 4.

形態素解析部302は、質問入力部301から文書を受け取り、形態素解析器306を介して文書の形態素解析を行う。なお、図3における形態素解析部203と同等の機能を有するものであれば望ましい。   The morpheme analysis unit 302 receives a document from the question input unit 301 and performs morpheme analysis of the document via the morpheme analyzer 306. In addition, it is desirable if it has a function equivalent to the morphological analysis part 203 in FIG.

キーワード抽出部303は、形態素解析部302から得られた結果から、キーワードを抽出する。この際、形態素解析部302から品詞付きの情報が得られるため、特定の品詞の語を選択することで、キーワードとする。例えば、「名詞」「動詞」のみをキーワードとして取得する、などである。   The keyword extraction unit 303 extracts keywords from the result obtained from the morphological analysis unit 302. At this time, since information with a part of speech is obtained from the morphological analysis unit 302, a word having a specific part of speech is selected as a keyword. For example, only “noun” and “verb” are acquired as keywords.

質問検索部304は、キーワード抽出部303より得られたキーワードを用いて、回答データベース5に回答の検索を行う部分である。   The question search unit 304 is a part that searches the answer database 5 for answers using the keywords obtained from the keyword extraction unit 303.

形態素解析器306は、形態素解析部302とデータのやりとりを行う。なお、図3における形態素解析器208と同様の機能を有するものあればよい。   The morpheme analyzer 306 exchanges data with the morpheme analyzer 302. In addition, what has the same function as the morphological analyzer 208 in FIG.

通信部305は、制御サーバ1、回答データベース5とそれぞれ通信する。   The communication unit 305 communicates with the control server 1 and the answer database 5.

図5は本実施の形態における操作端末4の構成の一例を表すブロック図である。   FIG. 5 is a block diagram showing an example of the configuration of the operation terminal 4 in the present embodiment.

図5に示されるように、操作端末4は、入力検出部401、制御部402、表示部403、通信部404を有する。   As illustrated in FIG. 5, the operation terminal 4 includes an input detection unit 401, a control unit 402, a display unit 403, and a communication unit 404.

入力検出部401は、ユーザからのタッチパネル、音声、およびボタンなどを用いた入力の情報を取得する。   The input detection unit 401 acquires input information using a touch panel, voice, buttons, and the like from the user.

制御部402は、入力検出部401、表示部403との情報の送受信と、通信部404とのやりとりを行う。例えば、ユーザから「知識レベル:1」といった基準を意味する情報や「エアコンの効きが悪い」といった質問を意味する情報を受け付けると、制御部402を通じて通信部404に送信する。   The control unit 402 performs transmission / reception of information with the input detection unit 401 and the display unit 403 and exchanges with the communication unit 404. For example, when information indicating a criterion such as “knowledge level: 1” or information indicating a question such as “ineffectiveness of air conditioner” is received from the user, the information is transmitted to the communication unit 404 through the control unit 402.

表示部403は、制御部402から得られた情報を表示する。例えば、ユーザの質問に対する回答などである。   The display unit 403 displays information obtained from the control unit 402. For example, an answer to a user's question.

通信部404は、入力検出部401の情報を、制御部402を介してタグ付与サーバ2または質問回答サーバ3に送信し、タグ付与サーバ2または質問回答サーバ3から、制御部402を通じて、画面表示に関する情報を受信する。   The communication unit 404 transmits the information of the input detection unit 401 to the tagging server 2 or the question answering server 3 via the control unit 402, and displays the screen from the tagging server 2 or the question answering server 3 through the control unit 402. Receive information about.

図6は、本実施の形態における質問回答システムの一連の処理の一例を示すシーケンス図である。図6の例では、タグ調整文書を選択する基準として、ユーザの知識レベルを用いている。また、図6の例では、回答データベース5の更新、およびユーザの質問に対して操作端末4に回答を出力するまでの一連の通信処理のシーケンスを示している。このシーケンスは、操作端末4になんらかの入力が検出されたときに開始される。   FIG. 6 is a sequence diagram showing an example of a series of processes of the question answering system in the present embodiment. In the example of FIG. 6, the knowledge level of the user is used as a reference for selecting the tag adjustment document. In the example of FIG. 6, a series of communication processes until the answer database 5 is updated and the answer is output to the operation terminal 4 in response to the user's question is shown. This sequence is started when any input is detected on the operation terminal 4.

ステップS001において、操作端末4はユーザの知識レベルに関する入力を取得する。   In step S001, the operation terminal 4 acquires an input related to the user's knowledge level.

ステップS002において、ステップS001で得られた情報から、回答データベース5に対してユーザの知識レベルに合ったタグを付与する処理か、ユーザの質問に回答する処理かを選択する。ここでは、知識レベルに関する情報が入力されたため、タグ付与の処理を行う。これらの処理は図7に示されているため、後述する。   In step S002, it is selected from the information obtained in step S001 whether the process is to apply a tag that matches the knowledge level of the user to the answer database 5 or the process of answering the user's question. Here, since information related to the knowledge level has been input, a tagging process is performed. Since these processes are shown in FIG. 7, they will be described later.

ステップS003において、S002からユーザの知識レベルに関する情報を取得する。ステップS004において、回答データベース5からタグ付け対象の文書を取得する。また、図10に示すようなユーザの知識レベルとタグ調整文書との関係を示すテーブルを参照し、ステップS005において、適切なタグ調整文書をタグ調整文書データベース6から選択する。ここでの処理は、図8に示されているため、後述する。   In step S003, information about the user's knowledge level is acquired from S002. In step S 004, a tagging target document is acquired from the answer database 5. Further, referring to a table showing the relationship between the user knowledge level and the tag adjustment document as shown in FIG. 10, an appropriate tag adjustment document is selected from the tag adjustment document database 6 in step S005. The processing here is shown in FIG. 8, and will be described later.

ステップS006において、ステップS003、S004、S005から選択された文書からタグを抽出し、タグ付け対象文書の内容を最も示しているタグを文書と紐付ける。ここでの処理は、図9に示されているため、後述する。   In step S006, a tag is extracted from the document selected from steps S003, S004, and S005, and the tag that most indicates the content of the tagging target document is associated with the document. The processing here is shown in FIG. 9 and will be described later.

ステップS007において、タグを回答データベース5に反映することでデータベースの更新を行う。   In step S007, the database is updated by reflecting the tag in the answer database 5.

ステップS008において、操作端末4はユーザの質問の入力を取得する。   In step S008, the operation terminal 4 acquires an input of a user's question.

ステップS009において、ステップS008で得られた情報から、回答データベース5に対してユーザの知識レベルに合ったタグを付与する処理か、ユーザの質問に回答する処理かを選択する。ここでは、質問に関する情報が入力されたため、質問回答処理を行う。これらの処理は図7に示されているため、後述する。   In step S009, it is selected from the information obtained in step S008 whether the process is to apply a tag that matches the user's knowledge level to the answer database 5 or to answer the user's question. Here, since the information about the question is input, the question answer process is performed. Since these processes are shown in FIG. 7, they will be described later.

ステップS010において、ユーザの質問文からキーワードを抽出する。   In step S010, keywords are extracted from the user's question text.

ステップS011において、ユーザの質問に対する回答検索のための処理を行う。   In step S011, a process for searching for an answer to the user's question is performed.

ステップS012において、回答データベース5の検索を行う。   In step S012, the answer database 5 is searched.

ステップS013において、操作端末4に質問の回答を表示する。   In step S013, the answer to the question is displayed on the operation terminal 4.

従来手法では、どのユーザに対しても同一のタグが付けられるものであった。ユーザの知識レベルが異なると質問に使われる語が異なるため、あらゆる人に対して正しい検索ができるとは限らなかった。本手法であれば、ユーザ自身が知識レベルを申告する、または、ユーザの質問回答システムの使用履歴により、ユーザの知識レベルに合った語をタグとして自動で付与することができる。このため、どのようなユーザでも、所望の回答を得ることができるようになる。また、質問回答システムの使用履歴から自動で更新することもできるので、知識レベルが向上した場合も自動的にタグを更新することが可能である。   In the conventional method, the same tag is attached to any user. Because the words used for questions differ depending on the user's level of knowledge, it was not always possible to perform a correct search for everyone. According to this method, the user himself / herself declares the knowledge level, or a word suitable for the user's knowledge level can be automatically given as a tag based on the use history of the user's question answering system. For this reason, any user can obtain a desired answer. In addition, since the usage history of the question answering system can be automatically updated, the tag can be automatically updated even when the knowledge level is improved.

図7は、本実施の形態における、タグ付与サーバ2または質問回答サーバ3の選択処理の手順の一例を示すフローチャートである。この処理は、図6におけるサーバ選択処理(S002、S009)の詳細である。   FIG. 7 is a flowchart showing an example of the procedure of the selection process of the tag assignment server 2 or the question answering server 3 in the present embodiment. This process is the details of the server selection process (S002, S009) in FIG.

ステップS201において、操作端末4から得られたユーザの入力を取得する。   In step S201, the user input obtained from the operation terminal 4 is acquired.

ステップS202において、ステップS201から得られたデータ中に、知識レベルに関するデータ(すなわち、タグ調整文書を選択する基準に関する情報)が含まれているかを判断する。知識レベルに関する情報が含まれていると判断された場合には、ステップS203において、タグ付与サーバ2に知識レベルの情報を送信する。ステップS204において、ステップS201から得られたデータの中に、ユーザの質問が含まれているかどうかを判断する。質問に関する情報が含まれていると判断された場合には、ステップS205において、質問回答サーバ3に質問に関する情報を送信する。   In step S202, it is determined whether the data obtained from step S201 includes data relating to the knowledge level (that is, information relating to criteria for selecting the tag adjustment document). If it is determined that information on the knowledge level is included, the knowledge level information is transmitted to the tag assignment server 2 in step S203. In step S204, it is determined whether or not the user's question is included in the data obtained from step S201. If it is determined that the information related to the question is included, the information related to the question is transmitted to the question answering server 3 in step S205.

例えば、「インターネットの接続方法が知りたい」という情報が得られた場合、質問に関する情報であるため、質問回答サーバ3に情報が送信され、質問回答の処理が行われる。また、「知識レベル:1」のような情報が得られた場合、知識レベルに関する情報であるため、タグ付与サーバ2に情報が送信され、タグ付けの処理が行われる。図11は本実施形態による、ユーザの知識レベル入力時の操作端末4の表示画面の一例を示す図である。ただし、これらの表示方法は一例であり、これに限らない。   For example, when the information “I want to know how to connect to the Internet” is obtained, the information is related to the question, so the information is transmitted to the question answering server 3 and the question answering process is performed. Further, when information such as “knowledge level: 1” is obtained, the information is related to the knowledge level, so the information is transmitted to the tag assignment server 2 and the tagging process is performed. FIG. 11 is a diagram showing an example of a display screen of the operation terminal 4 when a user's knowledge level is input according to the present embodiment. However, these display methods are examples and are not limited thereto.

図11Aおよび図11Bは、それぞれ、ユーザが質問を行う際に、操作端末4に表示される画面の一例を示す図である。例えば、図11Aのように、各製品や製品全体に対して自分の知識レベルを入力する。また、例えば、図11Bのように、ユーザの質問と同時に、質問対象の製品に自分の知識レベルを入力することで、ユーザにあったタグで検索が可能になる。   11A and 11B are diagrams each showing an example of a screen displayed on the operation terminal 4 when the user asks a question. For example, as shown in FIG. 11A, the user's own knowledge level is input for each product or the entire product. Further, for example, as shown in FIG. 11B, by inputting the user's own knowledge level to the question target product at the same time as the user's question, the search can be performed with the tag suitable for the user.

なお、図11Aおよび図11Bの例では、ユーザが知識レベルを直接入力するようになっているが、ユーザの知識レベルに対応付けられる情報を入力するようにしてもよい。例えば、家電の使用方法に関する質問の場合、質問を行うユーザに対して、「若者」、「高齢者」のいずれであるかを選択する画面、あるいは、「一般ユーザ」、「営業マン」、「技術者」のいずれであるかを選択する画面を提示し、入力された情報に基づき、知識レベルを判定するようにしてもよい。また、製品が、特定の性別のユーザ、特定の年代のユーザ、または特定の地域に住むユーザによって主に使用されるものである場合、質問を行うユーザに対して、性別、年齢、または住所を入力する画面を提示し、入力された情報に基づき、知識レベルを判定するようにしてもよい。   11A and 11B, the user directly inputs the knowledge level. However, information associated with the user's knowledge level may be input. For example, in the case of a question about how to use home appliances, a screen for selecting whether the user is “young” or “elderly”, or “general user”, “salesman”, “ A screen for selecting one of “engineer” may be presented, and the knowledge level may be determined based on the input information. Also, if the product is primarily used by users of a specific gender, users of a specific age, or users who live in a specific region, the gender, age, A screen to be input may be presented, and the knowledge level may be determined based on the input information.

なお、図11Aのように、質問を受け付ける前に、回答提供者においてあらかじめ回答文書にタグ付けするためのオーサリングツールのような使い方もあれば、図11Bのように質問を問い合わせる際にタグを付与する方式でも構わない。質問問合せの際にタグを付与することで、オーサリングツールでは事前に対応できなかったものにも対応できることになる。さらに、そのユーザに合わせたタグだけを付与することができるため、余計なタグを検索することもない。例えば、オーサリングツールにおいて「インターネット、接続」というタグが付与されていても、質問時にユーザの知識レベルが向上していれば、質問時にタグ付けを行って、「インターネット、LAN、IPアドレス、ブラウザ」などと変更されていれば、より適切な回答を提示することができる。   In addition, before accepting a question as shown in FIG. 11A, if there is a usage like an authoring tool for tagging a response document in advance by an answer provider, a tag is given when inquiring a question as shown in FIG. 11B It does not matter if you do this. By attaching a tag when inquiring a question, the authoring tool can cope with things that could not be handled in advance. Furthermore, since only a tag tailored to the user can be assigned, an unnecessary tag is not searched. For example, even if the tag “Internet, connection” is given in the authoring tool, if the user's knowledge level is improved at the time of the question, tagging is performed at the time of the question, and “Internet, LAN, IP address, browser” If it is changed, etc., a more appropriate answer can be presented.

以上の処理により、各サーバで行う処理を切り分けることが可能である。これにより、ユーザの知識レベルを得て回答データベース5のタグを逐次的に更新しながら、ユーザの質問に対して適切な回答を行うことができる。   With the above processing, it is possible to separate the processing performed by each server. Accordingly, an appropriate answer can be made to the user's question while obtaining the user's knowledge level and sequentially updating the tags of the answer database 5.

図8は、本実施の形態における、タグ付け対象文書に対して、タグ調整文書を選択する処理の手順の一例を示すフローチャートである。この処理は、図6における文書選択処理(S003)の詳細である。   FIG. 8 is a flowchart showing an example of a processing procedure for selecting a tag adjustment document for a tagging target document in the present embodiment. This process is a detail of the document selection process (S003) in FIG.

ステップS301において、ユーザの知識レベルに関する情報(すなわち、タグ調整文書を選択する基準に関する情報)を取得する。ここで、図10のようなテーブルで読み取ることのできる情報に変換する。知識レベルを表す語として、例えば、「低・中・高」「易しい・普通・難しい」などが挙げられる。これらは一例であり、ここに挙げたもの以外を用いても構わない。これらを、テーブルが保持している情報に変換する機構を持っていることとする。図13は本発明の実施の態様に係るタグ調整文書データベース6のデータ構造の一例を示す図である。図13のように、タグ調整文書データベース6のデータの中に、複数の知識レベルの表現を含んでおいてもよい。   In step S301, information on the knowledge level of the user (that is, information on criteria for selecting a tag adjustment document) is acquired. Here, the information is converted into information that can be read by a table as shown in FIG. Examples of words representing the knowledge level include “low / medium / high”, “easy / ordinary / difficult”, and the like. These are only examples, and those other than those listed here may be used. It is assumed that a mechanism for converting these into information held in the table is provided. FIG. 13 is a diagram showing an example of the data structure of the tag adjustment document database 6 according to the embodiment of the present invention. As shown in FIG. 13, the data of the tag adjustment document database 6 may include a plurality of knowledge level expressions.

ステップS302において、ステップS301で取得した知識レベルと対応するタグ調整文書をタグ調整文書データベース6より選択する。この際、例えば図10に示すような、ユーザ習熟度とタグ調整文書のテーブルから対応関係を取得する。対応関係がわかればどのような形式でデータを保持してもよく、これに限らない。また、知識レベルに合わせた文章であれば、選択する文書の個数はいくつでもよい。   In step S302, a tag adjustment document corresponding to the knowledge level acquired in step S301 is selected from the tag adjustment document database 6. At this time, for example, the correspondence relationship is acquired from a table of user proficiency levels and tag adjustment documents as shown in FIG. Data can be held in any format as long as the correspondence relationship is known, but the present invention is not limited to this. In addition, any number of documents may be selected as long as the text matches the knowledge level.

ステップS303において、タグ付け対象文書と、ステップS302で選択されたタグ調整文書を組み合わせる。例えば、エアコンの取扱説明書のページにタグを付与したいとする。同時に、ユーザの知識レベルは「4(高い)」という情報が得られた場合、知識レベルとタグ調整文書の対応テーブルにより、タグ調整文書としてエアコン工事取り付け専門書が選ばれる。次に、タグ調整文書データベース6から、エアコン工事取り付け専門書に関する文書を取得し、タグ付け対象文書と組み合わせる。ここで、エアコン工事取り付け専門書が2個選ばれた場合は、例えば、タグ付け対象文書1個と合わせて、3個分の文書が次の処理に送られることとなる。   In step S303, the tagging target document and the tag adjustment document selected in step S302 are combined. For example, suppose you want to add a tag to a page of an air conditioner instruction manual. At the same time, when the information that the user's knowledge level is “4 (high)” is obtained, the air conditioning construction installation special book is selected as the tag adjustment document by the correspondence table of the knowledge level and the tag adjustment document. Next, a document related to the air conditioner installation specialization book is acquired from the tag adjustment document database 6 and combined with the tagging target document. Here, when two air conditioner construction attachment technical books are selected, for example, one document to be tagged and three documents are sent to the next processing.

以上の処理により、タグ付け対象文書に組み合わせる文書を自動で選択する。これにより、ユーザが自分でタグ付け対象文書に合ったタグ調整文書を選ぶ必要がなく、ユーザの負担を軽くすることができる。   Through the above processing, a document to be combined with a tagging target document is automatically selected. As a result, it is not necessary for the user to select a tag adjustment document suitable for the document to be tagged, and the burden on the user can be reduced.

図9は、本実施の形態における、タグ付け対象文書に対して、タグを抽出し紐付ける処理の手順の一例を示すフローチャートである。この処理は、図6におけるタグ抽出/紐付け処理(S006)の詳細である。   FIG. 9 is a flowchart illustrating an example of a processing procedure for extracting and linking a tag to a tagging target document according to the present embodiment. This process is a detail of the tag extraction / linking process (S006) in FIG.

ステップS601において、取得した文書の形態素解析を行う。形態素解析を行った文書は意味のある単語に区切られ、品詞情報を持ったデータとなる。   In step S601, morphological analysis of the acquired document is performed. A document subjected to morphological analysis is divided into meaningful words and becomes data having part-of-speech information.

ステップS602において、ステップS601から得られたデータを文書ごとにベクトル化する。この際、品詞付きの情報が得られているため、特定の品詞のみを採用してもよい。さらに、TF−IDF(Term Frequency − Inverse Document Frequency)により、特定の文書だけに出現頻度の高い語に重みを付けても構わない。重み付けに関しては一例であり、ここに挙げたもの以外の手法を用いても構わない。   In step S602, the data obtained from step S601 is vectorized for each document. At this time, since information with parts of speech is obtained, only specific parts of speech may be employed. Further, words having a high appearance frequency may be weighted only for a specific document by TF-IDF (Term Frequency-Inverse Document Frequency). The weighting is an example, and methods other than those listed here may be used.

ステップS603において、トピックモデルを用いて文書のタグを抽出する。トピックモデルは、データに隠れた潜在的なトピックを統計的に推定するモデルのことである。ここでトピックとは話題や意味のまとまりのことを指す。用意された複数文書に対して、トピック数を指定しトピックモデルを適用すると、指定したトピックの数だけトピックが得られる。ここでは、トピックの名称が得られるわけではないが、文書間や単語間の意味の関係性を統計的に見つけ出し、それぞれの文書がどのようなトピックから構成されているかが分かる。さらに、ステップS604において、それぞれの文書に最も出現しているトピックをその文書を最も表すトピックとみなし、トピックに含まれている単語をタグとして付与する。トピックモデルとして、具体的には、LDA(Latent Dirichlet Allocation)や、LSI(Latent Semantic Indexing)、PLSA(Probabilistic Latent SemanticAnalysis)などが挙げられるが、その文書を表すトピックを抽出できるものであれば、これに限らない。また、トピックの数は、文書の数もしくはそれ以上の数を指定するものとする。   In step S603, a document tag is extracted using the topic model. A topic model is a model that statistically estimates potential topics hidden in data. Here, topic refers to a group of topics and meanings. If a topic model is applied to a plurality of prepared documents and a topic model is applied, topics corresponding to the specified number of topics are obtained. Here, the topic name is not obtained, but the semantic relationship between documents and words is statistically found, and it is understood what topic each document is composed of. Further, in step S604, the topic that appears most in each document is regarded as the topic that best represents the document, and the words included in the topic are assigned as tags. Specific examples of the topic model include LDA (Lent Dirichlet Allocation), LSI (Lent Semantic Indexing), PLSA (Probabilistic Latin Semantic Analysis), and the like, as long as a topic representing the document can be extracted. Not limited to. In addition, the number of topics specifies the number of documents or more.

ステップS604において、抽出されたトピックをタグとして、タグ付け対象文書と紐付ける。この時、最もタグ付け対象文書を表しているトピックを選び、回答データベース5を更新する。例えば、最もタグ付け対象文書の語を含んでいるトピックを選ぶ、などが挙げられるが、これは一例であり、ここに挙げたもの以外の手法を用いても構わない。   In step S604, the extracted topic is linked to the tagging target document as a tag. At this time, the topic most representative of the document to be tagged is selected, and the answer database 5 is updated. For example, it is possible to select a topic that includes the word of the document to be tagged most, but this is an example, and methods other than those listed here may be used.

例えば、エアコンの取扱説明書1ページを1個と、タグ調整文書(知識レベル:1)2個の文書が得られたとする。形態素解析とベクトル化を行ったのち、タグの抽出を行ったとする。タグ抽出の結果、トピックとして、例えば、トピック1:「日当たり、センサー、調整」、トピック2:「テレビ欄、スマートフォン、テレビ」トピック3:「スポーツ、大会、選手」などのトピックが得られる。この時、タグ付け対象文書の1ページが日当たりセンサーの話題だった場合、トピック1の「日当たり、センサー、調節」がタグとして選択され、回答データベース5のタグを更新する。タグ調整文書の内容は、エアコンの内容と直接関係ない文章である可能性もあるため、トピック2の「テレビ欄、スマートフォン、テレビ」などの語は、タグ調整文書から抽出された語である可能性が高い。また、タグ調整文書の知識レベルを高く設定した場合、「調節日射センサー、屋外温度、室外ユニット」といった、知識レベルの高い人が使うような語をタグとして割り当てることになる。   For example, it is assumed that one page of an air conditioner instruction manual and two documents of tag adjustment documents (knowledge level: 1) are obtained. Assume that tags are extracted after morphological analysis and vectorization. As a result of the tag extraction, for example, topics such as Topic 1: “Daily, Sensor, Adjustment”, Topic 2: “TV Field, Smartphone, TV” Topic 3: “Sports, Competition, Player” are obtained. At this time, when one page of the document to be tagged is a topic of the daily sensor, the topic “daily, sensor, adjustment” is selected as the tag, and the tag of the answer database 5 is updated. Since the content of the tag adjustment document may be a sentence that is not directly related to the content of the air conditioner, words such as “TV column, smartphone, TV” in Topic 2 may be words extracted from the tag adjustment document High nature. When the knowledge level of the tag adjustment document is set high, words that are used by people with a high knowledge level such as “adjusted solar radiation sensor, outdoor temperature, outdoor unit” are assigned as tags.

以上の処理により、タグ調整文書の内容によって異なるトピックを抽出し、タグ付け対象文書に適切なトピックをタグとして付与する。これにより、ユーザの知識レベルから自動的にタグを抽出し文書に付与することで、ユーザに合わせた回答が可能になる。   Through the above processing, different topics are extracted depending on the contents of the tag adjustment document, and an appropriate topic is assigned as a tag to the tagging target document. Thus, by automatically extracting the tag from the user's knowledge level and assigning it to the document, an answer tailored to the user becomes possible.

図12は、本実施の形態における、回答データベース5に保持されているXMLの一例を表したものである。例えば、このように、本文、タグなどが構造化された状態で保持されている。また、ユーザの知識レベルが更新されるごとに、このタグの内容も更新される。ここに挙げた項目は一例であり、これら以外の項目があっても構わない。また、データの保存形式の一例としてXML形式を挙げているが、データを構造的に保持できるものであれば、これに限らない。   FIG. 12 shows an example of XML held in the answer database 5 in the present embodiment. For example, in this way, the text, tags, etc. are held in a structured state. Further, every time the user's knowledge level is updated, the contents of this tag are also updated. The items listed here are merely examples, and there may be other items. Also, the XML format is given as an example of the data storage format, but it is not limited to this as long as the data can be structurally held.

図13は、本実施の形態における、タグ調整文書データベース6に保持されているXMLの一例を表したものである。例えば、このように、本文、知識レベルなどが構造化された状態で保持されている。知識レベルの表現のゆらぎに関しては、図13のように知識レベルの項目に含んでおいてもよいし、別途、知識レベルの表現を変換する機構を持っていてもよい。ここに挙げた項目は一例であり、これら以外の項目があっても構わない。また、データの保存形式の一例としてXML形式を挙げているが、データを構造的に保持できるものであれば、これに限らない。   FIG. 13 shows an example of XML held in the tag adjustment document database 6 in the present embodiment. For example, in this way, the text, knowledge level, etc. are held in a structured state. The fluctuation of the knowledge level expression may be included in the knowledge level item as shown in FIG. 13, or a mechanism for converting the knowledge level expression may be provided separately. The items listed here are merely examples, and there may be other items. Also, the XML format is given as an example of the data storage format, but it is not limited to this as long as the data can be structurally held.

図14は、本実施の形態における、LDAを用いたトピック抽出の結果の一例を表す図である。例えば、取扱説明書の,機器のインターネット接続に関する項目にタグを付与するため、本手法であるトピックモデルを用いてタグ付けを行うとする。タグ付け対象文書を機器のインターネット接続に関するページとし、タグ調整文書をインターネット接続と異なる内容の取扱説明書とした場合、図14の(a)に示すような語が抽出される。また、タグ付け対象文書を機器のインターネット接続に関するページとし、タグ調整文書をWikipediaから選んだ一般的な内容とした場合、図14の(b)に示すような語が抽出される。また、どちらの組み合わせでも得られる語は、共通のタグとして図14の(c)に示すような語が現れる。本来の手法では、タグとして、例えば図14の(a)に表すような語を一意に付与することになるが、本手法を用いると、図14の(b)のような語もタグとして付与することができるため、ユーザに合わせたタグ付けが可能になることを示している。上記のように、文書の組み合わせを変えると、トピックモデルにおいてモデルを構成する語が異なるため、得られるトピックやそれに含まれる語も異なるものになる。   FIG. 14 is a diagram illustrating an example of a result of topic extraction using LDA in the present embodiment. For example, suppose that tagging is performed using the topic model which is the present technique in order to add a tag to an item related to the Internet connection of the device in the instruction manual. When the document to be tagged is a page related to the Internet connection of the device and the tag adjustment document is an instruction manual having contents different from those of the Internet connection, words as shown in FIG. 14A are extracted. Further, when the tag target document is a page related to the Internet connection of the device and the tag adjustment document is a general content selected from Wikipedia, words as shown in FIG. 14B are extracted. Further, as words obtained by either combination, words as shown in FIG. 14C appear as common tags. In the original method, for example, a word as shown in FIG. 14A is uniquely assigned as a tag. However, when this method is used, a word as in FIG. 14B is also assigned as a tag. This indicates that tagging tailored to the user is possible. As described above, when the combination of documents is changed, since the words constituting the model in the topic model are different, the obtained topics and the words included therein are also different.

以上、本発明の一態様に係るタグ付与装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、あるいは異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。   As described above, the tag assignment device according to one aspect of the present invention has been described based on the embodiments. However, the present invention is not limited to these embodiments. Unless it deviates from the meaning of this invention, the form which carried out various deformation | transformation which those skilled in the art can think to this embodiment, or the structure constructed | assembled combining the component in different embodiment is also contained in the scope of the present invention. .

例えば、ある家電製品に新しく搭載された機能のみを検索したいとする。このとき、ある家電製品の取扱説明書と後継機種(新機種)の取扱説明書を組み合わせてタグを抽出することで、例えば、後継機種(新機種)の特徴のみをタグとして付与することができる。同様に、ある家電製品の取扱説明書と旧機種の取扱説明書を組み合わせてタグを抽出することで、旧機種の特徴のみをタグとして付与することができるのは言うまでもない。また、上位機種・下位機種の組み合わせでタグを抽出することで、例えば、上位機種にしかない機能をタグとして付与することもできる。   For example, suppose you want to search only for functions newly installed in a certain home appliance. At this time, by extracting a tag by combining an instruction manual of a certain household electrical appliance and an instruction manual of a successor model (new model), for example, only features of the succeeding model (new model) can be assigned as a tag. . Similarly, it is needless to say that only the features of the old model can be added as a tag by extracting the tag by combining the instruction manual of a certain home appliance and the instruction manual of the old model. Further, by extracting a tag by a combination of a higher model and a lower model, for example, a function that is available only in a higher model can be given as a tag.

また、ある取扱説明書にタグを付与したい場合、タグ付け対象文書を取扱説明書の1ページとし、その他のページをタグ調整文書としてもよい。例えば、エアコンに関する取扱説明書の場合、タグ付け対象文書を風量調節に関係するページとし、タグ調整文書をエアコンの風量調節以外のページとすることで、タグ付け対象文書にタグが付与される。さらに、これらを取扱説明書のすべてのページについて行うことで、取扱説明書の全ページにタグが付与される。なお、ページは一例であって、項目や目次単位でも構わない。   If a tag is to be assigned to a certain instruction manual, the tagging target document may be one page of the instruction manual and the other pages may be tag adjustment documents. For example, in the case of an instruction manual related to an air conditioner, a tag is assigned to a tagging target document by setting the tagging target document as a page related to air volume adjustment and setting the tag adjustment document as a page other than the air volume adjustment of the air conditioner. Further, by performing these operations for all pages of the instruction manual, tags are assigned to all pages of the instruction manual. The page is an example, and an item or a table of contents may be used.

また、タグ調整文書データベース6を常時ネットワークにつなぐことで、データベースの内容を追加・更新する機構を持っていてもよい。タグ調整文書データベース6を更新する内容としては、例えば、Wikipediaのようなインターネット上の辞典、ニュース、ブログ、またはTwitter(登録商標)のような短文投稿サービスなどの内容を自動的に取り入れて、データベースの内容を更新することができる。また、新しい製品のプレスリリースなどの情報を取り入れてもよい。これらは一例であり、文書データであればこれに限らない。   Further, the tag adjustment document database 6 may be connected to a network at all times to have a mechanism for adding / updating the contents of the database. The contents for updating the tag adjustment document database 6 include automatically contents such as a dictionary on the Internet such as Wikipedia, news, blog, or a short text posting service such as Twitter (registered trademark). Can be updated. Information such as new product press releases may also be incorporated. These are only examples, and the document data is not limited thereto.

また、システム構成全体を表す図1において、制御サーバ1、タグ付与サーバ2、質問回答サーバ3は1つのサーバにより構成してもよいし、図1に示すものと異なる構成であっても構わない。また、例えば、オーサリングツールとして使う場合は、質問回答サーバ3がなくても構わない。回答データベース5、タグ調整文書データベース6は一つのデータベースとして構成されていても構わない。   Further, in FIG. 1 showing the entire system configuration, the control server 1, the tag assignment server 2, and the question answering server 3 may be configured by one server or may be different from the configuration shown in FIG. . For example, when used as an authoring tool, the question answering server 3 may not be provided. The answer database 5 and the tag adjustment document database 6 may be configured as one database.

また、本実施形態の例では、操作端末4からユーザの知識レベルを入力すると回答データベース5の回答文書にタグが付与されるが、質問回答システムにおいて、ユーザの行動履歴から知識レベルを取得することができれば、回答データベース5の文書のタグを自動、または手動で更新してもよい。例えば、ユーザのウェブの閲覧履歴やメールのやりとりで使われている語などを取得すれば、例えば機械学習を使って、統計的に知識レベルを算出してもよい。また、過去の質問の履歴からどのような語を使って質問しているのか、質問に対する回答は適切だったのかなどの情報を元に、回答データベース5のタグを更新してもよい。これらは一例であって、ユーザの知識レベルを得ることができる情報であればこれに限らない。   In the example of this embodiment, when a user's knowledge level is input from the operation terminal 4, a tag is assigned to the answer document in the answer database 5. In the question answering system, the knowledge level is acquired from the user's action history. If possible, the tag of the document in the answer database 5 may be updated automatically or manually. For example, if a user's web browsing history or words used in email exchange are acquired, the knowledge level may be statistically calculated using, for example, machine learning. Further, the tag of the answer database 5 may be updated based on information such as what kind of word is used from the history of past questions and whether the answer to the question is appropriate. These are merely examples, and the present invention is not limited to this as long as the information can obtain the user's knowledge level.

なお、本実施形態の例における知識レベルにおける難易度の部分は、どのような基準を用いても構わない。例えば、何らかの技術に対するスキルレベル、営業マンまたは技術者が使う語の違い、若者と高齢者が使う言葉の違いなどの観点で、タグ付けする語を変えても構わない。また、これらは一例であり、基準によって語が変わるようなものであればこれに限らない。   Note that any standard may be used for the level of difficulty in the knowledge level in the example of the present embodiment. For example, the terms to be tagged may be changed in terms of skill levels for some technologies, differences in terms used by salespeople or engineers, and differences in terms used by young people and elderly people. Moreover, these are examples, and it is not restricted to this as long as a word changes with criteria.

また、本実施の形態においては、家電の使用方法に関する質問回答システムを例として説明したが、他の分野への応用も可能である。例えば、医療診断システムにおいて、まず、質問を行うユーザに対して、医療分野あるいは質問しようとする症状に関する知識レベルを問い合わせ、得られた知識レベルに応じて、症例や治療方法に関する回答文書に適切なタグを付与するといったことが可能である。ユーザからの知識レベルの取得にあたっては、図11Aまたは図11Bと同様の画面により、知識レベルに相当する数値等の入力を受け付けるようにしてもよいし、一般患者であるか、医療関係者であるかといったような、知識レベルに相当する情報を受け付けるようにしてもよい。また、タグ調整文書については、例えば、知識レベルが高い場合は医学書や医療分野の論文を、知識レベルが低い場合は一般知識に関する文書を選択するようにすればよい。   Further, in the present embodiment, the question answering system relating to the usage method of home appliances has been described as an example, but application to other fields is also possible. For example, in a medical diagnosis system, first, a user who asks a question is inquired about a knowledge level regarding the medical field or a symptom to be asked, and according to the obtained knowledge level, an appropriate answer document regarding a case or a treatment method is used. It is possible to add a tag. When acquiring the knowledge level from the user, an input of a numerical value or the like corresponding to the knowledge level may be received on the same screen as in FIG. 11A or FIG. 11B, or it may be a general patient or a medical staff. Such information as the knowledge level may be received. For the tag adjustment document, for example, when the knowledge level is high, a medical book or a paper in the medical field may be selected, and when the knowledge level is low, a document related to general knowledge may be selected.

また、実施の形態におけるタグ付与装置が備える構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。   In addition, some or all of the components included in the tagging device according to the embodiment may be configured by one system LSI (Large Scale Integration).

システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Ramdom Access Memory)などを含んで構成されるコンピュータシステムである。前記ROMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。   The system LSI is an ultra-multifunctional LSI manufactured by integrating a plurality of components on one chip. Specifically, a microprocessor, a ROM (Read Only Memory), a RAM (Random Access Memory), etc. It is a computer system comprised including. A computer program is stored in the ROM. The system LSI achieves its functions by the microprocessor operating according to the computer program.

なお、ここでは、システムLSIとしたが、集積度の違いにより、IC、LSI、スーパーLSI、ウルトラLSIと呼称されることもある。また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、あるいはLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。   Although the system LSI is used here, it may be called IC, LSI, super LSI, or ultra LSI depending on the degree of integration. Further, the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. An FPGA (Field Programmable Gate Array) that can be programmed after manufacturing the LSI, or a reconfigurable processor that can reconfigure the connection and setting of circuit cells inside the LSI may be used.

さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。   Further, if integrated circuit technology comes out to replace LSI's as a result of the advancement of semiconductor technology or a derivative other technology, it is naturally also possible to carry out function block integration using this technology. Biotechnology can be applied.

また、本発明は、このような特徴的な処理部を備える、タグ付与装置として実現することができるだけでなく、タグ付与装置に含まれる特徴的な処理部をステップとするタグ付与方法などとして実現することもできる。また、そのような方法に含まれる特徴的な各ステップをコンピュータに実行させるコンピュータプログラムとして実現することもできる。そして、そのようなコンピュータプログラムを、CD−ROM等のコンピュータ読取可能な非一時的な記録媒体あるいはインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。   In addition, the present invention can be realized not only as a tag providing device including such a characteristic processing unit, but also as a tag providing method using the characteristic processing unit included in the tag adding device as a step. You can also It can also be realized as a computer program that causes a computer to execute the characteristic steps included in such a method. Needless to say, such a computer program can be distributed via a computer-readable non-transitory recording medium such as a CD-ROM or a communication network such as the Internet.

本発明に係るタグ付与方法は、文書に対して自動でタグを付与するタグ付与装置、文書に付されたタグにより質問に対する回答を検索する質問回答システム、文書に付されたタグにより文書を管理する文書管理システムなどに適用することができる。   A tagging method according to the present invention includes a tagging device for automatically tagging a document, a question answering system for searching for an answer to a question using a tag attached to the document, and managing the document by a tag attached to the document It can be applied to a document management system.

1 制御サーバ
2 タグ付与サーバ
3 質問回答サーバ
4 操作端末
5 回答データベース
6 タグ調整文書データベース
7 ネットワーク
101 入力検出部
102 処理選択部
103 制御部
104,207,305,404 通信部
201 基準取得部
202 文書選択部
203,302 形態素解析部
204 ベクトル生成部
205 タグ自動生成部
206 タグ紐付け部
208,306 形態素解析器
301 質問入力部
303 キーワード抽出部
304 質問検索部
401 入力検出部
402 制御部
403 表示部
DESCRIPTION OF SYMBOLS 1 Control server 2 Tag grant server 3 Question answer server 4 Operation terminal 5 Answer database 6 Tag adjustment document database 7 Network 101 Input detection part 102 Process selection part 103 Control part 104,207,305,404 Communication part 201 Reference | standard acquisition part 202 Document Selection unit 203, 302 Morphological analysis unit 204 Vector generation unit 205 Tag automatic generation unit 206 Tag linking unit 208, 306 Morphological analyzer 301 Question input unit 303 Keyword extraction unit 304 Question search unit 401 Input detection unit 402 Control unit 403 Display unit

Claims (18)

ユーザからの質問に対する回答を構成する回答文書に対して、回答を検索するためのタグを付与するタグ付与装置が行うタグ付与方法であって、
前記回答文書に対してタグとして付与するトピックを、前記検索を行うユーザまたは前記検索の対象に関する所定の基準により調整するためのタグ調整文書を選択し、
前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出し、
前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与する、
タグ付与方法。
A tagging method performed by a tagging device that grants a tag for searching for answers to an answer document that constitutes an answer to a question from a user,
Select a tag adjustment document for adjusting a topic to be given as a tag to the answer document according to a predetermined criterion related to a user who performs the search or the search target,
Extracting a topic representing the answer document and the selected tag adjustment document from the answer document and the selected tag adjustment document;
The extracted topic is given to the answer document as a predetermined reference tag.
Tagging method.
前記所定の基準は、検索の対象に対するユーザの習熟度または知識レベルが高いかあるいは低いかである、
請求項1記載のタグ付与方法。
The predetermined criterion is whether the user's proficiency level or knowledge level for the search target is high or low,
The tag providing method according to claim 1.
前記検索の対象は製品であり、前記回答文書は当該製品の取り扱いを説明する文書の少なくとも一部である、
請求項2記載のタグ付与方法。
The search target is a product, and the response document is at least a part of a document explaining the handling of the product.
The tag providing method according to claim 2.
前記検索の対象に対する習熟度または知識レベルが低いユーザよる検索に用いるタグを付与するための前記タグ調整文書として、一般知識に関する文書を選択する、
請求項3記載のタグ付与方法。
Selecting a document relating to general knowledge as the tag adjustment document for assigning a tag used for a search by a user having a low proficiency level or knowledge level with respect to the search target;
The tag providing method according to claim 3.
前記一般知識に関する文書とは、辞典、教科書、ニュース、ブログ、または短文投稿サービスのうち少なくとも1つである、
請求項4記載のタグ付与方法。
The general knowledge document is at least one of a dictionary, textbook, news, blog, or short text posting service.
The tag providing method according to claim 4.
前記検索の対象に対する習熟度または知識レベルが高いユーザよる検索に用いるタグを付与するための前記タグ調整文書として、専門知識に関する文書を選択する、
請求項3記載のタグ付与方法。
Selecting a document relating to expertise as the tag adjustment document for assigning a tag used for a search by a user having a high proficiency level or knowledge level with respect to the search target;
The tag providing method according to claim 3.
前記専門知識に関する文書とは、工事取り付け専門書、取扱説明書、学術専門書、社内文書、または営業情報のうち少なくとも1つである、
請求項6記載のタグ付与方法。
The document relating to the specialized knowledge is at least one of construction installation manual, instruction manual, academic technical book, in-house document, or sales information.
The tag providing method according to claim 6.
前記検索の対象は製品であり、前記所定の基準は、当該製品の新機能に関する情報であるか旧機能に関する情報であるかのいずれか一方である、
請求項1記載のタグ付与方法。
The target of the search is a product, and the predetermined criterion is either information on a new function of the product or information on an old function.
The tag providing method according to claim 1.
前記回答文書は、前記製品の機能を説明する文書の少なくとも一部であり、前記タグ調整文書は、当該製品より新機種または旧機種の機能を説明する文書の少なくとも一部である、
請求項8記載のタグ付与方法。
The answer document is at least a part of a document explaining the function of the product, and the tag adjustment document is at least a part of a document explaining a function of a new model or an old model from the product.
The tag providing method according to claim 8.
前記検索の対象は製品であり、前記所定の基準は、当該製品の上位機種に関する情報であるか下位機種に関する情報であるかのいずれか一方である、
請求項1記載のタグ付与方法。
The target of the search is a product, and the predetermined criterion is either information on a higher model of the product or information on a lower model.
The tag providing method according to claim 1.
前記回答文書は、前記製品の機能を説明する文書の少なくとも一部であり、前記タグ調整文書は、当該製品より上位機種または下位機種の機能を説明する文書の少なくとも一部である、
請求項10記載のタグ付与方法。
The answer document is at least a part of a document explaining the function of the product, and the tag adjustment document is at least a part of a document explaining a function of a higher model or a lower model than the product.
The tag providing method according to claim 10.
前記タグとして付与するキーワードの抽出は、文書を構成するトピックを自動で抽出するためのトピックモデルを用い、各文書の特徴を抽出することにより行う、
請求項1記載のタグ付与方法。
The extraction of keywords to be given as the tag is performed by extracting features of each document using a topic model for automatically extracting the topics constituting the document.
The tag providing method according to claim 1.
前記トピックモデルは、LDA(Latent Dirichlet Allocation)、LSI(Latent Semantic Indexing)、またはPLSA(Probabilistic Latent Semantic Analysis)の少なくとも1つである、
請求項12記載のタグ付与方法。
The topic model is at least one of LDA (Lent Dielectric Allocation), LSI (Lent Semantic Indexing), or PLSA (Probabilistic Lent Semantic Analysis).
The tag providing method according to claim 12.
前記回答文書への前記タグの付与は、前記トピックモデルから得られた複数のタグ群の中で、最も多く回答文書を含むタグ群を選択することにより行う、
請求項12記載のタグ付与方法。
The assignment of the tag to the answer document is performed by selecting a tag group including the most answer documents among a plurality of tag groups obtained from the topic model.
The tag providing method according to claim 12.
前記タグ調整文書の選択は、前記ユーザの行動履歴に基づいて行う、
請求項1記載のタグ付与方法。
The tag adjustment document is selected based on the user's action history.
The tag providing method according to claim 1.
検索対象の文書群からユーザの質問に適合する回答文書を検索する質問回答システムが行う質問検索方法であって、
前記検索を行うユーザまたは前記検索の対象に関する所定の基準を判定し、
前記所定の基準に基づき、前記回答文書に対してタグとして付与するトピックを調整するためのタグ調整文書を選択し、
前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出し、
前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与し、
前記ユーザの質問からキーワードを抽出し、当該キーワードと合致するタグが付与された前記回答文書を検索する、
質問回答検索方法。
A question search method performed by a question answering system that searches an answer document that matches a user's question from a document group to be searched,
Determining a predetermined criterion relating to the user or the search target of the search;
Based on the predetermined criteria, select a tag adjustment document for adjusting the topic to be given as a tag to the answer document,
Extracting a topic representing the answer document and the selected tag adjustment document from the answer document and the selected tag adjustment document;
The extracted topic is given to the answer document as a predetermined reference tag,
A keyword is extracted from the user's question, and the answer document to which a tag matching the keyword is assigned is searched;
Question answer search method.
ユーザからの質問に対する回答を構成する回答文書に対して、回答を検索するためのタグを付与するタグ付与装置であって、
前記回答文書に対してタグとして付与するトピックを、前記検索を行うユーザまたは前記検索の対象に関する所定の基準により調整するためのタグ調整文書を選択する文書選択手段と、
前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出するトピック抽出手段と、
前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与するタグ付与手段と、
を備えるタグ付与装置。
A tag assignment device for attaching a tag for searching for an answer to an answer document constituting an answer to a question from a user,
A document selection means for selecting a tag adjustment document for adjusting a topic to be given as a tag to the answer document according to a predetermined criterion relating to the user who performs the search or the search target;
Topic extracting means for extracting a topic representing the answer document and the selected tag adjustment document from the answer document and the selected tag adjustment document;
Tag giving means for giving the extracted topic to the answer document as a predetermined reference tag;
A tagging device comprising:
コンピュータを、ユーザからの質問に対する回答を構成する回答文書に対して、回答を検索するタグを付与するためのタグ付与装置として機能させるためのプログラムであって、
前記コンピュータに、
前記回答文書に対してタグとして付与するトピックを、前記検索を行うユーザまたは前記検索の対象に関する所定の基準により調整するためのタグ調整文書を選択し、
前記回答文書および前記選択されたタグ調整文書から、当該回答文書および当該選択されたタグ調整文書を表わすトピックを抽出し、
前記抽出されたトピックを、所定の基準のタグとして前記回答文書に付与する、
ことを実行させるプログラム。
A program for causing a computer to function as a tag assigning device for assigning a tag for searching for an answer to an answer document constituting an answer to a question from a user,
In the computer,
Select a tag adjustment document for adjusting a topic to be given as a tag to the answer document according to a predetermined criterion related to a user who performs the search or the search target,
Extracting a topic representing the answer document and the selected tag adjustment document from the answer document and the selected tag adjustment document;
The extracted topic is given to the answer document as a predetermined reference tag.
A program that lets you do that.
JP2015010177A 2015-01-22 2015-01-22 Tag assignment method, tag assignment device, program, and question answer search method Expired - Fee Related JP6388212B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015010177A JP6388212B2 (en) 2015-01-22 2015-01-22 Tag assignment method, tag assignment device, program, and question answer search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015010177A JP6388212B2 (en) 2015-01-22 2015-01-22 Tag assignment method, tag assignment device, program, and question answer search method

Publications (2)

Publication Number Publication Date
JP2016134124A true JP2016134124A (en) 2016-07-25
JP6388212B2 JP6388212B2 (en) 2018-09-12

Family

ID=56464373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015010177A Expired - Fee Related JP6388212B2 (en) 2015-01-22 2015-01-22 Tag assignment method, tag assignment device, program, and question answer search method

Country Status (1)

Country Link
JP (1) JP6388212B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947905A (en) * 2017-08-15 2019-06-28 富士通株式会社 Generate the method and apparatus for puing question to answer pair
WO2021038690A1 (en) * 2019-08-26 2021-03-04 日本電信電話株式会社 Document tag assignment device, similar document search system, document tag assignment method, and document tag assignment program
JP2021114184A (en) * 2020-01-20 2021-08-05 シャープ株式会社 Summary generation device, summary generation method and program
US11144712B2 (en) 2019-09-02 2021-10-12 Fujitsu Limited Dictionary creation apparatus, dictionary creation method, and non-transitory computer-readable storage medium for storing dictionary creation program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084754A (en) * 2003-09-04 2005-03-31 Hitachi Software Eng Co Ltd System for assigning link tag for dictionary consultation
JP2012221316A (en) * 2011-04-11 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> Document topic extraction device, method, and program
JP2013045415A (en) * 2011-08-26 2013-03-04 Nippon Telegr & Teleph Corp <Ntt> Topic word acquisition device, method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084754A (en) * 2003-09-04 2005-03-31 Hitachi Software Eng Co Ltd System for assigning link tag for dictionary consultation
JP2012221316A (en) * 2011-04-11 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> Document topic extraction device, method, and program
JP2013045415A (en) * 2011-08-26 2013-03-04 Nippon Telegr & Teleph Corp <Ntt> Topic word acquisition device, method, and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947905A (en) * 2017-08-15 2019-06-28 富士通株式会社 Generate the method and apparatus for puing question to answer pair
CN109947905B (en) * 2017-08-15 2023-02-21 富士通株式会社 Method and equipment for generating question and answer pairs
WO2021038690A1 (en) * 2019-08-26 2021-03-04 日本電信電話株式会社 Document tag assignment device, similar document search system, document tag assignment method, and document tag assignment program
US11144712B2 (en) 2019-09-02 2021-10-12 Fujitsu Limited Dictionary creation apparatus, dictionary creation method, and non-transitory computer-readable storage medium for storing dictionary creation program
JP2021114184A (en) * 2020-01-20 2021-08-05 シャープ株式会社 Summary generation device, summary generation method and program

Also Published As

Publication number Publication date
JP6388212B2 (en) 2018-09-12

Similar Documents

Publication Publication Date Title
US20240078386A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
JP6440732B2 (en) Automatic task classification based on machine learning
CN110704626B (en) Short text classification method and device
US20120016661A1 (en) System, method and device for intelligent textual conversation system
JP6745384B2 (en) Method and apparatus for pushing information
CA2823835C (en) Voice search and response based on relevancy
CN110399470B (en) Session message handling
KR20200137601A (en) Apparatus and method for processing of question and answer using chatbot
JP6388212B2 (en) Tag assignment method, tag assignment device, program, and question answer search method
CN104063455A (en) Method and device for acquiring counseling messages of disease based on searching
US20230030086A1 (en) System and method for generating ontologies and retrieving information using the same
Tonelli et al. Boosting collaborative ontology building with key-concept extraction
Pitti et al. Social networks and archival context: From project to cooperative archival program
WO2013147236A1 (en) Expert evaluation data management system
JP2017182646A (en) Information processing device, program and information processing method
JP2019121060A (en) Generation program, generation method and information processing apparatus
US20210224303A1 (en) Searching device and searching program
JP6188222B2 (en) Topic extraction apparatus and program
JP7188879B2 (en) Provision device, provision method and provision program
JP2020091539A (en) Information processing device, information processing method, and information processing program
JP6941802B1 (en) Search system, search method and search program
JP6640519B2 (en) Information analysis device and information analysis method
Bormann et al. The influence of word frequency on semantic word substitutions in aphasic naming
JP6941803B1 (en) Search system, search method and search program
JP6941801B1 (en) Search system, search method and search program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180802

R151 Written notification of patent or utility model registration

Ref document number: 6388212

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees