JP6739361B2 - Information providing device, information providing method, and program - Google Patents

Information providing device, information providing method, and program Download PDF

Info

Publication number
JP6739361B2
JP6739361B2 JP2017006361A JP2017006361A JP6739361B2 JP 6739361 B2 JP6739361 B2 JP 6739361B2 JP 2017006361 A JP2017006361 A JP 2017006361A JP 2017006361 A JP2017006361 A JP 2017006361A JP 6739361 B2 JP6739361 B2 JP 6739361B2
Authority
JP
Japan
Prior art keywords
content
search
question
label
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017006361A
Other languages
Japanese (ja)
Other versions
JP2018116447A (en
Inventor
一真 村尾
一真 村尾
拓也 大久保
拓也 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017006361A priority Critical patent/JP6739361B2/en
Publication of JP2018116447A publication Critical patent/JP2018116447A/en
Application granted granted Critical
Publication of JP6739361B2 publication Critical patent/JP6739361B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報提供装置、情報提供方法、およびプログラムに関する。 The present invention relates to an information providing device, an information providing method, and a program.

従来、ウェブ検索において、ユーザが入力した質問文の内容を解析し、ユーザが要求する回答を含む検索結果が得られるようにする技術についての研究が進められている。例えば、ユーザが入力した質問文の解析を行って、質問文がその回答として「人名」を求めているのか、「地名」を求めているのか、「日付」を求めているのかなどの質問内容の質問種別であるラベルを判定し、検索結果の精度を向上させる技術についての研究が進められている(例えば、特許文献1および2参照)。 2. Description of the Related Art Conventionally, in web search, research has been conducted on a technique for analyzing the content of a question sentence input by a user and obtaining a search result including an answer requested by the user. For example, by analyzing the question text entered by the user, whether the question text asks for "personal name", "place name", or "date" as the answer. Research on techniques for determining the label, which is the question type, and improving the accuracy of search results is underway (see, for example, Patent Documents 1 and 2).

特開2012−68687号公報JP 2012-68687 A 特開2010−198189号公報JP, 2010-198189, A

従来の技術において質問内容のラベルを判定する場合、予め基準となる質問内容のパターンとラベルとの関係性をルール化しておく必要がある。例えば、「〜は誰ですか」という質問内容のパターンに対しては「Person(人名)」というラベルを付与し、「〜はいつですか」という質問内容のパターンに対しては「Date(日付)」というラベルを付与したルールを予め定義しておく必要がある。 In the case of determining the question content label in the conventional technique, it is necessary to rule the relationship between the reference question content pattern and the label in advance. For example, a label "Person (person name)" is given to the question content pattern "Who is ..." and a "Date (date )” is required to be defined in advance.

上記のようなルール化は手動で行われる場合が多く、ルール化に要する作業負荷が増大してしまう場合があった。また、ラベルの定義を増やすなどのラベル変更を行いたい場合には、ルールの再構築を行う必要があった。さらに、このようなルールの精度はルール化の作業を行う作業者のスキルに依存するものであるため、質問文のパターンやラベルの設定内容が適切でない場合、検索結果の精度を向上させることができないという問題があった。 In many cases, the rule formation as described above is performed manually, and the workload required for the rule formation may increase. In addition, in order to change the label such as increasing the label definition, it was necessary to reconstruct the rule. Furthermore, since the accuracy of such rules depends on the skill of the worker who makes the rules, the accuracy of the search results can be improved if the question sentence pattern or label settings are not appropriate. There was a problem that I could not.

本発明は、このような事情を考慮してなされたものであり、質問内容に対するラベル付与を自動化および適正化することにより検索結果の精度を向上させることが可能な情報提供装置、情報提供方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in view of such circumstances, and an information providing device, an information providing method, which can improve the accuracy of search results by automating and optimizing the labeling of question contents. And one of the purposes is to provide a program.

本発明の一態様は、第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得する第1検索部と、前記第1検索部によって取得された前記第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与する付与部と、を備える情報提供装置である。 One aspect of the present invention uses a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content. A first search unit that performs a network search to obtain a first document as a search result, and a third morpheme that is before and after the second character string included in the first document obtained by the first search unit. An information providing apparatus, comprising: an assigning unit that assigns a first label indicating a question type to the first question content based on a character string.

本発明の一態様によれば、質問内容に対するラベル付与を自動化および適正化することにより検索結果の精度を向上させることができる。 According to one aspect of the present invention, the accuracy of search results can be improved by automating and optimizing the labeling of question contents.

情報提供システム1の構成図である。It is a block diagram of the information providing system 1. 情報提供装置5の機能構成を示す図である。It is a figure which shows the function structure of the information provision apparatus 5. 判定部14の機能構成を示す図である。It is a figure which shows the function structure of the determination part 14. 記憶部20に記憶された質問内容QLに対して回答内容ALが関連付けされたレコードの一例を示す図である。FIG. 6 is a diagram showing an example of a record in which an answer content AL is associated with a question content QL stored in a storage unit 20. 記憶部20に記憶された質問内容QLに対して、ラベルLが付与された後のレコードの一例を示す図である。FIG. 9 is a diagram showing an example of a record after a label L is added to the question content QL stored in the storage unit 20. 学習段階における情報提供装置5の処理を示すフローチャートである。It is a flowchart which shows the process of the information provision apparatus 5 in a learning stage. 運用段階における情報提供装置5の処理を示すフローチャートである。It is a flowchart which shows the process of the information provision apparatus 5 in an operation stage.

以下、図面を参照し、本発明の情報提供装置、情報提供方法、およびプログラムの実施形態について説明する。情報提供装置は、質問内容から抽出されたキーワードと、回答内容との組である検索クエリを用いてネットワーク検索を行って検索結果であるドキュメントを取得し、このドキュメントに含まれる回答内容の文字列の前後にある形態素に基づいて、質問内容に対して質問種別を示すラベルを付与する装置である。また、情報提供装置は、質問内容と、ラベルとの関係性を予め学習し、情報提供を要求する質問内容に関連付けされるラベルを判定する。 Hereinafter, embodiments of an information providing apparatus, an information providing method, and a program of the present invention will be described with reference to the drawings. The information providing device performs a network search using a search query that is a combination of a keyword extracted from the question content and the answer content to obtain a document that is a search result, and a character string of the answer content included in this document. It is a device that adds a label indicating a question type to the question content based on the morphemes before and after. Further, the information providing apparatus learns the relationship between the question content and the label in advance and determines the label associated with the question content requesting the information provision.

図1は、情報提供システム1の構成図である。情報提供システム1は、対話型の情報提供サービスを実現する。例えば、情報提供システム1は、ユーザからの「日本の首都は何処ですか?」という質問内容に対して、「東京」という回答内容を提供するような質問応答型の情報提供サービスを実現する。 FIG. 1 is a configuration diagram of the information providing system 1. The information providing system 1 realizes an interactive information providing service. For example, the information providing system 1 realizes a question-and-answer type information providing service that provides the answer content "Tokyo" to the question content "where is the capital of Japan?" from the user.

情報提供システム1は、例えば、一以上の端末装置3と、一以上の情報提供装置5と、一以上の検索サーバ7とを備える。端末装置3と、情報提供装置5と、検索サーバ7とは、ネットワークNWによって互いに接続されており、このネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。 The information providing system 1 includes, for example, one or more terminal devices 3, one or more information providing devices 5, and one or more search servers 7. The terminal device 3, the information providing device 5, and the search server 7 are connected to each other via a network NW, and communicate with each other via this network NW. The network NW includes, for example, a WAN (Wide Area Network), a LAN (Local Area Network), the Internet, a dedicated line, a wireless base station, a provider, and the like.

[端末装置]
端末装置3は、対話型の情報提供サービスを利用するユーザによって操作される。端末装置3は、例えば、パーソナルコンピュータ、スマートフォンなどの携帯電話やタブレット端末、PDA(Personal Digital Assistant)などのコンピュータ装置である。端末装置3は、ユーザの操作に基づいて、情報提供を要求する質問内容Q(第2質問内容)を情報提供装置5に送信し、質問内容Qに対する回答内容Aを情報提供装置5から受信する。
[Terminal device]
The terminal device 3 is operated by a user who uses an interactive information providing service. The terminal device 3 is, for example, a personal computer, a mobile phone such as a smartphone, a tablet terminal, or a computer device such as a PDA (Personal Digital Assistant). The terminal device 3 transmits the question content Q (second question content) requesting the information provision to the information providing apparatus 5 and receives the answer content A to the question content Q from the information providing apparatus 5 based on the operation of the user. ..

[情報提供装置]
情報提供装置5は、端末装置3から受信した質問内容Qに対する回答内容Aを、端末装置3に送信するコンピュータ装置である。図2は、情報提供装置5の機能構成を示す図である。情報提供装置5は、例えば、通信部10(受付部)と、質問内容検索部12(第2検索部)と、判定部14と、回答決定部16(決定部)と、記憶部18とを備える。情報提供装置5に含まれる各機能部は、複数の装置に分散されてもよい。例えば、判定部14と他の機能部とは別体の装置によって実現されてもよい。記憶部18は、NAS(Network Attached Storage)などの記憶装置であってもよい。
[Information providing device]
The information providing device 5 is a computer device that transmits the answer content A to the question content Q received from the terminal device 3 to the terminal device 3. FIG. 2 is a diagram showing a functional configuration of the information providing device 5. The information providing device 5 includes, for example, a communication unit 10 (reception unit), a question content search unit 12 (second search unit), a determination unit 14, an answer determination unit 16 (determination unit), and a storage unit 18. Prepare Each functional unit included in the information providing device 5 may be distributed to a plurality of devices. For example, the determination unit 14 and the other functional units may be realized by a device separate from each other. The storage unit 18 may be a storage device such as NAS (Network Attached Storage).

質問内容検索部12、判定部14、および回答決定部16は、例えば、CPU(Central Processing Unit)などのプロセッサが、記憶部18に記憶されたプログラム(ソフトウェア)を実行することにより実現される。プログラムは、例えば、ネットワークNWを介してアプリケーションサーバからダウンロードされてもよいし、予め情報提供装置5にプリインストールされていてもよい。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。記憶部18は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などによって実現される。 The question content search unit 12, the determination unit 14, and the answer determination unit 16 are realized by a processor such as a CPU (Central Processing Unit) executing a program (software) stored in the storage unit 18, for example. The program may be downloaded from an application server via the network NW, or may be preinstalled in the information providing device 5, for example. Further, these functional units may be realized by hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), or the cooperation of software and hardware. May be realized by. The storage unit 18 is realized by, for example, a RAM (Random Access Memory), a ROM (Read Only Memory), a HDD (Hard Disk Drive), a flash memory, or a hybrid storage device in which a plurality of these are combined.

通信部10は、端末装置3から質問内容Qを受信し、受信した質問内容Qを、質問内容検索部12および判定部14に出力する。また、通信部10は、回答決定部16により決定された回答内容Aを端末装置3に送信する。 The communication unit 10 receives the question content Q from the terminal device 3, and outputs the received question content Q to the question content search unit 12 and the determination unit 14. The communication unit 10 also transmits the answer content A determined by the answer determination unit 16 to the terminal device 3.

質問内容検索部12は、通信部10から入力された質問内容Qを検索クエリ(第2検索クエリ)として、ネットワーク検索を行う。例えば、質問内容検索部12は、通信部10から入力された質問内容Qである検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページを少なくも1つ取得し、取得したページを検索結果Dとして回答決定部16に出力する。取得したページは、HTML(Hyper Text Markup Language)などのマークアップ言語で記述されたテキストデータであるドキュメント(第2ドキュメント)などである。なお、質問内容検索部12は、質問内容Qに加え、質問内容Qと関連する用語を使用して検索を行うクエリ拡張検索を行ってもよい。また、質問内容検索部12は、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページの一部を取得するようにしてもよい。 The question content search unit 12 performs a network search using the question content Q input from the communication unit 10 as a search query (second search query). For example, the question content search unit 12 transmits a search query, which is the question content Q input from the communication unit 10, to the search server 7, and the search server 7 returns at least 1 page of the URL of the content associated with the search query. One is acquired, and the acquired page is output to the answer determination unit 16 as the search result D. The acquired page is a document (second document) that is text data described in a markup language such as HTML (Hyper Text Markup Language). In addition to the question content Q, the question content search unit 12 may perform a query expansion search using a term related to the question content Q. Further, the question content search unit 12 may acquire a part of the page of the URL of the content associated with the search query from the search server 7.

判定部14は、通信部10から入力された質問内容Qの質問種別であるラベルLを判定する。このラベルLとしては、例えば、組織名(Organization)、人名(Person)、地名(Location)、日付表現(Date)、時間表現(Time)、金額表現(Money)、割合表現(Percent)、固有物名(Artifact)などが含まれる。ラベルの定義は、情報提供装置5の管理者などによって任意に定められる。判定部14は、判定したラベルLを回答決定部16に出力する。 The determination unit 14 determines the label L, which is the question type of the question content Q input from the communication unit 10. As the label L, for example, an organization name (Organization), a person name (Person), a place name (Location), a date expression (Date), a time expression (Time), an amount expression (Money), a percentage expression (Percent), and a unique item Name (Artifact) etc. are included. The definition of the label is arbitrarily set by the administrator of the information providing device 5 or the like. The determination unit 14 outputs the determined label L to the answer determination unit 16.

判定部14におけるラベルLの判定処理においては、再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)多層構造のニューラルネットワーク(Deep Neural Network:DNN)、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)などを用いたディープラーニング技術を採用する。 In the determination processing of the label L in the determination unit 14, a recurrent neural network (RNN), a multilayered neural network (Deep Neural Network: DNN), a convolutional neural network (CNN), or the like is used. Adopt deep learning technology.

図3は、判定部14の機能構成を示す図である。判定部14は、例えば、記憶部20と、読出部22と、キーワード検索部24(第1検索部)と、ラベル付与部26(付与部)と、ラベル判定部28(判定部)とを備える。記憶部20と、読出部22と、キーワード検索部24と、ラベル付与部26とは、ラベル判定部28の学習段階で動作する機能部である。 FIG. 3 is a diagram showing a functional configuration of the determination unit 14. The determination unit 14 includes, for example, a storage unit 20, a reading unit 22, a keyword search unit 24 (first search unit), a label assignment unit 26 (assignment unit), and a label determination unit 28 (determination unit). .. The storage unit 20, the reading unit 22, the keyword searching unit 24, and the label assigning unit 26 are functional units that operate at the learning stage of the label determining unit 28.

記憶部20には、予め、質問内容QL(第1質問内容)に対して回答内容ALが関連付けされたレコードが複数記憶されている。これらの複数のレコードは、ラベル判定部28が学習対象とする学習データの元となるレコードである。これらの複数のレコードは、学習データを提供する外部のデータベースから提供されてもよいし、インターネット上のコンテンツから自動的に生成されるようにしてもよい。また、これらの複数のレコードは、情報提供装置5の管理者により手動で登録されるようにしてもよいし、回答内容から複数の質問内容が機械的に生成されるようにしてもよい。これらの複数のレコードの各々における、質問内容QLに対してラベルLがラベル付与部26によって付与される。このラベル付与部26によってラベルLが付与された後のレコードが、ラベル判定部28が学習対象とする学習データとなる。 The storage unit 20 stores in advance a plurality of records in which the answer content AL is associated with the question content QL (first question content). These plurality of records are records that are the sources of the learning data that the label determination unit 28 learns. These plurality of records may be provided from an external database that provides learning data, or may be automatically generated from content on the Internet. Further, these plural records may be manually registered by the administrator of the information providing device 5, or plural question contents may be mechanically generated from the answer contents. A label L is attached to the question content QL in each of the plurality of records by the label attaching unit 26. The record to which the label L has been attached by the label attaching unit 26 becomes the learning data to be learned by the label determining unit 28.

図4は、記憶部20に予め記憶された質問内容QLに対して回答内容ALが関連付けされたレコードの一例を示す図である。また、図5は、記憶部20に記憶された質問内容QLに対して、ラベルLが付与された後のレコードの一例を示す図である。 FIG. 4 is a diagram showing an example of a record in which the answer content AL is associated with the question content QL stored in advance in the storage unit 20. FIG. 5 is a diagram showing an example of a record after the label L is attached to the question content QL stored in the storage unit 20.

図4に示す例では、記憶部20には、「日本の首都は何処ですか?」という質問内容QLに対して「東京」という回答内容ALが関連付けされたレコードなどが記憶されている。ここで、例えば、外部のデータベースから提供されて、記憶部20に予め記憶されたこれらのレコードに対してはラベルLが付与されていない。一方、図5に示す例では、記憶部20には、ラベル付与部26によるラベル付与処理によって、「日本の首都は何処ですか?」という質問内容QLに対して「地名」というラベルLが付与されたレコードなどが記憶されている。 In the example shown in FIG. 4, the storage unit 20 stores a record in which the answer content AL of “Tokyo” is associated with the question content QL of “where is the capital of Japan?”. Here, for example, the label L is not given to these records that are provided from an external database and stored in the storage unit 20 in advance. On the other hand, in the example shown in FIG. 5, the label assigning unit 26 assigns the label L of “place name” to the question content QL “where is the capital of Japan?” by the label assigning unit 26. Recorded records are stored.

記憶部20は、例えば、RAM、ROM、HDD、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などによって実現される。記憶部20は、記憶部18と同じ装置であってもよい。 The storage unit 20 is realized by, for example, a RAM, a ROM, a HDD, a flash memory, or a hybrid storage device in which a plurality of these are combined. The storage unit 20 may be the same device as the storage unit 18.

読出部22は、記憶部20から、図4に示すような質問内容QLと回答内容ALとの組を読み出す。読出部22は、読み出した質問内容QLの形態素解析を行って少なくとも1つのキーワードK(第1文字列)を抽出し、抽出したキーワードKと読み出した回答内容AL(第2文字列)との組をキーワード検索部24に出力する。また、読出部22は、読み出した回答内容ALをラベル付与部26に出力する。 The reading unit 22 reads a set of question contents QL and answer contents AL as shown in FIG. 4 from the storage unit 20. The reading unit 22 performs morphological analysis of the read question content QL to extract at least one keyword K (first character string), and a combination of the extracted keyword K and the read answer content AL (second character string). Is output to the keyword search unit 24. Further, the reading unit 22 outputs the read response content AL to the label assigning unit 26.

キーワード検索部24は、読出部22から入力されたキーワードKと回答内容ALとの組を検索クエリ(第1検索クエリ)として、ネットワーク検索を行う。例えば、キーワード検索部24は、読出部22から入力されたキーワードKと回答内容ALとの組である検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページを少なくも1つ取得し、取得したページを検索結果DLとしてラベル付与部26に出力する。取得したページは、例えば、HTMLなどのマークアップ言語で記述されたテキストデータであるドキュメント(第1ドキュメント)などである。なお、キーワード検索部24は、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページの一部を取得するようにしてもよい。 The keyword search unit 24 performs a network search by using the combination of the keyword K and the answer content AL input from the reading unit 22 as a search query (first search query). For example, the keyword search unit 24 transmits a search query, which is a set of the keyword K and the answer content AL input from the reading unit 22, to the search server 7, and the search server 7 sends the URL of the content associated with the search query. At least one page is acquired, and the acquired page is output to the labeling unit 26 as the search result DL. The acquired page is, for example, a document (first document) which is text data described in a markup language such as HTML. The keyword search unit 24 may acquire a part of the URL page of the content associated with the search query from the search server 7.

ラベル付与部26は、形態素解析による固有表現抽出技術を適用することにより、質問内容QLに対してラベルL(第1ラベル)を付与する。ここで、固有表現抽出技術は、形態素解析により、所定の用語が接尾語や接頭語になっているか、また所定の用語の共起性などに応じて用語の類型の判定などを行う技術である。例えば、ラベル付与部26は、検索結果Dのテキストを形態素解析し、回答内容ALの文字列の前後にある形態素である文字列(第3文字列)に基づいて、回答内容ALが関連付けされた質問内容QLに対してラベルLを付与する。 The label assigning unit 26 assigns a label L (first label) to the question content QL by applying a unique expression extraction technique by morphological analysis. Here, the proper expression extraction technique is a technique that determines the type of a term according to the co-occurrence of a given term by morphological analysis, whether the given term is a suffix or a prefix. .. For example, the labeling unit 26 morphologically analyzes the text of the search result D, and associates the answer content AL with the character string (third character string) that is a morpheme before and after the character string of the answer content AL. A label L is given to the question content QL.

例えば、ラベル付与部26は、回答内容ALの文字列の前の形態素が「株式会社・・」、「社団法人・・」などの場合は、ラベルLとして「組織名」を付与し、「首都・・」、「県庁所在地・・」などの場合は、ラベルLとして「地名」を付与する。また、ラベル付与部26は、回答内容ALの文字列の後の形態素が「・・県」、「・・発」などの場合は、ラベルLとして「地名」を付与し、「・・家」、「・・流」などの場合は、ラベルLとして「人名」を付与する。 For example, when the morpheme before the character string of the response content AL is “corporation...”, “corporation corporation...”, etc., the label assigning unit 26 assigns “organization name” as the label L, and ..", "prefectural office location...", etc., "place name" is given as the label L. When the morpheme after the character string of the answer content AL is "... prefecture", "... departure", etc., the label assigning unit 26 assigns "place name" as the label L and "... house". , "...", "person name" is given as the label L.

ラベル判定部28は、学習段階において、図5に示すような質問内容QLに対してラベルLが付与された後のレコードを学習データとして使用し、質問内容QLと、ラベルLとの関係性を学習する。また、ラベル判定部28は、運用段階において、通信部10から入力された質問内容Q(ユーザからの質問内容Q)のラベルL(第2ラベル)を判定し、判定したラベルLを回答決定部16に出力する。 In the learning stage, the label determination unit 28 uses the record after the label L is attached to the question content QL as shown in FIG. 5 as learning data, and determines the relationship between the question content QL and the label L. learn. Further, the label determination unit 28 determines the label L (second label) of the question content Q (question content Q from the user) input from the communication unit 10 in the operation stage, and the determined label L is the answer determination unit. Output to 16.

回答決定部16は、判定部14から入力されたラベルLと、質問内容検索部12から入力された検索結果Dとに基づいて、質問内容Qに対する回答内容Aを決定する。例えば、回答決定部16は、検索結果Dのドキュメントの形態素解析を行い、ラベルLと関連性の高い用語を抽出し、抽出した用語を回答内容Aとして決定する。また、回答決定部16は、検索結果Dの形態素解析を行い、ラベルLと関連性の低い用語のフィルタリングを行ってもよい。また、回答決定部16は、抽出した用語の出現頻度、抽出元となった検索結果Dの検索順位、検索結果Dのドキュメント内における抽出した用語の位置関係などに基づいてスコアリングを行い、最も質問内容Qに対する回答内容Aとしての妥当性が高いと判断される用語を回答内容Aとして決定してもよい。回答決定部16は、通信部10を介して、決定した回答内容Aを端末装置3に送信する。 The answer determination unit 16 determines the answer content A for the question content Q based on the label L input from the determination unit 14 and the search result D input from the question content search unit 12. For example, the answer determination unit 16 performs a morphological analysis of the document of the search result D, extracts a term having high relevance to the label L, and determines the extracted term as the answer content A. In addition, the answer determination unit 16 may perform morphological analysis of the search result D to filter terms that are less relevant to the label L. In addition, the answer determination unit 16 performs scoring based on the appearance frequency of the extracted term, the search order of the search result D that is the extraction source, the positional relationship of the extracted term in the document of the search result D, and the like. A term that is judged to be highly valid as the answer content A for the question content Q may be determined as the answer content A. The answer determination unit 16 transmits the determined answer content A to the terminal device 3 via the communication unit 10.

記憶部18は、例えば、通信部10が端末装置3から受信した質問内容Q、質問内容検索部12が検索サーバ7から受信したコンテンツのURLおよびページなどを記憶する。 The storage unit 18 stores, for example, the question content Q received by the communication unit 10 from the terminal device 3, the URL of the content and the page received by the question content search unit 12 from the search server 7, and the like.

[検索サーバ]
検索サーバ7は、情報提供装置5から検索クエリを受け付け、受け付けた検索クエリに基づいて検索の結果を提供するコンピュータ装置である。検索サーバ7は、検索クエリと、コンテンツのURLおよびURLのページまたはその一部とを関連付けた検索データベース(図示しない)を備えている。検索サーバ7は、情報提供装置5から検索クエリを受け付けた場合、検索データベースから、検索クエリに関連付けられたコンテンツのURLおよびURLのページまたはその一部を抽出する。検索サーバ7は、検索データベースから抽出したコンテンツのURLおよびURLのページまたはその一部を情報提供装置5に送信する。
[Search Server]
The search server 7 is a computer device that receives a search query from the information providing device 5 and provides a search result based on the received search query. The search server 7 includes a search database (not shown) that associates the search query with the URL of the content and the page of the URL or a part thereof. When receiving the search query from the information providing device 5, the search server 7 extracts the URL of the content associated with the search query and the page of the URL or a part thereof from the search database. The search server 7 transmits the URL of the content extracted from the search database and the page of the URL or a part thereof to the information providing device 5.

[情報提供装置の処理(学習段階)]
次に、図6を参照しながら学習段階における情報提供装置5の動作について説明する。図6は、学習段階における情報提供装置5の処理を示すフローチャートである。
[Processing of information providing device (learning stage)]
Next, the operation of the information providing device 5 in the learning stage will be described with reference to FIG. FIG. 6 is a flowchart showing the processing of the information providing device 5 in the learning stage.

まず、判定部14に備えられる読出部22は、記憶部20から、図4に示すような質問内容QLと回答内容ALとの組のレコードを1つ読み出す(S101)。読出部22は、読み出した質問内容QLから少なくとも1つのキーワードKを抽出し、抽出したキーワードKと読み出した回答内容ALとの組をキーワード検索部24に出力する。また、読出部22は、読み出した回答内容ALをラベル付与部26に出力する。 First, the reading unit 22 included in the determination unit 14 reads one record of the set of question content QL and answer content AL as shown in FIG. 4 from the storage unit 20 (S101). The reading unit 22 extracts at least one keyword K from the read question content QL, and outputs a set of the extracted keyword K and the read answer content AL to the keyword searching unit 24. Further, the reading unit 22 outputs the read response content AL to the label assigning unit 26.

次に、キーワード検索部24は、読出部22から入力されたキーワードKおよび回答内容ALを用いた検索を行う(S103)。例えば、キーワード検索部24は、読出部22から入力されたキーワードKと回答内容ALとの組である検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページであるドキュメントを少なくも1つ取得し、取得したドキュメントを検索結果DLとしてラベル付与部26に出力する。 Next, the keyword search unit 24 performs a search using the keyword K and the answer content AL input from the reading unit 22 (S103). For example, the keyword search unit 24 transmits a search query, which is a set of the keyword K and the answer content AL input from the reading unit 22, to the search server 7, and the search server 7 sends the URL of the content associated with the search query. At least one document that is a page is acquired, and the acquired document is output to the label assigning unit 26 as a search result DL.

次に、ラベル付与部26は、検索結果Dのテキストを形態素解析し、回答内容ALの文字列の前後にある形態素である文字列(第3文字列)に基づいて、回答内容ALが関連付けされた質問内容QLに対してラベルを付与する(S105)。例えば、ラベル付与部26は、記憶部20に記憶された質問内容QLに対して、ラベルLを関連付けして記憶部20に記憶させることでラベルの付与を行う。 Next, the label assigning unit 26 morphologically analyzes the text of the search result D, and associates the answer content AL with the character string (third character string) that is a morpheme before and after the character string of the answer content AL. A label is attached to the question content QL that has been asked (S105). For example, the label assigning unit 26 assigns a label to the question content QL stored in the storage unit 20 by associating the label L with the question content QL and storing the label L in the storage unit 20.

次に、読出部22は、記憶部20に記憶された全てのレコードの読み出しが完了したか否かを判定する(S107)。読出部22は、全てのレコードの読み出しが完了していないと判定した場合、記憶部20から、読み出されていない質問内容QLと回答内容ALとの組のレコードを1つ読み出し、上記のラベルLの付与を行う。 Next, the reading unit 22 determines whether reading of all the records stored in the storage unit 20 has been completed (S107). When the reading unit 22 determines that reading of all the records has not been completed, the reading unit 22 reads one record of the unread question content QL and answer content AL from the storage unit 20, and reads the above label. L is given.

一方、読出部22が全てのレコードの読み出しが完了したと判定した場合、ラベル判定部28は、質問内容QLと、ラベルLとの関係性を学習する学習処理を行う(S109)。ラベル判定部28は、図5に示すような質問内容QLに対してラベルLが付与された後のレコードを学習の対象として、質問内容QLと、ラベルLとの関係性を学習する。 On the other hand, when the reading unit 22 determines that all the records have been read, the label determining unit 28 performs a learning process for learning the relationship between the question content QL and the label L (S109). The label determination unit 28 learns the relationship between the question content QL and the label L, with the record after the label L is added to the question content QL as shown in FIG.

例えば、ラベル判定部28は、「日本の首都は何処ですか?」という質問内容QLに対して形態素解析を行って「日本/の/首都/は/何処/です/か/?/」という形態素に分割し、各形態素を固定長のベクトルに変換して、このベクトルを順に再起型ニューラルネットワークの各層に挿入し、ソフトマックス関数などを用いた重み付けを行い、ラベルとの関連付け行い、質問内容QLと、ラベルLとの関係性を学習する。このような学習を行うことで、ラベル判定部28は、情報提供を要求する質問内容Qを受け付けた場合に、この質問内容Qと関連付けされるべきラベルLを判定することが可能となる。以上により、情報提供装置5は、本フローチャートの処理を終了する。 For example, the label determination unit 28 performs a morpheme analysis on the question content QL "where is the capital of Japan?" and performs the morpheme "Japan/no/capital/wa/where/is/ka/?/". , Each morpheme is converted into a fixed-length vector, this vector is inserted into each layer of the recurrent neural network in order, weighting is performed using a softmax function, etc., association with the label is performed, and the question content QL And the label L are learned. By performing such learning, the label determination unit 28 can determine the label L to be associated with the question content Q when the question content Q requesting the information provision is received. With the above, the information providing apparatus 5 ends the processing of this flowchart.

[情報提供装置の処理(運用段階)]
次に、図7を参照しながら運用段階における情報提供装置5の動作について説明する。図7は、運用段階における情報提供装置5の処理を示すフローチャートである。
[Processing of information providing device (operation stage)]
Next, the operation of the information providing device 5 in the operation stage will be described with reference to FIG. FIG. 7 is a flowchart showing the processing of the information providing device 5 in the operation stage.

まず、通信部10は、ユーザの操作に応じて端末装置3から受信した質問内容Qを取得する(S201)。通信部10は、取得した質問内容Qを、質問内容検索部12および判定部14に出力する。 First, the communication unit 10 acquires the question content Q received from the terminal device 3 according to the user's operation (S201). The communication unit 10 outputs the acquired question content Q to the question content search unit 12 and the determination unit 14.

次に、質問内容検索部12は、通信部10から入力された質問内容Qを検索クエリとして、検索処理を行う(S203)。例えば、質問内容検索部12は、通信部10から入力された質問内容Qである検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページであるドキュメントを少なくも1つ取得し、取得したドキュメントを検索結果Dとして回答決定部16に出力する。 Next, the question content search unit 12 performs a search process using the question content Q input from the communication unit 10 as a search query (S203). For example, the question content search unit 12 transmits the search query, which is the question content Q input from the communication unit 10, to the search server 7, and the search server 7 displays the document that is the page of the URL of the content associated with the search query. At least one document is acquired, and the acquired document is output to the answer determination unit 16 as the search result D.

次に、上記の質問内容検索部12による検索処理と並行して、或いは、検索処理の前または後に、判定部14に備えられたラベル判定部28は、通信部10から入力された質問内容Qと関連付けされるべきラベルLを判定する(S205)。例えば、ラベル判定部28は、質問内容Qの形態素解析を行い、再帰型ニューラルネットワーク(RNN)を用いて、質問内容Qと関連付けされるべきラベルLを判定する。ラベル判定部28は、判定したラベルLを回答決定部16に出力する。 Next, in parallel with the search process by the question content search unit 12, or before or after the search process, the label determination unit 28 included in the determination unit 14 causes the question content Q input from the communication unit 10 to be input. A label L to be associated with is determined (S205). For example, the label determination unit 28 performs a morphological analysis of the question content Q and determines a label L to be associated with the question content Q using a recurrent neural network (RNN). The label determination unit 28 outputs the determined label L to the answer determination unit 16.

回答決定部16は、ラベル判定部28から入力されたラベルLと、質問内容検索部12から入力された検索結果Dとに基づいて、質問内容Qに対する回答内容Aを決定する(S207)。例えば、回答決定部16は、検索結果Dのドキュメントの形態素解析を行い、ラベルLと関連性の高い用語を抽出し、抽出した用語を回答内容Aとして決定する。回答決定部16は、通信部10を介して、決定した回答内容Aを端末装置3に送信する。以上により、情報提供装置5は、本フローチャートの処理を終了する。 The answer determination unit 16 determines the answer content A for the question content Q based on the label L input from the label determination unit 28 and the search result D input from the question content search unit 12 (S207). For example, the answer determination unit 16 performs a morphological analysis of the document of the search result D, extracts a term having high relevance to the label L, and determines the extracted term as the answer content A. The answer determination unit 16 transmits the determined answer content A to the terminal device 3 via the communication unit 10. With the above, the information providing apparatus 5 ends the processing of this flowchart.

以上説明した実施形態によれば、記憶部20に記憶された質問内容QL(第1質問内容)から抽出されたキーワードK(第1文字列)と、回答内容QLとの組である検索クエリ(第1検索クエリ)を用いてネットワーク検索を行って検索結果DL(第1ドキュメント)を取得するキーワード検索部24(第1検索部)と、キーワード検索部24によって取得された検索結果DLに含まれる回答内容QLの前後にある形態素(第3文字列)に基づいて、質問内容QLに対して質問種別を示すラベルL(第1ラベル)を付与するラベル付与部26(付与部)と、を備えることで、質問内容に対するラベル付与を自動化および適正化し、検索結果の精度を向上させることができる。 According to the embodiment described above, the search query (which is a set of the keyword K (first character string) extracted from the question content QL (first question content) stored in the storage unit 20 and the answer content QL ( It is included in the keyword search unit 24 (first search unit) that performs the network search using the first search query) to obtain the search result DL (first document), and the search result DL obtained by the keyword search unit 24. A label assigning unit 26 (assigning unit) that assigns a label L (first label) indicating a question type to the question content QL based on morphemes (third character string) before and after the answer content QL. This makes it possible to automate and optimize the labeling of the question content and improve the accuracy of search results.

以上説明した実施形態によれば、質問内容に対するラベル付与が自動化されるため、ラベル付与に伴う作業負荷を軽減し、またラベルの設定を適正化することができる。また、ラベルの定義を増やすなどのラベル変更を行いたい場合であっても学習処理を再度行えばよいため、従来のようにルールの再構築を行う必要はない。 According to the embodiment described above, since the labeling of question contents is automated, it is possible to reduce the work load associated with labeling and to optimize label setting. Further, even if it is desired to change the label such as increasing the definition of the label, the learning process can be performed again, so that it is not necessary to reconstruct the rule as in the conventional case.

なお、上記の実施形態では、情報提供装置5がネットワークNWを介して接続された端末装置3から質問内容Qを受信し、この質問内容Qに対する回答内容Aを端末装置3に送信する例を説明した。しかしながら、情報提供装置5の機能は、端末装置3内に実装されるようにしてもよい。 In the above embodiment, an example is described in which the information providing device 5 receives the question content Q from the terminal device 3 connected via the network NW and transmits the answer content A to the question content Q to the terminal device 3. did. However, the function of the information providing device 5 may be implemented in the terminal device 3.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As described above, the embodiments for carrying out the present invention have been described using the embodiments, but the present invention is not limited to such embodiments, and various modifications and substitutions are made within the scope not departing from the gist of the present invention. Can be added.

1‥情報提供システム、3‥端末装置、5‥情報提供装置、7‥検索サーバ、10‥通信部、12‥質問内容検索部、14‥判定部、16‥回答決定部、18‥記憶部、20‥記憶部、22‥読出部、24‥キーワード検索部、26‥ラベル付与部、28‥ラベル判定部、NW‥ネットワーク 1... Information providing system, 3... Terminal device, 5... Information providing device, 7... Search server, 10... Communication unit, 12... Question content search unit, 14... Judgment unit, 16... Answer determination unit, 18... Storage unit, 20... Storage unit, 22... Reading unit, 24... Keyword search unit, 26... Label assigning unit, 28... Label determination unit, NW... Network

Claims (7)

第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得する第1検索部と、
前記第1検索部によって取得された前記第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与する付与部と、
を備える情報提供装置。
A network search is performed using a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content, and a search result A first search unit for obtaining the first document of
A first type indicating a question type for the first question content based on a third character string that is a morpheme before and after the second character string included in the first document acquired by the first search unit. An assigning part that assigns a label,
An information providing device including.
前記第1質問内容と、前記付与部により付与された前記第1ラベルとの関係性を予め学習し、情報提供を要求する第2質問内容に関連付けされる第2ラベルを判定する判定部をさらに備える、
請求項1記載の情報提供装置。
A determination unit that further learns the relationship between the first question content and the first label assigned by the assignment unit in advance and determines the second label associated with the second question content that requests information provision is further provided. Prepare,
The information providing device according to claim 1.
端末装置から前記第2質問内容を受け付ける受付部と、
前記第2質問内容である第2検索クエリを用いてネットワーク検索を行い、検索結果の第2ドキュメントを取得する第2検索部と、
前記判定部によって判定された前記第2ラベルと、前記第2検索部によって取得された前記第2ドキュメントとに基づいて、前記第2質問内容に対する回答内容を決定する決定部と、をさらに備える、
請求項2記載の情報提供装置。
A receiving unit that receives the second question content from the terminal device;
A second search unit that performs a network search using the second search query, which is the content of the second question, and obtains a second document as a search result;
Further comprising a determination unit that determines the content of the answer to the second question content based on the second label determined by the determination unit and the second document acquired by the second search unit,
The information providing device according to claim 2.
前記決定部は、前記第2ドキュメントの形態素解析を行い、前記判定部によって判定された前記第2ラベルと関連付けされる用語を抽出し、前記抽出した用語を前記第2質問内容に対する回答内容として決定する、
請求項3記載の情報提供装置。
The determination unit performs a morphological analysis of the second document, extracts a term associated with the second label determined by the determination unit, and determines the extracted term as an answer content to the second question content. To do
The information providing device according to claim 3.
前記情報提供装置は、ネットワークを介して接続された端末装置から前記第2質問内容を受信し、前記第2質問内容に対する回答内容を前記端末装置に送信する、
請求項2記載の情報提供装置。
The information providing device receives the second question content from a terminal device connected via a network and transmits an answer content to the second question content to the terminal device.
The information providing device according to claim 2.
コンピュータが、
第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得し、
前記取得された第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与する、
情報提供方法。
Computer
A network search is performed using a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content, and a search result Get the first document of
Assigning a first label indicating a question type to the first question content based on a third character string that is a morpheme before and after the second character string included in the acquired first document,
Information provision method.
コンピュータに、
第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得させ、
前記取得された第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与させる、
プログラム。
On the computer,
A network search is performed using a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content, and a search result To get the first document of
A first label indicating a question type is given to the first question content based on a third character string that is a morpheme before and after the second character string included in the acquired first document,
program.
JP2017006361A 2017-01-18 2017-01-18 Information providing device, information providing method, and program Active JP6739361B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017006361A JP6739361B2 (en) 2017-01-18 2017-01-18 Information providing device, information providing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017006361A JP6739361B2 (en) 2017-01-18 2017-01-18 Information providing device, information providing method, and program

Publications (2)

Publication Number Publication Date
JP2018116447A JP2018116447A (en) 2018-07-26
JP6739361B2 true JP6739361B2 (en) 2020-08-12

Family

ID=62983950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017006361A Active JP6739361B2 (en) 2017-01-18 2017-01-18 Information providing device, information providing method, and program

Country Status (1)

Country Link
JP (1) JP6739361B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150624A (en) * 2001-11-12 2003-05-23 Mitsubishi Electric Corp Information extraction device and information extraction method
JP4162223B2 (en) * 2003-05-30 2008-10-08 日本電信電話株式会社 Natural sentence search device, method and program thereof
JP2006119697A (en) * 2004-10-19 2006-05-11 Fuji Xerox Co Ltd Question answering system, question answering method, and question answering program
JP4650072B2 (en) * 2005-04-12 2011-03-16 富士ゼロックス株式会社 Question answering system, data retrieval method, and computer program
JP5710581B2 (en) * 2012-12-18 2015-04-30 日本電信電話株式会社 Question answering apparatus, method, and program

Also Published As

Publication number Publication date
JP2018116447A (en) 2018-07-26

Similar Documents

Publication Publication Date Title
CN105247507B (en) Method, system and storage medium for the influence power score for determining brand
US8515969B2 (en) Splitting a character string into keyword strings
JP6691280B1 (en) Management system and management method
US8706728B2 (en) Calculating reliability scores from word splitting
CN107704480A (en) Extension and the method and system and computer media for strengthening knowledge graph
US20110040769A1 (en) Query-URL N-Gram Features in Web Ranking
US8099430B2 (en) Computer method and apparatus of information management and navigation
JP6363682B2 (en) Method for selecting an image that matches content based on the metadata of the image and content
JP2020191075A (en) Recommendation of web apis and associated endpoints
CN112749284A (en) Knowledge graph construction method, device, equipment and storage medium
JP2017220204A (en) Method and system for matching images with content using whitelists and blacklists in response to search query
CN107491465A (en) For searching for the method and apparatus and data handling system of content
CN110928917A (en) Target user determination method and device, computing equipment and medium
CN110895587B (en) Method and device for determining target user
CN107766398A (en) For the method, apparatus and data handling system for image is matched with content item
US10504145B2 (en) Automated classification of network-accessible content based on events
JP5639549B2 (en) Information retrieval apparatus, method, and program
JP6739361B2 (en) Information providing device, information providing method, and program
CN105740436B (en) Method and device for pushing written works based on Internet search technology
KR101723310B1 (en) System and mehtod for providing search service for representatives based on patent publication
JP2006155275A (en) Information extraction method and information extraction device
CN111680122A (en) Space data active recommendation method and device, storage medium and computer equipment
JP6271617B2 (en) Information processing apparatus, information processing method, and information processing program
JP2019053469A (en) Database creating device, database creating method, and program
KR102528401B1 (en) System for providing interactive morphological analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190325

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200721

R150 Certificate of patent or registration of utility model

Ref document number: 6739361

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350