JP6739361B2 - Information providing device, information providing method, and program - Google Patents
Information providing device, information providing method, and program Download PDFInfo
- Publication number
- JP6739361B2 JP6739361B2 JP2017006361A JP2017006361A JP6739361B2 JP 6739361 B2 JP6739361 B2 JP 6739361B2 JP 2017006361 A JP2017006361 A JP 2017006361A JP 2017006361 A JP2017006361 A JP 2017006361A JP 6739361 B2 JP6739361 B2 JP 6739361B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- search
- question
- label
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000000877 morphologic effect Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000002372 labelling Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報提供装置、情報提供方法、およびプログラムに関する。 The present invention relates to an information providing device, an information providing method, and a program.
従来、ウェブ検索において、ユーザが入力した質問文の内容を解析し、ユーザが要求する回答を含む検索結果が得られるようにする技術についての研究が進められている。例えば、ユーザが入力した質問文の解析を行って、質問文がその回答として「人名」を求めているのか、「地名」を求めているのか、「日付」を求めているのかなどの質問内容の質問種別であるラベルを判定し、検索結果の精度を向上させる技術についての研究が進められている(例えば、特許文献1および2参照)。
2. Description of the Related Art Conventionally, in web search, research has been conducted on a technique for analyzing the content of a question sentence input by a user and obtaining a search result including an answer requested by the user. For example, by analyzing the question text entered by the user, whether the question text asks for "personal name", "place name", or "date" as the answer. Research on techniques for determining the label, which is the question type, and improving the accuracy of search results is underway (see, for example,
従来の技術において質問内容のラベルを判定する場合、予め基準となる質問内容のパターンとラベルとの関係性をルール化しておく必要がある。例えば、「〜は誰ですか」という質問内容のパターンに対しては「Person(人名)」というラベルを付与し、「〜はいつですか」という質問内容のパターンに対しては「Date(日付)」というラベルを付与したルールを予め定義しておく必要がある。 In the case of determining the question content label in the conventional technique, it is necessary to rule the relationship between the reference question content pattern and the label in advance. For example, a label "Person (person name)" is given to the question content pattern "Who is ..." and a "Date (date )” is required to be defined in advance.
上記のようなルール化は手動で行われる場合が多く、ルール化に要する作業負荷が増大してしまう場合があった。また、ラベルの定義を増やすなどのラベル変更を行いたい場合には、ルールの再構築を行う必要があった。さらに、このようなルールの精度はルール化の作業を行う作業者のスキルに依存するものであるため、質問文のパターンやラベルの設定内容が適切でない場合、検索結果の精度を向上させることができないという問題があった。 In many cases, the rule formation as described above is performed manually, and the workload required for the rule formation may increase. In addition, in order to change the label such as increasing the label definition, it was necessary to reconstruct the rule. Furthermore, since the accuracy of such rules depends on the skill of the worker who makes the rules, the accuracy of the search results can be improved if the question sentence pattern or label settings are not appropriate. There was a problem that I could not.
本発明は、このような事情を考慮してなされたものであり、質問内容に対するラベル付与を自動化および適正化することにより検索結果の精度を向上させることが可能な情報提供装置、情報提供方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in view of such circumstances, and an information providing device, an information providing method, which can improve the accuracy of search results by automating and optimizing the labeling of question contents. And one of the purposes is to provide a program.
本発明の一態様は、第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得する第1検索部と、前記第1検索部によって取得された前記第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与する付与部と、を備える情報提供装置である。 One aspect of the present invention uses a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content. A first search unit that performs a network search to obtain a first document as a search result, and a third morpheme that is before and after the second character string included in the first document obtained by the first search unit. An information providing apparatus, comprising: an assigning unit that assigns a first label indicating a question type to the first question content based on a character string.
本発明の一態様によれば、質問内容に対するラベル付与を自動化および適正化することにより検索結果の精度を向上させることができる。 According to one aspect of the present invention, the accuracy of search results can be improved by automating and optimizing the labeling of question contents.
以下、図面を参照し、本発明の情報提供装置、情報提供方法、およびプログラムの実施形態について説明する。情報提供装置は、質問内容から抽出されたキーワードと、回答内容との組である検索クエリを用いてネットワーク検索を行って検索結果であるドキュメントを取得し、このドキュメントに含まれる回答内容の文字列の前後にある形態素に基づいて、質問内容に対して質問種別を示すラベルを付与する装置である。また、情報提供装置は、質問内容と、ラベルとの関係性を予め学習し、情報提供を要求する質問内容に関連付けされるラベルを判定する。 Hereinafter, embodiments of an information providing apparatus, an information providing method, and a program of the present invention will be described with reference to the drawings. The information providing device performs a network search using a search query that is a combination of a keyword extracted from the question content and the answer content to obtain a document that is a search result, and a character string of the answer content included in this document. It is a device that adds a label indicating a question type to the question content based on the morphemes before and after. Further, the information providing apparatus learns the relationship between the question content and the label in advance and determines the label associated with the question content requesting the information provision.
図1は、情報提供システム1の構成図である。情報提供システム1は、対話型の情報提供サービスを実現する。例えば、情報提供システム1は、ユーザからの「日本の首都は何処ですか?」という質問内容に対して、「東京」という回答内容を提供するような質問応答型の情報提供サービスを実現する。
FIG. 1 is a configuration diagram of the
情報提供システム1は、例えば、一以上の端末装置3と、一以上の情報提供装置5と、一以上の検索サーバ7とを備える。端末装置3と、情報提供装置5と、検索サーバ7とは、ネットワークNWによって互いに接続されており、このネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。
The
[端末装置]
端末装置3は、対話型の情報提供サービスを利用するユーザによって操作される。端末装置3は、例えば、パーソナルコンピュータ、スマートフォンなどの携帯電話やタブレット端末、PDA(Personal Digital Assistant)などのコンピュータ装置である。端末装置3は、ユーザの操作に基づいて、情報提供を要求する質問内容Q(第2質問内容)を情報提供装置5に送信し、質問内容Qに対する回答内容Aを情報提供装置5から受信する。
[Terminal device]
The terminal device 3 is operated by a user who uses an interactive information providing service. The terminal device 3 is, for example, a personal computer, a mobile phone such as a smartphone, a tablet terminal, or a computer device such as a PDA (Personal Digital Assistant). The terminal device 3 transmits the question content Q (second question content) requesting the information provision to the
[情報提供装置]
情報提供装置5は、端末装置3から受信した質問内容Qに対する回答内容Aを、端末装置3に送信するコンピュータ装置である。図2は、情報提供装置5の機能構成を示す図である。情報提供装置5は、例えば、通信部10(受付部)と、質問内容検索部12(第2検索部)と、判定部14と、回答決定部16(決定部)と、記憶部18とを備える。情報提供装置5に含まれる各機能部は、複数の装置に分散されてもよい。例えば、判定部14と他の機能部とは別体の装置によって実現されてもよい。記憶部18は、NAS(Network Attached Storage)などの記憶装置であってもよい。
[Information providing device]
The
質問内容検索部12、判定部14、および回答決定部16は、例えば、CPU(Central Processing Unit)などのプロセッサが、記憶部18に記憶されたプログラム(ソフトウェア)を実行することにより実現される。プログラムは、例えば、ネットワークNWを介してアプリケーションサーバからダウンロードされてもよいし、予め情報提供装置5にプリインストールされていてもよい。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。記憶部18は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などによって実現される。
The question
通信部10は、端末装置3から質問内容Qを受信し、受信した質問内容Qを、質問内容検索部12および判定部14に出力する。また、通信部10は、回答決定部16により決定された回答内容Aを端末装置3に送信する。
The
質問内容検索部12は、通信部10から入力された質問内容Qを検索クエリ(第2検索クエリ)として、ネットワーク検索を行う。例えば、質問内容検索部12は、通信部10から入力された質問内容Qである検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページを少なくも1つ取得し、取得したページを検索結果Dとして回答決定部16に出力する。取得したページは、HTML(Hyper Text Markup Language)などのマークアップ言語で記述されたテキストデータであるドキュメント(第2ドキュメント)などである。なお、質問内容検索部12は、質問内容Qに加え、質問内容Qと関連する用語を使用して検索を行うクエリ拡張検索を行ってもよい。また、質問内容検索部12は、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページの一部を取得するようにしてもよい。
The question
判定部14は、通信部10から入力された質問内容Qの質問種別であるラベルLを判定する。このラベルLとしては、例えば、組織名(Organization)、人名(Person)、地名(Location)、日付表現(Date)、時間表現(Time)、金額表現(Money)、割合表現(Percent)、固有物名(Artifact)などが含まれる。ラベルの定義は、情報提供装置5の管理者などによって任意に定められる。判定部14は、判定したラベルLを回答決定部16に出力する。
The
判定部14におけるラベルLの判定処理においては、再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)多層構造のニューラルネットワーク(Deep Neural Network:DNN)、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)などを用いたディープラーニング技術を採用する。
In the determination processing of the label L in the
図3は、判定部14の機能構成を示す図である。判定部14は、例えば、記憶部20と、読出部22と、キーワード検索部24(第1検索部)と、ラベル付与部26(付与部)と、ラベル判定部28(判定部)とを備える。記憶部20と、読出部22と、キーワード検索部24と、ラベル付与部26とは、ラベル判定部28の学習段階で動作する機能部である。
FIG. 3 is a diagram showing a functional configuration of the
記憶部20には、予め、質問内容QL(第1質問内容)に対して回答内容ALが関連付けされたレコードが複数記憶されている。これらの複数のレコードは、ラベル判定部28が学習対象とする学習データの元となるレコードである。これらの複数のレコードは、学習データを提供する外部のデータベースから提供されてもよいし、インターネット上のコンテンツから自動的に生成されるようにしてもよい。また、これらの複数のレコードは、情報提供装置5の管理者により手動で登録されるようにしてもよいし、回答内容から複数の質問内容が機械的に生成されるようにしてもよい。これらの複数のレコードの各々における、質問内容QLに対してラベルLがラベル付与部26によって付与される。このラベル付与部26によってラベルLが付与された後のレコードが、ラベル判定部28が学習対象とする学習データとなる。
The
図4は、記憶部20に予め記憶された質問内容QLに対して回答内容ALが関連付けされたレコードの一例を示す図である。また、図5は、記憶部20に記憶された質問内容QLに対して、ラベルLが付与された後のレコードの一例を示す図である。
FIG. 4 is a diagram showing an example of a record in which the answer content AL is associated with the question content QL stored in advance in the
図4に示す例では、記憶部20には、「日本の首都は何処ですか?」という質問内容QLに対して「東京」という回答内容ALが関連付けされたレコードなどが記憶されている。ここで、例えば、外部のデータベースから提供されて、記憶部20に予め記憶されたこれらのレコードに対してはラベルLが付与されていない。一方、図5に示す例では、記憶部20には、ラベル付与部26によるラベル付与処理によって、「日本の首都は何処ですか?」という質問内容QLに対して「地名」というラベルLが付与されたレコードなどが記憶されている。
In the example shown in FIG. 4, the
記憶部20は、例えば、RAM、ROM、HDD、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などによって実現される。記憶部20は、記憶部18と同じ装置であってもよい。
The
読出部22は、記憶部20から、図4に示すような質問内容QLと回答内容ALとの組を読み出す。読出部22は、読み出した質問内容QLの形態素解析を行って少なくとも1つのキーワードK(第1文字列)を抽出し、抽出したキーワードKと読み出した回答内容AL(第2文字列)との組をキーワード検索部24に出力する。また、読出部22は、読み出した回答内容ALをラベル付与部26に出力する。
The
キーワード検索部24は、読出部22から入力されたキーワードKと回答内容ALとの組を検索クエリ(第1検索クエリ)として、ネットワーク検索を行う。例えば、キーワード検索部24は、読出部22から入力されたキーワードKと回答内容ALとの組である検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページを少なくも1つ取得し、取得したページを検索結果DLとしてラベル付与部26に出力する。取得したページは、例えば、HTMLなどのマークアップ言語で記述されたテキストデータであるドキュメント(第1ドキュメント)などである。なお、キーワード検索部24は、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページの一部を取得するようにしてもよい。
The
ラベル付与部26は、形態素解析による固有表現抽出技術を適用することにより、質問内容QLに対してラベルL(第1ラベル)を付与する。ここで、固有表現抽出技術は、形態素解析により、所定の用語が接尾語や接頭語になっているか、また所定の用語の共起性などに応じて用語の類型の判定などを行う技術である。例えば、ラベル付与部26は、検索結果Dのテキストを形態素解析し、回答内容ALの文字列の前後にある形態素である文字列(第3文字列)に基づいて、回答内容ALが関連付けされた質問内容QLに対してラベルLを付与する。
The
例えば、ラベル付与部26は、回答内容ALの文字列の前の形態素が「株式会社・・」、「社団法人・・」などの場合は、ラベルLとして「組織名」を付与し、「首都・・」、「県庁所在地・・」などの場合は、ラベルLとして「地名」を付与する。また、ラベル付与部26は、回答内容ALの文字列の後の形態素が「・・県」、「・・発」などの場合は、ラベルLとして「地名」を付与し、「・・家」、「・・流」などの場合は、ラベルLとして「人名」を付与する。
For example, when the morpheme before the character string of the response content AL is “corporation...”, “corporation corporation...”, etc., the
ラベル判定部28は、学習段階において、図5に示すような質問内容QLに対してラベルLが付与された後のレコードを学習データとして使用し、質問内容QLと、ラベルLとの関係性を学習する。また、ラベル判定部28は、運用段階において、通信部10から入力された質問内容Q(ユーザからの質問内容Q)のラベルL(第2ラベル)を判定し、判定したラベルLを回答決定部16に出力する。
In the learning stage, the
回答決定部16は、判定部14から入力されたラベルLと、質問内容検索部12から入力された検索結果Dとに基づいて、質問内容Qに対する回答内容Aを決定する。例えば、回答決定部16は、検索結果Dのドキュメントの形態素解析を行い、ラベルLと関連性の高い用語を抽出し、抽出した用語を回答内容Aとして決定する。また、回答決定部16は、検索結果Dの形態素解析を行い、ラベルLと関連性の低い用語のフィルタリングを行ってもよい。また、回答決定部16は、抽出した用語の出現頻度、抽出元となった検索結果Dの検索順位、検索結果Dのドキュメント内における抽出した用語の位置関係などに基づいてスコアリングを行い、最も質問内容Qに対する回答内容Aとしての妥当性が高いと判断される用語を回答内容Aとして決定してもよい。回答決定部16は、通信部10を介して、決定した回答内容Aを端末装置3に送信する。
The
記憶部18は、例えば、通信部10が端末装置3から受信した質問内容Q、質問内容検索部12が検索サーバ7から受信したコンテンツのURLおよびページなどを記憶する。
The
[検索サーバ]
検索サーバ7は、情報提供装置5から検索クエリを受け付け、受け付けた検索クエリに基づいて検索の結果を提供するコンピュータ装置である。検索サーバ7は、検索クエリと、コンテンツのURLおよびURLのページまたはその一部とを関連付けた検索データベース(図示しない)を備えている。検索サーバ7は、情報提供装置5から検索クエリを受け付けた場合、検索データベースから、検索クエリに関連付けられたコンテンツのURLおよびURLのページまたはその一部を抽出する。検索サーバ7は、検索データベースから抽出したコンテンツのURLおよびURLのページまたはその一部を情報提供装置5に送信する。
[Search Server]
The
[情報提供装置の処理(学習段階)]
次に、図6を参照しながら学習段階における情報提供装置5の動作について説明する。図6は、学習段階における情報提供装置5の処理を示すフローチャートである。
[Processing of information providing device (learning stage)]
Next, the operation of the
まず、判定部14に備えられる読出部22は、記憶部20から、図4に示すような質問内容QLと回答内容ALとの組のレコードを1つ読み出す(S101)。読出部22は、読み出した質問内容QLから少なくとも1つのキーワードKを抽出し、抽出したキーワードKと読み出した回答内容ALとの組をキーワード検索部24に出力する。また、読出部22は、読み出した回答内容ALをラベル付与部26に出力する。
First, the
次に、キーワード検索部24は、読出部22から入力されたキーワードKおよび回答内容ALを用いた検索を行う(S103)。例えば、キーワード検索部24は、読出部22から入力されたキーワードKと回答内容ALとの組である検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページであるドキュメントを少なくも1つ取得し、取得したドキュメントを検索結果DLとしてラベル付与部26に出力する。
Next, the
次に、ラベル付与部26は、検索結果Dのテキストを形態素解析し、回答内容ALの文字列の前後にある形態素である文字列(第3文字列)に基づいて、回答内容ALが関連付けされた質問内容QLに対してラベルを付与する(S105)。例えば、ラベル付与部26は、記憶部20に記憶された質問内容QLに対して、ラベルLを関連付けして記憶部20に記憶させることでラベルの付与を行う。
Next, the
次に、読出部22は、記憶部20に記憶された全てのレコードの読み出しが完了したか否かを判定する(S107)。読出部22は、全てのレコードの読み出しが完了していないと判定した場合、記憶部20から、読み出されていない質問内容QLと回答内容ALとの組のレコードを1つ読み出し、上記のラベルLの付与を行う。
Next, the
一方、読出部22が全てのレコードの読み出しが完了したと判定した場合、ラベル判定部28は、質問内容QLと、ラベルLとの関係性を学習する学習処理を行う(S109)。ラベル判定部28は、図5に示すような質問内容QLに対してラベルLが付与された後のレコードを学習の対象として、質問内容QLと、ラベルLとの関係性を学習する。
On the other hand, when the
例えば、ラベル判定部28は、「日本の首都は何処ですか?」という質問内容QLに対して形態素解析を行って「日本/の/首都/は/何処/です/か/?/」という形態素に分割し、各形態素を固定長のベクトルに変換して、このベクトルを順に再起型ニューラルネットワークの各層に挿入し、ソフトマックス関数などを用いた重み付けを行い、ラベルとの関連付け行い、質問内容QLと、ラベルLとの関係性を学習する。このような学習を行うことで、ラベル判定部28は、情報提供を要求する質問内容Qを受け付けた場合に、この質問内容Qと関連付けされるべきラベルLを判定することが可能となる。以上により、情報提供装置5は、本フローチャートの処理を終了する。
For example, the
[情報提供装置の処理(運用段階)]
次に、図7を参照しながら運用段階における情報提供装置5の動作について説明する。図7は、運用段階における情報提供装置5の処理を示すフローチャートである。
[Processing of information providing device (operation stage)]
Next, the operation of the
まず、通信部10は、ユーザの操作に応じて端末装置3から受信した質問内容Qを取得する(S201)。通信部10は、取得した質問内容Qを、質問内容検索部12および判定部14に出力する。
First, the
次に、質問内容検索部12は、通信部10から入力された質問内容Qを検索クエリとして、検索処理を行う(S203)。例えば、質問内容検索部12は、通信部10から入力された質問内容Qである検索クエリを検索サーバ7に送信し、検索サーバ7から検索クエリに関連付けられたコンテンツのURLのページであるドキュメントを少なくも1つ取得し、取得したドキュメントを検索結果Dとして回答決定部16に出力する。
Next, the question
次に、上記の質問内容検索部12による検索処理と並行して、或いは、検索処理の前または後に、判定部14に備えられたラベル判定部28は、通信部10から入力された質問内容Qと関連付けされるべきラベルLを判定する(S205)。例えば、ラベル判定部28は、質問内容Qの形態素解析を行い、再帰型ニューラルネットワーク(RNN)を用いて、質問内容Qと関連付けされるべきラベルLを判定する。ラベル判定部28は、判定したラベルLを回答決定部16に出力する。
Next, in parallel with the search process by the question
回答決定部16は、ラベル判定部28から入力されたラベルLと、質問内容検索部12から入力された検索結果Dとに基づいて、質問内容Qに対する回答内容Aを決定する(S207)。例えば、回答決定部16は、検索結果Dのドキュメントの形態素解析を行い、ラベルLと関連性の高い用語を抽出し、抽出した用語を回答内容Aとして決定する。回答決定部16は、通信部10を介して、決定した回答内容Aを端末装置3に送信する。以上により、情報提供装置5は、本フローチャートの処理を終了する。
The
以上説明した実施形態によれば、記憶部20に記憶された質問内容QL(第1質問内容)から抽出されたキーワードK(第1文字列)と、回答内容QLとの組である検索クエリ(第1検索クエリ)を用いてネットワーク検索を行って検索結果DL(第1ドキュメント)を取得するキーワード検索部24(第1検索部)と、キーワード検索部24によって取得された検索結果DLに含まれる回答内容QLの前後にある形態素(第3文字列)に基づいて、質問内容QLに対して質問種別を示すラベルL(第1ラベル)を付与するラベル付与部26(付与部)と、を備えることで、質問内容に対するラベル付与を自動化および適正化し、検索結果の精度を向上させることができる。
According to the embodiment described above, the search query (which is a set of the keyword K (first character string) extracted from the question content QL (first question content) stored in the
以上説明した実施形態によれば、質問内容に対するラベル付与が自動化されるため、ラベル付与に伴う作業負荷を軽減し、またラベルの設定を適正化することができる。また、ラベルの定義を増やすなどのラベル変更を行いたい場合であっても学習処理を再度行えばよいため、従来のようにルールの再構築を行う必要はない。 According to the embodiment described above, since the labeling of question contents is automated, it is possible to reduce the work load associated with labeling and to optimize label setting. Further, even if it is desired to change the label such as increasing the definition of the label, the learning process can be performed again, so that it is not necessary to reconstruct the rule as in the conventional case.
なお、上記の実施形態では、情報提供装置5がネットワークNWを介して接続された端末装置3から質問内容Qを受信し、この質問内容Qに対する回答内容Aを端末装置3に送信する例を説明した。しかしながら、情報提供装置5の機能は、端末装置3内に実装されるようにしてもよい。
In the above embodiment, an example is described in which the
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As described above, the embodiments for carrying out the present invention have been described using the embodiments, but the present invention is not limited to such embodiments, and various modifications and substitutions are made within the scope not departing from the gist of the present invention. Can be added.
1‥情報提供システム、3‥端末装置、5‥情報提供装置、7‥検索サーバ、10‥通信部、12‥質問内容検索部、14‥判定部、16‥回答決定部、18‥記憶部、20‥記憶部、22‥読出部、24‥キーワード検索部、26‥ラベル付与部、28‥ラベル判定部、NW‥ネットワーク 1... Information providing system, 3... Terminal device, 5... Information providing device, 7... Search server, 10... Communication unit, 12... Question content search unit, 14... Judgment unit, 16... Answer determination unit, 18... Storage unit, 20... Storage unit, 22... Reading unit, 24... Keyword search unit, 26... Label assigning unit, 28... Label determination unit, NW... Network
Claims (7)
前記第1検索部によって取得された前記第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与する付与部と、
を備える情報提供装置。 A network search is performed using a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content, and a search result A first search unit for obtaining the first document of
A first type indicating a question type for the first question content based on a third character string that is a morpheme before and after the second character string included in the first document acquired by the first search unit. An assigning part that assigns a label,
An information providing device including.
請求項1記載の情報提供装置。 A determination unit that further learns the relationship between the first question content and the first label assigned by the assignment unit in advance and determines the second label associated with the second question content that requests information provision is further provided. Prepare,
The information providing device according to claim 1.
前記第2質問内容である第2検索クエリを用いてネットワーク検索を行い、検索結果の第2ドキュメントを取得する第2検索部と、
前記判定部によって判定された前記第2ラベルと、前記第2検索部によって取得された前記第2ドキュメントとに基づいて、前記第2質問内容に対する回答内容を決定する決定部と、をさらに備える、
請求項2記載の情報提供装置。 A receiving unit that receives the second question content from the terminal device;
A second search unit that performs a network search using the second search query, which is the content of the second question, and obtains a second document as a search result;
Further comprising a determination unit that determines the content of the answer to the second question content based on the second label determined by the determination unit and the second document acquired by the second search unit,
The information providing device according to claim 2.
請求項3記載の情報提供装置。 The determination unit performs a morphological analysis of the second document, extracts a term associated with the second label determined by the determination unit, and determines the extracted term as an answer content to the second question content. To do
The information providing device according to claim 3.
請求項2記載の情報提供装置。 The information providing device receives the second question content from a terminal device connected via a network and transmits an answer content to the second question content to the terminal device.
The information providing device according to claim 2.
第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得し、
前記取得された第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与する、
情報提供方法。 Computer
A network search is performed using a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content, and a search result Get the first document of
Assigning a first label indicating a question type to the first question content based on a third character string that is a morpheme before and after the second character string included in the acquired first document,
Information provision method.
第1質問内容から抽出されたキーワードである第1文字列と、前記第1質問内容に対する回答内容である第2文字列との組である第1検索クエリを用いてネットワーク検索を行い、検索結果の第1ドキュメントを取得させ、
前記取得された第1ドキュメントに含まれる前記第2文字列の前後にある形態素である第3文字列に基づいて、前記第1質問内容に対して質問種別を示す第1ラベルを付与させる、
プログラム。 On the computer,
A network search is performed using a first search query that is a set of a first character string that is a keyword extracted from the first question content and a second character string that is an answer content to the first question content, and a search result To get the first document of
A first label indicating a question type is given to the first question content based on a third character string that is a morpheme before and after the second character string included in the acquired first document,
program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006361A JP6739361B2 (en) | 2017-01-18 | 2017-01-18 | Information providing device, information providing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006361A JP6739361B2 (en) | 2017-01-18 | 2017-01-18 | Information providing device, information providing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018116447A JP2018116447A (en) | 2018-07-26 |
JP6739361B2 true JP6739361B2 (en) | 2020-08-12 |
Family
ID=62983950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017006361A Active JP6739361B2 (en) | 2017-01-18 | 2017-01-18 | Information providing device, information providing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6739361B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003150624A (en) * | 2001-11-12 | 2003-05-23 | Mitsubishi Electric Corp | Information extraction device and information extraction method |
JP4162223B2 (en) * | 2003-05-30 | 2008-10-08 | 日本電信電話株式会社 | Natural sentence search device, method and program thereof |
JP2006119697A (en) * | 2004-10-19 | 2006-05-11 | Fuji Xerox Co Ltd | Question answering system, question answering method, and question answering program |
JP4650072B2 (en) * | 2005-04-12 | 2011-03-16 | 富士ゼロックス株式会社 | Question answering system, data retrieval method, and computer program |
JP5710581B2 (en) * | 2012-12-18 | 2015-04-30 | 日本電信電話株式会社 | Question answering apparatus, method, and program |
-
2017
- 2017-01-18 JP JP2017006361A patent/JP6739361B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018116447A (en) | 2018-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105247507B (en) | Method, system and storage medium for the influence power score for determining brand | |
US8515969B2 (en) | Splitting a character string into keyword strings | |
JP6691280B1 (en) | Management system and management method | |
US8706728B2 (en) | Calculating reliability scores from word splitting | |
CN107704480A (en) | Extension and the method and system and computer media for strengthening knowledge graph | |
US20110040769A1 (en) | Query-URL N-Gram Features in Web Ranking | |
US8099430B2 (en) | Computer method and apparatus of information management and navigation | |
JP6363682B2 (en) | Method for selecting an image that matches content based on the metadata of the image and content | |
JP2020191075A (en) | Recommendation of web apis and associated endpoints | |
CN112749284A (en) | Knowledge graph construction method, device, equipment and storage medium | |
JP2017220204A (en) | Method and system for matching images with content using whitelists and blacklists in response to search query | |
CN107491465A (en) | For searching for the method and apparatus and data handling system of content | |
CN110928917A (en) | Target user determination method and device, computing equipment and medium | |
CN110895587B (en) | Method and device for determining target user | |
CN107766398A (en) | For the method, apparatus and data handling system for image is matched with content item | |
US10504145B2 (en) | Automated classification of network-accessible content based on events | |
JP5639549B2 (en) | Information retrieval apparatus, method, and program | |
JP6739361B2 (en) | Information providing device, information providing method, and program | |
CN105740436B (en) | Method and device for pushing written works based on Internet search technology | |
KR101723310B1 (en) | System and mehtod for providing search service for representatives based on patent publication | |
JP2006155275A (en) | Information extraction method and information extraction device | |
CN111680122A (en) | Space data active recommendation method and device, storage medium and computer equipment | |
JP6271617B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2019053469A (en) | Database creating device, database creating method, and program | |
KR102528401B1 (en) | System for providing interactive morphological analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200721 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6739361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |