WO2023119496A1

WO2023119496A1 - 抽出装置

Info

Publication number: WO2023119496A1
Application number: PCT/JP2021/047621
Authority: WO
Inventors: 淳吉田
Original assignee: 日本電気株式会社
Priority date: 2021-12-22
Filing date: 2021-12-22
Publication date: 2023-06-29

Abstract

抽出装置４００は、ユーザにより入力される第一の自然文を取得する取得部４２１と、第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、前記取得部４２１により取得される前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出する抽出部４２２と、前記抽出部４２２が抽出した前記対象語を出力する出力部４２３と、を有する。

Description

抽出装置

　本発明は、抽出装置、抽出方法、記録媒体に関する。

　投稿された口コミなどの文字情報を解析する際に用いられる技術が知られている。

　例えば、特許文献１には、文脈によって極性が変化しない絶対ポジティブ表現に係る意見・感情単語および絶対ネガティブ表現に係る意見・感情単語を格納した意見・感情辞書を用いて言語解析結果に対して所定の処理を行うことで、ポジティブ表現に係る単語およびネガティブ表現に係る単語を抽出する情報抽出システムが記載されている。

国際公開２０１４／０６５３９２号公報

　特許文献１に記載のように予め辞書を用意して辞書内の単語を抽出できたとしても、ポジティブやネガティブなどの評価の要因が何であったのかを判断するためには、評価の要因を示す単語を抽出することが必要となる。ここで、評価の要因を示す単語を抽出する方法としては、例えば、ＢＥＲＴ（Bidirectional Encoder Representations from Transformers）などにより、感情分析を通してアテンションと係り受け解析を用いて目的の単語を抽出する、という方法がある。しかしながら、係り受け解析結果は表記ゆれにセンシティブである。そのため、係り受け解析から目的の単語をルールベースで抽出することは難しかった。このように、文字情報を解析して、ポジティブやネガティブなどの評価や顧客からの要望などの提言の要因を示す言葉を抽出することが難しい、という課題が生じていた。

　そこで、本発明の目的は、文字情報を解析して、ポジティブやネガティブなどの評価や顧客からの要望などの提言の要因を示す言葉を抽出することが難しい、という課題を解決することが可能な抽出装置、抽出方法、記録媒体を提供することにある。

　かかる目的を達成するため本開示の一形態である抽出装置は、
　ユーザにより入力される第一の自然文を取得する取得部と、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、前記取得部により取得される前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出する抽出部と、
　前記抽出部が抽出した前記対象語を出力する出力部と、
　を有する
　という構成をとる。

　また、本開示の他の形態である抽出方法は、
　情報処理装置が、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　という構成をとる。

　また、本開示の他の形態である記録媒体は、
　情報処理装置に、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体である。

　上述したような各構成によると、文字情報を解析して、ポジティブやネガティブなどの評価や顧客からの要望などの提言の要因を示す言葉を抽出することが可能な抽出装置、抽出方法、記録媒体を提供することが出来る。

本発明の概要を説明するための図である。本開示の第１の実施形態における抽出装置の構成例を示すブロック図である。構文解析の一例を説明するための図である。ラベル付けの一例を説明するための図である。抽出装置の動作例を示すフローチャートである。抽出装置の動作例を示すフローチャートである。抽出装置の他の構成例を示すブロック図である。本開示の第２の実施形態における抽出装置の構成例を示すブロック図である。抽出装置における抽出例を示す図である。抽出装置における出力例を示す図である。本開示の第３の実施形態における抽出装置の構成例を示すブロック図である。抽出装置における抽出例を示す図である。抽出装置における出力例を示す図である。本開示の第４の実施形態における抽出装置のハードウェア構成例を示す図である。抽出装置の構成例を示すブロック図である。要望抽出装置の構成例を示すブロック図である。

［第１の実施形態］
　本開示の第１の実施形態について、図１から図７までを参照して説明する。図１は、本発明の概要を説明するための図である。図２は、抽出装置１００の構成例を示すブロック図である。図３は、構文解析の一例を説明するための図である。図４は、ラベル付けの一例を説明するための図である。図５、図６は、抽出装置１００の動作例を示すフローチャートである。図７は、抽出装置の他の構成例を示すブロック図である。

　本開示の第１の実施形態においては、図１で示すように、入力された自然文（または自然言語文）から関係性語と対象語のペアのうちの少なくとも一つを抽出して出力する情報処理装置である抽出装置１００について説明する。例えば、モデルの学習段階において、抽出装置１００には、口コミなどの複数の自然文（例えば、第二の自然文）が入力される。すると、抽出装置１００は、入力された自然文に対して、所定の構文解析を行う。また、抽出装置１００は、構文解析の後、関係性語と対象語のペアに対するラベル付けの入力を受け付ける。そして、抽出装置１００は、構文解析結果とラベル付けされた結果を入力とする機械学習処理を施すことで、自然文から関係性語と対象語を抽出して出力する学習済みモデルを学習、生成する。なお、学習済みモデルは、関係性語と対象語のうちの予め定められた一方のみを出力するよう学習されてもよい。

　また、例えば、活用時において、抽出装置１００には、口コミなどの複数の自然文（例えば、第一の自然文）が入力される。すると、抽出装置１００は、入力された自然文に対して構文解析などを行ったうえで上述した学習済みモデルに入力することで、自然文から関係性語と対象語のペアを抽出する。そして、抽出装置１００は、必要に応じて前処理を行ったうえで、抽出した結果を出力する。

　なお、本実施形態において、関係性語とは、単語間の関係性を定義する単語のことを指す。例えば、単語間で「ポジティブ」という関係性を定義する場合、「良かった」、「嬉しい」などの単語（例えば、肯定的な感情を示す単語など）が関係性語となる。また、例えば、単語間で「ネガティブ」という関係性を定義する場合、「つまらなかった」、「まずい」などの単語（例えば、否定的な感情を示す単語など）が関係性語となる。なお、単語間で定義される関係性としては、ポジティブ、ネガティブなどの感情を示す単語の他に、要望、そのほか任意の提言などを示す単語が含まれてよい。単語間で定義される関係性は上記例示した以外が含まれてもよい。例えば、以上のように、関係性語とは、ポジティブやネガティブなどのユーザの感情を示す単語やユーザの要望を示す単語などのことをいう。

　また、本実施形態において、対象語とは、関係性語の関係先の単語を意味する。例えば、「良かった」や「嬉しい」等の「ポジティブ」という関係性を定義する関係性語に対し、「何が」良かったかの、「何が」の部分が対象語になる。一例として、「ここの温泉は泉質が良かった」の場合、「泉質」が対象語となる。このように、対象語は、関係性語が示す関係性の要因を示す単語などを含み、関係性語とペアになる。換言すると、対象語とは、関係性語の対象となる単語のことをいう。

　例えば、自然文から単語間で定義された意味的な関係性を抽出するためには、単語ペアの組み合わせによる意味の付与の関係性を抽出する必要がある。例として、「古いパソコンなのにスペックが良い」という文では、「スペック」という単語のみ抽出したとしても、文章作成者がスペックに対してどういう意味付け（関係性の付与）を行ったかが分からない。これは、「良い」という単語のみを抽出した場合も同様である。「スペック,良い」という組み合わせで抽出することで、ユーザは「スペック」に対して「良い」と意味づけ、つまりポジティブな関係性を付与したことがわかる。このように、自然文から単語間の意味的な関係性を特定するためには、ある単語間に対する「意味の付与」の関係性を抽出する必要がある。そこで、本実施形態で説明する抽出装置１００では、自然文から上述したような関係性語と対象語のペアを抽出可能なようにモデルを学習する。

　図２は、抽出装置１００の構成例を示している。図２を参照すると、抽出装置１００は、主な構成要素として、例えば、操作入力部１１０と、画面表示部１２０と、通信Ｉ／Ｆ部１３０と、記憶部１４０と、演算処理部１５０と、を有している。

　なお、図２では、１台の情報処理装置を用いて抽出装置１００としての機能を実現する場合について例示している。しかしながら、抽出装置１００は、例えば、クラウド上に実現されるなど、複数台の情報処理装置を用いて実現されてもよい。例えば、抽出装置１００としての機能は、後述する自然文入力受付部１５１と構文解析部１５２とラベル付け受付部１５３と関係性学習部１５４としての機能を有する学習装置と、後述する自然文入力受付部１５１と構文解析部１５２と抽出部１５５と前処理部１５６と出力部１５７としての機能を有する抽出装置と、の２台の情報処理装置により実現されてもよい。また、抽出装置１００は、操作入力部を有さないなど上記例示した構成の一部を含まなくてもよいし、上記例示した以外の構成を有してもよい。

　操作入力部１１０は、キーボード、マウスなどの操作入力装置からなる。操作入力部１１０は、抽出装置１００を操作する操作者の操作を検出して演算処理部１５０に出力する。

　画面表示部１２０は、ＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ、液晶ディスプレイ）などの画面表示装置からなる。画面表示部１２０は、演算処理部１５０からの指示に応じて、記憶部１４０に格納されている各種情報などを画面表示することが出来る。

　通信Ｉ／Ｆ部１３０は、データ通信回路などからなる。通信Ｉ／Ｆ部１３０は、通信回線を介して接続された外部装置などとの間でデータ通信を行う。

　記憶部１４０は、ハードディスクやメモリなどの記憶装置である。記憶部１４０は、演算処理部１５０における各種処理に必要な処理情報やプログラム１４５を記憶する。プログラム１４５は、演算処理部１５０に読み込まれて実行されることにより各種処理部を実現する。プログラム１４５は、通信Ｉ／Ｆ部１３０などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部１４０に保存されている。記憶部１４０で記憶される主な情報としては、例えば、自然文情報１４１、解析結果情報１４２、ラベル情報１４３、学習済みモデル１４４などがある。

　自然文情報１４１は、自然文入力受付部１５１が入力を受け付けた、１つまたは複数の自然文を含んでいる。一例として、自然文は、ＥＣ（Electronic commerce）サイト、商品レビュー、ＳＮＳ（Social networking service）などのユーザによる口コミなどである。自然文は、収集した商品レビューやアンケート結果など上記例示した以外であってもよい。例えば、自然文情報１４１は、モデルの学習時や学習済みモデルの活用時に自然文入力受付部１５１が自然文の入力を受け付けた際に更新される。

　例えば、自然文情報１４１には、学習用の自然文（第二の自然文）と活用時の自然文（第一の自然文）とが互いに区別して含まれる。自然文情報１４１に含まれうる自然文のうち学習用の自然文は、例えば、後述する関係性学習部１５４による学習が終わった段階で削除されてよい。また、自然文情報１４１に含まれうる自然文のうち活用時の自然文も、必要に応じて適宜削除されてよい。

　解析結果情報１４２は、自然文情報１４１に含まれる自然文を後述する構文解析部１５２により構文解析した結果に応じた情報が含まれる。例えば、解析結果情報１４２は、後述する構文解析部１５２が自然文情報１４１に含まれる自然文に対して構文解析を行うごとに更新される。

　一例として、解析結果情報１４２には、形態素解析などにより自然文を切り分けた単語単位での、単語の種類である品詞（例えば、品詞タグ）や単語間の関係を示す係り受け情報（例えば、係り受けタグ）などが含まれる。例えば、図３は、「値段が高いのと、重たいのを改善してほしい」というユーザの要望を含む自然文に対する構文解析処理の一例を示している。図３で示すように、構文解析時の形態素解析により、上記自然文は、「値段」「高い」「重たい」「改善」などの単語に分解される。そのため、解析結果情報１４２には、上記分解された各単語の品詞や単語間の関係などを示す情報が含まれる。例えば、図３で示す例の場合、解析結果情報１４２には、「改善」という単語の品詞が「動詞」である旨を示す品詞タグなどの情報や、「改善」と「重たい」という単語間に「副詞節修飾」の関係がある旨を示す係り受けタグなど自然文を切り分けた各単語の品詞や単語間の係り受け情報などが含まれる。なお、品詞タグや係り受けタグなどは既知のものであってよい。

　ラベル情報１４３は、解析結果情報１４２に含まれる単語に対するラベル付けの結果に応じた情報が含まれる。例えば、ラベル情報１４３は、後述するラベル付け受付部１５３がラベル付けを受け付けるごとに更新される。

　本実施形態の場合、ラベル情報１４３には、単語に関係性語である旨を示すラベルが付与されている旨を示す情報と、単語に上記関係性語に対応する対象語である旨を示すラベルが付与されている旨を示す情報と、が含まれる。例えば、図４は、図３で例示した構文解析結果に応じたラベル付けの一例を示している。図４で示すように、例えば、図３で例示したような構文解析が行われた場合、抽出装置１００の操作者などは、「改善」という単語に関係性語のラベルを付与し、「値段」という単語に対象語のラベルを付与する。そのため、ラベル情報１４３には、「改善」という単語に関係性語である旨を示すラベルが付与されていることを示す情報と、「値段」という単語に上記関係性語に対応する対象語である旨を示すラベルが付与されていることを示す情報と、が含まれる。

　学習済みモデル１４４は、ラベル付けられた結果に基づいて機械学習処理が施されたモデルを含んでいる。例えば、学習済みモデル１４４に含まれるモデルは、入力された自然文（構文解析後の自然文）に対して関係性語と対象語を抽出して出力するよう学習、調整されている。例えば、学習済みモデル１４４は、後述する関係性学習部１５４がラベル付けされた結果に基づく学習を行うことに応じて更新される。なお、第２の実施形態や第３の実施形態で説明するように、学習済みモデル１４４は、関係性語により定義される関係性ごとのモデルを含んでいてもよい。

　演算処理部１５０は、ＣＰＵ（Central Processing Unit）などの演算装置とその周辺回路を有する。演算処理部１５０は、記憶部１４０からプログラム１４５を読み込んで実行することにより、上記ハードウェアとプログラム１４５とを協働させて各種処理部を実現する。演算処理部１５０で実現される主な処理部としては、例えば、自然文入力受付部１５１、構文解析部１５２、ラベル付け受付部１５３、関係性学習部１５４、抽出部１５５、前処理部１５６、出力部１５７などがある。なお、演算処理部１５０で実現される主な処理部のうち、自然文入力受付部１５１、構文解析部１５２、ラベル付け受付部１５３、関係性学習部１５４は、主にモデルの学習時に動作する。また、演算処理部１５０で実現される主な処理部のうち、自然文入力受付部１５１、構文解析部１５２、抽出部１５５、前処理部１５６、出力部１５７は、主に学習したモデルの活用時に動作する。

　自然文入力受付部１５１は、自然文の入力を受け付ける。換言すると、自然文入力受付部１５１は、自然文を取得する取得部として機能する。例えば、自然文入力受付部１５１は、通信Ｉ／Ｆ部１３０を介して外部装置などから自然文の入力を受け付けたり、操作入力部１１０を用いた操作に応じて自然文の入力を受け付けたりする。また、自然文入力受付部１５１は、受け付けた自然文を自然文情報１４１として記憶部１４０に格納する。

　例えば、自然文入力受付部１５１は、ＥＣサイト、商品レビュー、ＳＮＳなどのユーザによる口コミ、アンケート結果などの複数の自然文の入力を受け付ける。自然文入力受付部１５１は、上記例示した以外の自然文の入力を受け付けてもよい。

　なお、自然文入力受付部１５１は、上述したように、モデルの学習時と学習したモデルの活用時のそれぞれにおいて自然文の入力を受け付けることが出来る。自然文入力受付部１５１は、学習用の自然文（第二の自然文）と、活用時の自然文（第一の自然文）とを、区別可能なように記憶部１４０に格納してよい。

　構文解析部１５２は、自然文入力受付部１５１が受け付けた自然文に対して構文解析を行う。そして、構文解析部１５２は、解析結果を解析結果情報１４２として記憶部１４０に格納する。

　例えば、構文解析部１５２は、自然文に対して形態素解析を行った後、係り受け解析を行うことなどにより、自然文を切り分けた単語単位での、単語の種類である品詞や単語間の関係を示す係り受け情報などを判断する。例えば、図３で例示する自然文の場合、構文解析部１５２は、形態素解析を行うことで、図３で例示する自然文を「値段」「高い」「重たい」「改善」などの単語に分解する。また、構文解析部１５２は、分解した各単語の品詞を判断するとともに、係り受け解析を行うことなどにより、各単語間の関係を判断する。例えば、図３で例示する場合、構文解析部１５２は、「改善」という単語の品詞が「動詞」である旨を判断したり、「改善」と「重たい」という単語間に「副詞節修飾」の関係がある旨を判断したりする。その後、構文解析部１５２は、上記判断により特定した品詞や係り受け情報などを解析結果情報１４２として記憶部１４０に格納する。なお、構文解析部１５２は、既知の構文解析器を用いて構文解析を行ってよい。

　なお、上述したように、構文解析部１５２は、モデルの学習時と学習したモデルの活用時の両方において、自然文に対する構文解析を行うことが出来る。

　ラベル付け受付部１５３は、モデルの学習時において、構文解析部１５２が構文解析を行った後、操作入力部１１０に対する操作者の操作を受け付けることなどにより、単語に対するラベルの付与を受け付ける。そして、ラベル付け受付部１５３は、受け付けたラベルを示す情報をラベル情報１４３として記憶部１４０に格納する。

　例えば、ラベル付け受付部１５３は、構文解析部１５２により構文解析が行われた後、構文解析の結果を画面表示部１２０などに表示させる。そして、ラベル付け受付部１５３は、対象語と関係性語に対するラベル付けを抽出装置１００の操作者から受け付ける。例えば、図４で例示する場合、ラベル付け受付部１５３は、「改善」という単語に関係性語のラベルを付与する旨と「値段」という単語に上記関係性語に対応する対象語のラベルを付与する旨の入力を受け付ける。また、ラベル付け受付部１５３は、「改善」という単語に関係性語のラベルを付与する旨と「重たい」という単語に上記関係性語に対応する対象語のラベルを付与する旨の入力を受け付ける。その後、ラベル付け受付部１５３は、上記受け付けた結果に応じた情報をラベル情報１４３として記憶部１４０に格納する。

　例えば、以上のように、ラベル付け受付部１５３は、１つの自然文に対して１つまたは複数の対となるラベルを付与する旨の情報を受け付けることが出来る。一例として、ラベル付け受付部１５３は、関係を有する単語の集まりであるトークンごとにラベル付けを受け付けてもよい。図４で例示する場合、「改善」「重たい」という単語間に副詞節修飾という関係があり、また、「改善」「高い」「値段」という単語間に副詞節修飾と主語名詞という関係がある。そこで、ラベル付け受付部１５３は、「改善」「重たい」というトークンに対するラベル付けを受け付けるとともに、「改善」「高い」「値段」というトークンに対するラベル付けを受け付けることが出来る。なお、ラベル付け受付部１５３は、例えば、構文解析の結果を通信Ｉ／Ｆ部１３０などを介して外部装置へと送信することなどにより、外部装置などからラベルの情報を受け付けてもよい。

　関係性学習部１５４は、ラベル付け受付部１５３が受け付けた結果及び、構文解析結果を入力として、ニューラルネットワークの重み値を調整することなどにより、入力された構文解析後の自然文に対して関係性語と対象語を抽出して出力するようにモデルを学習する。そして、関係性学習部１５４は、学習したモデルを学習済みモデル１４４として記憶部１４０に格納する。なお、関係性学習部１５４は、構文解析部１５２が行った係り受け解析の結果に応じて判断されるトークンごとに、ラベル付け受付部１５３が受け付けた結果を入力して重み値を調整してよい。また、関係性学習部１５４は、関係性語により定義される関係性ごとに、モデルを学習してよい。

　抽出部１５５は、学習したモデルの活用時において、構文解析部１５２が構文解析した結果を学習済みモデル１４４が示すモデルに入力することで、自然文に対応する関係性語と対象語のペアを抽出する。例えば、抽出部１５５は、構文解析の結果として判断されるトークンごとに、関係性語と対象語のペアを抽出することが出来る。

　なお、抽出部１５５は、関係性語と対象語のペアのうちの少なくとも一方を抽出、出力するよう構成されていれば、必ずしも関係性語と対象語を両方抽出、出力しなくてもよい。例えば、抽出部１５５は、対象語のみを抽出、出力するよう構成してもよい。

　前処理部１５６は、抽出部１５５が出力した結果に対して所定の前処理を行う。例えば、前処理部１５６は、抽出部１５５が抽出した対象語に対して、関係性語が定義する関係性の要因を可視化するための前処理を行う。

　例えば、前処理部１５６は、抽出部１５５による出力に対してK-meansなどを用いたクラスタリングを行うことが出来る。また、前処理部１５６は、抽出部１５５により出力された対象語の出現頻度などを集計した上で、集計結果を示すグラフなどを作成するグラフ化を行うことが出来る。前処理部１５６は、上記例示した以外の抽出部１５５による複数の出力を可視化する処理などの前処理を行ったうえで、前処理の結果を出力するように構成してもよい。このように、前処理部１５６は、抽出部１５５が抽出した対象語を単語の類似度に基づいてグループ分けしたり、対象語の出現頻度などを集計してグラフ化したりすることで、関係性の要因を可視化する。

　なお、前処理部１５６は、例えば、関係性語の種類などに応じて予め定められた方法により前処理を行うよう構成してもよい。前処理部１５６は、予め定められた条件を満たす場合に、上記例示したような前処理を行うよう構成してもよい。

　出力部１５７は、前処理部１５６が前処理を行った結果を出力する。例えば、出力部１５７は、前処理部１５６が前処理を行った結果を画面表示部１２０上に表示させたり、通信Ｉ／Ｆ部１３０を介して外部装置に対して送信したりする。出力部１５７は、上記前処理部１５６が前処理を行った結果とともに、または、前処理を行った結果の代わりに、抽出部１５５が出力した結果を出力してもよい。

　以上が、抽出装置１００の構成例である。続いて、図５、図６を参照して抽出装置１００の動作例について説明する。

　図５は、学習時の抽出装置１００の動作例を示すフローチャートである。図５を参照すると、自然文入力受付部１５１は、自然文の入力を受け付ける（ステップＳ１０１）。

　構文解析部１５２は、自然文入力受付部１５１が受け付けた自然文に対して構文解析を行う（ステップＳ１０２）。例えば、構文解析部１５２は、自然文に対して形態素解析を行った後、係り受け解析を行うことなどにより、自然文を切り分けた単語単位での、単語の種類である品詞や単語間の関係を示す係り受け情報などを判断する。

　ラベル付け受付部１５３は、構文解析部１５２が構文解析を行った後、操作入力部１１０に対する操作者の操作を検出することなどにより、単語に対するラベルの付与を受け付ける（ステップＳ１０３）。例えば、ラベル付け受付部１５３は、関係性語である旨を示すラベルと、対象語である旨を示すラベルと、の付与を受け付ける。

　関係性学習部１５４は、ラベル付け受付部１５３が受け付けた結果を入力として、重み行列の重み値を調整することなどにより、入力された自然文に対して関係性語と対象語を抽出して出力するようにモデルを学習する（ステップＳ１０４）。

　以上が、学習時における抽出装置１００の動作例である。続いて、図６を参照して、学習したモデルの活用時における抽出装置１００の動作例について説明する。

　図６は、学習したモデルの活用時における抽出装置１００の動作例を示すフローチャートである。図６を参照すると、自然文入力受付部１５１は、自然文の入力を受け付ける（ステップＳ２０１）。

　構文解析部１５２は、自然文入力受付部１５１が受け付けた自然文に対して構文解析を行う（ステップＳ２０２）。例えば、構文解析部１５２は、自然文に対して形態素解析を行った後、係り受け解析を行うことなどにより、自然文を切り分けた単語単位での、単語の種類である品詞や単語間の関係を示す係り受け情報などを判断する。

　抽出部１５５は、構文解析部１５２が構文解析した結果を学習済みモデル１４４が示すモデルに入力することで、自然文に対応する関係性語と対象語のペアを抽出する（ステップＳ２０３）。例えば、抽出部１５５は、構文解析の結果として判断されるトークンごとに、関係性語と対象語のペアを抽出することが出来る。

　前処理部１５６は、抽出部１５５が出力した結果に対して、所定の前処理を行う（ステップＳ２０４）。ステップＳ２０５の処理は、省略してもよい。

　出力部１５７は、前処理部１５６が前処理した結果を出力する（ステップＳ２０５）。出力部１５７は、前処理部１５６が前処理した結果とともに、または、その代わりに、抽出部１５５が出力した結果を出力するよう構成してもよい。

　以上が、学習したモデルの活用時における抽出装置１００の動作例である。

　このように、抽出装置１００は、抽出部１５５を有している。このような構成によると、抽出部１５５は、関係性語と対象語のペアを抽出するよう学習されたモデルを用いて、自然文から関係性語と対象語のペアを抽出することが出来る。これにより、抽出装置１００は、関係性語の要因を示す単語である対象語を抽出、出力することが出来る。

　また、抽出装置１００は、前処理部１５６を有している。このような構成によると、出力部１５７は、前処理部１５６が前処理を行った結果を出力することが出来る。その結果、関係性語が定義する関係性の要因などをユーザが容易に把握することが出来る。

　なお、本実施形態においては、抽出装置１００の構成の一例について説明した。しかしながら、抽出装置１００は、本実施形態で例示した以外の構成を有してもよい。例えば、図７は、抽出装置１００の他の構成例を示している。図７を参照すると、抽出装置１００が有する記憶部１４０は、本実施形態で例示した構成に加えて、単語特徴量ＤＢ１４６を有してもよい。記憶部１４０が単語特徴量ＤＢ１４６を有する場合、関係性学習部１５４は、単語特徴量ＤＢ１４６が示す単語ごとの特徴量を追加で入力した上でモデルの学習を行うよう構成してよい。このように、単語特徴量ＤＢ１４６を用意して単語の意味を加えて学習を行うことにより、抽出精度の向上を見込むことが出来る。

［第２の実施形態］
　次に、本開示の第２の実施形態について、図８から図１０までを参照して説明する。図８は、抽出装置２００の構成例を示すブロック図である。図９は、抽出装置２００における抽出例を示す図である。図１０は、抽出装置２００における出力例を示す図である。

　本開示の第２の実施形態においては、第１の実施形態で説明した抽出装置１００と同様に、入力された自然文から関係性語と対象語のペアのうちの少なくとも一つを抽出して出力する情報処理装置である抽出装置２００について説明する。後述するように、本実施形態で説明する抽出装置２００の場合、「ポジティブ」という関係性を定義する関係性語と対象語のペアを抽出するポジティブモデルと「ネガティブ」という関係性を定義する関係性語と対象語のペアを抽出するネガティブモデルとを有している。そして、抽出装置２００は、口コミや商品レビュー等の自然文をそれぞれのモデルに入力することで、ポジティブ／ネガティブ評価につながった要因を示す対象語を抽出する。また、抽出装置２００は、抽出された対象語をポジティブ／ネガティブそれぞれでクラスタリングすることで、ユーザにとって良かった／悪かった要因を視覚的に提示することが出来る。

　図８は、抽出装置２００の構成例を示している。図８を参照すると、抽出装置２００は、主な構成要素として、例えば、操作入力部１１０と、画面表示部１２０と、通信Ｉ／Ｆ部１３０と、記憶部２４０と、演算処理部２５０と、を有している。

　なお、図８では、１台の情報処理装置を用いて抽出装置２００としての機能を実現する場合について例示しているが、抽出装置１００の場合と同様に、抽出装置２００の構成は様々な変形例を採用してよい。また、以降においては、抽出装置２００の構成のうち抽出装置１００の構成とは異なる本実施形態に特徴的な構成について説明する。

　記憶部２４０は、ハードディスクやメモリなどの記憶装置である。記憶部２４０は、演算処理部２５０における各種処理に必要な処理情報やプログラム２４６を記憶する。プログラム２４６は、演算処理部２５０に読み込まれて実行されることにより各種処理部を実現する。プログラム２４６は、通信Ｉ／Ｆ部１３０などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部２４０に保存されている。記憶部２４０で記憶される主な情報としては、例えば、自然文情報１４１、解析結果情報１４２、ラベル情報２４３、ポジティブモデル情報２４４、ネガティブモデル情報２４５などがある。

　ラベル情報２４３は、解析結果情報１４２に含まれる単語に対するラベル付けの結果に応じた情報が含まれる。例えば、ラベル情報２４３は、後述するラベル付け受付部２５３がラベル付けを受け付けるごとに更新される。

　本実施形態の場合、ラベル情報２４３には、単語に「ポジティブ」という関係性を定義する関係性語である旨を示すラベルが付与されている旨を示す情報と、単語に上記関係性語に対応する対象語である旨を示すラベルが付与されている旨を示す情報と、が含まれる。また、ラベル情報２４３には、単語に「ネガティブ」という関係性を定義する関係性語である旨を示すラベルが付与されている旨を示す情報と、単語に上記関係性語に対応する対象語である旨を示すラベルが付与されている旨を示す情報と、が含まれる。

　ポジティブモデル情報２４４は、ラベル付けられた結果のうち、「ポジティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けられた結果に基づいて機械学習処理が施されたモデルを含んでいる。例えば、ポジティブモデル情報２４４に含まれるポジティブモデルは、入力された自然文（構文解析後の自然文）に対して「ポジティブ」という関係性を定義する関係性語と対象語を抽出して出力するよう学習、調整されている。例えば、ポジティブモデル情報２４４は、後述するポジ・ネガ関係性学習部２５４により「ポジティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けされた結果に基づく学習を行うことに応じて更新される。

　ネガティブモデル情報２４５は、ラベル付けられた結果のうち、「ネガティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けられた結果に基づいて機械学習処理が施されたモデルを含んでいる。例えば、ネガティブモデル情報２４５に含まれるネガティブモデルは、入力された自然文（構文解析後の自然文）に対して「ネガティブ」という関係性を定義する関係性語と対象語を抽出して出力するよう学習、調整されている。例えば、ネガティブモデル情報２４５は、後述するポジ・ネガ関係性学習部２５４により「ネガティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けされた結果に基づく学習を行うことに応じて更新される。

　演算処理部２５０は、ＣＰＵなどの演算装置とその周辺回路を有する。演算処理部２５０は、記憶部２４０からプログラム２４６を読み込んで実行することにより、上記ハードウェアとプログラム２４６とを協働させて各種処理部を実現する。演算処理部２５０で実現される主な処理部としては、例えば、自然文入力受付部１５１、構文解析部１５２、ラベル付け受付部２５３、ポジ・ネガ関係性学習部２５４、抽出部２５５、前処理部２５６、出力部２５７などがある。

　ラベル付け受付部２５３は、モデルの学習時において、構文解析部１５２が構文解析を行った後、操作入力部１１０に対する操作者の操作を受け付けることなどにより、単語に対するラベルの付与を受け付ける。そして、ラベル付け受付部２５３は、受け付けたラベルを示す情報をラベル情報２４３として記憶部２４０に格納する。

　本実施形態の場合、ラベル付け受付部２５３は、「ポジティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とに対するラベルを受け付けるとともに、「ネガティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とに対するラベル付けを受け付ける。なお、ラベル付け受付部２５３は、第１の実施形態で説明したラベル付け受付部１５３の場合と同様に、ラベル付けを外部装置などから受け付けたりしてもよい。

　ポジ・ネガ関係性学習部２５４は、関係性学習部１５４と同様に、ラベル付け受付部２５３が受け付けた結果及び、構文解析結果を入力として、重み行列の重み値を調整することなどにより、入力された構文解析後の自然文に対して関係性語と対象語を抽出して出力するようにモデルを学習する。本実施形態の場合、ポジ・ネガ関係性学習部２５４は、ラベル付けられた結果のうち、「ポジティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けられた結果に基づいて、ポジティブモデルを学習する。また、ポジ・ネガ関係性学習部２５４は、ラベル付けられた結果のうち、「ネガティブ」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けられた結果に基づいて、ネガティブモデルを学習する。このように、ポジ・ネガ関係性学習部２５４は、関係性語が定義する関係性ごとにモデルを学習する。

　抽出部２５５は、抽出部１５５と同様に、自然文から関係性語と対象語のペアを抽出、出力する。例えば、抽出部２５５は、モデルの活用時において、構文解析部１５２が構文解析した結果をポジティブモデル情報２４４が示すポジティブモデルに入力する。これにより、抽出部２５５は、自然文から「ポジティブ」という関係性を定義する関係性語と対象語のペアを抽出する。また、抽出部２５５は、構文解析部１５２が構文解析した結果をネガティブモデル情報２４５が示すネガティブモデルに入力する。これにより、抽出部２５５は、自然文から「ネガティブ」という関係性を定義する関係性語と対象語のペアを抽出する。このように、抽出部２５５は、関係性語が定義する関係性ごとに学習されたモデルを用いて、それぞれの関係性に対応する関係性語と対象語のペアを抽出する。

　例えば、図９を参照すると、抽出部２５５は、ポジティブモデルに対して構文解析後の自然文を入力することで、「スペック」「性能」「軽い」……などの対象語を抽出、出力する。また、抽出部２５５は、ネガティブモデルに対してポジティブモデルに対する入力と同様の自然文を入力することで、「電池持ち」「割れやすい」「値段」……などの対象語を抽出、出力する。

　前処理部２５６は、前処理部１５６と同様に、抽出部２５５が出力した結果に対して所定の前処理を行う。例えば、前処理部２５６は、抽出部２５５が抽出した対象語に対して、関係性語が定義する関係性の要因を可視化するための前処理を行う。

　例えば、前処理部２５６は、前処理としてK-meansなどを用いたクラスタリングを行う。図１０は、図９で示す抽出例に対して前処理であるクラスタリングを行った結果の一例を示している。例えば、前処理部２５６は、図１０で示すように、抽出部２５５が抽出、出力した結果をクラスタリングすることで、ポジティブ評価の要因やネガティブ評価の要因を整理・可視化する。なお、前処理部２５６は、第１の実施形態の場合と同様に、グラフ化などを行ってもよい。

　出力部２５７は、出力部１５７と同様に、前処理部２５６が前処理した結果を出力する。上述したように、前処理部２５６が行う前処理により、ポジティブ評価の要因やネガティブ評価の要因が整理・可視化されている。そのため、出力部２５７による出力によると、ポジティブ評価の要因やネガティブ評価の要因を容易に確認することが出来る。

　以上が、抽出装置２００の構成例である。なお、抽出装置２００の動作は、学習済みモデルとしてポジティブモデルとネガティブモデルとがあるため、それぞれを学習すること、および、活用時にはポジティブモデルとネガティブモデルのそれぞれに自然文を入力してそれぞれの出力ごとに前処理を行うこと、を除いて概ね抽出装置１００の動作と同様であってよい。

　このように、抽出装置２００は、抽出部２５５を有している。このような構成によると、抽出装置２００は、ポジティブモデルを用いて対象語を抽出するとともにネガティブモデルを用いて対象語を抽出することが出来る。これにより、抽出装置２００は、「ポジティブ」な関係性を定義する関係性語の要因を示す単語である対象語を抽出、出力するとともに、「ネガティブ」な関係性を定義する関係性語の要因を示す単語である対象語を抽出、出力することが出来る。

　なお、抽出装置２００は、抽出装置１００と同様の変形例を採用してよい。また、本実施形態において、抽出装置２００は、ポジティブモデルとネガティブモデルの両方を有する場合について例示した。しかしながら、抽出装置２００は、ポジティブモデルとネガティブモデルのうちのいずれか一方のみを有していてもよい。

［第３の実施形態］
　次に、本開示の第３の実施形態について、図１１から図１３までを参照して説明する。図１１は、抽出装置３００の構成例を示すブロック図である。図１２は、抽出装置３００における抽出例を示す図である。図１３は、抽出装置３００における出力例を示す図である。

　本開示の第３の実施形態においては、第１の実施形態で説明した抽出装置１００や第２の実施形態で説明した抽出装置２００と同様に、入力された自然文から関係性語と対象語のペアのうちの少なくとも一つを抽出して出力する情報処理装置である抽出装置３００について説明する。後述するように、本実施形態で説明する抽出装置３００の場合、「要望」という関係性を定義する関係性語と対象語のペアを抽出する要望モデルを有している。そして、抽出装置３００は、口コミや商品レビュー等の自然文を要望モデルに入力することで、要望の要因（つまり、ユーザが何を要望しているか）を示す対象語を抽出する。また、抽出装置３００は、抽出された対象語をクラスタリングしたりグラフ化したりすることで、ユーザの要望を的確に抽出するとともに、視覚的に提示可能にする。

　図１１は、抽出装置３００の構成例を示している。図１１を参照すると、抽出装置３００は、主な構成要素として、例えば、操作入力部１１０と、画面表示部１２０と、通信Ｉ／Ｆ部１３０と、記憶部３４０と、演算処理部３５０と、を有している。

　なお、図１１では、１台の情報処理装置を用いて抽出装置３００としての機能を実現する場合について例示しているが、抽出装置１００や抽出装置２００の場合と同様に、抽出装置３００の構成は様々な変形例を採用してよい。また、以降においては、抽出装置３００の構成のうち抽出装置１００や抽出装置２００の構成とは異なる本実施形態に特徴的な構成について説明する。

　記憶部３４０は、ハードディスクやメモリなどの記憶装置である。記憶部３４０は、演算処理部３５０における各種処理に必要な処理情報やプログラム３４５を記憶する。プログラム３４５は、演算処理部３５０に読み込まれて実行されることにより各種処理部を実現する。プログラム３４５は、通信Ｉ／Ｆ部１３０などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部２４０に保存されている。記憶部２４０で記憶される主な情報としては、例えば、自然文情報１４１、解析結果情報１４２、ラベル情報３４３、要望モデル情報３４４などがある。

　ラベル情報３４３は、解析結果情報１４２に含まれる単語に対するラベル付けの結果に応じた情報が含まれる。例えば、ラベル情報３４３は、後述するラベル付け受付部３５３がラベル付けを受け付けるごとに更新される。本実施形態の場合、ラベル情報３４３には、単語に「要望」という関係性を定義する関係性語である旨を示すラベルが付与されている旨を示す情報と、単語に上記関係性語に対応する対象語である旨を示すラベルが付与されている旨を示す情報と、が含まれる。

　要望モデル情報３４４は、ラベル付けられた結果に基づいて機械学習処理が施されたモデルを含んでいる。例えば、要望モデル情報３４４に含まれる要望モデルは、入力された自然文（構文解析後の自然文）に対して「要望」という関係性を定義する関係性語と対象語を抽出して出力するよう学習、調整されている。例えば、要望モデル情報３４４は、後述する要望関係性学習部３５４により「要望」という関係性を定義する関係性語と上記関係性語に対応する対象語とがラベル付けされた結果に基づく学習を行うことに応じて更新される。

　演算処理部３５０は、ＣＰＵなどの演算装置とその周辺回路を有する。演算処理部３５０は、記憶部３４０からプログラム３４５を読み込んで実行することにより、上記ハードウェアとプログラム３４５とを協働させて各種処理部を実現する。演算処理部３５０で実現される主な処理部としては、例えば、自然文入力受付部１５１、構文解析部１５２、ラベル付け受付部３５３、要望関係性学習部３５４、抽出部３５５、前処理部３５６、出力部３５７などがある。

　ラベル付け受付部３５３は、モデルの学習時において、構文解析部１５２が構文解析を行った後、操作入力部１１０に対する操作者の操作を受け付けることなどにより、単語に対するラベルの付与を受け付ける。そして、ラベル付け受付部３５３は、受け付けたラベルを示す情報をラベル情報３４３として記憶部３４０に格納する。

　本実施形態の場合、ラベル付け受付部３５３は、「要望」という関係性を定義する関係性語と上記関係性語に対応する対象語とに対するラベルを受け付ける。なお、ラベル付け受付部３５３は、第１の実施形態で説明したラベル付け受付部１５３やラベル付け受付部２５３の場合と同様に、ラベル付けを外部装置などから受け付けたりしてもよい。

　要望関係性学習部３５４は、関係性学習部１５４やポジ・ネガ関係性学習部２５４と同様に、ラベル付け受付部３５３が受け付けた結果及び、構文解析結果を入力として、重み行列の重み値を調整することなどにより、入力された構文解析後の自然文に対して関係性語と対象語を抽出して出力するようにモデルを学習する。本実施形態の場合、要望関係性学習部３５４は、ラベル付けられた結果に基づいて、要望モデルを学習する。このように、要望関係性学習部３５４は、関係性語が定義する関係性に応じたモデルである要望モデルを学習する。

　抽出部３５５は、抽出部１５５や抽出部２５５と同様に、自然文から関係性語と対象語のペアを抽出、出力する。例えば、抽出部３５５は、モデルの活用時において、構文解析部１５２が構文解析した結果を要望モデル情報３４４が示す要望モデルに入力する。これにより、抽出部３５５は、自然文から「要望」という関係性を定義する関係性語と対象語のペアを抽出する。

　例えば、図１２は、第２の実施形態と同様の自然文を要望モデルに入力した際の抽出、出力例を示している。図１２を参照すると、抽出部３５５は、要望モデルに対して構文解析後の自然文を入力することで、「安くして」「軽くして」「種類を増やして」……などの対象語を抽出、出力する。このように、抽出部３５５は、関係性語が定義する関係性に応じた対象語を抽出、出力することが出来る。

　前処理部３５６は、前処理部１５６や前処理部２５６と同様に、抽出部３５５が出力した結果に対して所定の前処理を行う。例えば、前処理部３５６は、抽出部３５５が抽出した対象語に対して、関係性語が定義する関係性の要因を可視化するための前処理を行う。

　例えば、前処理部３５６は、前処理としてK-meansなどを用いたクラスタリングを行う。また、前処理部３５６は、単語（対象語）の出現頻度を集計したうえで、集計結果をグラフ化する。図１３は、図１２で示す抽出例に対して前処理であるクラスタリングやグラフ化を行った結果の一例を示している。例えば、前処理部３５６は、図１３で示すように、抽出、出力した結果をクラスタリングしたりグラフ化したりすることで、要望の要因を整理・可視化する。

　出力部３５７は、出力部１５７や出力部２５７と同様に、前処理部３５６が前処理した結果を出力する。上述したように、前処理部３５６が行う前処理により、ユーザによる要望の要因が整理・可視化されている。そのため、出力部３５７による出力によると、ユーザによる要望の要因を容易に確認することが出来る。

　以上が、抽出装置３００の構成例である。なお、抽出装置３００の動作は、概ね抽出装置１００と同様であってよい。

　このように、抽出装置３００は、抽出部３５５を有している。このような構成によると、抽出装置３００は、要望モデルを用いて対象語を抽出することが出来る。これにより、抽出装置３００は、「要望」という関係性を定義する関係性語の要因を示す単語である対象語を抽出、出力することが出来る。

　なお、抽出装置３００は、抽出装置１００や抽出装置２００と同様の変形例を採用してよい。また、抽出装置３００は、例えば、抽出装置２００と組み合わされてもよい。

［第４の実施形態］
　次に、本開示の第４の実施形態について、図１４から図１６までを参照して説明する。図１４は、抽出装置４００のハードウェア構成例を示す図である。図１５は、抽出装置４００の構成例を示すブロック図である。図１６は、要望抽出装置５００の構成例を示すブロック図である。

　本開示の第４の実施形態においては、抽出装置４００の構成例について説明する。図１４は、抽出装置４００のハードウェア構成例を示している。図１４を参照すると、抽出装置４００は、一例として、以下のようなハードウェア構成を有している。
　・ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）４０１（演算装置）
　・ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）４０２（記憶装置）
　・ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）４０３（記憶装置）
　・ＲＡＭ４０３にロードされるプログラム群４０４
　・プログラム群４０４を格納する記憶装置４０５
　・情報処理装置外部の記録媒体４１０の読み書きを行うドライブ装置４０６
　・情報処理装置外部の通信ネットワーク４１１と接続する通信インタフェース４０７
　・データの入出力を行う入出力インタフェース４０８
　・各構成要素を接続するバス４０９

　また、抽出装置４００は、プログラム群４０４をＣＰＵ４０１が取得して当該ＣＰＵ４０１が実行することで、図１５に示す取得部４２１、抽出部４２２、出力部４２３としての機能を実現することが出来る。なお、プログラム群４０４は、例えば、予め記憶装置４０５やＲＯＭ４０２に格納されており、必要に応じてＣＰＵ４０１がＲＡＭ４０３などにロードして実行する。また、プログラム群４０４は、通信ネットワーク４１１を介してＣＰＵ４０１に供給されてもよいし、予め記録媒体４１０に格納されており、ドライブ装置４０６が該プログラムを読み出してＣＰＵ４０１に供給してもよい。

　なお、図１５は、抽出装置４００のハードウェア構成例を示している。抽出装置４００のハードウェア構成は上述した場合に限定されない。例えば、抽出装置４００は、ドライブ装置４０６を有さないなど、上述した構成の一部から構成されてもよい。

　取得部４２１は、ユーザにより入力される第一の自然文を取得する。

　抽出部４２２は、取得部４２１により取得される第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出する。例えば、抽出部４２２は、第二の自然文を入力として、第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出する。

　例えば、単語間で「ポジティブ」という関係性を定義する場合、「良かった」、「嬉しい」などのポジティブな感情を示す単語が関係性語となる。また、例えば、単語間で「ネガティブ」という関係性を定義する場合、「つまらなかった」、「まずい」などのネガティブな感情を示す単語が関係性語となる。

　出力部４２３は、抽出部４２２が抽出した対象語を出力する。例えば、出力部４２３は、抽出部４２２が抽出した対象語に応じた情報を、外部装置に送信したり画面表示部に表示させたりすることが出来る。

　このように、抽出装置４００は、抽出部４２２を有している。このような構成によると、抽出装置４００は、自然文に対して関係性語と対象語のうちの少なくとも対象語を抽出することが出来る。その結果、抽出装置４００は、関係性語の要因を示す単語である対象語を抽出、出力することが出来る。

　なお、上述した抽出装置４００は、当該抽出装置４００などの情報処理装置に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、抽出装置４００などの情報処理装置に、ユーザにより入力される第一の自然文を取得し、第二の自然文を入力として、第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出し、抽出した対象語を出力する、処理を実現するためのプログラムである。

　また、上述した抽出装置４００などの情報処理装置により実行される抽出方法は、抽出装置４００などの情報処理装置が、ユーザにより入力される第一の自然文を取得し、第二の自然文を入力として、第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出し、抽出した対象語を出力する、という方法である。

　上述した構成を有する、プログラム、又は、プログラムを記録したコンピュータが読み取り可能な記録媒体、又は、抽出方法、の発明であっても、上述した抽出装置４００と同様の作用・効果を有するために、上述した本発明の目的を達成することが出来る。

　また、図１６は、抽出装置４００の一例である要望抽出装置５００を示している。要望抽出装置５００のハードウェア構成は、抽出装置４００と同様であってよい。要望抽出装置５００は、プログラム群４０４をＣＰＵ４０１が取得して当該ＣＰＵ４０１が実行することで、図１６に示す取得部５２１、要望抽出部５２２、出力部５２３としての機能を実現することが出来る。

　取得部５２１は、ユーザにより入力される第一の自然文を取得する。

　要望抽出部５２２は、第二の自然文を入力として第二の自然文に含まれるユーザの要望を示す単語である関係性語と関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得部により取得される第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出する。

　出力部５２３は、要望抽出部５２２が抽出した対象語を出力する。

　このように、要望抽出装置５００は要望抽出部５２２を有している。このような構成によると、要望抽出部５２２は、自然文に対してユーザからの要望という関係性を定義する関係性語と対象語のうちの少なくとも対象語を抽出することが出来る。その結果、口コミなどの自然文の中からユーザの要望を的確に抽出することが出来る。

　なお、上述した要望抽出装置５００は、当該要望抽出装置５００などの情報処理装置に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、要望抽出装置５００などの情報処理装置に、ユーザにより入力される第一の自然文を取得し、第二の自然文を入力として第二の自然文に含まれるユーザの要望を示す単語である関係性語と関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出し、抽出した対象語を出力する、処理を実現するためのプログラムである。

　また、上述した要望抽出装置５００などの情報処理装置により実行される要望抽出方法は、要望抽出装置５００などの情報処理装置が、ユーザにより入力される第一の自然文を取得し、第二の自然文を入力として第二の自然文に含まれるユーザの要望を示す単語である関係性語と関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した第一の自然文から、関係性語と対象語のうちの少なくとも対象語を抽出し、抽出した対象語を出力する、という方法である。

　上述した構成を有する、プログラム、又は、プログラムを記録したコンピュータが読み取り可能な記録媒体、又は、要望抽出方法、の発明であっても、上述した要望抽出装置５００と同様の作用・効果を有するために、上述した本発明の目的を達成することが出来る。

　＜付記＞
　上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における抽出装置、要望抽出装置などの概略を説明する。但し、本発明は、以下の構成に限定されない。

（付記１）
　ユーザにより入力される第一の自然文を取得する取得部と、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、前記取得部により取得される前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出する抽出部と、
　前記抽出部が抽出した前記対象語を出力する出力部と、
　を有する
　抽出装置。
（付記２）
　付記１に記載の抽出装置であって、
　前記抽出部は、前記関係性語が定義する関係性ごとに学習された複数のモデルを用いて、それぞれの関係性に対応する前記関係性語と前記対象語のペアのうちの少なくとも前記対象語を抽出する
　抽出装置。
（付記３）
　付記１または付記２に記載の抽出装置であって、
　前記抽出部は、ポジティブな感情を示す前記関係性語と前記対象語のペアを抽出するポジティブモデルを用いて、前記取得部により取得される前記第一の自然文から、ポジティブな感情を示す関係性語と対象語のうちの少なくとも前記対象語を抽出する
　抽出装置。
（付記４）
　付記１から付記３までのうちのいずれか１項に記載の抽出装置であって、
　前記抽出部は、ネガティブな感情を示す前記関係性語と前記対象語のペアを抽出するネガティブモデルを用いて、前記取得部により取得される前記第一の自然文から、ネガティブな感情を示す関係性語と対象語のうちの少なくとも前記対象語を抽出する
　抽出装置。
（付記５）
　付記１から付記４までのうちのいずれか１項に記載の抽出装置であって、
　構文解析後の前記第二の自然文に対して、前記関係性語と前記対象語とをラベル付けした結果を用いて、自然文に対して前記関係性語と前記対象語を抽出して出力するようにモデルを学習する学習部を有し、
　前記抽出部は、前記学習部が学習したモデルを用いて、前記関係性語と前記対象語のうちの少なくとも前記対象語を抽出する
　抽出装置。
（付記６）
　付記５に記載の抽出装置であって、
　前記学習部は、ラベル付けをした結果と、予め記憶する単語の特徴量と、を用いてモデルを学習する
　抽出装置。
（付記７）
　付記１から付記６までのうちのいずれか１項に記載の抽出装置であって、
　前記抽出部が抽出した前記対象語に対して、前記関係性語が定義するユーザからの要望という関係性の要因を可視化するための前処理を行う前処理部を有し、
　前記出力部は、前記前処理部により前処理された結果を出力する
　抽出装置。
（付記８）
　付記７に記載の抽出装置であって、
　前記前処理部は、前記抽出部が抽出した前記対象語に対して、前記前処理としてクラスタリングを行い、　前記出力部は、前記前処理部によりクラスタリングされた結果を出力する
　抽出装置。
（付記９）
　情報処理装置が、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　抽出方法。
（付記１０）
　情報処理装置に、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
（付記１１）
　ユーザにより入力される第一の自然文を取得する取得部と、
　第二の自然文を入力として前記第二の自然文に含まれるユーザの要望を示す単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、前記取得部により取得される前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出する要望抽出部と、
　前記要望抽出部が抽出した前記対象語を出力する出力部と、
　を有する
　要望抽出装置。
（付記１２）
　付記１１に記載の要望抽出装置であって、
　前記要望抽出部が抽出した前記対象語に対して、前記関係性語が定義するユーザからの要望という関係性の要因を可視化するための前処理を行う前処理部を有し、
　前記出力部は、前記前処理部により前処理された結果を出力する
　要望抽出装置。
（付記１３）
　付記１２に記載の要望抽出装置であって、
　前記前処理部は、前記要望抽出部が抽出した前記対象語に対して、前記前処理としてクラスタリングを行い、
　前記出力部は、前記前処理部がクラスタリングを行った結果を出力する
　要望抽出装置。
（付記１４）
　付記１２または付記１３に記載の要望抽出装置であって、
　前記前処理部は、前記要望抽出部が抽出した前記対象語に対して、前記前処理として抽出した前記対象語の出現頻度を集計してグラフ化し、
　前記出力部は、前記前処理部がグラフ化した結果を出力する
　要望抽出装置。
（付記１５）
　付記１１から付記１４までのうちのいずれか１項に記載の要望抽出装置であって、
　構文解析後の前記第二の自然文に対して、ユーザの要望を示す単語である前記関係性語と前記関係性語の対象となる単語である前記対象語とをラベル付けした結果を用いて、自然文に対して前記関係性語と前記対象語を抽出して出力するようにモデルを学習する要望学習部を有し、
　前記要望抽出部は、前記要望学習部が学習したモデルを用いて、前記関係性語と前記対象語のうちの少なくとも前記対象語を抽出する
　要望抽出装置。
（付記１６）
　付記１５に記載の要望抽出装置であって、
　前記要望学習部は、ラベル付けをした結果と、予め記憶する単語の特徴量と、を用いてモデルを学習する
　要望抽出装置。
（付記１７）
　情報処理装置が、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として前記第二の自然文に含まれるユーザの要望を示す単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　要望抽出方法。
（付記１８）
　付記１７に記載の要望抽出方法であって、
　抽出した前記対象語に対して、前記関係性語が定義するユーザからの要望という関係性の要因を可視化するための前処理を行い、
　前処理された結果を出力する
　要望抽出方法。
（付記１９）
　情報処理装置に、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として前記第二の自然文に含まれるユーザの要望を示す単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
（付記２０）
　付記１９に記載の記録媒体であって、
　抽出した前記対象語に対して、前記関係性語が定義するユーザからの要望という関係性の要因を可視化するための前処理を行い、
　前処理された結果を出力する
　プログラムを記録した、コンピュータが読み取り可能な記録媒体。

　以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることが出来る。

１００　抽出装置
１１０　操作入力部
１２０　画面表示部
１３０　通信Ｉ／Ｆ部
１４０　記憶部
１４１　自然文情報
１４２　解析結果情報
１４３　ラベル情報
１４４　学習済みモデル
１４５　プログラム
１４６　単語特徴量ＤＢ
１５０　演算処理部
１５１　自然文入力受付部
１５２　構文解析部
１５３　ラベル付け受付部
１５４　関係性学習部
１５５　抽出部
１５６　前処理部
１５７　出力部
２００　抽出装置
２４０　記憶部
２４３　ラベル情報
２４４　ポジティブモデル情報
２４５　ネガティブモデル情報
２４６　プログラム
２５０　演算処理部
２５３　ラベル付け受付部
２５４　ポジ・ネガ関係性学習部
２５５　抽出部
２５６　前処理部
２５７　出力部
３００　抽出装置
３４０　記憶部
３４３　ラベル情報
３４４　要望モデル情報
３４５　プログラム
３５０　演算処理部
３５３　ラベル付け受付部
３５４　要望関係性学習部
３５５　抽出部
３５６　前処理部
３５７　出力部
４００　抽出装置
４０１　ＣＰＵ
４０２　ＲＯＭ
４０３　ＲＡＭ
４０４　プログラム群
４０５　記憶装置
４０６　ドライブ装置
４０７　通信インタフェース
４０８　入出力インタフェース
４０９　バス
４１０　記録媒体
４１１　通信ネットワーク
４２１　取得部
４２２　抽出部
４２３　出力部
５００　要望抽出装置
５２１　取得部
５２２　要望抽出部
５２３　出力部

Claims

　ユーザにより入力される第一の自然文を取得する取得部と、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、前記取得部により取得される前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出する抽出部と、
　前記抽出部が抽出した前記対象語を出力する出力部と、
　を有する
　抽出装置。
　請求項１に記載の抽出装置であって、
　前記抽出部は、前記関係性語が定義する関係性ごとに学習された複数のモデルを用いて、それぞれの関係性に対応する前記関係性語と前記対象語のペアのうちの少なくとも前記対象語を抽出する
　抽出装置。
　請求項１または請求項２に記載の抽出装置であって、
　前記抽出部は、ポジティブな感情を示す前記関係性語と前記対象語のペアを抽出するポジティブモデルを用いて、前記取得部により取得される前記第一の自然文から、ポジティブな感情を示す関係性語と対象語のうちの少なくとも前記対象語を抽出する
　抽出装置。
　請求項１から請求項３までのうちのいずれか１項に記載の抽出装置であって、
　前記抽出部は、ネガティブな感情を示す前記関係性語と前記対象語のペアを抽出するネガティブモデルを用いて、前記取得部により取得される前記第一の自然文から、ネガティブな感情を示す関係性語と対象語のうちの少なくとも前記対象語を抽出する
　抽出装置。
　請求項１から請求項４までのうちのいずれか１項に記載の抽出装置であって、
　構文解析後の前記第二の自然文に対して、前記関係性語と前記対象語とをラベル付けした結果を用いて、自然文に対して前記関係性語と前記対象語を抽出して出力するようにモデルを学習する学習部を有し、
　前記抽出部は、前記学習部が学習したモデルを用いて、前記関係性語と前記対象語のうちの少なくとも前記対象語を抽出する
　抽出装置。
　請求項５に記載の抽出装置であって、
　前記学習部は、ラベル付けをした結果と、予め記憶する単語の特徴量と、を用いてモデルを学習する
　抽出装置。
　請求項１から請求項６までのうちのいずれか１項に記載の抽出装置であって、
　前記抽出部が抽出した前記対象語に対して、前記関係性語が定義するユーザからの要望という関係性の要因を可視化するための前処理を行う前処理部を有し、
　前記出力部は、前記前処理部により前処理された結果を出力する
　抽出装置。
　請求項７に記載の抽出装置であって、
　前記前処理部は、前記抽出部が抽出した前記対象語に対して、前記前処理としてクラスタリングを行い、　前記出力部は、前記前処理部によりクラスタリングされた結果を出力する
　抽出装置。
　情報処理装置が、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　抽出方法。
　情報処理装置に、
　ユーザにより入力される第一の自然文を取得し、
　第二の自然文を入力として、前記第二の自然文に含まれる単語間の関係性を定義する単語である関係性語と前記関係性語の対象となる単語である対象語とを出力するよう学習されたモデルを用いて、取得した前記第一の自然文から、関係性語と対象語のうちの少なくとも前記対象語を抽出し、
　抽出した前記対象語を出力する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。