JP5782487B2 - 行動目的抽出方法及び装置 - Google Patents

行動目的抽出方法及び装置 Download PDF

Info

Publication number
JP5782487B2
JP5782487B2 JP2013163980A JP2013163980A JP5782487B2 JP 5782487 B2 JP5782487 B2 JP 5782487B2 JP 2013163980 A JP2013163980 A JP 2013163980A JP 2013163980 A JP2013163980 A JP 2013163980A JP 5782487 B2 JP5782487 B2 JP 5782487B2
Authority
JP
Japan
Prior art keywords
action
behavioral
class
behavior
action purpose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013163980A
Other languages
English (en)
Other versions
JP2015032287A (ja
Inventor
法子 横山
法子 横山
要 船越
船越  要
佐藤 隆
隆 佐藤
鷲崎 誠司
誠司 鷲崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013163980A priority Critical patent/JP5782487B2/ja
Publication of JP2015032287A publication Critical patent/JP2015032287A/ja
Application granted granted Critical
Publication of JP5782487B2 publication Critical patent/JP5782487B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、行動目的抽出方法及び装置に係り、特に、個人が経験を綴った文書や目的-手段の関係が記述された文書から短期的・長期的取り組みを要する様々な行動目的を抽出するための行動目的抽出方法及び装置に関する。
本発明では、「行動」とは、動作を伴う行動(例:散歩する)、状態(例:充実した人生を送る)、または心理的活動(例:達成感を得る)とし、行動目的とは、その行動で達成したい行動であると定義する。「行動目的」とは、ある行動を起点として存在する相対的なものであるとする。
インターネット上には様々な情報提供サービスがあり、ユーザは、外食や遊びなど、行動の参考になる情報を得ることができる。しかし、多くは「外食」といった特定の行動ごとに情報がまとめられていることが多く、特定の行動が決まっておらず漠然と暇つぶしがしたいと思った時などに、自分の行動目的にあった情報を得ることは難しい。こういった具体的行動が決まっていない曖昧な要求に応える情報提供のためには、「気分転換がしたい」「達成感が得られることがしたい」「ダイエットがしたい」など、要求の背景にある多様な行動目的を明らかにし、その行動目的にあった情報を抽出する技術が必要である。
行動目的に合った情報は、例えば、「ダイエット」についての情報を集めたまとめサイトなどから得ることも可能であるが、人手でまとめた情報を作成するには多くの手間を要する、網羅性がない、リアルタイム性がないなどの問題がある。
そこで、こういった問題を解決し、曖昧な行動目的に合った情報提供を行うためには、行動目的と、行動目的に合った情報を自動で収集する技術が必要となる。
そのため、文書からある行動の行動目的を抽出する方法として、大きく二つのアプローチが考えられる。
一つは、行動目的辞書を作成する方法である。辞書を用いた従来技術として、人々が経験を綴った文書から、目的情報を抽出する技術がある(例えば、非特許文献1参照)。当該技術は、例えば、旅行に行く理由を旅行口コミサイトの口コミテキストから抽出し、理由と行動をデータベース化することで、目的に合った旅行先を推薦することを目指している。
もう一つは、構文パターンや接続助詞等の関係を用いる方法である。例えば、「〜ため」「〜を理由に」等の手掛かり表現と、構文パターンを用いて因果関係を抽出する技術がある(例えば、非特許文献2参照)。
また、個人が経験を記述した文書から経験情報を抽出する技術として、ブログから状況(時間,空間)・行動(動作,対象)・主観(評価,感情)からなる経験情報を抽出する技術がある(例えば、非特許文献3参照)。
若木裕美,有賀康顕,中田康太,藤井寛子,住田一男,鈴木優,"口コミ情報からの目的情報抽出",FIT2011(第10回情報科学技術フォーラム). 坂地泰紀,竹内康介,関根聡,増山繁,"構文パターンを用いた因果関係抽出",言語処理学会年次大会発表論文集,No. 14, pp. 1144-1147, 2008. 倉島健,藤村考,奥田英範,"大規模テキストからの経験マイニング",電子情報通信学会論文誌,Vol. J92-D, No.3, pp. 301-310, 2009.
上記の非特許文献1は、人々の実際の経験情報をもとに、行動を行う目的とそれに向けた行動を抽出し、提供しようという試みである。当該手法は、様々な目的を自動的に抽出する技術であるが、行動が「旅行」に限定されたものであり、「旅行」に限らず様々な行動に関係する行動目的を抽出するためには、より多くの行動に関係する行動目的を整理し、抽出方法を検討する必要がある。また、考慮される行動目的が短期的に達成可能なものに限られているということも挙げられる。例えば、「ダイエットがしたい」、「料理が上手になりたい」など、長期的な取り組みを要する行動目的については考慮されていない。
また、非特許文献2を利用して、関係表現から行動に対する行動目的を抽出することが考えられる。しかし、この方法では、行動目的と行動の因果関係が記述された行動目的−行動しか抽出できない。
また、非特許文献3は、様々な行動を対象に経験情報を抽出するものである。行動目的は、主観(評価、感情)の一部として抽出できる可能性はあるが、行動目的のみを抽出できるものではない。
本発明は、上記の点に鑑みなされたもので、その人が経験を記述した文書や目的−手段関係が記載された文書から、短期的に達成可能な行動目的や特定の行動に関係した行動目的に加え、長期的な取り組みを要する行動目的や複数の行動を取り得る行動目的を抽出することが可能な行動目的抽出方法及び装置を提供することを目的とする。
一態様によれば、個人が経験を綴った文書または目的と手段の関係が記載された文書から行動目的を抽出する行動目的抽出装置であって、
個人の経験を綴った文書を格納した経験文書記憶手段と、
行動の結果、得たい、または、達成したいものである行動目的を分類した行動目的クラスの階層構造またはネットワーク構造を格納した行動目的オントロジ記憶手段と、
行動、行動目的クラス、行動目的詳細文を格納した行動目的記憶手段と、
与えられた行動群のある行動を示す用語に基づいて前記経験文書記憶手段を検索し、該行動を示す用語に対応する経験が記述された文書群を検索する検索手段と、
前記文書群の中から、行動と因果関係のある行動目的を抽出する行動目的抽出手段と、
前記行動目的が、前記行動目的オントロジ記憶手段の階層構造またはネットワーク構造の行動目的クラスに分類されるかを判断し、いずれの行動目的クラスにも分類されない場合には、新たな行動目的クラスを生成して前記行動目的オントロジ記憶手段に追加する行動目的分類手段と、
前記行動目的分類手段において、いずれかの行動目的クラスに分類された場合、または、新たな行動目的クラスが生成された場合には、前記行動目的記憶手段の前記行動目的詳細文から、該行動目的クラスに対応する特徴的な単語(以下、「特徴語」と記す)を抽出し、該行動目的クラスと該特徴語を行動目的辞書に格納する特徴語抽出手段と、
前記行動目的辞書を参照して、入力された個人のある行動に関する経験が含まれるテキストに特徴語が含まれているかを判断し、含まれている場合には、該特徴語を含む文を行動目的詳細文として抽出し、該特徴語が属する行動目的クラスを該行動目的辞書から抽出し、該行動目的クラスと該行動目的詳細文を出力する行動目的抽出手段と、を有する行動目的抽出装置が提供される。
一態様によれば、短期的に達成可能な行動目的や特定の行動に関係した行動目的だけではなく、例えば、「気分転換したい」、「ダイエットがしたい」といった、長期的な取り組みを要する行動目的や複数の行動を取り得る行動目的等の対象とする範囲を拡げ、行動目的を体系化したことにより、個人が行動を行った経験を綴った文書から自動で抽出することができる。
さらに、行動目的オントロジの最上位に『充実した人生を送る』というような広範な行動目的を設定することで、目的−手段関係に着目した行動目的オントロジを構築したことにより、行動目的の網羅性の向上、暗黙情報の明示化が期待できる。
また、生成された行動目的辞書を使うことにより、テキストに「〜のため」といった接続助詞等の関係表現が記述されていない場合でも、行動目的を抽出できる。
また、テキストに直接的に書かれた行動目的を抽出するため、その人が行動のモチベーションにしている強い行動目的を抽出できることが期待できる。
本発明の一実施の形態における行動目的抽出装置の構成例である。 本発明の一実施の形態におけるオントロジの構成例である。 本発明の一実施の形態における行動目的クラスの初期モデルの例である。 本発明の一実施の形態における行動目的DBの例である。 本発明の一実施の形態における行動目的辞書の例である。 本発明の一実施の形態における行動目的辞書作成部の処理のフローチャートである。 本発明の一実施の形態における行動目的抽出部の各文書から行動目的を抽出する例である。 本発明の一実施の形態における行動目的抽出部の上位の行動目的を抽出する例である。 本発明の一実施の形態におけるオントロジの作成を示す図である。 本発明の一実施の形態における行動目的オントロジの初期モデルの作成例(その1)である。 本発明の一実施の形態における行動目的オントロジの初期モデルの作成例(その2)である。 本発明の一実施の形態における行動目的オントロジの初期モデルの作成例(その3)である。 本発明の一実施の形態における新規行動目的を行動目的オントロジの行動目的クラスに分類可能な例である。 本発明の一実施の形態における行動目的オントロジに新たな行動目的クラスを追加する例である。 本発明の一実施の形態における新規行動目的を行動目的オントロジの行動目的クラスに分類する例である。 本発明の一実施の形態における行動目的抽出部の処理のフローチャートである。 本発明の一実施の形態における行動目的辞書作成部で作成された行動目的辞書の例である。 本発明の一実施の形態における行動目的抽出部の入力・出力例である。
以下、図面と共に本発明の実施の形態を説明する。
本発明において、『行動』とは、動作を伴う行動(散歩する)、状態(充実した人生を送る)、または、心理的活動(達成感を得る)とし、『行動目的』とは、その行動で達成したい行動であると定義する。『行動目的』とは、ある行動を起点として存在する相対的なものであるとする。つまり、その行動の結果、得たいものや達成したいことを指す。
本発明では、従来、抽出対象であった特定の行動(例えば「外食」など)に関する目的や、短期的に達成可能な目的の抽出に加え、散歩や買物、旅行など複数の行動を取り得る目的や、ダイエットや英会話など長期的な取り組みを要する様々な目的を個人が経験を綴った文書から抽出する。
図1は、本発明の一実施の形態における行動目的抽出装置の構成例である。
同図に示す行動目的抽出装置10は、行動目的辞書作成部100、目的抽出部200を有する。
行動目的辞書作成部100は、検索部110、行動目的抽出部120、行動目的分類部130、特徴語抽出部160、Web文書記憶部101、行動目的オントロジ記憶部102、行動目的DB103、行動目的辞書104を有する。
目的抽出部200は、行動目的抽出部210を有する。
Web文書記憶部101には、ブログ等の個人が経験を綴ったテキストが格納されている。なお、ブログに限らず、情報サイトの口コミ情報やTwitter(登録商標)、また、Web上にあげられた情報に限らず、アンケート等により集められた感想や、マニュアルや仕様書などの目的と手段の関係を有する文書など、様々な文書が適用可能である。なお、本明細書中では、Webから取得したブログ等の個人の経験が記載されたテキストを一例として説明する。
行動目的オントロジ記憶部102は、図2に示すような目的−手段関係に着目して生成された行動目的の階層構造またはネットワーク構造を記憶するものである。行動目的は様々な抽象度があり、運動したいと思ってサイクリングをする人もいれば、健康維持をするために、「運動」の一つとしてサイクリングをしたいと考える人もいる。「健康維持」と「運動」は、目的−手段関係になっているように、様々な行動目的同士は、互いに目的−手段関係になっていると考えられる。そこで、行動目的同士を、目的−手段関係に着目して図2に示すように階層構造またはネットワーク構造で表す。行動目的分類部130が、同図に示すように、様々な行動目的同士をつなぐことにより構築された階層構造またはネットワーク構造を格納する。その際に、直接行動目的A,B同士をつなぐだけでなく、ある行動目的Cを介してA→C、C→Bといった目的-手段関係が成り立つのであれば、行動目的Cを追加してもよい。このように、行動目的を追加することによって、暗黙の情報の顕在化を行い、行動目的の拡張を行うことも可能である。また、階層構造であれば最上位にくるような、抽象的な行動目的クラスとその他の行動目的クラスとの関係を考えることで、階層構造を考えやすくする。
また、行動目的分類部130が、類似語辞書(非特許文献4:NTTコミュニケーション科学基礎研究所、"日本語語彙体系",岩波書店,1999.)等に基づいて、類似の行動目的をまとめ、作成された行動目的クラスを格納する。例えば、図3に示すように、最上位の行動目的に「充実した人生を送る」という人生の大目的を置き、また、他の行動目的として、世論調査で使われていた生涯学習を行う理由を取得して初期モデルを生成することも可能である。
行動目的DB103は、テキスト文書に書かれた、行動、行動目的クラス、行動目的詳細文が行動目的分類部130によって、図4に示すように格納される。
行動目的辞書104は、目的抽出部200によって参照される特徴語を格納する辞書であり、特徴語抽出部160により行動目的クラスとその行動目的クラスに特徴的な単語を図5に示すように格納される。
以下、図1に各処理部について説明する。
<行動目的辞書作成部100>
検索部110は、入力された行動群の中のある行動に関して、Web文書記憶部101を検索し、実際にその行動を行った経験が記述された文書群を取得する。なお、行動群から「行動」を抽出する際には、形態素解析を行い、テンプレートや辞書等を参照して行動を表す意味を持つ用語を抽出する等の方法を用いるものとする。
行動目的抽出部120は、検索部110が取得した文書群の中から行動の目的となっている語を抽出する。「○○のために××をした」といった接続助詞や接続詞などで表現される因果関係を用いて行動の目的となる語を抽出する等の方法を用いるものとする。
行動目的分類部130は、行動目的を階層構造またはネットワーク構造に整理する処理を行う。このとき、類似する行動目的はまとめて行動目的クラスを作り、目的−手段の関係に階層化(ネットワーク化)する。行動目的抽出部120から行動目的を取得し、当該行動目的が、行動オントロジ記憶部140の行動目的クラスに分類されるかを判断する。いずれの行動目的クラスにも属さない場合には、行動オントロジ記憶部140に新たな行動目的クラスを追加する。当該行動目的分類部130の詳細な処理は図6で後述する。
特徴語抽出部160は、行動目的DB103に記録された行動目的クラスを基に、各行動目的に特徴的な単語(または文)を行動目的詳細文から抽出する。
目的抽出部200の行動目的抽出部210は、入力された個人が行動に関する経験を綴ったテキストに対して、行動目的辞書104の行動目的クラスと特徴語を参照し、行動目的詳細文を抽出し、行動目的データ(行動目的クラスと行動目的詳細文)を出力する。
次に、上記の構成における処理の流れを説明する。
最初に事前処理である行動目的辞書作成部100の処理について説明する。
図6は、本発明の一実施の形態における行動目的辞書作成部の処理のフローチャートである。
ステップ610) 検索部110が外部から入力された行動目的を抽出する行動群を受け付ける。ここで、行動としては、例えば、『サイクリングをする』や『料理を作る』など、趣味や遊び、日常生活活動、仕事に関わるあらゆる行動を対象とする。
ステップ620) 検索部110は、取得した行動群から、まだ選択されていないある一つの行動を選択する。新たに選択する行動がなくなった場合はステップ680以降の処理に移行する。
ステップ630) 検索部110は、Web文書記憶部101のWeb文書に対して文脈判断を行い、選択した行動を実際に行った経験が書かれた文書群を取得する。実際に行動を行ったかどうかの判断方法としては、例えば『サイクリングをする』という行動であれば、「サイクリングをした」、「サイクリングに行った」等の表現を抜き出すこと等が考えられる。
ステップ640) 行動目的抽出部120は、検索部110からある行動を行った経験が書かれた文書群を取得し、当該文書群から、その行動を行った行動目的を抽出する。行動とは、動作を伴う行動(例:散歩する)、状態(例:充実した人生を送る)、または心理的活動(例:達成感を得る)とし、行動目的とは、その行動で達成したい行動であると定義する。行動目的とは、ある行動を起点として存在する相対的なものであるとする。例えば、図7の例において、『ダイエットのためにサイクリングをする』のであれば、「サイクリング」が行動、「ダイエット」が行動目的となる。『○○のために××をした』といった接続助詞、接続詞なども参考にしながら、行動を行うことで達成したい行動目的を抽出する。
このような行動目的は、ユーザインタフェースを介してユーザが抽出し、ファイル等の記憶手段に格納しておき、当該記憶手段から読み込む、または、既存の因果関係抽出技術(非特許文献2参照)等をもとに、機械的に抽出してもよい。
さらに、図8に示すように、抽出した行動目的を行動として、さらに上位の行動目的を抽出してもよい。
ステップ650) 行動目的分類部130は、行動目的抽出部120が抽出した行動目的が行動目的オントロジ記憶部102のいずれかの行動目的クラスに含まれるか確認する。行動目的クラスへの分類は、ユーザインタフェースを介してユーザからの入力を取得する。または、類語辞書(非特許文献4)等を用いて機械的に行ってもよい。行動目的オントロジ記憶部102の行動目的クラスに含まれる場合には、ステップ670に移行する。
ステップ660) 行動目的分類部130は、行動目的が行動目的オントロジ内のいずれの行動目的クラスでもないと判断された場合には、新たに行動目的クラスを作成し、目的−手段関係になるように、行動目的オントロジ記憶部102のネットワーク構造または階層構造に追加する。その際、行動目的間の間を補う新たな行動目的クラスの追加を行ってもよい。目的−手段関係の判断は、ユーザインタフェースを介してユーザに判断を促してもよいし、他の文書から因果関係抽出技術等をもとに、機械的に判断してもよい。
行動目的オントロジ記憶部102に行動目的オントロジが何もない一番初めの処理では、ある程度の行動目的クラスを集めて初期モデル(行動目的オントロジ)を構築してもよいし、1つずつネットワークのノード(行動目的クラス)を増やしていってもよい。行動目的オントロジを作成することによって、技術の応用サービスにおいて、ある行動目的Gの下位の行動A,Bを図9のaのように作成するだけでなく、上位の行動目的G'を経由して、関連する行動Cを図9のbのように作成することができる。このように、最上位にくるような、抽象的な行動目的クラスとその他の行動目的クラスとの関係を考えることで、階層構造(ネットワーク構造)を認識しやすくする。
具体的に図10〜図12を用いて説明する。
ステップ640で行動目的抽出部120によりアンケート項目やWebページなどから一般的な行動目的が抽出されると(図10の(1))、図11のパターン1に示すように、類似辞書(図示せず)を参照して、類語として分類された単語(行動目的)同士をまとめる手法や、図11のパターン2に示すように、連結している行動目的(「気分転換する」「気晴らしをする」)が類似していれば、同じクラスと判断して同じクラスにまとめる手法がある。なお、パターン2は、図9のbのように上位の行動目的が抽出された場合に適用可能である。
さらに、図12に示すように、文書から得られた様々な行動目的クラスをネットワーク化する。図12のパターン1に示すように、文書『健康維持のために、ダイエット始めました』から抽出された行動目的(「健康維持」)と手段(「ダイエット」)の組を目的−手段関係としてネットワークを構築する。また、図12のパターン2に示すように行動目的クラス間に新たに行動目的クラスを作成して補間することも可能である。補間する際は、ユーザインタフェースを介してユーザが生成した行動目的クラスを取得してもよいし、行動目的クラスA,Bに関して、ある行動目的Cを介してA→C、C→といった目的-手段関係が他の文書から抽出できれば、行動目的クラスCを補間してもよい。
このように、階層構造(ネットワーク構造)にまとめることにより、行動目的の網羅性の向上、暗黙情報の明示化が期待できる。
また、ステップ650で新規に生成された行動目的「運動する」が、図13に示すように行動目的オントロジ記憶部102の行動目的クラスに分類できない場合は、図14のAやBに行動目的オントロジの行動目的クラスを当てはめた文がWeb文書記憶部101に存在すれば、その行動目的クラスとネットワークを結ぶ。図14の例では、新たに生成された行動目的「運動する」が行動オントロジ記憶部140内の「健康を維持する」と「ジョギングをする」に接続される。
ステップ670) 行動目的分類部130は、行動目的の詳細が記述された一文(または複数文)を行動目的詳細文として入力された文書から抽出し、行動、行動目的クラス、行動目的詳細文の組を行動目的DB103に格納する。ここで、行動目的詳細文とは、例えば「○○して達成感が得られた。」等である。
図15の例に示すように、『ダイエットのために、サイクリングを始めました。…』というテキストがあった場合、「ダイエット」が行動目的として抽出され、「サイクリング」が当該行動目的に対応する行動として抽出された場合、当該行動目的−行動の組に、ステップ650で作成した行動目的クラスを与えて行動目的DB103に格納する。
ステップ680) 特徴語抽出部160は、行動目的DB103から行動目的クラス、行動目的詳細文を読み込む。
ステップ690) 特徴語抽出部160は、ステップ680で取得した行動目的クラスごとに、行動目的詳細文をまとめ、行動目的クラスごとに特徴的な単語(または文)を抽出し、出現頻度が高い単語(または文)を特徴語とする。例えば、「達成感を得たい」という行動目的クラスであれば、「達成感」などが特徴的な単語となり得る。特徴的な単語(または文)の算出に関しては、tf-idfなどの方法で抽出する。
ステップ695) 特徴語抽出部160は、判定した各行動目的クラスの特徴語(文)を行動目的辞書104に格納する。
なお、上記の行動目的辞書作成部100の処理においては、ステップ610で外部から行動群を受け付けているが、対象とする行動群を指定しない方法であってもよい。その場合、処理はステップ630から開始され、ステップ630において、Web文書から行動が抽出できる文書を取得すればよい。行動の抽出方法としては、例えば、特許文献1(特許第5197491号公報)の方法を用いて、動作動詞とその対象格、または、自動詞で表現される行動を、シソーラスや係り受け解析器などを用いて抽出すればよい。
また、抽出した行動目的クラスをステップ610の行動群として、行動目的辞書作成部100のステップ610〜695の処理を繰り返し、行動目的オントロジ記憶部102を拡張してもよい。
次に、目的抽出部200の処理について説明する。
図16は、本発明の一実施の形態における行動目的抽出部の処理のフローチャートである。
ステップ710) 目的抽出部200の行動目的抽出部210は、個人の経験を綴った文書(経験文書)を受け付ける。
ステップ720) 行動目的抽出部210は、行動目的辞書104を参照して、受け取った経験文書に行動目的が含まれているかを判定する。具体的には、行動目的辞書104に記憶された特徴語が、経験文書内に含まれているかを判断する。
ステップ730) 含まれていればステップ740に移行し、含まれていなければ当該処理を終了する。
ステップ740) 特徴語が経験文書内に含まれていれば、その特徴語が属する目的が記載されているものとし、当該特徴語を含む文を行動詳細文として抽出する。
ステップ750) 特徴語が属する行動目的クラスと特徴語が記載された行動詳細文を出力する。
具体的には、行動目的辞書作成部100において、「サイクリングをする」、「料理を作る」などの行動群を入力し、行動目的を抽出及び分類した結果、50種類の行動目的クラスからなる行動目的オントロジが作成され、行動目的DB103に基づいて、特徴語抽出部160で図17に示すような行動目的辞書104が作成されたものとする。当該行動目的辞書104に基づいて、例えば、行動目的抽出部210にサイクリングについて綴られた経験文書が入力されると、図18のように行動目的データ(行動目的クラス、行動目的詳細文)が出力される。
上記ように、行動目的抽出部210は、行動目的辞書104に行動目的ごとの特徴語を格納しているため、経験文書に「〜ため」といった接続助詞等の関係表現が記述されていない場合でも行動目的を抽出することが可能となる。
なお、上記の図1に示す行動目的抽出装置10の構成要素の動作をプログラムとして構築し、行動目的抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
10 行動目的抽出装置
100 行動目的辞書作成部
101 Web文書記憶部
102 行動目的オントロジ記憶部
103 行動目的DB
104 行動目的辞書
110 検索部
120 行動目的抽出部
130 行動目的分類部
160 特徴語抽出部
200 目的抽出部
210 行動目的抽出部

Claims (8)

  1. 個人が経験を綴った文書または目的と手段の関係が記載された文書から行動目的を抽出する行動目的抽出装置であって、
    個人の経験を綴った文書または目的と手段の関係が記載された文書を格納した経験文書記憶手段と、
    行動の結果、得たい、または、達成したいものである行動目的を分類した行動目的クラスの階層構造またはネットワーク構造を格納した行動目的オントロジ記憶手段と、
    行動、行動目的クラス、行動目的詳細文を格納した行動目的記憶手段と、
    与えられた行動群のある行動を示す用語に基づいて前記経験文書記憶手段を検索し、該行動を示す用語に対応する経験が記述された文書群を検索する検索手段と、
    前記文書群の中から、行動と因果関係のある行動目的を抽出する行動目的抽出手段と、
    前記行動目的が、前記行動目的オントロジ記憶手段の階層構造またはネットワーク構造の行動目的クラスに分類されるかを判断し、いずれの行動目的クラスにも分類されない場合には、新たな行動目的クラスを生成して前記行動目的オントロジ記憶手段に追加する行動目的分類手段と、
    前記行動目的分類手段において、いずれかの行動目的クラスに分類された場合、または、新たな行動目的クラスが生成された場合には、前記行動目的記憶手段の前記行動目的詳細文から、該行動目的クラスに対応する特徴的な単語(以下、「特徴語」と記す)を抽出し、該行動目的クラスと該特徴語を行動目的辞書に格納する特徴語抽出手段と、
    前記行動目的辞書を参照して、入力された個人のある行動に関する経験が含まれるテキストに特徴語が含まれているかを判断し、含まれている場合には、該特徴語を含む文を行動目的詳細文として抽出し、該特徴語が属する行動目的クラスを該行動目的辞書から抽出し、該行動目的クラスと該行動目的詳細文を出力する行動目的抽出手段と、
    を有することを特徴とする行動目的抽出装置。
  2. 前記行動目的分類手段は、
    前記行動目的同士を、目的と該目的を達成するための手段とする目的−手段関係とし、前記行動目的を複数の抽象度で表現した行動目的クラスを複数生成し、該行動目的クラスを階層構造化またはネットワーク構造化して前記行動目的オントロジ記憶手段に格納する手段を含む
    請求項1記載の行動目的抽出装置。
  3. 前記行動目的分類手段は、
    類語辞書を参照して類語として分類された単語を含む行動目的同士または、連結している行動目的が類似している行動目的同士を一つの行動目的クラスとして生成する手段を含む
    請求項2記載の行動目的抽出装置。
  4. 前記行動目的分類手段は、
    階層構造またはネットワーク構造の上位の行動目的クラスと下位の行動目的クラスの間に新たな行動目的クラスを生成して挿入する手段を含む
    請求項2記載の行動目的抽出装置。
  5. 個人が経験を綴った文書または目的と手段の関係が記載された文書から行動目的を抽出する行動目的抽出方法であって、
    個人の経験を綴った文書または目的と手段の関係が記載された文書を格納した経験文書記憶手段と、
    行動の結果、得たい、または、達成したいものである行動目的を分類した行動目的クラスの階層構造またはネットワーク構造を格納した行動目的オントロジ記憶手段と、
    行動、行動目的クラス、行動目的詳細文を格納した行動目的記憶手段と、
    検索手段と、行動目的抽出手段と、行動目的分類手段と、特徴語抽出手段と、行動目的抽出手段と、行動目的辞書と、を有する装置において、
    前記検索手段が、与えられた行動群のある行動を示す用語に基づいて前記経験文書記憶手段を検索し、該行動を示す用語に対応する経験が記述された文書群を検索する検索ステップと、
    前記行動目的抽出手段が、 前記文書群の中から、行動と因果関係のある行動目的を抽出する行動目的抽出ステップと、
    前記行動目的分類手段が、前記行動目的抽出ステップで抽出された前記行動目的が、前記行動目的オントロジ記憶手段の階層構造またはネットワーク構造の行動目的クラスに分類されるかを判断し、いずれの行動目的クラスにも分類されない場合には、新たな行動目的クラスを生成して前記行動目的オントロジ記憶手段に追加する行動目的分類ステップと、
    前記特徴語抽出手段が、前記行動目的分類ステップにおいて、いずれかの行動目的クラスに分類された場合、または、新たな行動目的クラスが生成された場合には、前記行動目的記憶手段の前記行動目的詳細文から、該行動目的クラスに対応する特徴的な単語(以下、「特徴語」と記す)を抽出し、該行動目的クラスと該特徴語を行動目的辞書に格納する特徴語抽出ステップと、
    前記行動目的抽出手段が、前記行動目的辞書を参照して、入力された個人のある行動に関する経験が含まれるテキストに特徴語が含まれているかを判断し、含まれている場合には、該特徴語を含む文を行動目的詳細文として抽出し、該特徴語が属する行動目的クラスを該行動目的辞書から抽出し、該行動目的クラスと該行動目的詳細文を出力する行動目的抽出ステップと、
    を行うことを特徴とする行動目的抽出方法。
  6. 前記行動目的分類ステップにおいて、
    前記行動目的同士を、目的と該目的を達成するための手段とする目的−手段関係とし、前記行動目的を複数の抽象度で表現した行動目的クラスを複数生成し、該行動目的クラスを階層構造化またはネットワーク構造化して前記行動目的オントロジ記憶手段に格納する
    請求項5記載の行動目的抽出方法。
  7. 前記行動目的分類ステップにおいて、
    類語辞書を参照して類語として分類された単語を含む行動目的同士または、連結している行動目的が類似している行動目的同士を一つの行動目的クラスとして生成する
    請求項6記載の行動目的抽出方法。
  8. 前記行動目的分類ステップにおいて、
    階層構造またはネットワーク構造の上位の行動目的クラスと下位の行動目的クラスの間に新たな行動目的クラスを生成して挿入する
    請求項6記載の行動目的抽出方法。
JP2013163980A 2013-08-07 2013-08-07 行動目的抽出方法及び装置 Expired - Fee Related JP5782487B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013163980A JP5782487B2 (ja) 2013-08-07 2013-08-07 行動目的抽出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013163980A JP5782487B2 (ja) 2013-08-07 2013-08-07 行動目的抽出方法及び装置

Publications (2)

Publication Number Publication Date
JP2015032287A JP2015032287A (ja) 2015-02-16
JP5782487B2 true JP5782487B2 (ja) 2015-09-24

Family

ID=52517511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013163980A Expired - Fee Related JP5782487B2 (ja) 2013-08-07 2013-08-07 行動目的抽出方法及び装置

Country Status (1)

Country Link
JP (1) JP5782487B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020224128A1 (zh) * 2019-05-08 2020-11-12 平安科技(深圳)有限公司 基于用户短期兴趣的新闻推荐方法及装置、电子设备及介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549636A (zh) * 2018-04-09 2018-09-18 北京信息科技大学 一种赛事文字直播关键句抽取方法
JP7305566B2 (ja) * 2020-01-21 2023-07-10 株式会社東芝 情報処理装置、情報処理システム、および情報処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020224128A1 (zh) * 2019-05-08 2020-11-12 平安科技(深圳)有限公司 基于用户短期兴趣的新闻推荐方法及装置、电子设备及介质

Also Published As

Publication number Publication date
JP2015032287A (ja) 2015-02-16

Similar Documents

Publication Publication Date Title
Laniado et al. Using WordNet to turn a Folksonomy into a Hierarchy of Concepts.
Teso et al. Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective
Jung et al. Automatic construction of a large-scale situation ontology by mining how-to instructions from the web
CN108563620A (zh) 文本自动写作方法和系统
KR20190015797A (ko) 인공지능(ai)을 통한 딥러닝훈련모듈과, 순위화프레임워크모듈을 활용하여, 법률전문가에게 최적화된 모범답안을 제시하는 한편, 법률정보를 의미 벡터로 변환하여, 데이터베이스에 저장하고, 이에 대한 문자열 사전모듈을 활용한 온라인 법률정보사전을 제공하는 시스템 및 그 방법
Shah et al. Sentimental Analysis Using Supervised Learning Algorithms
US20180102062A1 (en) Learning Map Methods and Systems
Alsaqer et al. Movie review summarization and sentiment analysis using rapidminer
Khan et al. Multi-objective model selection (MOMS)-based semi-supervised framework for sentiment analysis
CN105378717A (zh) 用于对社交媒体的用户分类的方法、计算机程序和计算机
Baowaly et al. Predicting the helpfulness of game reviews: A case study on the steam store
Schatten et al. An introduction to social semantic web mining & big data analytics for political attitudes and mentalities research
JP5782487B2 (ja) 行動目的抽出方法及び装置
Masood et al. Semantic analysis to identify students’ feedback
Sygkounas et al. A replication study of the top performing systems in semeval twitter sentiment analysis
Herng Leong et al. Classification of healthcare service reviews with sentiment analysis to refine user satisfaction
Connelly et al. Lack of consensus among sentiment analysis tools: A suitability study for SME firms
JP5697164B2 (ja) 対象文から直接的に導出できないカテゴリのタグを付与するタグ付けプログラム、装置、方法及びサーバ
Saft et al. Analysing full text content by means of a flexible co-citation analysis inspired text mining method–exploring 15 years of JASSS articles
Pokhrel et al. Web Data Scraping Technology using TF-IDF to Enhance the Big Data Quality on Sentiment Analysis
Phan et al. Tweet Integration by Finding the Shortest Paths on a Word Graph
Basu et al. An End-to-End Topic-Based Sentiment Analysis Framework from Twitter Using Feature Set Cumulation
Nandan et al. Sentiment Analysis of Twitter Classification by Applying Hybrid-Based Techniques
Hrešková et al. Haiku poetry generation using interactive evolution vs. poem models
Giannakis Sentiment analysis application with social media network integration

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150717

R150 Certificate of patent or registration of utility model

Ref document number: 5782487

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees