JP2016122263A - 情報処理装置、情報処理方法、プログラム - Google Patents

情報処理装置、情報処理方法、プログラム Download PDF

Info

Publication number
JP2016122263A
JP2016122263A JP2014260647A JP2014260647A JP2016122263A JP 2016122263 A JP2016122263 A JP 2016122263A JP 2014260647 A JP2014260647 A JP 2014260647A JP 2014260647 A JP2014260647 A JP 2014260647A JP 2016122263 A JP2016122263 A JP 2016122263A
Authority
JP
Japan
Prior art keywords
evaluation
text
expression
information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014260647A
Other languages
English (en)
Inventor
琢麻 蔵満
Takuma Kuramitsu
琢麻 蔵満
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2014260647A priority Critical patent/JP2016122263A/ja
Publication of JP2016122263A publication Critical patent/JP2016122263A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】SNSデータなど、記載されている内容の対象が不明確であるデータに対して、評価情報の検索実行時における処理時間を抑制しつつ、任意の評価対象に対する評価情報の検索をインタラクティブに行う。【解決手段】テキストに対して形態素解析を行うことで、テキストを形態素に分割し、分割された形態素のうち評価表現を抽出する。抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出し、抽出された複数の評価対象と、評価表現とを対応付けて一組の評価情報データとして登録する。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法、プログラムに関する。
SNS(Social Networking Service)データやアンケートデータなどから、ある対象に対する評価や意見を評価情報として抽出し、集約・可視化して提示する技術の研究開発が進んでいる。
ここで、評価情報の構成要素としては、評価の対象を表す評価対象、評価対象の性質や部分などを表す評価属性、評価を直接的に表す評価表現などがある。例えば、「製品□□はデザインがかっこいい」というテキストから評価情報を抽出する場合、評価対象は「製品□□」、評価属性は「デザイン」、評価表現は「かっこいい」となる。
評価表現の抽出方法としては、非特許文献1に記載されるように、評価表現に該当する形態素の辞書(評価表現辞書)をあらかじめ構築し、テキストから抽出するという手法がよく用いられる。
評価属性についても同様に、事前に評価対象に対する属性を表す形態素の辞書(評価属性辞書)を構築する手法が提案されている。
評価対象については、入力となるテキストデータが、アンケートや評価サイトなど、記載されている内容の対象が明確である場合には抽出処理自体が省略されることもある。しかし、SNSデータなど、記載されている内容の対象が不明なデータに対しては、評価表現に対する評価対象をテキスト中から抽出する処理が必要になる。
従来の研究では、特許文献1に記載されるように、ある評価表現に対応する評価対象は原則1つ(評価対象が並列の場合の除く)であることを前提とし、テキストに含まれる固有表現(人名、地名、組織名、人工物名など)のいずれか1つを評価対象として抽出する処理が行われる。
これら評価情報の抽出処理時間は、入力テキストのサイズに依存するため、入力となるテキストが少量である場合には、評価対象を定めた上でテキストに対する評価表現の抽出処理を実施することも容易である。
しかし、SNSデータなど日々増加するデータを対象とした場合、抽出処理に要する処理時間は膨大になるため、テキストに対する評価情報の抽出処理は事前に行えることが望ましい。
特許文献1には、抽出した評価表現において、テキスト上の(あるいは意味上の)位置関係が近い固有表現(人名、地名、組織名、人工物名など)を評価対象とすることで、任意のテキストから評価対象と評価表現を抽出する方法が示されている。
また、特許文献2では、評価表現のみをテキストから事前に全て抽出しておき、分析者が評価対象を決定した際(評価情報の検索実行時)において、評価対象と意味的に近い評価表現のみを選別することで、評価対象に関連した評判情報を検索する方法が示されている。
乾 孝司、他「テキストを対象とした評価情報の分析に関する研究動向」自然言語処理、言語処理学会、2006年7月、Vol.13、No.3、pp.201−241
特開2009−140048号公報 特開2008−234557号公報
特許文献1のシステムは、前述したように、1つの評価表現に対する評価対象は原則1つであることを前提とした手法であるが、任意の評価対象に対する評価情報を検索するという用途においては、テキストの情報のみから評価表現に対する評価対象を一意に定めておくことが必ずしも適切とは言えない。
例えば、「○○社の製品□□はレンズのデザインがかっこいい」というテキストは、「製品□□」のレンズについての評価であると同時に、「○○社」の製品についての評価でもある。評価情報を抽出する際に、評価表現「かっこいい」に対する評価対象を「製品□□」と一意に定めてしまうと、「○○社」についての評価情報が失われてしまい、評価情報の検索時において検索漏れが発生することになる。
一方、特許文献2のシステムは、評価情報のうち評価表現のみを事前に抽出する手法であるため、前述のような検索漏れは発生しない。しかし、評価情報の検索時において、評価対象を含む文書と評価表現を紐づける処理や、評価対象と評価対象が意味的に合致する表現か否かの選別処理を実行する必要があり、検索時間の短縮という面においては十分ではない。
そこで、本発明は、SNSデータなど、記載されている内容の対象が不明確であるデータに対して、評価情報の検索実行時における処理時間を抑制しつつ、任意の評価対象に対する評価情報の検索を行うことが可能なシステムを提供することを目的とする。
本発明の情報処理装置は、テキストに対して形態素解析を行うことで、当該テキストを形態素に分割する解析手段と、前記解析手段により分割された形態素うち評価表現を抽出する評価表現抽出手段と、前記評価表現抽出手段により抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出する評価対象抽出手段と、前記評価対象抽出手段により抽出された複数の評価対象と、前記評価表現とを対応付けて一組の評価情報データとして登録する登録手段と、
を備えることを特徴とする。
本発明の情報処理方法は、情報処理装置の解析手段が、テキストに対して形態素解析を行うことで、当該テキストを形態素に分割する解析工程と、前記情報処理装置の評価表現抽出手段が、前記解析工程により分割された形態素うち評価表現を抽出する評価表現抽出工程と、前記情報処理装置の評価対象抽出手段が、前記評価表現抽出工程により抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出する評価対象抽出工程と、前記情報処理装置の登録手段が、前記評価対象抽出工程により抽出された複数の評価対象と、前記評価表現とを対応付けて一組の評価情報データとして登録する登録工程と、を備えることを特徴とする。
本発明のプログラムは、情報処理装置において実行可能なプログラムであって、前記情報処理装置を、テキストに対して形態素解析を行うことで、当該テキストを形態素に分割する解析手段と、前記解析手段により分割された形態素うち評価表現を抽出する評価表現抽出手段と、前記評価表現抽出手段により抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出する評価対象抽出手段と、前記評価対象抽出手段により抽出された複数の評価対象と、前記評価表現とを対応付けて一組の評価情報データとして登録する登録手段として機能させることを特徴とする。
本発明によれば、SNSデータなど、記載されている内容の対象が不明確であるデータに対して、評価情報の検索実行時における処理時間を抑制しつつ、任意の評価対象に対する評価情報の検索を行うことが可能なシステムを提供することが可能となる。
本発明の実施形態における評価情報検索システムの構成を示す図である。 本発明の情報処理装置のハードウエア構成の一例を示す図である。 本発明の実施形態におけるテキストデータの一例を示す図である。 本発明の実施形態における評価情報データの一例を示す図である。 本発明の実施形態における評価表現辞書の一例を示す図である。 本発明の実施形態における評価情報抽出処理のフローチャートである。 本発明の実施形態における評価情報検索画面(初期画面)の一例である。 本発明の実施形態における評価情報検索画面(評価対象入力後)の一例である。 本発明の実施形態における評価情報検索画面(検索後)の一例である。 本発明の実施形態における評価情報検索処理のフローチャートである。
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は、本発明の実施形態における評価情報検索システムの構成を示す図である。評価情報検索システム100は、SNSデータなどから抽出したテキスト(外部のSNSサイト上の投稿文(テキスト)に対して、予め定められた検索条件により検索することで得られたSNS投稿文など)を保管するテキストデータ101と、テキストデータ101から抽出した評価情報を保管する評価情報データ102と、評価情報抽出処理に使用する評価表現辞書103と、評価情報の抽出処理を実行する評価情報抽出部110と、評価情報の検索処理を実行する評価情報検索部120とを備える。
評価情報抽出部110は、テキストデータ101に追加されたテキストを参照して評価情報を抽出し、評価情報データ102を更新する。評価情報抽出部110における評価情報の抽出処理については、後に例を用いて詳しく説明する。
評価情報検索部120は、評価情報データ102、および、テキストデータ101を参照し、評価属性の集約処理、評価表現の集約処理、評価情報の検索処理を実行する処理部で、入力データとして、各種リクエストを受け取ることができる。
評価情報検索システム100のユーザーは、ブラウザなどに表示される画面から、評価情報検索部120にリクエストを送信することができる。評価情報検索部120における各処理の詳細は、後に例を用いて詳しく説明する。
なお、本実施形態では、評価情報検索システムを1つの情報処理装置として説明するが、複数の情報処理装置が連携して評価情報検索システムを構成してもよい。
以下、図2を用いて、図1に示した評価情報検索システムに適用可能な情報処理装置のハードウエア構成の一例について説明する。
図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な各種プログラム等が記憶されている。
202はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
また、205は入力コントローラで、入力装置209等からの入力を制御する。206はビデオコントローラで、液晶ディスプレイ等のディスプレイ装置210への表示を制御する。なお、ディスプレイ装置は、液晶ディスプレイに限られず、CRTディスプレイなどであっても良い。これらは必要に応じてクライアントが使用するものである。
207はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶するハードディスク(HD)や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
208は通信I/Fコントローラで、ネットワーク(例えば、図1に示したLAN400)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
なお、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ装置210上での表示を可能としている。また、CPU201は、ディスプレイ装置210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
ハードウエア上で動作する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。
図3は、テキストデータ101の一例であり、テキストを一意に識別するテキストIDと、テキストを保持する。説明を簡潔にするため、テキストデータ101が保持するデータをこのように提示しているが、テキストの出自情報や、抽出した日時情報などを含め、後述する評価情報の検索処理に利用してもよい。
なお、本実施形態においては、SNSへの投稿を分析するものとして説明するが、分析対象となるテキストは、SNSの投稿に限られるものではなく、インターネット上のWebサイトや、論文、雑誌、書籍など、どのようなテキストであってもよい。SNSへの投稿は本発明を適用する上で好適なテキストの一例である。
図4は、評価情報データ102の一例であり、テキストデータ101における各テキストから抽出した評価対象候補と、評価表現と、評価情報に対応したテキストIDとを保持する。評価対象候補は、評価表現に対応する可能性のある形態素の一覧であり、評価対象、評価属性の区別なく保持する。各項目の抽出方法については後述する。
図5は、評価表現辞書103の一例であり、評価を表す形態素の一覧を保持する。説明の簡略化のため、評価表現辞書103を単に形態素の一覧として定義しているが、非特許文献1に記載されるように、評価表現と評価の極性(肯定―否定)との組の集合として定義し、後述する評価情報の検索処理に利用してもよい。
以下、評価情報抽出部110、および、評価情報検索部120における各処理について、例を用いて詳しく説明する。
まず、評価情報抽出部110における評価情報抽出処理について、図3〜図6を用いて説明する。
図6は、評価情報抽出処理を示すフローチャートである。
なお、本実施形態において図6のフローチャートで示す処理は、情報処理装置のCPU201が所定の制御プログラムを読み出して実施する処理である。
以下、図6の処理に従って、テキストデータ101に保管されているテキスト「Z社の製品Yは品質も価格も製品Xbより高いよ」(テキストID:3)から評価情報を抽出する例を示す。
ステップS101では、形態素解析を行い、テキストを品詞付の形態素に分割する。この処理を実行することにより、前述の例におけるテキストは「Z社(固有名詞)」、「の(助詞)」、「製品Y(固有名詞)」、「は(助詞)」、「品質(名詞)」、「も(助詞)」、「価格(名詞)」、「も(助詞)」、「製品Xb(固有名詞)」、「より(助詞)」、「高い(形容詞)」、「よ(助詞)」に分割される。この形態素解析と品詞特定については、公知の技術を用いて実現可能であるため、詳細についての説明は省略する。
次に、S101で分割した各形態素に対して、ステップS102〜ステップS105の処理を繰り返し実行する。ステップS102〜ステップS105の処理は、テキストデータに含まれる評価表現と評価対象候補を抽出して評価情報データ102に登録する処理である。
まず、ステップS103では、形態素が評価表現であるか否かを判定する。評価情報抽出部110は、形態素が評価表現辞書103に含まれていれば評価表現であると判定(ステップS103:Yes)してステップS104に処理を移行する。前述の例においては、「高い(形容詞)」が評価表現として判定される。
ステップS104では、評価表現に対する評価対象候補の抽出処理(ステップS201〜ステップS206)を実行する。
ステップS201では、評価対象候補リストを初期化する。ここで、評価対象候補リストは、ステップS103で評価表現と判定した形態素に対して、評価対象と成り得る形態素の一覧を管理するためのリストである。
ステップS202では、評価表現に直接係る名詞を評価対象候補リストに追加する。ただし、ここでの処理は、「より」、「と比べて」など、比較を表す表現が後述するものを除く。
ここでの処理は、公知の係り受け解析技術を用いてもよいし、単にテキスト上の位置関係が近い名詞を取得してもよい。前述の例においては、評価表現「高い(形容詞)」にテキスト上の位置が最も近い名詞としては、「製品Xb(固有名詞)」が存在するが、比較を表す表現「より(助詞)」が後続するため、「製品Xb(固有名詞)」は評価対象に含めず、「価格(名詞)」を評価対象候補リストに追加する。
その後、評価対象候補リストに含まれる各評価対象について、評価対象候補リストの要素に変化がなくなるまでステップS203〜ステップS204の処理を繰り返し実行する。ステップS203〜ステップS204の処理は、評価対象の候補を拡張する処理である。
ステップS204では、評価対象に対して、「は」、「が」、「の」など、部分を表す助詞によって係る名詞、および、「も」、「と」など、並列を表す助詞によって係る名詞を評価対象候補に追加する。前述の例においては、「品質(名詞)」、「製品Y(固有名詞)」、「Z社(固有名詞)」を評価対象候補に追加する。係り先の判定方法については、ステップS202と同様である。
ステップS205で、ステップS201〜ステップS204において抽出した評価対象候補リストを返して、ステップS105へ処理を移行する。
ステップS105では、テキストIDと、ステップS103において評価表現と判定した形態素と、ステップS104において抽出した評価対象候補を、評価情報データ102に追加する。
前述の例では、テキストIDとして「3」、評価表現として「高い」、評価対象候補として「[Z社,製品Y,品質,価格]」を一組の評価情報データとして追加する。
以上、評価情報抽出部110における評価情報抽出処理について、例を用いて説明した。
なお、説明の簡略化のため、ステップS202について、比較を表す表現によって係る形態素を単に除去する方法を説明したが、当該形態素を評価対象の比較対象として評価情報の構成要素に含め、後述の検索処理で利用してもよい。
次に、評価情報検索部120における評価属性の集約処理、評価表現の集約処理、評価情報の検索処理を、図3〜図5、および、図7〜図10を用いて説明する。
なお、図10に示す処理は、情報処理装置のCPU201が所定の制御プログラムを読み出して実行する処理である。
図7は、本発明の実施形態における評価情報検索画面の一例である。評価情報検索画面300は、評価対象310、評価属性320、評価表現330を編集するためのフォームと、評価対象310の入力フォームを追加するボタン311と、評価情報の検索リクエストを送信する検索ボタン340などを備える。
なお、評価情報検索画面は、情報処理装置をユーザが操作する場合は、当該情報処理装置の表示部に表示される。情報処理装置とは別にユーザが使用する端末(不図示)がある場合(すなわち、情報処理装置がいわゆるサーバ装置として機能する場合)は、当該ユーザが操作する端末の表示部に表示される画面である。この場合、情報処理装置は、評価情報検索画面を表示するためのデータを出力する。
評価対象310の編集フォームは、ユーザが任意のキーワードを入力可能なフォームである。評価対象310の編集フォームに評価対象が入力されると、入力された評価対象が評価情報検索部120へ送信される(図10におけるステップS1001)。
そして、評価情報検索部120によって、評価属性の集約処理、および、評価表現の集約処理が実行され、実行結果が評価属性320の編集フォーム、および、評価表現330の編集フォームに反映される。以下、各処理について順に説明する。
評価情報検索部120における評価属性集約処理は、評価情報データ102を参照して、入力とした与えられた評価対象に対する評価属性(評価対象候補における評価対象以外の要素)を取得し、評価属性ごとの評価情報件数を集計する処理で、入力情報として評価対象を表すキーワードの集合を受け取る(図10におけるステップS1002)。
具体的には、評価情報検索画面300から入力として与えられた評価対象(評価対象310の編集フォームに入力されたキーワード)を、評価対象候補の要素として少なくとも1つもつレコードを評価情報データ102から取得し、評価対象以外の要素に対して、要素ごとの数を集計する処理である。例えば、図4に示す評価情報データ102から、「製品Xa」、「製品Xb」に対する評価属性の候補を集約する場合、「製品Y(1件)」、「バッテリー(1件)」、「レンズ(3件)」、「デザイン(2件)」を集約処理結果として出力する。
評価情報検索部120における評価表現集約処理は、評価情報データ102を参照して、入力として与えられた評価対象に対する評価表現ごとの評価情報件数を集計する処理で、入力情報としては、必須の引数として評価対象を表すキーワードの集合を、任意の引数として評価属性を表すキーワードの集合を受け取る(図10におけるステップS1003)。
具体的には、評価属性集約処理と同様に、入力として与えられた評価対象を、評価対象候補の要素として少なくとも1つもつレコードを評価情報データ102から取得し、評価情報ごとの件数を集計する処理である。例えば、図4に示す評価情報データ102から、「製品Xa」、「製品Xb」に対する評価表現を集約した場合、「減りやすい(1件)」、「かっこいい(2件)」、「壊れやすい(1件)」を集約処理結果として出力する。
また、評価属性を表すキーワードの集合が評価対象の集合とともに与えられた場合は、入力として与えられた評価対象を、評価対象候補の要素として少なくとも1つもち、かつ、入力として与えられた評価属性を、評価対象候補の要素として少なくとも1つもつレコードを対象に評価表現の集計処理を行う。
図8は、評価対象310の編集フォームに、「製品Xa」と「製品Xb」を入力した後、評価属性集約処理、および、評価表現集約処理の実行結果が反映された評価情報検索画面の一例を示している。評価属性320の編集フォームには、評価属性集約処理によって出力された評価属性の一覧が頻度に対して降順で表示され、チェックボックスによる選択が可能な状態になる。
同様に、評価表現330の編集フォームには、評価表現集約処理によって出力された評価表現の一覧が頻度に対して降順で表示され、チェックボックスによる選択が可能な状態になる。
なお、評価情報検索画面において、評価対象310の編集フォーム、または、評価属性320の編集フォームの入力内容に変更があった際には、適宜、評価情報検索部120に対して集約処理のリクエストが送信され、各フォームはインタラクティブに更新される。
そして、ユーザによりチェックボックスに対するチェックを受け付け、検索ボタン340の押下を受け付ける(図10におけるステップS1004)。
図9は、ユーザにより検索ボタンが押下された後における評価情報検索画面の一例を示している。評価情報検索システム100のユーザにより検索ボタン340が押下されると、評価対象310の編集フォームに記載したキーワード、および、評価属性320、評価表現330の編集フォームにおいてチェックされているキーワードが評価情報検索部120に送信され、評価情報検索部120によって、評価情報の検索処理(ステップS1005)が実行された後、検索結果として評価情報を含むテキストが出力され(S1006)、評価情報検索画面300の下部に表示される。以下、評価情報の検索処理の詳細について説明する。
評価情報検索部120における評価情報検索処理は、評価情報検索画面300から入力された情報を用いて評価情報データ102から評価情報を絞りこみ、元のテキストデータと紐づけて出力する処理である。
具体的には、評価情報検索画面300から入力として与えられた評価対象を、評価対象候補の要素として少なくとも1つもつレコードを評価情報データ102から取得する。
そして、テキストIDに紐づくテキストをテキストデータ101から取得する。
このとき、同じテキストIDをもつテキストは1つに集約する。また、評価属性を表すキーワードの集合が評価対象の集合とともに与えられた場合は、評価情報の絞り込み条件として、入力として与えられた評価属性を、評価対象候補の要素として少なくとも1つもつという条件を追加する。
また、評価表現を表すキーワードの集合が与えられた場合は、入力として与えられた評価表現のうちのいずれかのキーワードを評価表現としてもつという条件を追加する。
例えば、図9に示すように、評価対象として「製品Xa」と「製品Xb」、評価属性として「レンズ」が選択されており、評価表現については指定がない場合(全選択がチェックされている場合)、評価情報検索部120には、評価対象を表すキーワードの集合として「製品Xa」と「製品Xb」が、評価属性を表すキーワードの集合として「レンズ」が送信される。評価情報検索部120は、入力に該当する評価情報を含むテキストとして、テキストIDが2と4であるテキストを検索結果として出力する。
以上、評価情報検索部120における評価属性の集約処理、評価表現の集約処理、評価情報の検索処理について、例を用いて説明した。
このように、本実施形態によれば、評価対象が事前に定まらないテキストデータに対しても、任意の評価対象に対する評価属性の候補を表示しつつ、評価情報を適宜絞り込みながら検索することが可能になる。
評価属性の候補に関しては、前述の例のように、「製品Xa」に対する評価属性として「製品Y」が出力されるなど、必ずしもふさわしい結果が表示されるとは限らないが、出現頻度に対して降順に表示されるため、着目すべき項目が優先して表示される仕組みになっている。また、各評価対象に対する評価属性辞書を事前に準備することなく評価情報の絞り込みを実施できることも本発明の特徴である。
なお、評価属性辞書を事前に準備できる環境であれば、評価属性の集約処理において、評価属性辞書に含まれる形態素のみを抽出すればよい。
評価情報の検索漏れに関する課題は、評価表現に対する評価対象を一意に定めずに候補の集合として管理することで緩和される。前述の例では、「Z社の製品Yは品質も価格も製品Xbより高いよ」というテキストに対して、評価対象を「Z社」としても「製品Y」としても評価情報を検索可能である。
また、評価情報の検索時に発生する処理が、事前に抽出した評価属性や評価表現の集計のみとなり、評価対象と評価表現を紐づける処理が検索時に必要な手法と比べて、評価情報の検索処理時間を短縮することができる。
本発明におけるプログラムは、図6、図10の処理をコンピュータに実行させるプログラムである。なお、本発明におけるプログラムは、図6、図10の各処理ごとのプログラムであってもよい。
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
100 評価情報検索システム
101 テキストデータ
102 評価情報
103 評価表現辞書
110 評価情報抽出部
120 評価情報検索部

Claims (5)

  1. テキストに対して形態素解析を行うことで、当該テキストを形態素に分割する解析手段と、
    前記解析手段により分割された形態素うち評価表現を抽出する評価表現抽出手段と、
    前記評価表現抽出手段により抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出する評価対象抽出手段と、
    前記評価対象抽出手段により抽出された複数の評価対象と、前記評価表現とを対応付けて一組の評価情報データとして登録する登録手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記登録手段は、評価対象と評価表現の抽出元となったテキストを示す情報を、前記評価対象および評価表現に対応付けて登録することを特徴とする請求項1に記載の情報処理装置。
  3. 評価対象または評価表現を入力する入力手段と、
    前記入力手段により入力された評価対象または評価表現を含む評価情報データを検索する検索手段と、
    前記検索手段により検索された評価情報データに対応付けられたテキストを示す情報に基づき、当該評価情報データの元となったテキストを出力する出力手段と、
    をさらに備えることを特徴とする請求項2に記載の情報処理装置。
  4. 情報処理装置の解析手段が、テキストに対して形態素解析を行うことで、当該テキストを形態素に分割する解析工程と、
    前記情報処理装置の評価表現抽出手段が、前記解析工程により分割された形態素うち評価表現を抽出する評価表現抽出工程と、
    前記情報処理装置の評価対象抽出手段が、前記評価表現抽出工程により抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出する評価対象抽出工程と、
    前記情報処理装置の登録手段が、前記評価対象抽出工程により抽出された複数の評価対象と、前記評価表現とを対応付けて一組の評価情報データとして登録する登録工程と、
    を備えることを特徴とする情報処理方法。
  5. 情報処理装置において実行可能なプログラムであって、
    前記情報処理装置を、
    テキストに対して形態素解析を行うことで、当該テキストを形態素に分割する解析手段と、
    前記解析手段により分割された形態素うち評価表現を抽出する評価表現抽出手段と、
    前記評価表現抽出手段により抽出された評価表現と係り受け関係にある複数の名詞を、評価対象として抽出する評価対象抽出手段と、
    前記評価対象抽出手段により抽出された複数の評価対象と、前記評価表現とを対応付けて一組の評価情報データとして登録する登録手段として機能させることを特徴とするプログラム。
JP2014260647A 2014-12-24 2014-12-24 情報処理装置、情報処理方法、プログラム Pending JP2016122263A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014260647A JP2016122263A (ja) 2014-12-24 2014-12-24 情報処理装置、情報処理方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014260647A JP2016122263A (ja) 2014-12-24 2014-12-24 情報処理装置、情報処理方法、プログラム

Publications (1)

Publication Number Publication Date
JP2016122263A true JP2016122263A (ja) 2016-07-07

Family

ID=56328941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014260647A Pending JP2016122263A (ja) 2014-12-24 2014-12-24 情報処理装置、情報処理方法、プログラム

Country Status (1)

Country Link
JP (1) JP2016122263A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256777A (zh) * 2018-01-30 2018-07-06 许晓山 一种通用型科技成果转化可行性评估系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256777A (zh) * 2018-01-30 2018-07-06 许晓山 一种通用型科技成果转化可行性评估系统

Similar Documents

Publication Publication Date Title
US11429661B2 (en) System and method for automatically selecting images to accompany text
US9177249B2 (en) Scientometric methods for identifying emerging technologies
Candela et al. Reusing digital collections from GLAM institutions
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
US11768849B2 (en) Extensible data platform with database domain extensions
CN110737824B (zh) 内容查询方法和装置
US20120046937A1 (en) Semantic classification of variable data campaign information
US8862609B2 (en) Expanding high level queries
JP6384469B2 (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム
JP2016122263A (ja) 情報処理装置、情報処理方法、プログラム
JP2016045552A (ja) 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置
JP2016162357A (ja) 商品に対するユーザの感情分析装置及びプログラム
JP6287192B2 (ja) 情報処理装置、情報処理方法、プログラム
JP2012027525A (ja) ファイル格納補助システムと方法およびプログラム
JP7074999B2 (ja) 情報処理装置、制御方法、プログラム
JP2009223679A (ja) 電子文書検索装置、及び電子文書検索プログラム
JP5718630B2 (ja) 情報処理装置、情報資産管理システム、情報資産管理方法、及びプログラム
JP2011086156A (ja) 漏洩情報追跡システムおよび漏洩情報追跡プログラム
JP6878379B2 (ja) 情報処理装置、制御方法、及びプログラム
JP2011244849A (ja) 類似症例検索プログラム
CN114996221A (zh) 一种数据处理方法、装置、设备及存储介质
WO2021084723A1 (ja) 検索方法、検索プログラム及び検索装置
JP2016115315A (ja) 情報処理装置、情報処理方法、プログラム
JP2021120905A (ja) 情報処理装置、サーバ装置、ユーザ端末、方法及びプログラム
JP2022126229A (ja) 将来事象推定システム、および将来事象推定方法

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20161101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20161101