JP2017134686A

JP2017134686A - 解析システム、解析方法、及び解析プログラム

Info

Publication number: JP2017134686A
Application number: JP2016014776A
Authority: JP
Inventors: 孝文岸; Takafumi Kishi; 仁護小澤; Kimimori Ozawa; 健宮本; Takeshi Miyamoto; 良昭重岡; Yoshiaki Shigeoka; 徹稲田; Toru Inada
Original assignee: Nissan Motor Co Ltd; SCSK Corp
Current assignee: Nissan Motor Co Ltd; SCSK Corp
Priority date: 2016-01-28
Filing date: 2016-01-28
Publication date: 2017-08-03
Anticipated expiration: 2036-01-28
Also published as: JP6576847B2

Abstract

【課題】解析の精度を向上させることが可能な解析システム、解析方法、及び解析プログラムを提供すること。【解決手段】解析システム１は、文を解析する解析システムであって、解析対象となる文である対象文のうち、対象文の要点を特定するための表現である要点表現を抽出する要点抽出部８と、要点抽出部８にて抽出された要点表現に基づいて、対象文を解析する解析部９と、解析システム１と相互に通信可能に接続された端末装置３０にてユーザによって入力された文を、端末装置３０から通信を介して取得する入力文取得部７を備え、要点抽出部８は、入力文取得部７にて取得した文を対象文として、当該対象文に基づいて、要点表現を抽出する。【選択図】図１

Description

本発明は、解析システム、解析方法、及び解析プログラムに関する。

従来、論文や新聞などに記述された文や、会話の音声に基づいてテキスト化された文を解析して知識を抽出する解析システムが提案されている（例えば、特許文献１を参照）。

特開２０１５−０９９４９７号公報

ここで、従来は、文の全体に基づいて解析を行っていたが、実際の文には、解析に不必要な箇所が多く含まれているため、このような解析に不必要な箇所がノイズとなり、解析の精度が低下してしまう可能性があった。そこで、解析の精度を向上させることが可能な解析システムが要望されていた。

本発明は、上記に鑑みてなされたものであって、解析の精度を向上させることが可能な解析システムを提供することを目的とする。

請求項１に記載の解析システムは、文を解析する解析システムであって、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段と、前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析手段と、を備える。

請求項２に記載の解析システムは、請求項１に記載の解析システムにおいて、当該解析システムと相互に通信可能に接続された端末装置にてユーザによって入力された文を、前記端末装置から通信を介して取得する入力文取得手段を備え、前記要点抽出手段は、前記入力文取得手段にて取得した文を対象文として、当該対象文に基づいて、前記要点表現を抽出する。

請求項３に記載の解析システムは、請求項２に記載の解析システムにおいて、連続する複数の前記文を含む文群を解析する前記解析システムであって、前記要点抽出手段は、解析対象となる文群である対象文群に含まれる文のうち、前記対象文群の要点を特定するための表現である要点表現を含む文である要点文を抽出し、前記解析手段は、前記要点抽出手段にて抽出された前記要点文に基づいて、前記対象文群を解析する。

請求項４に記載の解析システムは、請求項１から３のいずれか一項に記載の解析システムにおいて、複数の前記要点表現を格納する要点辞書格納手段を備え、前記要点抽出手段は、前記対象文に含まれる表現と、前記要点辞書格納手段に格納された前記要点表現とを相互に対比することにより、前記対象文に含まれる要点表現を抽出する。

請求項５に記載の解析システムは、請求項４に記載の解析システムにおいて、前記対象文と同一分野に限定されない文の要点を特定するための表現である共通要点表現を格納する共通要点辞書格納手段と、前記共通要点辞書格納手段に格納された前記共通要点表現と、前記対象文と同一分野の文である特定分野文とに基づいて、前記特定分野文に含まれる前記共通要点表現の出現頻度に関する情報を特定し、当該特定した前記共通要点表現の出現頻度に関する情報に基づいて、前記要点辞書格納手段に前記要点表現を格納する要点辞書作成手段と、を備える。

請求項６に記載の解析システムは、請求項１から５のいずれか一項に記載の解析システムにおいて、前記対象文の話題に関する解析を行う前記解析システムであって、素材文の話題を示す話題表現を格納する話題辞書格納手段を備え、前記解析手段は、前記要点表現を含む文に含まれる主部表現と述部表現との組み合わせを抽出し、当該抽出した組み合わせのうち、前記話題辞書格納手段に格納された前記話題表現が前記主部表現又は前記述部表現の少なくとも一方に含まれる組み合わせを特定し、当該特定された組み合わせに基づいて、前記対象文の話題を特定する。

請求項７に記載の解析システムは、請求項１から６のいずれか一項に記載の解析システムにおいて、前記対象文の評価に関する解析を行う前記解析システムであって、素材文に含まれる各表現の出現頻度に関する情報と、前記素材文の評価と、を相互に関連付けて構成された評価情報を格納する、評価情報格納手段を備え、前記解析手段は、前記対象文に含まれる各表現の出現頻度に関する情報を特定し、当該特定された情報と、前記評価情報格納手段に格納された評価情報とを対比することにより、前記対象文の評価を特定する。

請求項８に記載の解析方法は、文を解析する解析方法であって、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出工程と、前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析工程と、を含む。

請求項９に記載の解析プログラムは、文を解析する解析プログラムであって、コンピュータを、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段と、前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析手段と、として機能させる。

請求項１に記載の解析システム、請求項８に記載の解析方法、又は請求項９に記載の解析プログラムによれば、要点抽出手段にて抽出した要点表現に基づいて、対象文を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

請求項２に記載の解析システムによれば、解析システムと相互に通信可能に接続された端末にてユーザによって入力された文を対象文として解析を行うので、ユーザが例えばＳＮＳ等に投稿した意見や苦情等の文を解析することができ、幅広い多数のユーザの思考を反映させた解析が可能となる。

請求項３に記載の解析システムによれば、要点抽出手段にて抽出した要点文に基づいて、対象文群を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

請求項４に記載の解析システムによれば、対象文に含まれる表現と、要点辞書格納手段に格納された要点表現とを相互に対比することにより、要点表現を抽出するので、要点表現を極めて簡素な構成により抽出することができる。

請求項５に記載の解析システムによれば、共通要点表現と、特定分野文と、に基づいて特定した共通要点表現の出現頻度に関する情報に基づいて、要点辞書格納手段に要点表現を格納するので、対象文の分野に一層即した要点表現を用いることができ、解析の精度を一層向上させることが可能となる。

請求項６に記載の解析システムによれば、話題辞書格納手段に格納された話題表現が主部表現又は述部表現の少なくとも一方に含まれる組み合わせに基づいて、対象文の話題を特定するので、対象文の話題を精度良く特定することが可能となる。

請求項７に記載の解析システムによれば、対象文に含まれる各表現の出現頻度に関する情報を特定し、当該特定された情報と、評価情報格納手段に格納された評価情報とを対比することにより、対象文の評価を特定するので、対象文の評価を精度良く特定することが可能となる。

本発明の実施の形態１に係る解析システムを機能概念的に示すブロック図である。対象投稿文群の構成例である。要点辞書ＤＢに格納された要点辞書の構成例である。話題辞書ＤＢに格納された話題辞書の構成例である。評価ＤＢに格納された評価情報の構成例である。要点スコアテーブルに格納された要点スコア情報の構成例である。要点辞書作成処理のフローチャートである。特定分野投稿文群を示す構成例である。要点頻度情報の構成例である。解析処理のフローチャートである。要点抽出処理のフローチャートである。話題特定処理のフローチャートである。形態素解析結果情報の構成例である。話題結果情報の構成例である。評価特定処理のフローチャートである。評価結果情報の構成例である。本発明の実施の形態２に係る解析システムを機能概念的に示すブロック図である。対象会話文群の構成例である。要点辞書ＤＢに格納された要点辞書の構成例である。話題辞書ＤＢに格納された話題辞書の構成例である。評価ＤＢに格納された評価情報の構成例である。要点スコアテーブルに格納された要点スコア情報の構成例である。要点辞書作成処理のフローチャートである。特定分野会話文群を示す構成例である。要点頻度情報の構成例である。解析処理のフローチャートである。要点抽出処理のフローチャートである。話題特定処理のフローチャートである。形態素解析結果情報の構成例である。話題結果情報の構成例である。評価特定処理のフローチャートである。評価結果情報の構成例である。

以下に添付図面を参照して、この発明に係る解析システム、解析方法、及び解析プログラムの実施の形態を詳細に説明する。まず、実施の形態の基本的概念について説明した後、各実施の形態の具体的内容を説明し、最後に各実施の形態に対する変形例について説明する。ただし、各実施の形態によって本発明が限定されるものではない。

〔実施の形態の基本的概念〕
最初に、実施の形態の基本的概念について説明する。各実施の形態に係る解析システム、解析方法、及び解析プログラムは、文を解析するためのものである。ここで、「文」とは、文字列であって、例えば投稿文や、会話文を含む。ここで、「投稿文」とは、例えば解析システムと相互に通信可能に接続された端末にてユーザによって入力された文（例えば、ＳＮＳ（social networking service）への投稿等）を含む。また、「会話文」とは、複数の対話者の相互間において行われる会話を公知の方法でテキスト化したものや、テキスト表示を介して会話を行うような表示（画像）対話のテキストを含む。このようにテキスト化を行う方法は任意で、コンピュータの音声認識によって自動的にテキスト化しても構わないし、会話の音声を聞いた人が手動でテキストを打ち込んでテキスト化しても構わない。また、「複数の対話者」とは、代表的には１人の顧客と１人の相談員であるが、人以外を含んでいても構わず、例えば１人の顧客と１台の自動対話装置であっても構わない。なお、以下では、必要に応じて顧客は「ＣＵ」、相談員は「ＯＰ」として標記する。なお、これらの「文」の単位は任意であり、以下では句点で区切られた文字の羅列を１つの文として説明するが、文章としての体裁を成していなくても構わず、単なる文字の羅列を文としても構わない。

ここで、少なくとも２つ以上の文の集合を以下では「文群」と称する。この「文群」は、投稿文の集合である「投稿文群」や、会話文の集合である「会話文群」を含む。また、各実施の形態に係る解析の対象となる文を「対象文」と称する。解析の対象は、単一の文であっても、文群であっても構わないが、各実施の形態では解析の対象は文群であるものとして説明し、この文群を特に「対象文群」と称して説明する。なお、対象文群のうち、解析の対象となる投稿文群を「対象投稿文群」、解析の対象となる会話文群を「対象会話文群」と区別して称して説明する。

また、「解析する」とは、文を調べることによって当該文に関する情報を特定することであり、例えば文の話題を特定したり、文の評価を特定したりすることを含む。ここで、「話題」とは、文の核となる要点であって、例えば会話の題材となっている内容を含む概念である。また、「評価」とは、ものや人やサービスの良し悪しであって、例えば文の話題となっている商品やサービスに対する顧客の満足度等を含む概念である。

ここで、各実施の形態に係る解析システム及び解析プログラムの適用分野は任意であり、以下では、後述する実施の形態１においては、「ソフトへの苦情」に関するＳＮＳへの投稿に適用されるものとして説明し、後述する実施の形態２においては「携帯電話の操作説明」の相談窓口での会話に適用されるものとして説明するが、これらに限らず、「車の事故処理」、「機器の操作説明」、「飲食物の苦情」、又は「保険の適用」等のあらゆる分野に適用可能である。

〔各実施の形態の具体的内容〕
次に、各実施の形態の具体的内容について説明する。

（実施の形態１）
まずは、実施の形態１に係る解析システムについて説明する。この実施の形態１は、概略的に、ユーザによって入力されたＳＮＳへの投稿文を解析するシステムに関する。なお、以下では、上記の投稿文を入力するものを、「ユーザ」と称し、解析システムを管理するものを「管理者」と称して説明する。最初に、本実施の形態１に係る解析システムの構成について説明し、その後に、解析システムで行われる処理について説明する。

（構成）
まず、本実施の形態１に係る解析システム１及び端末装置３０の構成について説明する。図１は、本実施の形態１に係る解析システム１及び端末装置３０を機能概念的に示すブロック図である。このように、解析システム１は、ネットワーク２０を介して端末装置３０と相互に通信可能に接続されている。ここで、図１には端末装置３０を１台のみ示しているが、実際には解析システム１は、複数の端末装置３０と、これら複数の端末装置３０に対して通信可能な共通の解析システム１とを備えて構成されている。ただし、これら複数の端末装置３０は、相互に同様に構成することができるため、以下では、１台の端末装置３０について説明するものとし、他の端末装置３０についてはその説明を省略する。

（構成−解析システム）
この解析システム１は、機能概念的に、入力部２、出力部３、制御部４、記憶部５、及び通信部６を接続して構成されており、例えば、公知のデスクトップコンピュータ、ノートブックコンピュータ、タブレット型コンピュータ、あるいはスマートフォンを用いて構成されている。

入力部２は、各種の情報を解析システム１に入力するための入力手段である。この入力部２の具体的な構成は任意であり、例えば、マウス、キーボード、あるいはタッチパネルとして構成することができる。

出力部３は、各種の情報を解析システム１から出力するための出力手段である。この出力部３の具体的な構成は任意であり、例えば、公知の液晶ディスプレイや有機ＥＬディスプレイの如きフラットパネルディスプレイとして構成することができる。

制御部４は、ＣＰＵ（Central Processing Unit）や、このＣＰＵ上で解釈実行される各種のプログラム（ＯＳなどの制御プログラムや各種の処理手順などを規定したプログラム）、及び、所要プログラムや所要データを格納するためのキャッシュメモリを備えて構成される。このＣＰＵ上で解釈実行される各種のプログラムには解析プログラムが含まれ、この解析プログラムは、例えば、ＣＤ−ＲＯＭやＤＶＤを含む任意の記憶媒体に記憶された後、インストールされて記憶部５に不揮発的に記憶され、ＣＰＵにて解釈実行されることで制御部４の実質的機能を構成する。

この制御部４は、機能概念的に、入力文取得部７、要点抽出部８、解析部９、及び要点辞書作成部１０を備えて構成されている。入力文取得部７は、解析システム１と相互に通信可能に接続された端末装置３０にてユーザによって入力された文を、端末装置３０から通信を介して取得する入力文取得手段である。要点抽出部８は、解析対象となる文である対象文のうち、対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段である。図２は、対象投稿文群の構成例である。図２には、「要点表現」及び「要点投稿文」が開示されている。ここで、「要点表現」とは、対象文の要点において用いられる可能性の高い表現であって、本実施の形態１においては、投稿文の要点においてユーザが用いる可能性が高いと考えられる投稿の表現である。例えば図２においては四角の太枠で囲われた表現であり、具体的には、「これはない」、「レベルやろ」、「ならなるで」、「凹んだ」、「わかってるけど」という表現が含まれる。すなわち、例えば「これはない」という表現の前後や、「レベルやろ」という表現の前後には、投稿の要点となる表現が含まれる可能性が高く、このような要点となる表現を特定するための指標として、要点表現を用いる。また、「要点投稿文」とは、当該要点表現を含む単数の投稿文、又は、当該単数の投稿文及び当該投稿文の前後複数文を含む投稿文群である。なお、このように単数の投稿文だけでなく、前後複数文を含めても良いことの理由については後述する。例えば、図２において細枠ａ〜ｆで囲われた表現であり、具体的には、「いきなりＸＸＸが使えなくなった。これはない！もうＸＸＸなんて一生使わない！！！嘘つき！！」という投稿文群や、「ＸＸＸだったから買ったのにこんなレベルやろか？？がっかり！」という投稿文群が該当する。なお、「ＸＸＸ」とは任意の製品やサービスの名称であるが、本実施の形態１ではソフトの製品名であるものとして説明する。すなわち、上記の各投稿文群は、いずれも「製品への苦情」という投稿の要点を含んでいる。また、図２に示す対象投稿文群は、それぞれ異なるユーザ（ユーザＡ〜ユーザＦ）の投稿であるものとして説明するが、これに限らず、これらは同一のユーザが異なる時間に投稿したものであっても構わない。

解析部９は、要点抽出部８にて抽出された要点表現に基づいて、対象文を解析する解析手段である。要点辞書作成部１０は、後述する図６に示す要点スコアテーブル１４に格納された共通要点表現と、対象文と同一分野の文である特定分野文とに基づいて、特定分野文に含まれる共通要点表現の出現頻度に関する情報を特定し、当該特定した共通要点表現の出現頻度に関する情報に基づいて、後述する要点辞書ＤＢ１１に要点表現を格納する要点辞書作成手段である。ここで、「共通要点表現」とは、対象文と同一分野に限定されない文の要点を特定するための表現である。具体的には、本実施の形態１に係る分野である「ソフトへの苦情」に限らず、「車の事故処理」、「機器の操作説明」、「飲食物の苦情」、又は「保険の適用」等の分野においても、文の要点を特定するための表現として用いられるものである。例えば、共通要点表現には、「これはない」、「レベルやろ」、「ならなるで」、「凹んだ」、「わかってるけど」、「ちっとも」といった表現が含まれる。また、「特定分野文」とは、要点辞書を作成するために用いられる文であり、対象投稿文と同一分野の投稿文である。すなわち本実施の形態１では「ソフトへの苦情」の分野における投稿文を示す。また、「出現頻度に関する情報」とは、代表的には出現回数であるが、例えば出現回数に基づいて算定した出現割合等も含む概念である。なお、この特定分野文の集合である投稿文を、以下では「特定分野投稿文群」と称して説明する。なお、これら各部の機能については、各処理と併せて説明する。

記憶部５は、解析システム１で実行される各種処理に必要な情報やパラメータを不揮発的に格納する格納手段であり、例えば、ＨＤ（Hard Disk）や半導体メモリにより構成される。この記憶部５には、要点辞書データベース（以下、データベースをＤＢと称する）１１、話題辞書ＤＢ１２、評価ＤＢ１３、及び要点スコアテーブル１４が格納されている。

要点辞書ＤＢ１１は、複数の要点表現を格納する要点辞書格納手段である。図３は、要点辞書ＤＢ１１に格納された要点辞書の構成例である。この図３に示すように、要点辞書は、項目「要点表現」に対応する情報を備えて構成されている。この項目「要点表現」に対応する情報は、要点表現を特定するための要点表現特定情報である。ここで、要点辞書には、要点表現として「これはない」、「レベルやろ」、「ならなるで」、「凹んだ」、「わかってるけど」、「ちっとも」等の要点表現が格納されている。すなわち、本実施の形態１では、これらの要点表現の近傍に投稿の要点が存在するものという前提の下に、解析を行う。なお、このような解析の具体的な方法については後述する。また、この要点辞書ＤＢ１１に要点辞書を格納する方法は任意で、本実施の形態１においては、後述する要点辞書作成処理にて格納する。

図１の話題辞書ＤＢ１２は、素材文の話題を示す話題表現を格納する話題辞書格納手段である。なお、「素材文」とは、当該話題辞書ＤＢ１２に格納される情報や、後述する評価ＤＢ１３に格納される情報を作成するために用いられる文であり、任意の方法で取得した文を用いることができる。ただし、本実施の形態１では、素材文の集合（以下、素材投稿文群）を用いるものとし、具体的には、過去にユーザによって入力された投稿文群を用いるものとして説明する。図４は、話題辞書ＤＢ１２に格納された話題辞書の構成例である。この図４に示すように、話題辞書は、項目「話題表現」に対応する情報と、項目「話題区分」に対応する情報と、を相互に関連付けて構成されている。項目「話題表現」に対応する情報は、投稿文の話題を特定するための表現である話題表現を特定するための話題表現特定情報である。項目「話題区分」に対応する情報は、各話題の区分を特定するための話題区分特定情報である。例えば図４では、話題表現「最低」の話題区分は「苦情」であり、話題表現「よかった」の話題区分は「意見」であり、話題表現「調子悪い」の話題区分は「問題」であり、話題表現「さえあれば」の話題区分は「要望」であることを示している。なお、この話題辞書ＤＢ１２に話題辞書を格納する方法は任意で、本実施の形態１においては、管理者等に解析システム１の入力部２を介して予め打ち込まれた話題辞書が格納されているものとする。

図１の評価ＤＢ１３は、素材文に含まれる各表現の出現頻度に関する情報と、素材文の評価と、を相互に関連付けて構成された評価情報を格納する、評価情報格納手段である。図５は、評価ＤＢ１３に格納された評価情報の構成例である。この図５に示すように、評価情報は、項目「レコードＩＤ」に対応する情報と、項目「文字数」に対応する情報と、項目「リンク有無」に対応する情報と、項目「画像有無」に対応する情報と、項目「投稿数」に対応する情報と、項目「投稿時刻」に対応する情報と、項目「キーワード」に対応する情報と、項目「判別」に対応する情報と、を相互に関連付けて構成されている。項目「レコードＩＤ」に対応する情報は、素材文を一意に識別するための識別情報である。項目「文字数」に対応する情報は、素材文を構成する文字の数を示す情報であう。項目「リンク有無」に対応する情報は、素材文にＵＲＬのリンクが付されているか否かを示す情報であって、具体的には、リンクの数を示す情報である。項目「画像有無」に対応する情報は、素材文に画像が付されているか否かを示す情報であって、具体的には、添付された画像の数を示す情報である。項目「投稿数」に対応する情報は、素材文の投稿を行ったユーザの総投稿数を示す情報である。項目「投稿時刻」に対応する情報は、ユーザが素材分の投稿を行った時刻を示す情報である。項目「キーワード」に対応する情報には、小項目として、素材文の評価を特定するための表現が格納されている。また、各小項目に対応する情報は、素材文に含まれる各表現の出現回数を示す情報である。項目「判別」に対応する情報は、素材文を投稿したユーザのソフトに対する評価を示す情報であって、「満足」又は「不満」のいずれかの評価が格納されている。ここで、「満足」とは、ユーザがソフトの性能やソフトに関するサービスの対応等について満足していることを示し、「不満」とは、ユーザがソフトの性能やソフトに関するサービスの対応等について満足していないことを示す。

図１の要点スコアテーブル１４は、対象文と同一分野に限定されない文の要点を特定するための表現である共通要点表現を格納する共通要点辞書格納手段である。図６は、要点スコアテーブル１４に格納された要点スコア情報の構成例である。この図６に示すように、要点スコア情報は、項目「共通要点表現」に対応する情報と、項目「ウェイト」に対応する情報と、を相互に関連付けて構成されている。項目「共通要点表現」に対応する情報は、共通要点表現を特定するための共通要点表現特定情報である。項目「ウェイト」に対応する情報は、各共通要点表現の重みを示す重み特定情報である。例えば、図６の一番上のレコードは、共通要点表現「これはない」のウェイト＝「０．８３１」であることを示している。本実施の形態１では、ウェイトの数値が大きい程、表現の重み付けが大きい（表現の重要性が大きい）ことを示すものとする。この「重要性」とは、投稿文群の要点を特定するための重要性であり、「重要性が大きい」とは、共通要点表現の近傍に投稿の要点が存在する可能性が高いことを示す。なお、この要点スコアテーブル１４に共通要点表現を格納する方法は任意で、本実施の形態１においては、管理者等に入力部２を介して予め打ち込まれた共通要点表現が格納されているものとする。

図１の通信部６は、端末装置３０との間でネットワーク２０を介して通信するための通信手段である。この通信部６としては、例えば、移動体無線通信網を用いて通信を行う公知の通信手段として構成することができる。

（構成−端末装置）
端末装置３０は、解析システム１と相互に通信可能に接続された端末である。この端末装置３０は、機能概念的に、入力部３１、出力部３２、制御部３３、記憶部３４、及び通信部３５を接続して構成されており、例えば、公知のデスクトップコンピュータ、ノートブックコンピュータ、タブレット型コンピュータ、あるいはスマートフォンを用いて構成されている。

入力部３１は、各種の情報を端末装置３０に入力するための入力手段である。この入力部３１の具体的な構成は任意であり、例えば、マウス、キーボード、あるいはタッチパネルとして構成することができる。

出力部３２は、各種の情報を端末装置３０から出力するための出力手段である。この出力部３２の具体的な構成は任意であり、例えば、公知の液晶ディスプレイや有機ＥＬディスプレイの如きフラットパネルディスプレイとして構成することができる。

制御部３３は、ＣＰＵ（Central Processing Unit）や、このＣＰＵ上で解釈実行される各種のプログラム（ＯＳなどの制御プログラムや各種の処理手順などを規定したプログラム）、及び、所要プログラムや所要データを格納するためのキャッシュメモリを備えて構成される。このＣＰＵ上で解釈実行される各種のプログラムには解析プログラムが含まれ、この解析プログラムは、例えば、ＣＤ−ＲＯＭやＤＶＤを含む任意の記憶媒体に記憶された後、インストールされて記憶部５に不揮発的に記憶され、ＣＰＵにて解釈実行されることで制御部４の実質的機能を構成する。

記憶部３４は、解析システム１で実行される各種処理に必要な情報やパラメータを不揮発的に格納する格納手段であり、例えば、ＨＤ（Hard Disk）や半導体メモリにより構成される。

通信部３５は、解析システム１との間でネットワーク２０を介して通信するための通信手段である。この通信部３５としては、例えば、移動体無線通信網を用いて通信を行う公知の通信手段として構成することができる。

（処理）
次に、このように構成された解析システム１において行われる処理について説明する。以下の説明においては、特記する主体を除いて制御部４にて処理が行われるものとする。また、「ステップ」を「Ｓ」と略記する。

（処理−要点辞書作成処理）
まず、本実施の形態１に係る解析システム１にて実行される要点辞書作成処理について説明する。図７は、要点辞書作成処理のフローチャートである。この要点辞書作成処理は、概略的に、上述した図３に示す要点辞書ＤＢ１１に格納された要点辞書を作成するための処理である。なお、この要点辞書作成処理は、解析システム１の入力部２を介して所定方法で起動される。

ＳＡ１において、要点辞書作成部１０は、特定分野投稿文群を取得したか否かを判定する。この判定方法は任意で、例えば要点辞書作成部１０は、管理者等によって、特定分野投稿文群に関するテキストデータが入力部２を介して入力されたか否かを判定し、入力された場合に特定分野投稿文群を取得したと判定しても良い。ここで、図８は、特定分野投稿文群を示す構成例である。この図８に示すように、特定分野投稿文群は、項目「レコードＩＤ」に対応する情報と、項目「テキスト」に対応する情報と、を相互に関連付けて構成されている。項目「レコードＩＤ」に対応する情報は、特定分野投稿文群を一意に識別するための識別情報である。項目「テキスト」に対応する情報は、特定分野投稿文群であって、具体的にはユーザの投稿のテキストである。なお、図示のように、本実施の形態１に係る特定分野投稿文群は、対象投稿文群を含むものとして説明する。ただし、特定分野投稿文群は、対象投稿文群を含まなくても構わず、このパターンについては、後述する実施の形態２にて説明する。図７に戻り、要点辞書作成部１０は、特定分野投稿文群を取得するまで待機し（ＳＡ１、Ｎｏ）、取得した場合（ＳＡ１、Ｙｅｓ）、ＳＡ２に移行する。

ＳＡ２において、要点辞書作成部１０は、ＳＡ１にて取得した特定分野投稿文群に含まれる要点投稿文を取得したか否かを判定する。具体的には、まず、管理者が特定分野投稿文群を精査し、投稿の要点となっている発言を示す投稿文を要点投稿文として特定し、特定した要点投稿文を、入力部２を介して入力する。例えば、本実施の形態１では、図８のレコードＩＤ「１」の「いきなりＸＸＸが使えなくなった。これはない！もうＸＸＸなんて一生使わない！！！嘘つき！！」という投稿文群や、レコードＩＤ「２」の「ＸＸＸだったから買ったのにこんなレベルやろか？？がっかり！」という投稿文群等を、要点投稿文として特定したことを例に挙げて説明する。そして、要点辞書作成部１０は、この入力があった場合に、要点投稿文を取得したと判定する。このようにして、要点辞書作成部１０は、要点投稿文を取得するまで待機し（ＳＡ２、Ｎｏ）、取得した場合（ＳＡ２、Ｙｅｓ）、ＳＡ３に移行する。

ＳＡ３において、要点辞書作成部１０は、要点投稿文に含まれる表現を抽出する。この抽出の具体的な方法は任意で、例えば、本実施の形態１において要点辞書作成部１０は、公知の自然言語処理又は形態素解析により、要点投稿文に含まれる各表現を品詞属性（接頭詞、名詞、動詞、副詞、接続詞、感動詞、助詞等）毎に分解して抽出する。

ＳＡ４において、要点辞書作成部１０は、抽出した表現と図６の要点スコア情報とを対比し、要点頻度情報を作成する。図９は、要点頻度情報の構成例である。図９に示すように、要点頻度情報は、項目「表現」に対応する情報と、項目「頻度」に対応する情報と、項目「出現割合」に対応する情報と、項目「ウェイト」に対応する情報と、項目「スコア」に対応する情報と、を相互に関連付けて構成されている。ここで、項目「表現」に対応する情報は、図７のＳＡ３にて抽出した表現のうち、要点スコア情報の項目「共通要点表現」と合致する表現を特定する情報である。項目「頻度」に対応する情報は、特定分野投稿文群の中に、対応するレコードの表現が出現する回数を特定する情報である。項目「出現割合」に対応する情報は、複数の特定分野投稿文群のうち、対応するレコードの表現（例えば、「これはない」、「レベルやろ」等）が出現する特定分野投稿文群の割合を特定する情報である。項目「ウェイト」に対応する情報は、各表現の重みを示す重み特定情報であって、上述した図６に示す要点スコア情報と同一の値が格納される。項目「スコア」に対応する情報は、各表現を要点辞書に含めるか否かの判定指標となるスコアであって、具体的には、項目「出現割合」に対応する値と、項目「ウェイト」に対応する値との乗算によって得られた値を示す情報である。

図７に戻り、ＳＡ５において、要点辞書作成部１０は、ＳＡ４にて作成した要点頻度情報に基づいて図３に示す要点辞書ＤＢ１１を作成する。具体的には、図９に示す要点頻度情報のうち、スコアが所定基準以上のものを、投稿の要点に使用される表現であるものとし、要点表現として要点辞書に格納し、要点辞書ＤＢ１１を作成する。例えば本実施の形態１では、スコアが「０．１００」以上の表現（すなわち、「これはない」、「レベルやろ」、「ならなるで」、「凹んだ」、「わかってるけど」、「ちっとも」）を要点表現とし、スコアが「０．０１０」未満の表現（本実施の形態１では該当なし）を要点表現から除外する。

このように、特定分野投稿文群に含まれる投稿文群のうち、管理者が投稿の要点であると判断した投稿文に含まれる表現を、要点表現として要点辞書ＤＢ１１に格納できるので、管理者の経験に基づく主観を反映させて要点辞書を作成できる。また、特定分野投稿文群の表現の中から、あらゆる分野に共通の表現である図６の共通要点表現と合致する表現を抽出して、対象投稿文群の分野に特有の要点辞書を作成するので、実情に一層即した要点辞書を作成できる。すなわち、日本語一般における表現の特性と、各分野における表現の特性とが必ずしも一致しない場合があるが、本実施の形態１のように共通要点表現を参照して要点辞書を作成することにより、最初から対象投稿文群の分野毎の要点辞書を作成する場合と比べて両方の特性を考慮した解析処理（後述する）が可能となる。また、対象投稿文群と同一分野の特定分野投稿文群における表現の頻度を考慮して要点辞書を作成できるので、頻度に応じた表現の特性を反映させた要点辞書を作成することができ、より実情に即した要点辞書を作成することが可能となる。

（処理−解析処理）
続いて、本実施の形態１に係る解析システム１にて実行される解析処理について説明する。図１０は、解析処理のフローチャートである。この解析処理は、概略的に、対象文の解析を行う処理である。なお、単一の文を解析しても構わないが、本実施の形態１においては、複数の文の集合を含む対象投稿文群を解析するものとして説明する。この解析によって対象投稿文群から具体的に何を特定するかについては任意であるが、本実施の形態１では対象投稿文群の話題及び評価を特定する。ここで、当該解析処理を実行するタイミングは任意であり、本実施の形態１では、入力文取得部７が、様々なユーザのＳＮＳへの投稿を通信部３５、ネットワーク２０、及び通信部６を介して取得し、取得した投稿の中から、現在時刻から所定期間以内（例えば、１日）の投稿であって、「ＸＸＸ」を含む複数の投稿を公知の方法で抽出し、これら複数の投稿を集めて図２に示す対象投稿文群とし、この対象投稿文群の解析を行うものとする。ただし、これに限らず、投稿と同時進行で当該解析処理を実行しても構わない。すなわち、ユーザが端末装置３０の入力部３１を介して「ＸＸＸ」を含む投稿を行った場合、解析システム１は、当該投稿をネットワーク２０を介して取得し、当該投稿を対象投稿文群とし、この対象投稿文群を解析して解析結果をリアルタイムで表示しても構わない。なお、当該解析処理における解析は、上述した要点辞書作成処理にて作成された要点辞書に基づいて行われる。したがって、解析処理は要点辞書作成処理の後に実行される。ただし、解析処理の途中（後述するＳＣ３において対象投稿文群の要点表現を特定する前の段階）で上記の要点辞書作成処理を実行しても構わない。なお、この解析処理は、解析システム１の入力部２を介して所定方法で起動される。以下では、図１０を参照して解析処理について説明する。

（処理−解析処理−要点抽出処理）
ＳＢ１において、要点抽出部８は、要点抽出処理を行う。この要点抽出処理は、概略的に、対象投稿文群の投稿の要点を抽出する処理である。図１１は、要点抽出処理のフローチャートである。以下では、図１１を参照して要点抽出処理について説明する。

ＳＣ１において、要点抽出部８は、対象投稿文群を取得したか否か判定する。具体的には、「ＸＸＸ」を含む複数の投稿を集めた対象投稿文群が入力された場合に、対象投稿文群を取得したと判定する。このようにして、要点抽出部８は、対象投稿文群を取得するまで待機し（ＳＣ１、Ｎｏ）、取得した場合（ＳＣ２、Ｙｅｓ）、ＳＣ３に移行する。

ＳＣ２において、要点抽出部８は、ＳＣ１において取得した対象投稿文群に含まれる表現を抽出する。この抽出の具体的な方法は任意で、例えば図７に示すＳＡ３の処理と同様に、公知の自然言語処理又は形態素解析により、対象投稿文群を品詞属性毎に分解して抽出することができる。

ＳＣ３において、要点抽出部８は、対象投稿文群の要点表現を特定する。具体的には、ＳＣ２において抽出した対象投稿文群の表現と、図３に示す要点辞書ＤＢ１１に格納された要点表現とを対比し、合致する表現を対象投稿文群の要点表現として特定する。例えば、図２に示す対象投稿文群のうち、太枠内の「これはない」、「レベルやろ」、「ならなるで」、「凹んだ」、「わかってるけど」という表現を要点表現として特定したものとする。

ＳＣ４において、要点抽出部８は、ＳＣ３において特定した要点表現を含む文、及び前Ｘ文、後Ｙ文を抽出し、要点投稿文を特定する。ここで、このＸ及びＹの値は、全ての要点表現に共通であっても良いが、本実施の形態１においては要点表現毎に異なる値を用いるものとする。具体的には、要点表現と、Ｘの値と、Ｙの値と、を相互に関連付けて構成されたＸＹテーブル（図示省略）を参照し、ＳＣ３にて特定した要点表現に対応するＸの値とＹの値とを特定する。例えば本実施の形態１では、「これはない」という表現を含む投稿文、及び前１文、後２文（図２において枠ａに含まれる全ての投稿文）と、「レベルやろ」という表現を含む投稿文、及び前０文、後１文（図２において枠ｂに含まれる全ての投稿文）、「ならなるで」という表現を含む投稿文、及び前１文、後０文（図２において枠ｃに含まれる全ての投稿文）、「凹んだ」という表現を含む投稿文、及び前１文、後１文（図２において枠ｄ及び枠ｅに含まれる全ての投稿文）、「わかってるけど」という表現を含む投稿文、及び前０文、後０文（図２において枠ｆに含まれる全ての投稿文）、を要点投稿文として抽出する。すなわち、上述したように、このような要点表現は、要点表現を含む投稿文だけでなく、当該投稿文の前後の投稿文に、投稿の要点となる表現が含まれる可能性が高いため、このように前後の投稿文も必要に応じて併せて抽出する。これにて要点抽出処理を終了し、図１０の解析処理に戻り、ＳＢ２に移行する。

（処理−解析処理−話題特定処理）
ＳＢ２にて、解析部９は、話題特定処理を行う。この話題特定処理は、概略的に、要点抽出処理において抽出した要点投稿文に基づいて、対象投稿文群の話題を特定する処理である。図１２は、話題特定処理のフローチャートである。以下では、図１２を参照して話題特定処理について説明する。

ＳＤ１において、解析部９は、上述した図１１に示す要点抽出処理のＳＣ４にて特定した要点投稿文を形態素解析して、形態素解析結果情報を作成する。図１３は、形態素解析結果情報の構成例である。この図１３に示すように、形態素解析結果情報は、項目「主部表現」に対応する情報と、項目「主部品詞」に対応する情報と、項目「述部表現」に対応する情報と、項目「述部品詞」に対応する情報と、項目「頻度」に対応する情報と、を相互に関連付けて構成されている。項目「主部表現」に対応する情報は、各主部表現を特定する情報である。項目「主部品詞」に対応する情報は、各主部表現の品詞を特定する情報であり、主に「名詞」等の品詞が格納されている。項目「述部表現」に対応する情報は、各述部表現を特定する情報である。項目「述部品詞」に対応する情報は、各述部表現の品詞を特定する情報であり、主に「名詞」や「動詞」や「形容詞」等の品詞が格納されている。「頻度」に対応する情報は、各主部表現と各述部表現との組み合わせが要点投稿文に登場した回数を示す情報である。この図１３に示すように、要点投稿文を形態素解析することにより、要点投稿文に含まれる主部表現と述部表現との組み合わせ、及びその頻度を抽出することができる。

図１２のＳＤ２において、解析部９は、話題表現を含む主部表現及び述部表現の組み合わせを特定する。具体的には、ＳＤ１において作成した形態素解析結果情報における主部表現と述部表現との組み合わせのうち、図４に示す話題辞書の話題表現が主部表現又は述部表現の少なくとも一方に含まれる組み合わせを特定する。例えば、話題表現「使えない」、「使わない」、「できない」、「ダメ」、「スゲー好き」、「悪すぎ」は、いずれも図１３に示す形態素解析情報の項目「述部表現」に含まれているため、当該述部表現を含む組み合わせ（すなわち、主部表現「ＸＸＸ」と述部表現「使えない」との組み合わせ、主部表現「ＸＸＸ」と述部表現「使わない」との組み合わせ、主部表現「一生」と述部表現「使わない」との組み合わせ、主部表現「アプデ」と述部表現「ログインできない」との組み合わせ、主部表現「ＸＸＸ」と述部表現「ダメ」との組み合わせ、主部表現「頃」と述部表現「スゲー好き」との組み合わせ、主部表現「タイミング」と述部表現「悪すぎ」との組み合わせ）を特定する。なお、図１３においては、このように話題表現が含まれる述部表現にハッチングを付して表示している。また、「ログインできない」のように、話題表現「できない」と完全に一致しなくても、話題表現「できない」を一部に含む表現については、話題表現が含まれるものとみなして構わない。

図１２のＳＤ３において、解析部９は、話題結果情報を作成する。具体的には、解析部９は、ＳＤ２にて特定した主部表現と述部表現の組み合わせを抽出してリスト化し、話題結果情報を作成する。図１４は、話題結果情報の構成例である。この図１４に示すように、話題結果情報は、項目「主部表現」に対応する情報と、項目「述部表現」に対応する情報と、を相互に関連づけて格納されている。項目「主部表現」に対応する情報は、各組み合わせの主部表現を特定する情報で、項目「述部表現」に対応する情報は、各組み合わせの述部表現を特定する情報であり、図１４においては計７の組み合わせが格納されている。なお、作成された話題結果情報の利用方法は任意で、例えば出力部３を介して出力することにより対象投稿文群の話題を認識可能としても良いし、どのような話題の問い合わせが多いかの統計を取るための素材としても良い。このように、当該話題特定処理では、投稿の要点に基づいて話題を特定する解析を行うことができるので、要点以外の不要な投稿に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。これにて話題特定処理を終了し、図１０の解析処理に戻り、ＳＢ３に移行する。

（処理−解析処理−評価特定処理）
ＳＢ３において、解析部９は、評価特定処理を行う。この評価特定処理は、概略的に、要点抽出処理において抽出した要点投稿文に基づいて、対象投稿文群の評価を特定する処理である。なお本実施の形態１では、評価として、ユーザの満足度を特定する。図１５は、評価特定処理のフローチャートである。以下では、図１５を参照して評価特定処理について説明する。

ＳＥ１において、解析部９は、各要点投稿文に含まれる表現を抽出する。この抽出の具体的な方法は任意で、例えば図７に示すＳＡ３の処理と同様に、公知の自然言語処理、又は形態素解析により、要点投稿文に含まれる各表現を品詞属性（接頭詞、名詞、動詞、副詞、接続詞、感動詞、助詞等）毎に分解して抽出する。

ＳＥ２において、解析部９は、上記のＳＥ１において抽出した各表現と、図５に示す評価情報とを対比して、評価結果情報を作成する。図１６は、評価結果情報の構成例である。この図１６に示すように、評価結果情報は、項目「評価項目」に対応する情報と、項目「確率」に対応する情報と、項目「判定」に対応する情報と、を相互に関連付けて構成されている。項目「評価項目」に対応する情報は、評価の具体的な内容を特定するための情報であって、図１６においては「満足」と「不満」、及び「意見」と「要望」とが格納されている。

項目「確率」に対応する情報は、対象投稿文群が各評価項目に該当する確率を示している。この確率を算定する方法は任意で、以下に一例を示す。まず、図５における判別が「不満」のレコード（図５においては、「１」、「２」のレコード）を全て抽出し、キーワード毎の出現回数の総和を求める。例えば図５においては、「やっぱり」の総和は「１」、「どうせ」の総和は「１」、「だから」の総和は「２」、「嘘」の総和は「１」となり、他のキーワードの総和は「０」となる。続いて、求めた全ての総和を、抽出した「不満」のレコードの数（図５においては、「２」）で除して、各キーワードの基準ポイント（以下、第１の基準ポイント）を求める。例えば、「やっぱり」の基準ポイントは「０．５」、「どうせ」の基準ポイントは「０．５」、「だから」の基準ポイントは「１」、「嘘」の基準ポイントは「０．５」となり、他のキーワードの基準ポイントは「０」となる。続いて、ＳＥ１において抽出した各要点投稿文を形態素解析してキーワードを抽出し、図５の表の項目「キーワード」と同様の表を作成して、各キーワードの出現回数を求める。そして、上述した第１の基準ポイントの求め方と略同様に、各要点投稿文におけるキーワードの総和を求め、求めた総和を、抽出した要点投稿文の数で除することにより、各キーワードの第２の基準ポイントを求める。最後に、図５の素材文から求めた第１の基準ポイントと、図２の要点投稿文から求めた第２の基準ポイントと、の合致率を算定し、当該合致率に基づいて確率を算定する。ただし、このような算定方法に限らず、その他の要素を考慮して算定しても構わない。例えば、投稿にリンクや画像が有る場合には素材文の信ぴょう性が高いものとし、図５における「リンク有無」や「画像有無」に対応する情報に所定数（例えば、１）以上の数値が格納された投稿のみに基づいて上記の第１の基準ポイントの算定を行っても良い。また、投稿数の多いユーザの投稿は信ぴょう性が高いものとし、図５における「投稿数」に対応する情報に所定数（例えば、１０００）以上の数値が格納された投稿のみに基づいて上記の第１の基準ポイントの算定を行っても良い。また、新しい素材文の方が古い素材文よりも投稿の信ぴょう性が高いものとし、図５における「投稿時刻」に対応する情報に、現在時刻から所定時間（例えば、１０時間）以内の時刻が格納された投稿のみに基づいて上記の第１の基準ポイントの算定を行っても良い。

項目「判定」に対応する情報は、評価の最終的な判定結果を示す情報である。具体的には、評価項目＝「満足」である場合の項目「確率」に対応する値と、評価項目＝「不満」である場合の項目「確率」に対応する値とを比較し、値の大きい方が、最終的な判定結果として当該項目に対応する情報として格納される。なお、作成された評価結果情報の利用方法は任意で、例えば出力部３を介して出力することにより対象投稿文群の評価を認識可能としても良いし、ユーザの満足度の統計を取るための素材としても良い。このように、投稿の要点に基づいて評価を特定する解析を行うことができるので、要点以外の不要な投稿に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。これにて評価特定処理を終了し、図９の解析処理に戻り、解析処理を終了する。

（実施の形態１の効果）
このように、本実施の形態１によれば、要点抽出部８にて抽出した要点表現に基づいて、対象文を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

また、解析システム１と相互に通信可能に接続された端末にてユーザによって入力された文を対象文として解析を行うので、ユーザが例えばＳＮＳ等に投稿した意見や苦情等の文を解析することができ、幅広い多数のユーザの思考を反映させた解析が可能となる。

また、要点抽出部８にて抽出した要点文に基づいて、対象文群を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

また、対象文に含まれる表現と、要点辞書ＤＢ１１に格納された要点表現とを相互に対比することにより、要点表現を抽出するので、要点表現を極めて簡素な構成により抽出することができる。

また、共通要点表現と、特定分野文と、に基づいて特定した共通要点表現の出現頻度に関する情報に基づいて、要点辞書格納手段に要点表現を格納するので、対象文の分野に一層即した要点表現を用いることができ、解析の精度を一層向上させることが可能となる。

また、話題辞書ＤＢ１２に格納された話題表現が主部表現又は述部表現の少なくとも一方に含まれる組み合わせに基づいて、対象文の話題を特定するので、対象文の話題を精度良く特定することが可能となる。

また、対象文に含まれる各表現の出現頻度に関する情報を特定し、当該特定された情報と、評価情報格納手段に格納された評価情報とを対比することにより、対象文の評価を特定するので、対象文の評価を精度良く特定することが可能となる。

（実施の形態２）
続いて、実施の形態２に係る解析システムについて説明する。この実施の形態２は、概略的に、顧客と相談員との会話に基づいて当該会話をテキスト化し、テキスト化された文を解析するシステムに関する。最初に、本実施の形態２に係る解析システムの構成について説明し、その後に、解析システムで行われる処理について説明する。

（構成）
まず、本実施の形態２に係る解析システム４０の構成について説明する。図１７は、本実施の形態２に係る解析システム４０を機能概念的に示すブロック図である。この解析システム４０は、機能概念的に、入力部４１、出力部４２、制御部４３、及び記憶部４４を接続して構成されており、例えば、公知のデスクトップコンピュータ、ノートブックコンピュータ、タブレット型コンピュータ、あるいはスマートフォンを用いて構成されている。

入力部４１は、各種の情報を解析システム４０に入力するための入力手段である。この入力部４１の具体的な構成は任意であり、例えば、マウス、キーボード、あるいはタッチパネルとして構成することができる。

出力部４２は、各種の情報を解析システム４０から出力するための出力手段である。この出力部４２の具体的な構成は任意であり、例えば、公知の液晶ディスプレイや有機ＥＬディスプレイの如きフラットパネルディスプレイとして構成することができる。

制御部４３は、ＣＰＵ（Central Processing Unit）や、このＣＰＵ上で解釈実行される各種のプログラム（ＯＳなどの制御プログラムや各種の処理手順などを規定したプログラム）、及び、所要プログラムや所要データを格納するためのキャッシュメモリを備えて構成される。このＣＰＵ上で解釈実行される各種のプログラムには解析プログラムが含まれ、この解析プログラムは、例えば、ＣＤ−ＲＯＭやＤＶＤを含む任意の記憶媒体に記憶された後、インストールされて記憶部４４に不揮発的に記憶され、ＣＰＵにて解釈実行されることで制御部４３の実質的機能を構成する。

この制御部４３は、機能概念的に、要点抽出部４５、解析部４６、及び要点辞書作成部４７を備えて構成されている。要点抽出部４５は、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段である。特に、以下では、解析対象となる会話文群である対象会話文群に含まれる会話文のうち、対象会話文群の要点を特定するための表現である要点表現を含む会話文である要点会話文を抽出する。図１８は、対象会話文群の構成例である。ここで、「要点表現」とは、対象文の要点において用いられる可能性の高い表現であって、本実施の形態２においては対象会話文群の元となる会話の要点において、顧客や相談員が用いる可能性が高いと考えられる発話の表現である。例えば、要点表現には、「それでは」という表現や、「の件」という表現が含まれる。すなわち、「それでは」という表現の前後や、「の件」という表現の前後には、会話の要点となる表現が含まれる可能性が高く、このような要点となる表現を特定するための指標として、要点表現を用いる。また、「要点会話文」とは、当該要点表現を含む単数の会話文、又は会話文群である。例えば、「それでは携帯電話での電話帳転送の方法についてお伝えいたします。」という会話文や、「かしこまりました。携帯電話の電話帳の転送の件でございますね。」という会話文群が該当する。これらはいずれも「携帯電話での電話帳転送」という会話の要点を含んでいる。

解析部４６は、要点抽出部４５にて抽出された要点表現に基づいて、対象文を解析する解析手段である。要点辞書作成部４７は、後述する図２２に示す要点スコアテーブル５１に格納された共通要点表現と、対象文と同一分野の文である特定分野文とに基づいて、特定分野文に含まれる共通要点表現の出現頻度に関する情報を特定し、当該特定した共通要点表現の出現頻度に関する情報に基づいて、後述する要点辞書ＤＢ４８に要点表現を格納する要点辞書作成手段である。ここで、「共通要点表現」とは、対象文と同一分野に限定されない文の要点を特定するための表現である。具体的には、本実施の形態２に係る分野である「携帯電話の操作説明」に限らず、「車の事故処理」、「機器の操作説明」、「飲食物の苦情」、又は「保険の適用」等の分野においても、文の要点を特定するための表現として用いられるものである。例えば、共通要点表現には、「それでは」、「かどうか」、「確認致します」、「の件」、及び「という点」の５つの表現が含まれる。また、「特定分野文」とは、要点辞書を作成するために用いられる文であり、対象会話文と同一分野の会話文である。すなわち本実施の形態２では「携帯電話の操作説明」の分野における会話文を示す。また、「出現頻度に関する情報」とは、代表的には出現回数であるが、例えば出現回数に基づいて算定した出現割合等も含む概念である。なお、この特定分野文の集合である会話文を、以下では「特定分野会話文群」と称して説明する。なお、これら各部の機能については、各処理と併せて説明する。

記憶部４４は、解析システム４０で実行される各種処理に必要な情報やパラメータを不揮発的に格納する格納手段であり、例えば、ＨＤ（Hard Disk）や半導体メモリにより構成される。この記憶部４４には、要点辞書データベース（以下、データベースをＤＢと称する）４８、話題辞書ＤＢ４９、評価ＤＢ５０、及び要点スコアテーブル５１が格納されている。

要点辞書ＤＢ４８は、複数の要点表現を格納する要点辞書格納手段である。図１９は、要点辞書ＤＢ４８に格納された要点辞書の構成例である。この図１９に示すように、要点辞書は、項目「要点表現」に対応する情報を備えて構成されている。この項目「要点表現」に対応する情報は、要点表現を特定するための要点表現特定情報である。ここで、要点辞書には、要点表現として「それでは」、「かどうか」、「確認致します」、「の件」の要点表現が格納されている。すなわち、本実施の形態２では、これらの要点表現の近傍に会話の要点が存在するものという前提の下に、解析を行う。なお、このような解析の具体的な方法については後述する。また、この要点辞書ＤＢ４８に要点辞書を格納する方法は任意で、本実施の形態２においては、後述する要点辞書作成処理にて格納する。

図１７の話題辞書ＤＢ４９は、素材文の話題を示す話題表現を格納する話題辞書格納手段である。なお、「素材文」とは、当該話題辞書ＤＢ４９に格納される情報や、後述する評価ＤＢ５０に格納される情報を作成するために用いられる文であり、任意の方法で取得した文を用いることができる。ただし、本実施の形態２では、素材文の集合（以下、素材会話文群）を用いるものとし、具体的には、過去に行われた顧客と相談員との会話を公知の方法でテキスト化した文群を用いるものとして説明する。図２０は、話題辞書ＤＢ４９に格納された話題辞書の構成例である。この図２０に示すように、話題辞書は、項目「話題表現」に対応する情報と、項目「話題区分」に対応する情報と、を相互に関連付けて構成されている。項目「話題表現」に対応する情報は、会話文の話題を特定するための表現である話題表現を特定するための話題表現特定情報である。項目「話題区分」に対応する情報は、各話題の区分を特定するための話題区分特定情報である。例えば図２０では、話題表現「操作」の話題区分は「事象」であり、話題表現「エラー」の話題区分は「問題」であり、話題表現「希望」の話題区分は「要望」であることを示している。なお、この話題辞書ＤＢ４９に話題辞書を格納する方法は任意で、本実施の形態２においては、相談員等に入力部４１を介して予め打ち込まれた話題辞書が格納されているものとする。

図１７の評価ＤＢ５０は、素材文に含まれる各表現の出現頻度に関する情報と、素材文の評価と、を相互に関連付けて構成された評価情報を格納する、評価情報格納手段である。特に本実施の形態２においては、連続する複数の会話文群を含む素材会話文群に含まれる各表現の出現頻度に関する情報と、素材会話文群の評価と、を相互に関連付けて構成された評価情報を格納する。図２１は、評価ＤＢ５０に格納された評価情報の構成例である。この図２１に示すように、評価情報は、項目「音声認識ＩＤ」に対応する情報と、項目「ＯＰ文字数」に対応する情報と、項目「ＣＵ文字数」に対応する情報と、項目「ＯＰ／ＣＵ比率」に対応する情報と、項目「通話時間（秒）」に対応する情報と、項目「キーワード」に対応する情報と、項目「判別」に対応する情報と、を相互に関連付けて構成されている。項目「音声認識ＩＤ」に対応する情報は、素材会話文群を一意に識別するための識別情報である。項目「ＯＰ文字数」に対応する情報は、素材会話文群のうち相談員が発した言葉の総文字数を示す情報である。項目「ＣＵ文字数」に対応する情報は、素材会話文群のうち顧客が発した言葉の総文字数を示す情報である。項目「ＯＰ／ＣＵ比率」に対応する情報は、ＣＵ文字数に対するＯＰ文字数の割合を示す情報であり、ＯＰ文字数をＣＵ文字数で除した値が格納されている。項目「通話時間（秒）」に対応する情報は、素材会話文群の元となる顧客と相談員の通話が継続した時間を示す情報である。項目「キーワード」に対応する情報には、小項目として、素材会話文群の評価を特定するための表現及び当該表現の話者（「ＯＰ」又は「ＣＵ」）が格納されている。例えば、「ＯＰ［はい］」の項目は、「相談員」が「はい」と発したことを示している。また、各小項目に対応する情報は、素材会話文群に含まれる各表現の出現回数を示す情報である。項目「判別」に対応する情報は、素材会話文群の元となる会話の評価を示す情報である。この評価については、素材会話文群の元となる会話を行った相談員や、当該会話を聴取した他の相談員等が、会話における顧客の満足度を自ら判断し、当該項目に入力して格納する。なお、本実施の形態２では「満足」又は「不満」の何れかを格納するものとして説明するが、これに限らず例えば満足度を「０〜１００」で数値化したもの等を格納しても構わない。なお、この評価ＤＢ５０に評価情報を格納する方法は任意で、本実施の形態２では、項目「音声認識ＩＤ」に対応する情報と、項目「ＯＰ文字数」に対応する情報と、項目「ＣＵ文字数」に対応する情報と、項目「ＯＰ／ＣＵ比率」に対応する情報と、項目「通話時間（秒）」に対応する情報と、項目「キーワード」に対応する情報と、は素材会話文群を公知の方法で解析することにより格納されており、項目「判別」に対応する情報は上述したように相談員が入力することにより格納されているものとする。

要点スコアテーブル５１は、対象文と同一分野に限定されない文の要点を特定するための表現である共通要点表現を格納する共通要点辞書格納手段である。図２２は、要点スコアテーブル５１に格納された要点スコア情報の構成例である。この図２２に示すように、要点スコア情報は、項目「共通要点表現」に対応する情報と、項目「話者」に対応する情報と、項目「ウェイト」に対応する情報と、を相互に関連付けて構成されている。項目「共通要点表現」に対応する情報は、共通要点表現を特定するための共通要点表現特定情報である。項目「話者」に対応する情報は、各共通要点表現の話者を特定するための話者特定情報であって、具体的には、相談員を示す「ＯＰ」又は顧客を示す「ＣＵ」のいずれかが格納されている。項目「ウェイト」に対応する情報は、各共通要点表現の重みを示す重み特定情報である。例えば、図２２の一番上のレコードは、共通要点表現＝「それでは」が、話者＝「ＯＰ」に使用された際の、当該共通要点表現「それでは」のウェイト＝「０．４０１」であることを示している。本実施の形態２では、ウェイトの数値が大きい程、表現の重み付けが大きい（表現の重要性が大きい）ことを示すものとする。この「重要性」とは、会話文群の要点を特定するための重要性であり、「重要性が大きい」とは、共通要点表現の近傍に会話の要点が存在する可能性が高いことを示す。なお、この要点スコアテーブル５１に共通要点表現を格納する方法は任意で、本実施の形態２においては、相談員等に入力部４１を介して予め打ち込まれた共通要点表現が格納されているものとする。

（処理）
次に、このように構成された解析システム４０において行われる処理について説明する。以下の説明においては、特記する主体を除いて制御部４３にて処理が行われるものとする。また、「ステップ」を「Ｓ」と略記する。

（処理−要点辞書作成処理）
まず、本実施の形態２に係る解析システム４０にて実行される要点辞書作成処理について説明する。図２３は、要点辞書作成処理のフローチャートである。この要点辞書作成処理は、概略的に、上述した図１９に示す要点辞書ＤＢ４８に格納された要点辞書を作成するための処理である。なお、この要点辞書作成処理は、解析システム４０の入力部４１を介して所定方法で起動される。

ＳＦ１において、要点辞書作成部４７は、特定分野会話文群を取得したか否かを判定する。この判定方法は任意で、例えば要点辞書作成部４７は、相談員等によって、特定分野会話文群に関するテキストデータが入力部４１を介して入力されたか否かを判定し、入力された場合に特定分野会話文群を取得したと判定しても良い。ここで、図２４は、特定分野会話文群を示す構成例である。この図２４に示すように、特定分野会話文群は、項目「話者」に対応する情報と、項目「音声認識テキスト」に対応する情報と、を相互に関連付けて構成されている。項目「話者」に対応する情報は、発言の話者を特定する情報であり、項目「音声認識テキスト」は、話者による発言を音声認識してテキスト化したものである。図２３に戻り、要点辞書作成部４７は、特定分野会話文群を取得するまで待機し（ＳＦ１、Ｎｏ）、取得した場合（ＳＦ１、Ｙｅｓ）、ＳＦ２に移行する。

ＳＦ２において、要点辞書作成部４７は、ＳＦ１にて取得した特定分野会話文群に含まれる要点会話文を取得したか否かを判定する。具体的には、まず、相談員が特定分野会話文群を精査し、会話の要点となっている発言を示す会話文を要点会話文として特定し、特定した要点会話文を、入力部４１を介して入力する。例えば、本実施の形態２では、図２４の上から９項目目の「携帯電話の電話帳の転送の件でございますね。」という会話文や、一番下の項目の「それでは携帯電話での電話帳転送の方法についてお伝えいたします。」という会話文等を、要点会話文として特定したことを例に挙げて説明する。そして、要点辞書作成部４７は、この入力があった場合に、要点会話文を取得したと判定する。このようにして、要点辞書作成部４７は、要点会話文を取得するまで待機し（ＳＦ２、Ｎｏ）、取得した場合（ＳＦ２、Ｙｅｓ）、ＳＦ３に移行する。

ＳＦ３において、要点辞書作成部４７は、要点会話文に含まれる表現を抽出する。この抽出の具体的な方法は任意で、例えば、本実施の形態２において要点辞書作成部４７は、公知の自然言語処理又は形態素解析により、要点会話文に含まれる各表現を品詞属性（接頭詞、名詞、動詞、副詞、接続詞、感動詞、助詞等）毎に分解して抽出する。また、各表現を発言した話者を公知の方法（例えば音声の周波数解析等）で特定し、上記のように抽出した表現と相互に対応付けする。

ＳＦ４において、要点辞書作成部４７は、抽出した表現と図２２の要点スコア情報とを対比し、要点頻度情報を作成する。図２５は、要点頻度情報の構成例である。図２５に示すように、要点頻度情報は、項目「表現」に対応する情報と、項目「話者」に対応する情報と、項目「頻度」に対応する情報と、項目「出現割合」に対応する情報と、項目「ウェイト」に対応する情報と、項目「スコア」に対応する情報と、を相互に関連付けて構成されている。ここで、項目「表現」に対応する情報は、図２３のＳＦ３にて抽出した表現のうち、要点スコア情報の項目「共通要点表現」と合致する表現を特定する情報である。項目「話者」に対応する情報は、表現を発言した話者を特定する情報であって、図２３のＳＦ３にて抽出した表現に対応する話者を示す情報である。項目「頻度」に対応する情報は、特定分野会話文群の中に、対応するレコードの表現が出現する回数を特定する情報である。項目「出現割合」に対応する情報は、特定分野会話文群の中に、対応するレコードの表現が出現する割合を特定する情報である。項目「ウェイト」に対応する情報は、各表現の重みを示す重み特定情報であって、上述した図２２に示す要点スコア情報と同一の値が格納される。項目「スコア」に対応する情報は、各表現を要点辞書に含めるか否かの判定指標となるスコアであって、具体的には、項目「出現割合」に対応する値と、項目「ウェイト」に対応する値との乗算によって得られた値を示す情報である。

図２３に戻り、ＳＦ５において、要点辞書作成部４７は、ＳＦ４にて作成した要点頻度情報に基づいて図１９に示す要点辞書ＤＢ４８を作成する。具体的には、図２５に示す要点頻度情報のうち、スコアが所定基準以上のものを、会話の要点に使用される表現であるものとし、要点表現として要点辞書に格納し、要点辞書ＤＢ４８を作成する。例えば本実施の形態２では、スコアが「０．０１０」以上の表現（すなわち、「それでは」、「かどうか」、「確認致します」、「の件」）を要点表現とし、スコアが「０．０１０」未満の表現（すなわち、「という点」）を要点表現から除外する。

このように、特定分野会話文群に含まれる会話文群のうち、相談員が会話の要点であると判断した会話文に含まれる表現を、要点表現として要点辞書ＤＢ４８に格納できるので、相談員の経験に基づく主観を反映させて要点辞書を作成できる。また、特定分野会話文群の表現の中から、あらゆる分野に共通の表現である図２２の共通要点表現と合致する表現を抽出して、対象会話文群の分野に特有の要点辞書を作成するので、実情に一層即した要点辞書を作成できる。すなわち、日本語一般における表現の特性と、各分野における表現の特性とが必ずしも一致しない場合があるが、本実施の形態２のように共通要点表現を参照して要点辞書を作成することにより、最初から対象会話文群の分野毎の要点辞書を作成する場合と比べて両方の特性を考慮した解析処理（後述する）が可能となる。また、対象会話文群と同一分野の特定分野会話文群における表現の頻度を考慮して要点辞書を作成できるので、頻度に応じた表現の特性を反映させた要点辞書を作成することができ、より実情に即した要点辞書を作成することが可能となる。

（処理−解析処理）
続いて、本実施の形態２に係る解析システム４０にて実行される解析処理について説明する。図２６は、解析処理のフローチャートである。この解析処理は、概略的に、対象会話文群の解析を行う処理である。この解析によって対象会話文群から具体的に何を特定するかについては任意であるが、本実施の形態２では対象会話文群の話題及び評価を特定する。ここで、当該解析処理を実行するタイミングは任意であり、本実施の形態２では、顧客と相談員の会話を録音しておき、会話が終了した後に、会話の記録を公知の方法でテキスト化して対象会話文群とし、この対象会話文群の解析を行うものとする。ただし、これに限らず、会話と同時進行で当該解析処理を実行しても構わない。すなわち、顧客と相談員の会話を即座に公知の方法でテキスト化して対象会話文群とし、この対象会話文群を解析して解析結果をリアルタイムで表示しても構わない。なお、当該解析処理における解析は、上述した要点辞書作成処理にて作成された要点辞書に基づいて行われる。したがって、解析処理は要点辞書作成処理の後に実行される。ただし、解析処理の途中（後述するＳＨ３において対象会話文群の要点表現を特定する前の段階）で上記の要点辞書作成処理を実行しても構わない。なお、この解析処理は、解析システム４０の入力部４１を介して所定方法で起動される。以下では、図２６を参照して解析処理について説明する。

（処理−解析処理−要点抽出処理）
ＳＧ１において、要点抽出部４５は、要点抽出処理を行う。この要点抽出処理は、概略的に、対象会話文群の会話の要点を抽出する処理である。図２７は、要点抽出処理のフローチャートである。以下では、図２７を参照して要点抽出処理について説明する。

ＳＨ１において、要点抽出部４５は、対象会話文群を取得したか否か判定する。具体的には、顧客と相談員との会話が公知の方法でテキスト化されて対象会話文群に変換され、当該対象会話文群が入力された場合に、対象会話文群を取得したと判定する。

ＳＨ２において、要点抽出部４５は、ＳＨ１において取得した対象会話文群に含まれる表現を抽出する。この抽出の具体的な方法は任意で、例えば図２３に示すＳＦ３の処理と同様に、公知の自然言語処理又は形態素解析により、対象会話文群を品詞属性毎に分解して抽出することができる。

ＳＨ３において、要点抽出部４５は、対象会話文群の要点表現を特定する。具体的には、ＳＨ２において抽出した対象会話文群の表現と、図１９に示す要点辞書ＤＢ４８に格納された要点表現とを対比し、合致する表現を対象会話文群の要点表現として特定する。例えば、図１８に示す対象会話文群のうち、太枠内の「それでは」という表現と「の件」という表現と、を要点表現として特定したものとする。

ＳＨ４において、要点抽出部４５は、ＳＨ３において特定した要点表現、及び前Ｘ文、後Ｙ文を抽出し、要点会話文を特定する。ここで、このＸ及びＹの値は、全ての要点表現に共通であっても良いが、本実施の形態２においては要点表現毎に異なる値を用いるものとする。具体的には、要点表現と、Ｘの値と、Ｙの値と、を相互に関連付けて構成されたＸＹテーブル（図示省略）を参照し、ＳＨ３にて特定した要点表現に対応するＸの値とＹの値とを特定する。例えば本実施の形態２では、「それでは」という表現を含む会話文、及び前３文、後１文（図１８において一点鎖線内に含まれる全ての会話文）と、「の件」という表現を含む会話文、及び前４文、後１文（図１８において二点鎖線内に含まれる全ての会話文）を要点会話文として抽出する。すなわち、このような要点表現は、要点表現を含む会話文だけでなく、当該会話文の前後の会話文に、会話の要点となる表現が含まれる可能性が高いため、このように前後の会話文を抽出する。これにて要点抽出処理を終了し、図２６の解析処理に戻り、ＳＧ２に移行する。

（処理−解析処理−話題特定処理）
ＳＧ２にて、解析部４６は、話題特定処理を行う。この話題特定処理は、概略的に、要点抽出処理において抽出した要点会話文に基づいて、対象会話文群の話題を特定する処理である。図２８は、話題特定処理のフローチャートである。以下では、図２８を参照して話題特定処理について説明する。

ＳＩ１において、解析部４６は、上述した図２７に示す要点抽出処理のＳＨ４にて特定した要点会話文を形態素解析して、形態素解析結果情報を作成する。図２９は、形態素解析結果情報の構成例である。この図２９に示すように、形態素解析結果情報は、項目「主部表現」に対応する情報と、項目「主部品詞」に対応する情報と、項目「述部表現」に対応する情報と、項目「述部品詞」に対応する情報と、項目「頻度」に対応する情報と、を相互に関連付けて構成されている。項目「主部表現」に対応する情報は、各主部表現を特定する情報である。項目「主部品詞」に対応する情報は、各主部表現の品詞を特定する情報であり、主に「名詞」等の品詞が格納されている。項目「述部表現」に対応する情報は、各述部表現を特定する情報である。項目「述部品詞」に対応する情報は、各述部表現の品詞を特定する情報であり、主に「名詞」や「動詞」等の品詞が格納されている。「頻度」に対応する情報は、各主部表現と各述部表現との組み合わせが要点会話文に登場した回数を示す情報である。この図２９に示すように、要点会話文を形態素解析することにより、要点会話文に含まれる主部表現と述部表現との組み合わせ、及びその頻度を抽出することができる。

ＳＩ２において、解析部４６は、話題表現を含む主部表現及び述部表現の組み合わせを特定する。具体的には、ＳＩ１において作成した形態素解析結果情報における主部表現と述部表現との組み合わせのうち、図２０に示す話題辞書の話題表現が主部表現又は述部表現の少なくとも一方に含まれる組み合わせを特定する。例えば、話題表現「方法」、「したい」、「分からない」は、いずれも図２９に示す形態素解析情報の項目「述部表現」に含まれているため、当該述部表現を含む組み合わせ（すなわち、主部表現「操作」と述部表現「方法」との組み合わせ、主部表現「電話帳」と述部表現「転送したい」との組み合わせ、主部表現「操作」と述部表現「分からない」との組み合わせ）を特定する。なお、図２９においては、このように話題表現が含まれる述部表現にハッチングを付して表示している。また、「転送したい」のように、話題表現「したい」と完全に一致しなくても、話題表現「したい」を一部に含む表現については、話題表現が含まれるものとみなして構わない。

図２８のＳＩ３において、解析部４６は、話題結果情報を作成する。具体的には、解析部４６は、ＳＩ２にて特定した主部表現と述部表現の組み合わせを抽出してリスト化し、話題結果情報を作成する。図３０は、話題結果情報の構成例である。この図３０に示すように、話題結果情報は、項目「主部表現」に対応する情報と、項目「述部表現」に対応する情報と、を相互に関連づけて格納されている。項目「主部表現」に対応する情報は、各組み合わせの主部表現を特定する情報で、項目「述部表現」に対応する情報は、各組み合わせの述部表現を特定する情報であり、図３０においては計１４の組み合わせが格納されている。なお、作成された話題結果情報の利用方法は任意で、例えば出力部４２を介して出力することにより対象会話文群の話題を認識可能としても良いし、どのような話題の問い合わせが多いかの統計を取るための素材としても良い。このように、当該話題特定処理では、会話の要点に基づいて話題を特定する解析を行うことができるので、要点以外の不要な会話に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。これにて話題特定処理を終了し、図２６の解析処理に戻り、ＳＧ３に移行する。

（処理−解析処理−評価特定処理）
ＳＧ３において、解析部４６は、評価特定処理を行う。この評価特定処理は、概略的に、要点抽出処理において抽出した要点会話文に基づいて、対象会話文群の評価を特定する処理である。なお本実施の形態２では、評価として、顧客の満足度を特定する。図３１は、評価特定処理のフローチャートである。以下では、図３１を参照して評価特定処理について説明する。

ＳＪ１において、解析部４６は、要点会話文に含まれる表現を抽出する。この抽出の具体的な方法は任意で、例えば図２３に示すＳＦ３の処理と同様に、公知の自然言語処理、又は形態素解析により、要点会話文に含まれる各表現を品詞属性（接頭詞、名詞、動詞、副詞、接続詞、感動詞、助詞等）毎に分解して抽出する。

ＳＪ２において、解析部４６は、上記のＳＪ１において抽出した各表現と、図２１に示す評価情報とを対比して、評価結果情報を作成する。図３２は、評価結果情報の構成例である。この図３２に示すように、評価結果情報は、項目「評価項目」に対応する情報と、項目「確率」に対応する情報と、項目「判定」に対応する情報と、を相互に関連付けて構成されている。項目「評価項目」に対応する情報は、評価の具体的な内容を特定するための情報であって、図３２においては「満足」と「不満」、及び「解決」と「未解決」とが格納されている。

項目「確率」に対応する情報は、対象会話文群が各評価項目に該当する確率を示している。この確率を算定する方法は任意で、以下に一例を示す。まず、図２１の各キーワードの回数を通話時間で除してキーワード毎に基準ポイントを算定し、次に、レコードの判別が「不満」である全ての素材会話文群（例えば図２１の「１」、「２」、「３」のレコード）においてキーワード毎に基準ポイントの平均値を算定し、また、判別が「満足」である全ての素材会話文群（例えば図２１の「４」、「５」のレコード）においてキーワード毎に基準ポイントの平均値を算定する。続いて、要点会話文に含まれる各表現のキーワード毎の基準ポイントを同様に算定し、当該算定した基準ポイントと、「不満」の基準ポイント及び「満足」の基準ポイントと、の合致率を算定し、当該合致率に基づいて確率を算定する。ただし、このような算定方法に限らず、例えば図２１に示す評価情報における項目「ＯＰ文字数」に対応する情報、項目「ＣＵ文字数」に対応する情報、又は項目「ＯＰＣＵ比率」に対応する情報、に基づいて確率を算定しても良い。

項目「判定」に対応する情報は、評価の最終的な判定結果を示す情報である。具体的には、評価項目＝「満足」である場合の項目「確率」に対応する値と、評価項目＝「不満」である場合の項目「確率」に対応する値とを比較し、値の大きい方が、最終的な判定結果として当該項目に対応する情報として格納される。なお、作成された評価結果情報の利用方法は任意で、例えば出力部４２を介して出力することにより対象会話文群の評価を認識可能としても良いし、顧客の満足度の統計を取るための素材としても良い。このように、会話の要点に基づいて評価を特定する解析を行うことができるので、要点以外の不要な会話に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。これにて評価特定処理を終了し、図２５の解析処理に戻り、解析処理を終了する。

（実施の形態２の効果）
このように、本実施の形態２によれば、要点抽出部４５にて抽出した要点表現に基づいて、対象文を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

また、要点抽出部４５にて抽出した要点文に基づいて、対象文群を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

また、対象文に含まれる表現と、要点辞書ＤＢ４８に格納された要点表現とを相互に対比することにより、要点表現を抽出するので、要点表現を極めて簡素な構成により抽出することができる。

また、話題辞書ＤＢ４９に格納された話題表現が主部表現又は述部表現の少なくとも一方に含まれる組み合わせに基づいて、対象文の話題を特定するので、対象文の話題を精度良く特定することが可能となる。

〔変形例〕
以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。

（解決しようとする課題や発明の効果について）
まず、発明が解決しようとする課題や発明の効果は、前記した内容に限定されるものではなく、本発明によって、前記に記載されていない課題を解決したり、前記に記載されていない効果を奏することもでき、また、記載されている課題の一部のみを解決したり、記載されている効果の一部のみを奏することがある。例えば、解析の精度が従来と同程度の場合であっても、従来と異なる方法にて解析を行うことが出来ている場合には、本願発明の課題が解決されている。

（分散や統合について）
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散したり統合したりして構成できる。例えば、解析システム１、４０の機能を、複数のサーバに分散することもできる。また、解析システム１、４０の記憶部５、４４に記憶されたデータベースについても、任意に分散したり統合したりすることが可能である。

（評価情報について）
上記実施の形態２では、評価情報として顧客の満足度の情報を含むものとして説明したが、これに限らず、例えば顧客が相談にて問題を解決できたか否かの情報を含むものであっても構わない。

（解析処理について）
話題特定処理又は評価特定処理のいずれか一方又は両方を省略してもよく、他の方法で解析を行っても良い。

（解析の対象について）
本実施の形態１において、ＸＸＸという製品名に関する投稿の解析を行うものとして説明したが、これに限られない。例えば同様の処理によって、「製品名」の代わりに、「会社名」、「サービス名」、「地名」、「人名」、「国名」等に関する投稿の解析を行うことも可能である。

（付記）
付記１の解析システムは、文を解析する解析システムであって、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段と、前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析手段と、を備える。

付記２の解析システムは、付記１に記載の解析システムにおいて、当該解析システムと相互に通信可能に接続された端末装置にてユーザによって入力された文を、前記端末装置から通信を介して取得する入力文取得手段を備え、前記要点抽出手段は、前記入力文取得手段にて取得した文を対象文として、当該対象文に基づいて、前記要点表現を抽出する。

付記３の解析システムは、付記２に記載の解析システムにおいて、連続する複数の前記文を含む文群を解析する前記解析システムであって、前記要点抽出手段は、解析対象となる文群である対象文群に含まれる文のうち、前記対象文群の要点を特定するための表現である要点表現を含む文である要点文を抽出し、前記解析手段は、前記要点抽出手段にて抽出された前記要点文に基づいて、前記対象文群を解析する。

付記４の解析システムは、付記１から３のいずれか一項に記載の解析システムにおいて、複数の前記要点表現を格納する要点辞書格納手段を備え、前記要点抽出手段は、前記対象文に含まれる表現と、前記要点辞書格納手段に格納された前記要点表現とを相互に対比することにより、前記対象文に含まれる要点表現を抽出する。

付記５の解析システムは、付記４に記載の解析システムにおいて、前記対象文と同一分野に限定されない文の要点を特定するための表現である共通要点表現を格納する共通要点辞書格納手段と、前記共通要点辞書格納手段に格納された前記共通要点表現と、前記対象文と同一分野の文である特定分野文とに基づいて、前記特定分野文に含まれる前記共通要点表現の出現頻度に関する情報を特定し、当該特定した前記共通要点表現の出現頻度に関する情報に基づいて、前記要点辞書格納手段に前記要点表現を格納する要点辞書作成手段と、を備える。

付記６の解析システムは、付記１から５のいずれか一項に記載の解析システムにおいて、前記対象文の話題に関する解析を行う前記解析システムであって、素材文の話題を示す話題表現を格納する話題辞書格納手段を備え、前記解析手段は、前記要点表現を含む文に含まれる主部表現と述部表現との組み合わせを抽出し、当該抽出した組み合わせのうち、前記話題辞書格納手段に格納された前記話題表現が前記主部表現又は前記述部表現の少なくとも一方に含まれる組み合わせを特定し、当該特定された組み合わせに基づいて、前記対象文の話題を特定する。

付記７の解析システムは、付記１から６のいずれか一項に記載の解析システムにおいて、前記対象文の評価に関する解析を行う前記解析システムであって、素材文に含まれる各表現の出現頻度に関する情報と、前記素材文の評価と、を相互に関連付けて構成された評価情報を格納する、評価情報格納手段を備え、前記解析手段は、前記対象文に含まれる各表現の出現頻度に関する情報を特定し、当該特定された情報と、前記評価情報格納手段に格納された評価情報とを対比することにより、前記対象文の評価を特定する。

付記８の解析方法は、文を解析する解析方法であって、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出工程と、前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析工程と、を含む。

付記９の解析プログラムは、文を解析する解析プログラムであって、コンピュータを、解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段と、前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析手段と、として機能させる。

（付記の効果）
付記１に記載の解析システム、付記８に記載の解析方法、又は付記９に記載の解析プログラムによれば、要点抽出手段にて抽出した要点表現に基づいて、対象文を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

付記２に記載の解析システムによれば、解析システムと相互に通信可能に接続された端末にてユーザによって入力された文を対象文として解析を行うので、ユーザが例えばＳＮＳ等に投稿した意見や苦情等の文を解析することができ、幅広い多数のユーザの思考を反映させた解析が可能となる。

付記３に記載の解析システムによれば、要点抽出手段にて抽出した要点文に基づいて、対象文群を解析するので、解析に不必要な箇所を除外することにより、当該解析に不必要な箇所に基づいて解析の精度が低下してしまうことを防止でき、解析の精度を向上させることが可能となる。

付記４に記載の解析システムによれば、対象文に含まれる表現と、要点辞書格納手段に格納された要点表現とを相互に対比することにより、要点表現を抽出するので、要点表現を極めて簡素な構成により抽出することができる。

付記５に記載の解析システムによれば、共通要点表現と、特定分野文と、に基づいて特定した共通要点表現の出現頻度に関する情報に基づいて、要点辞書格納手段に要点表現を格納するので、対象文の分野に一層即した要点表現を用いることができ、解析の精度を一層向上させることが可能となる。

付記６に記載の解析システムによれば、話題辞書格納手段に格納された話題表現が主部表現又は述部表現の少なくとも一方に含まれる組み合わせに基づいて、対象文の話題を特定するので、対象文の話題を精度良く特定することが可能となる。

付記７に記載の解析システムによれば、対象文に含まれる各表現の出現頻度に関する情報を特定し、当該特定された情報と、評価情報格納手段に格納された評価情報とを対比することにより、対象文の評価を特定するので、対象文の評価を精度良く特定することが可能となる。

１解析システム
２入力部
３出力部
４制御部
５記憶部
６通信部
７入力文取得部
８要点抽出部
９解析部
１０要点辞書作成部
１１要点辞書ＤＢ
１２話題辞書ＤＢ
１３評価ＤＢ
１４要点スコアテーブル
２０ネットワーク
３０端末装置
３１入力部
３２出力部
３３制御部
３４記憶部
３５通信部
４０解析システム
４１入力部
４２出力部
４３制御部
４４記憶部
４５要点抽出部
４６解析部
４７要点辞書作成部
４８要点辞書ＤＢ
４９話題辞書ＤＢ
５０評価ＤＢ
５１要点スコアテーブル

Claims

文を解析する解析システムであって、
解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段と、
前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析手段と、を備える、
解析システム。
当該解析システムと相互に通信可能に接続された端末装置にてユーザによって入力された文を、前記端末装置から通信を介して取得する入力文取得手段を備え、
前記要点抽出手段は、前記入力文取得手段にて取得した文を対象文として、当該対象文に基づいて、前記要点表現を抽出する、
請求項１に記載の解析システム。
連続する複数の前記文を含む文群を解析する前記解析システムであって、
前記要点抽出手段は、解析対象となる文群である対象文群に含まれる文のうち、前記対象文群の要点を特定するための表現である要点表現を含む文である要点文を抽出し、
前記解析手段は、前記要点抽出手段にて抽出された前記要点文に基づいて、前記対象文群を解析する、
請求項１又は２に記載の解析システム。
複数の前記要点表現を格納する要点辞書格納手段を備え、
前記要点抽出手段は、前記対象文に含まれる表現と、前記要点辞書格納手段に格納された前記要点表現とを相互に対比することにより、前記対象文に含まれる要点表現を抽出する、
請求項１から３のいずれか一項に記載の解析システム。
前記対象文と同一分野に限定されない文の要点を特定するための表現である共通要点表現を格納する共通要点辞書格納手段と、
前記共通要点辞書格納手段に格納された前記共通要点表現と、前記対象文と同一分野の文である特定分野文とに基づいて、前記特定分野文に含まれる前記共通要点表現の出現頻度に関する情報を特定し、当該特定した前記共通要点表現の出現頻度に関する情報に基づいて、前記要点辞書格納手段に前記要点表現を格納する要点辞書作成手段と、を備える、
請求項４に記載の解析システム。
前記対象文の話題に関する解析を行う前記解析システムであって、
素材文の話題を示す話題表現を格納する話題辞書格納手段を備え、
前記解析手段は、前記要点表現を含む文に含まれる主部表現と述部表現との組み合わせを抽出し、当該抽出した組み合わせのうち、前記話題辞書格納手段に格納された前記話題表現が前記主部表現又は前記述部表現の少なくとも一方に含まれる組み合わせを特定し、当該特定された組み合わせに基づいて、前記対象文の話題を特定する、
請求項１から５のいずれか一項に記載の解析システム。
前記対象文の評価に関する解析を行う前記解析システムであって、
素材文に含まれる各表現の出現頻度に関する情報と、前記素材文の評価と、を相互に関連付けて構成された評価情報を格納する、評価情報格納手段を備え、
前記解析手段は、前記対象文に含まれる各表現の出現頻度に関する情報を特定し、当該特定された情報と、前記評価情報格納手段に格納された評価情報とを対比することにより、前記対象文の評価を特定する、
請求項１から６のいずれか一項に記載の解析システム。
文を解析する解析方法であって、
解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出工程と、
前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析工程と、を含む、
解析方法。
文を解析する解析プログラムであって、
コンピュータを、
解析対象となる文である対象文のうち、前記対象文の要点を特定するための表現である要点表現を抽出する要点抽出手段と、
前記要点抽出手段にて抽出された前記要点表現に基づいて、前記対象文を解析する解析手段と、
として機能させるための解析プログラム。