JPH1027181A - 文書評価装置 - Google Patents

文書評価装置

Info

Publication number
JPH1027181A
JPH1027181A JP8199542A JP19954296A JPH1027181A JP H1027181 A JPH1027181 A JP H1027181A JP 8199542 A JP8199542 A JP 8199542A JP 19954296 A JP19954296 A JP 19954296A JP H1027181 A JPH1027181 A JP H1027181A
Authority
JP
Japan
Prior art keywords
document
evaluation
expression
keyword
evaluated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8199542A
Other languages
English (en)
Inventor
Yasunori Oda
保憲 黄田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP8199542A priority Critical patent/JPH1027181A/ja
Publication of JPH1027181A publication Critical patent/JPH1027181A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ある文書が別の文書に対して、例えば、どの
ような意見を述べているか、文書の内容の関係にまで踏
み込んで自動的に解析し、評価結果を表示することので
きる文書評価装置を提供する。 【解決手段】 文書評価装置は、文書保持手段が、評価
対象の複数の文書を保持しており、キーワード保持手段
が、評価の基準とする表現内容の言葉をキーワードとし
て、その表現属性と共に保持しているので、評価処理手
段は、評価対象の文書から前記キーワードを検索し、検
出したキーワードの使用頻度を前記表現属性に対応して
計算し、その表現属性の統計分布から文書内容を評価す
る。この評価した結果は、表示手段により、文書内容の
評価結果を表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書評価装置に関
し、特に、文書の内容や、音楽または絵画などのマルチ
メディアを批評するコメントや、文書中の書き込みやア
ノテーションを評価する文書評価装置に関する。
【0002】
【従来の技術】今日、インターネットなどの広域ネット
ワークシステムや、CD−ROMなどのメディアの普及
に伴い、その中で多量の電子文書が流通しつつある。こ
のような電子文書についても、紙の文書と同様に、電子
文書などを読んだ時に、その読書感や意見、コメント等
の書き込みができるシステムが開発されている。このよ
うなシステムにおいては、例えば、書き込まれた書き込
みを付加キーワードとして利用して、書き込みがなされ
た本文を検索したり、分類することができるようになっ
ている(特開平7ー311764号公報参照)。
【0003】この種の文書分類システムの例として、例
えば、特公平5ー82363号公報で提案されているよ
うに、電子メールや文章をキーワードによって自動的に
分類し、その内容の概要を作ったりするシステムがあ
る。
【0004】また、ある文書とある文書の関係を、例え
ば、両方の文書共通にあらわれるキーワードの頻度を利
用して規定し、文書を分類する技術が、様々に開発され
ている。この種の技術に関しては、例えば、特開平7ー
192002号公報,特開平2ー158871号公報,
特開平6ー75995号公報,特開平5ー225247
号公報,特開平6ー82363号公報などが参照でき
る。
【0005】
【発明が解決しようとする課題】ところで、ある文書と
ある文書の関係を見つけることは、自然言語解析が完全
になされるならば、十分に可能であることが理論的には
明らかになっているが、現在の利用可能な技術を用い
て、自然言語解析処理を行うには、多大なコストと時間
を要する。
【0006】文書中に書き込みがあった場合、後で、こ
の文書を見る読者は、その文書中の書き込みの意見が、
本文のどの部分を引用したのか、どの部分に対してその
コメントや意見が述べられているのか、また、文書の本
文に対して同意しているのか同意していないのかを、往
々にして知ることを希望する場合が多い。また、更に
は、これまでのコメントが自分のコメントに近いのか遠
いかを知ることを希望する場合も多い。
【0007】また、コメントの内容は一般的にいって、
本文に同意する部分と賛同しない部分が混在しているも
のであり、全体として、賛成意見(または反対意見)と
言えるけれども、個々の引用された文章に対しては、反
対(または賛成)であったりすることがある。
【0008】このように、ある文書が別の文書に対し
て、例えば、どのような意見を述べているのかを、それ
ぞれの文書そのものを個別に読むことなく、相互の文書
の内容およびそれらの関係を自動的に解析することが所
望される。また、これは、実用的な意味では、複雑で多
大なコストと時間のかかる自然言語解析処理を行わずに
上記のような文書評価を行うことができるようにするこ
とが望まれる。文書評価を行った結果は、グラフィカル
ユーザインターフェースを用いて、それら文書の評価を
読者に分かりやすく表示して、複数の文書の中から利用
者が利用者の欲するものを選択できるようにすることが
希望される。
【0009】本発明は、このような事情を考慮してなさ
れたものであり、本発明の目的は、ある文書が別の文書
に対して、例えば、どのような意見を述べているか、文
書の内容の関係にまで踏み込んで自動的に解析し、その
評価結果を表示することのできる文書評価装置を提供す
ることにある。
【0010】
【課題を解決するための手段】上記のような目的を達成
するため、本発明の文書評価装置は、第1の特徴とし
て、評価対象の複数の文書を保持する文書保持手段(1
1)と、評価の基準とする表現内容の言葉をキーワード
としてその表現属性と共に保持するキーワード保持手段
(12)と、評価対象の文書から前記キーワードを検索
し、検出したキーワードの使用頻度を前記表現属性に対
応して計算し、その表現属性の統計分布から文書内容を
評価する評価処理手段(13)と、文書内容の評価結果
を表示する表示手段(14)とを備えることを特徴とす
る。
【0011】このような特徴を有する文書評価装置にお
いては、文書保持手段が、評価対象の複数の文書を保持
しており、キーワード保持手段が、評価の基準とする表
現内容の言葉をキーワードとして、その表現属性と共に
保持しているので、評価処理手段は、評価対象の文書か
ら前記キーワードを検索し、検出したキーワードの使用
頻度を前記表現属性に対応して計算し、その表現属性の
統計分布から文書内容を評価する。そして、この評価し
た結果は、表示手段により、文書内容の評価結果を表示
する。
【0012】また、本発明の文書評価装置は、第2の特
徴として、評価対象の文書を保持する第1文書保持手段
(91)と、前記第1文書保持手段に保持された評価対
象の文書の中に引用している文書本文を保持する第2文
書保持手段(96)と、前記第1文書保持手段と前記第
2文書保持手段に保持された文書の共通文字列を検出す
る引用文検出手段(97)と、評価の基準とする表現内
容の言葉をキーワードとしてその表現属性と共に保持す
るキーワード保持手段(92)と、評価対象の文書から
前記検索キーワードを検索し、検出したキーワードの使
用頻度を前記表現属性に対応して計算し、その表現属性
の統計分布から文書内容を評価する第1評価処理手段
(93)と、引用文の統計量とキーワードの使用頻度か
ら文書の内容を評価する第2評価処理手段(95)と、
文書内容の評価結果を表示する表示手段(94)とを備
えることを特徴とする。
【0013】このような特徴を有する文書評価装置にお
いては、第1文書保持手段が、評価対象の文書を保持し
ており、第2文書保持手段が、前記第1文書保持手段に
保持された評価対象の文書の中に引用している文書本文
を保持しているので、引用文検出手段が、前記第1文書
保持手段と前記第2文書保持手段に保持された文書の共
通文字列を検出する。また、キーワード保持手段は、評
価の基準とする表現内容の言葉をキーワードとして、そ
の表現属性と共に保持しており、第1評価処理手段が、
評価対象の文書から前記検索キーワードを検索し、検出
したキーワードの使用頻度を前記表現属性に対応して計
算し、その表現属性の統計分布から文書内容を評価す
る。そして続いて、第2評価処理手段が、引用文の統計
量とキーワードの使用頻度から文書の内容を評価する
と、表示手段が、文書内容の評価結果を表示する。これ
により、自動で文書評価を行える。
【0014】
【発明の実施の形態】以下、本発明を実施する場合の形
態について、図面を参照して具体的に説明する。図1
は、本発明の第1の実施例の文書評価装置の要部の構成
を示すブロック図である。図1において、11は文書保
持部、12はキーワード保持部、13は文書評価処理
部、14は出力処理部である。
【0015】文書保持部11には、読者が評価を与えた
文章が記載された文書を保持している。そのような文書
における評価対象の文章は一つの場合もあるし、複数の
場合もある。また、複数の文書の文章を評価と対象とす
る場合もある。キーワード保持部12は、文章の評価の
基準になる単語や用例やその表現形態をキーワードとし
て保持する。この場合、そのキーワードと共に、その表
現属性に対応させて分類して保持する。文書評価処理部
13は、キーワード検索および内容評価の処理を行う。
すなわち、文書評価処理部13は、評価を与えたい文章
が記載されている文書を文書保持部11から受け取り、
評価処理のための基準になるキーワードを、その表現属
性とともにキーワード保持部12から受け取る。そし
て、評価対象の文章に対して、キーワード検索を行い、
その各々のキーワードの表現属性ごとに検索されたキー
ワードの出現頻度を集計し、その統計量を求める。出力
処理部14は、文書評価処理部13で求められた統計量
に基づき、文書評価結果を読者(ユーザ)に表示する。
【0016】このようにして、検出したキーワードの使
用頻度をそのキーワードの表現属性に対応して計算し、
その表現属性の統計分布から文書内容を評価する。この
場合に、表現属性に基づき、キーワードの出現頻度を正
規化し、その統計分布を表示する。キーワード頻度や、
その正規化した値は、対応する表現属性名とともに表示
する。
【0017】図2は、キーワード保持部に保持される文
章評価のためのキーワードの一例を説明する図である。
文章中の賛成意見および反対意見を評価するためのキー
ワードは、図2に示すように、その表現属性として、肯
定的表現21と、否定的表現22とに分けられて登録さ
れ保持される。つまり、ここでの肯定的表現21の表現
属性を有する単語および用例のキーワードとして、「思
う」、「同感」、「同意する」、「賛同する」、「そう
思う」などのキーワードが登録されており、これに対し
て、否定的表現22の表現属性を有する単語および用例
のキーワードとしては、「思わない」、「間違ってい
る」、「同意しない」、「賛同しない」、「そう思わな
い」などのキーワードが登録されている。
【0018】また、図3は、キーワード保持部に保持さ
れる文章評価のための別のキーワードの一例を説明する
図である。文章中の感情的な表現を評価するためのキー
ワードは、図3に示すように、その表現属性として、感
性的表現31と、論理的表現32とに分けられて登録さ
れ保持される。ここでの感性的表現31の表現属性を有
する単語および用例のキーワードとして、「美しい」、
「感激した」、「快適である」、「不愉快である」、
「楽しい」などのキーワードが登録されている。また、
これに対して、論理的表現32の表現属性を有する単語
および用例のキーワードとしては、「厳密である」、
「論理的」、「科学的」、「精密」、「数学のような」
などのキーワードが登録されている。
【0019】この第1の実施例の文書評価装置では、評
価対象とする文書の文章に対して、上記のようなキーワ
ードの検索処理を行い、そのキーワードの出現頻度の統
計的分布から文書評価を行う。図4および図5は、本発
明による文書評価処理の具体例を説明する図である。図
4は、文書評価処理の処理フローを示すブロック図であ
り、図5は、文書評価処理の評価結果を表示する表示例
を示す図である。
【0020】図4を参照すると、評価対象の文章とし
て、コメント文41が与えられると、このコメント文4
1の中の言葉に対して、文書評価処理42により、評価
基準のキーワードの検索処理を行い、その評価結果43
として、検索されたキーワードを表現属性に対応して分
類し、該当するキーワードと共にその出現度数をカウン
トする。これにより、ここでのコメント文41の評価結
果43としては「肯定的表現が2語、否定的表現が1
語、感性的表現が1語、論理的表現は無し」と評価され
る。評価結果は、図5(a)または図5(b)に示すよ
うに、出現度数またはその統計分布として全体に対する
各表現属性の割合を表示出力する。なお、ここでは、意
見評価のみを表示しているが、感情的評価を同時に表示
してもよい。
【0021】この結果、ユーザは、このコメント文の文
章は、肯定的意見であると判定できる。更に、感性的表
現と論理的表現の表現属性による感情的評価も加える
と、感情的な肯定的意見であるのか、または、冷静な論
理的な否定的意見であるのかという評価も判定できる。
このようして、コメント文の文章の内容を評価できるの
で、例えば、記述式のアンケートに対する意見のコメン
ト文が、大量に発生した場合に、特に、コメント文の文
章の内容を読まなくても、コメント文の文章を自動で解
析し、否定的意見についてのみ詳細に内容を検討し、肯
定的意見に対しては詳細な内容の検討を省略することが
できる。これにより、意見集計の作業能率を向上でき
る。
【0022】なお、ここでの文章の評価基準とするキー
ワードは、意見に対する評価基準として肯定的表現およ
び否定的表現の2種類の表現属性に分けているが、2種
類とは限らず、何種類であっても良く、例えば、肯定的
でもなく否定的でもない中間的表現の表現属性のキーワ
ードを設けてもよい。
【0023】また、評価結果の表示出力の形態として、
ここでは、出現度数またはその統計分布として全体に対
する各表現属性の割合の百分率を個別に数値で表示出力
するようにしているが、コメント文の意見評価として、
その百分率の値に対して利用者の決めた所定の閾値によ
り自動判別させて、文書全体として『肯定的』または
『否定的』との2値による評価出力を行ってもよい。こ
れによると、大量のコメント文に対する全体の評価が直
ちに判定できる。
【0024】図6および図7は、文章評価結果の別の表
示例を説明する図である。文章を評価した結果の表示す
る場合、各表現属性の内訳については、例えば、図6に
示すように、その各々の各表現属性のキーワードの出現
度数と百分率を組み合わせて表示するようにしてもよ
い。また、図7に示すように、評価したキーワードの各
表現属性の使用頻度を、各表現属性の組み合わせの百分
率スケール(百分率横棒グラフ)で表示させてもよい。
図6に示す文章評価結果の表示内容と、図7に示す文章
評価結果の表示内容とは、同じ評価結果の内容を示して
いる。
【0025】評価するコメント文が複数である場合、そ
の複数の評価結果を百分率スケールで並べて表示する
と、各コメント文の内容の比較が明確になる。図8は、
複数のコメント文を評価した結果を百分率スケールで表
示する表示画面例を示す図である。図8に示すように、
ここでは、評価された3つのコメント文の評価結果につ
いて、グラフィカルユーザインターフェースによる評価
結果表示ウィンドウを開いて、その表現属性の評価の内
訳の統計分布を、百分率スケールの横棒グラフで表示色
を変えて表示している。このように、複数のコメント文
の評価が、表示画面上に各表現属性の表示色を変えて表
示されると、各コメントの違いが、視覚的に比較でき
る。例えば、コメント3は、論理的表現が50%もあ
り、コメント文は理屈っぽい書き方をしていることがわ
かる。また、コメント2は、否定的表現が多く(50%
であり)、本文に対して否定的見解を表している可能性
が高いことがわかる。これにより、その表示された評価
結果から、コメント文の文書がどの程度肯定的表現を使
用しているとか、否定的表現をどの程度使用していると
かを、読者は容易に判断することが出来る。
【0026】また、このような度数表示,百分率表示に
代えて、例えば、肯定的表現のキーワードの頻度の閾値
判別を行い、出現頻度が60%以上である時は『このコ
メント文は肯定的である』というメッセージを表示し、
40%から60%未満のときは『このコメント文につい
ては肯定的否定的は判断出来ません』というメッセージ
を表示し、また、40%未満のときは『このコメント文
は否定的である』というように、メッセージにより表示
するようにしてもよい。ここでの閾値とする判定値のデ
ータは、予め読者により指定されるものとする。
【0027】このようにして、例えば、音楽のCDに対
する様々な人の批評とか、小説の批評とかいったものの
ように、評価対象の文書が複数ある時にも、上記のよう
な様々な表現属性による内容評価、例えば、どの位に感
情表現を使っているかなどの表内容を、読者(ユーザ)
に提示することができ、この結果、例えば、その評価結
果を所定の評価基準に従って順序づけることにより、読
者が読みたい物を迅速に選択することができる。
【0028】図9は、本発明の第2の実施例の文書評価
システムの構成を示すブロック図である。図9におい
て、91はコメント文保持部、92はキーワード保持
部、93はキーワード検索処理部、94は出力処理部、
95は文書内容評価処理部、96は文書本文格納部、9
7は引用文検出処理部である。
【0029】コメント文保持部91は、読者が評価を与
えた評価対象の文章のコメント文を保持している。キー
ワード保持部92は、第1の実施例のキーワード保持部
12と同様に、文章の評価の基準になる単語や用例やそ
の表現形態をキーワードとして保持する。この場合、そ
のキーワードは、その表現属性と共に、その表現属性に
対応させて分類して保持する。キーワード検索処理部9
3は、キーワード検索および内容評価の処理を行う。つ
まり、キーワード検索処理部93は、第1実施例の文書
評価処理部13と同様に、評価を与えたい文章のコメン
ト文をコメント文保持部91から受け取り、評価処理の
ための基準になるキーワードを、その表現属性とともに
キーワード保持部92から受け取る。そして、評価対象
のコメント文の文章に対して、キーワード検索を行い、
その各々のキーワードの表現属性ごとに検索されたキー
ワードの出現頻度を集計し、その統計量を求める。
【0030】また、文書本文格納部96は、コメント文
保持部91に保持された評価対象の文書の中に引用され
ている文書を格納している。引用文検出処理部97は、
コメント文保持部91と文書本文格納部96に保持され
た文書の共通文字列を検出するので、文書内容評価処理
部95が、引用文検出処理部97により検出された共通
文字列の引用文の統計量を算出し、この統計量と、キー
ワード検索処理部93により求められたキーワードの使
用頻度から、文書の内容を評価する評価データを作成す
る。そして、出力処理部94が、グラフィカルユーザイ
ンターフェースを用いて、文書内容評価処理部95によ
り作成された評価データの文書内容の評価結果を見やす
い形式で表示する。
【0031】このように、この第2の実施例において
は、評価基準の単語または用例のキーワード検索に加え
て、コメント文の中に引用されている引用文の文字列を
検出して、この引用文の文字列の統計量の分布を文書評
価に加えている。文書内容評価処理部95では、引用文
検出処理部97で検出された第1の評価結果と、キーワ
ード検索処理部93で検出された第2の評価結果から文
書内容評価に必要なものを抽出および計算して、評価デ
ータを生成し、その評価データを出力表示部94に送
る。出力表示部94はこれら評価データをユーザに見や
すい形式で表示する。
【0032】図10は、本発明の第2の実施例の文書評
価システムの動作を説明する処理フローを示すブロック
図である。図10に示すように、読者が読みたいと思っ
ている文書の本文101は、文書本文格納部96に格納
されており、また、評価対象のコメント文102は、コ
メント文保持部91にが保持されている。このコメント
文102は、文書の本文101に対するアノテーション
や、コメント、書き込み文などである。
【0033】このような文書の本文101およびコメン
ト文102に対して、引用文検出処理103を行い、こ
れらの文章の文字列を読み込んで、パターンマッチング
処理を行い、コメント文102内でのテキストと同じ言
葉が使われているものを検出する。特に、ここでは連続
文字列(文字のラン)の長さが“2”以上であるものを
検出する。ここで検出する文字列の長さの値は、デフォ
ルト値として“2”以上であるものとしているが、勿
論、利用者が自由に設定変更できる。この場合、引用文
検出処理103で検出された連続文字列の長さが長けれ
ば長いほど、文章評価としては、コメント文102に本
文101のテキストの文章が多く引用されたと評価でき
る。
【0034】これらの処理の結果として引用文検出結果
104が得られるので、これらの結果データを受け取
り、更に文書評価処理105を行い、引用文の文字列分
布の文書評価結果106を得る。そして、これらの文書
評価の結果を出力処理部94により、利用者に分かりや
すい形態で表示出力する。ここでの引用文検出結果10
4によると、5個の引用文が検出され、更に、この引用
文の文字列の文字のランについての分布の統計量が求め
られる。この結果、文書評価結果106として、26文
字、20文字、6文字、8文字、2文字の各引用文が1
つずつ検出された評価が得られる。これらは、次に説明
するように、評価された文書の評価結果について、グラ
フィカルユーザインターフェースによる評価結果表示ウ
ィンドウを開いて、その表現属性の評価の内訳の統計分
布と、引用文の文字列分布が、文書評価として表示され
る。
【0035】また、キーワード検索処理107では、前
述した第1の実施例の文書評価処理42と同様に、コメ
ント文102に対して、各表現属性のキーワードについ
ての検索処理を行い、表現属性に対応して、その統計分
布の文章評価結果108を作成する。すなわち、ここで
のキーワード検索処理107では、コメント文102の
中から、表現属性が否定的表現である『間違っている』
と『思えない』の2つのキーワードを検出し、表現属性
が肯定的表現である『本当である』の1つのキーワード
を検出し、その統計量が文章評価結果108として得ら
れたものとなっている。
【0036】図11は、引用文評価を加えて評価を行っ
た文書評価結果の表示例を示す図である。図11に示す
ように、ここでは、前述した各々の表現属性に対応した
キーワード検索の文章評価結果に加えて、引用文の文字
列分布の評価結果が表示されている。この引用文の文字
列分布としては、各文字数の出現頻度を棒グラフにより
表示する。これにより、利用者のその分布が一目で理解
できるようになる。
【0037】また、このような文書評価の結果は、前述
のように、文字列分布の内訳を、そのまま頻度数の度数
表示(数値)により、そのまま表示するようにしてもよ
い。これにより、連続文字列の長さの頻度を表示するこ
とで、どの長さから実際の引用が行われたかを利用者が
容易に判断できる。また、引用文の検出結果は、結果表
示のためのサブウィンドウを開いて、評価対象のコメン
ト文をそのまま表示し、その中で、図10に示したよう
に、検出された引用文の文字列をコメント文の中にアン
ダーラインを付けて表示し、また、対応の引用文の文字
列部分を明確に区別できるようにハイライトして表示す
るようにしてもよい。
【0038】また、その場合、ハイライトする引用文
は、文字列の長さの閾値を設定することによって、所定
の文字数以上のものだけを明示的に表示させるようにも
できる。また、文字列の長さの閾値を、単語および用例
などとの区別ができるような数値とし、その評価結果
は、『引用あり』または『引用無し』の2値の表示とし
てもよい。
【0039】このような引用文の共通文字列の文字数の
分布の表示と、表現属性の統計量の表示により、利用者
は、評価対象のコメント文における共通文字列(引用
文)の出現位置やキーワードの出現位置にかかわらず、
否定的表現が多く、また引用した文字列が多いことか
ら、例えば、コメント文を読む前に当該コメント文が批
評を受けた文書に比較的「同意していない」ことが分か
る。
【0040】また、複数のコメント文に対しては、前述
した第1の実施例の場合と同様に、これらの文書評価結
果を、各コメント文ごとに評価結果をソートして表示す
るようにすればよい。つまり、複数のコメント文につい
て、引用文の文字数の出現頻度と表現属性ごとのキーワ
ードの使用の統計量の分布の値から、これらにしたがっ
てソートすることにより、コメント文を全て読むことな
く、読みたいコメントを選択することができる。
【0041】また、ここでの複数のコメント文に対する
文書評価を行う場合に、その中の1つのコメント文を自
己のコメント文とすることによって、例えば、自己のコ
メント文に対しても同様に文書評価を行い、自己のコメ
ントと他人のコメントを比較対照させることもできる。
また、引用文の出現位置と、肯定的表現または否定的表
現のキーワードの出現位置を正確に検出して、その対応
を明らかにすることによって、より正確にコメントが同
意的であるか非同意的であるかを判断できるようにも構
成できる。
【0042】
【発明の効果】以上、説明したように、本発明の文書評
価装置によれば、ある文書に対するコメント(書き込
み、アノテーション)があった場合に、それらがどのよ
うな感性的状態で書かれてあるかを評価して表示でき
る。また、コメントが本文に対してどの程度同意的であ
るか、または非同意的に書かれてあるかを、多大な時間
とコストを必要とする自然言語解析の手法を用いること
なく自動的に評価して、その評価結果を視覚的に表示で
きる。これにより、非常に大量のコメント文が発生した
場合に、読者となる利用者は興味のあるコメント文につ
いて、特に、個別に逐一コメント文を読むことなく選択
することが可能になる。
【図面の簡単な説明】
【図1】 図1は本発明の第1の実施例の文書評価装置
の要部の構成を示すブロック図、
【図2】 図2はキーワード保持部に保持される文章評
価のためのキーワードの一例を説明する図、
【図3】 図3はキーワード保持部に保持される文章評
価のための別のキーワードの一例を説明する図、
【図4】 図4は文書評価処理の処理フローを示すブロ
ック図、
【図5】 図5は文書評価処理の評価結果を表示する表
示例を示す図、
【図6】 図6は文章評価結果の別の表示例を説明する
図、
【図7】 図7は文章評価結果の更に別の表示例を説明
する図、
【図8】 図8は複数のコメント文を評価した結果を百
分率スケールで表示する表示画面例を示す図、
【図9】 図9は本発明の第2の実施例の文書評価シス
テムの構成を示すブロック図、
【図10】 図10は本発明の第2の実施例の文書評価
システムの動作を説明する処理フローを示すブロック
図、
【図11】 図11は引用文評価を加えて評価を行った
文書評価結果の表示例を示す図である。
【符号の説明】
11…文書保持部、12…キーワード保持部、13…文
書評価処理部、14…出力処理部、91…コメント文保
持部、92…キーワード保持部、93…キーワード検索
処理部、94…出力処理部、95…文書評価処理部、9
6…文書本文格納部、97…引用文検出処理部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 評価対象の複数の文書を保持する文書保
    持手段と、 評価の基準とする表現内容の言葉をキーワードとしてそ
    の表現属性と共に保持するキーワード保持手段と、 評価対象の文書から前記キーワードを検索し、検出した
    キーワードの使用頻度を前記表現属性に対応して計算
    し、その表現属性の統計分布から文書内容を評価する評
    価処理手段と、 文書内容の評価結果を表示する表示手段とを備えること
    を特徴とする文書評価装置。
  2. 【請求項2】 評価対象の文書を保持する第1文書保持
    手段と、 前記第1文書保持手段に保持された評価対象の文書の中
    に引用している文書本文を保持する第2文書保持手段
    と、 前記第1文書保持手段と前記第2文書保持手段に保持さ
    れた文書の共通文字列を検出する引用文検出手段と、 評価の基準とする表現内容の言葉をキーワードとしてそ
    の表現属性と共に保持するキーワード保持手段と、 評価対象の文書から前記検索キーワードを検索し、検出
    したキーワードの使用頻度を前記表現属性に対応して計
    算し、その表現属性の統計分布から文書内容を評価する
    第1評価処理手段と、 引用文の統計量とキーワードの使用頻度から文書の内容
    を評価する第2評価処理手段と、 文書内容の評価結果を表示する表示手段とを備えること
    を特徴とする文書評価装置。
JP8199542A 1996-07-11 1996-07-11 文書評価装置 Pending JPH1027181A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8199542A JPH1027181A (ja) 1996-07-11 1996-07-11 文書評価装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8199542A JPH1027181A (ja) 1996-07-11 1996-07-11 文書評価装置

Publications (1)

Publication Number Publication Date
JPH1027181A true JPH1027181A (ja) 1998-01-27

Family

ID=16409565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8199542A Pending JPH1027181A (ja) 1996-07-11 1996-07-11 文書評価装置

Country Status (1)

Country Link
JP (1) JPH1027181A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001250019A (ja) * 1999-12-28 2001-09-14 Syst Integureeshiyon Kk コンテンツの評価装置、評価方法、評価結果の取得方法及び記録媒体
JP2004178123A (ja) * 2002-11-26 2004-06-24 Hitachi Ltd 情報処理装置、該情報処理装置を実現するためのプログラム
JP2006252090A (ja) * 2005-03-10 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体
JP2007529824A (ja) * 2004-03-15 2007-10-25 ヤフー! インコーポレイテッド ユーザ注釈を一体化したサーチシステム及び方法
JP2007323238A (ja) * 2006-05-31 2007-12-13 National Institute Of Information & Communication Technology 強調表示装置及びプログラム
JP2008077543A (ja) * 2006-09-25 2008-04-03 Fujitsu Ltd レポート引用元情報取得装置、レポート引用元情報取得方法及びレポート引用元情報取得プログラム
JP2008139948A (ja) * 2006-11-30 2008-06-19 Olympus Imaging Corp 投稿画像評価装置、投稿画像評価方法および画像表示装置
KR101078907B1 (ko) 2009-02-02 2011-11-01 엘지전자 주식회사 문서 평가 시스템
JP2012008874A (ja) * 2010-06-25 2012-01-12 Kddi Corp 画像選定装置、方法及びプログラム
JP2012164356A (ja) * 2012-05-21 2012-08-30 Olympus Imaging Corp 画像表示システムおよびカメラ
JP2012226782A (ja) * 2012-08-09 2012-11-15 Olympus Imaging Corp 画像表示装置および投稿画像評価装置
JP5156879B1 (ja) * 2011-08-25 2013-03-06 パナソニック株式会社 情報提示制御装置及び情報提示制御方法
US9740681B2 (en) 2012-04-25 2017-08-22 International Business Machines Corporation Method for classifying pieces of text on basis of evaluation polarity, computer program product, and computer
JP2018045690A (ja) * 2016-09-09 2018-03-22 ファインディ株式会社 文書作成支援システム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001250019A (ja) * 1999-12-28 2001-09-14 Syst Integureeshiyon Kk コンテンツの評価装置、評価方法、評価結果の取得方法及び記録媒体
JP4550996B2 (ja) * 1999-12-28 2010-09-22 システム・インテグレーション株式会社 コンテンツの評価装置、評価方法及び記録媒体
JP2004178123A (ja) * 2002-11-26 2004-06-24 Hitachi Ltd 情報処理装置、該情報処理装置を実現するためのプログラム
JP2007529824A (ja) * 2004-03-15 2007-10-25 ヤフー! インコーポレイテッド ユーザ注釈を一体化したサーチシステム及び方法
JP4513098B2 (ja) * 2005-03-10 2010-07-28 日本電信電話株式会社 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体
JP2006252090A (ja) * 2005-03-10 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体
JP2007323238A (ja) * 2006-05-31 2007-12-13 National Institute Of Information & Communication Technology 強調表示装置及びプログラム
JP2008077543A (ja) * 2006-09-25 2008-04-03 Fujitsu Ltd レポート引用元情報取得装置、レポート引用元情報取得方法及びレポート引用元情報取得プログラム
JP2008139948A (ja) * 2006-11-30 2008-06-19 Olympus Imaging Corp 投稿画像評価装置、投稿画像評価方法および画像表示装置
KR101078907B1 (ko) 2009-02-02 2011-11-01 엘지전자 주식회사 문서 평가 시스템
JP2012008874A (ja) * 2010-06-25 2012-01-12 Kddi Corp 画像選定装置、方法及びプログラム
JP5156879B1 (ja) * 2011-08-25 2013-03-06 パナソニック株式会社 情報提示制御装置及び情報提示制御方法
US9059882B2 (en) 2011-08-25 2015-06-16 Panasonic Intellectual Management Co., Ltd. Information presentation control device and information presentation control method
US9740681B2 (en) 2012-04-25 2017-08-22 International Business Machines Corporation Method for classifying pieces of text on basis of evaluation polarity, computer program product, and computer
JP2012164356A (ja) * 2012-05-21 2012-08-30 Olympus Imaging Corp 画像表示システムおよびカメラ
JP2012226782A (ja) * 2012-08-09 2012-11-15 Olympus Imaging Corp 画像表示装置および投稿画像評価装置
JP2018045690A (ja) * 2016-09-09 2018-03-22 ファインディ株式会社 文書作成支援システム

Similar Documents

Publication Publication Date Title
Egbert et al. Incorporating text dispersion into keyword analyses
US7788086B2 (en) Method and apparatus for processing sentiment-bearing text
US7788087B2 (en) System for processing sentiment-bearing text
Görg et al. Combining computational analyses and interactive visualization for document exploration and sensemaking in jigsaw
US7120613B2 (en) Solution data edit processing apparatus and method, and automatic summarization processing apparatus and method
JP5160601B2 (ja) 相対頻度に基づくフレーズマイニングのためのシステム、方法、及び装置
Novakova et al. Phraseology and style in subgenres of the novel: a synthesis of corpus and literary perspectives
KR20190076381A (ko) 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
JPH1027181A (ja) 文書評価装置
Rachatasumrit et al. Citeread: Integrating localized citation contexts into scientific paper reading
WO2018182501A1 (en) Method and system of intelligent semtiment and emotion sensing with adaptive learning
Al Qundus et al. Exploring the impact of short-text complexity and structure on its quality in social media
CN112307336A (zh) 热点资讯挖掘与预览方法、装置、计算机设备及存储介质
Singh et al. Opinion mining and analysis of movie reviews
Jeaco Key words when text forms the unit of study: Sizing up the effects of different measures
Moura et al. Automated fake news detection using computational forensic linguistics
Montoro et al. Subordination as a potential marker of complexity in serious and popular fiction: a corpus stylistic approach to the testing of literary critical claims
KR102351745B1 (ko) 사용자 리뷰 기반 평점 재산정 장치 및 방법
Hoek et al. Automatic coherence analysis of Dutch: Testing the subjectivity hypothesis on a larger scale
JP2007323238A (ja) 強調表示装置及びプログラム
Ho-Dac et al. Exploring Wikipedia talk pages for conflict detection
De Clercq et al. Identifying disputed topics in the news
Sanda et al. Opinion mining feature-level using Naive Bayes and feature extraction based analysis dependencies
KR101409386B1 (ko) 웹 페이지 분석 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050802