JP2007233947A - 一貫した文脈を持つ広範な文章等の評価方法及び評価システム - Google Patents

一貫した文脈を持つ広範な文章等の評価方法及び評価システム Download PDF

Info

Publication number
JP2007233947A
JP2007233947A JP2006058041A JP2006058041A JP2007233947A JP 2007233947 A JP2007233947 A JP 2007233947A JP 2006058041 A JP2006058041 A JP 2006058041A JP 2006058041 A JP2006058041 A JP 2006058041A JP 2007233947 A JP2007233947 A JP 2007233947A
Authority
JP
Japan
Prior art keywords
value
text
topic
specific
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006058041A
Other languages
English (en)
Inventor
Yasuhide Yamauchi
康英 山内
Masahiro Funahashi
正浩 舟橋
Tadashi Komatsu
正 小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2006058041A priority Critical patent/JP2007233947A/ja
Publication of JP2007233947A publication Critical patent/JP2007233947A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【目的】会議等のように略一貫した文脈を持つ広範な文章の内容を評価する方法及びシステムを提供する。
【構成】文章が電子化されたもの又は前記文章を電子データ化したものを用い、電子データ化した文章のログを採取し、ログからパラグラフにしたテキストを作成し、テキストを、形態素解析ソフトにより形態素(品詞)単位に分解し、助詞、副詞、無意味記号を排除し、分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、上位のリンク数を解析して抽出し、ランク(順位)付けし、ランク(順位)をx軸とし、リンク数をy軸とするべき乗分布を示す対数グラフを作成し、べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とし、得られた値から前記文章等を評価することを特徴とする。
【選択図】 図1

Description

本発明は一貫した文脈を持つ広範な文章等の評価方法及び評価システムに関し、詳しくは電子会議の議事録の発言ログ等の一貫した文脈を持つ広範な文章の内容をべき乗則を用いて評価する方法及びシステムに関する。
会議等のように1つないし複数の議題に対する議論がなされた場合、当該議題に対する議論が充分になされたか否か、どの程度まで議論されたか等を一概に判断することは困難であり、どの時点をもって会議終了とするか、或いは会議を継続又は延長するか、又は再会議を開くか等の見極めは難しいものとなっている。
ところで、近年、会議等の議論に電子会議の利用が増えている。電子会議を利用した会議は、議題に対する議事内容である会議参加者の発言が電子データ化されたログとして記録・蓄積することが可能である。
こうした電子会議の発言や、電子掲示板やメーリングリスト等の電子化されたログを記録・蓄積したものでは、発言者・日付時間・発言内容等の各情報を自然言語等を利用して検索するシステムが既に利用されている。
しかし、この検索システムでは文章内において特定の言葉の使用の有無や使用箇所を特定することができるだけであり、文章内容に対する分析を行うことはできない。
電子化されて記録・蓄積されたログから特定の言葉等を分析する技術としては、特許文献1及び2等に記載の技術が知られている。
特許文献1には、複数の組織間で伝達される電子メールのログから、該電子メールのメッセージに含まれる特長的な表現の影響を判断することにより、複数の組織間の影響度を分析する技術が記載されている。
特許文献2には、電子メール・メーリングリスト・電子掲示板・チャット・電子会議等の組織コミュニケーションのログを分析し、イベント等の影響度を分析する技術が記載されている。
特開2005−242851 特開2003−085347
特許文献1及び2の技術は、ログ中の特定の言葉等を基点とする影響度の分析であり、ログの元となる文章全体の評価を行うようなものではない。従って、会議等のように1つないし複数の議題に対する議論がなされた場合の当該議題に対して議論が充分になされたか否か、どの程度まで議論されたか等の議論の進捗状況等の判断に用いることはできないものである。
そこで本発明の課題は、会議等のように1つないし複数の議題に対する議論がなされた場合の当該議題に対して議論が充分になされたか否か、どの程度まで議論されたか等の議論の進捗状況等の判断に用いることができる一貫した文脈を持つ広範な文章の評価方法及び評価システムを提供することにある。
上記課題を解決する本発明は下記構成を有する。
1.一貫した文脈を持つ広範な文章の評価方法であって、
前記文章が電子化されたもの又は前記文章を電子データ化したものを用い、
電子データ化した文章のログを採取し、
採取したログからパラグラフにしたテキストを作成し、
作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解し、
分解した形態素から助詞、副詞、無意味記号を排除し、
分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出し、
抽出した特定数の上位のリンク数をランク(順位)付けし、
前記ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを作成し、
べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とし、
得られたb値及び/又はr値から前記文章等を評価することを特徴とする一貫した文脈を持つ広範な文章の評価方法。
2.前記評価が、下記の評価基準(a)〜(d)により評価されることを特徴とする上記1に記載の一貫した文脈を持つ広範な文章の評価方法。
[評価基準]
(a)b値が小(原点に対して回帰直線の傾きが緩やか)のとき、言葉の関連に隔たりが無く話題が広がっている状態を示す。
(b)b値が大(原点に対して回帰直線の傾きが急)のとき、特定の言葉に偏っており話題が集中している状態を示す。
(c)r値は特定の話題の収束度であり、該r値が大のとき前記特定の話題が収束にむかっている乃至は収束している状態を示す。
(d)r値は特定の話題の収束度であり、該r値が小のとき前記特定の話題が未だ収束していない状態を示す。
3.経験値、過去の評価結果の値、予測値の少なくとも一つの値からなる操作変数を設定することにより前記b値及び/又はr値の調整を行うことを特徴とする上記1又は2に記載の一貫した文脈を持つ広範な文章の評価方法。
4.前記一貫した文脈を持つ広範な文章が、電子会議における議事内容(発言)、パブリックコメント、会議における議事内容、研究論文・批評・評論・白書・小説・物語等の一般的文書のいずれかであることを特徴とする上記1〜3のいずれかに記載の一貫した文脈を持つ広範な文章の評価方法。
5.一貫した文脈を持つ広範な文章の評価システムであって、
前記文章が電子化されたもの又は前記文章を電子データ化したものを用いて該電子データ化した文章からログを採取する手段と、
採取したログからパラグラフにしたテキストを作成する手段と、
作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解する手段と、
分解した形態素から助詞、副詞、無意味記号を排除する手段と、
分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出する手段と、
抽出した特定数の上位のリンク数をランク(順位)付けする手段と、
前記ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを作成する手段と、
べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とする前記文章等を評価する数値を算出する手段と
を有して構成されることを特徴とする一貫した文脈を持つ広範な文章の評価システム。
6.前記評価する数値が、下記の評価基準(a)〜(d)により評価されることを特徴とする上記5に記載の一貫した文脈を持つ広範な文章の評価システム。
[評価基準]
(a)b値が小(原点に対して回帰直線の傾きが緩やか)のとき、言葉の関連に隔たりが無く話題が広がっている状態を示す。
(b)b値が大(原点に対して回帰直線の傾きが急)のとき、特定の言葉に偏っており話題が集中している状態を示す。
(c)r値は特定の話題の収束度であり、該r値が大のとき前記特定の話題が収束にむかっている乃至は収束している状態を示す。
(d)r値は特定の話題の収束度であり、該r値が小のとき前記特定の話題が未だ収束していない状態を示す。
7.経験値、過去の評価結果の値、予測値の少なくとも一つの値からなる操作変数を設定することにより前記b値及び/又はr値の調整を行う調整手段を有することを特徴とする上記5又は6に記載の一貫した文脈を持つ広範な文章の評価システム。
8.前記一貫した文脈を持つ広範な文章が、電子会議における議事内容(発言)、パブリックコメント、会議における議事内容、研究論文・批評・評論・白書・小説・物語等の一般的文書のいずれかであることを特徴とする上記5〜7のいずれかに記載の一貫した文脈を持つ広範な文章の評価システム。
尚、本発明に係る評価方法は、次のステップを有するものとして表現することも可能である。
一貫した文脈を持つ広範な文章の評価方法であって、
前記文章が電子化されたもの又は前記文章を電子データ化したものを用い、
電子データ化した文章のログを採取するステップと、
採取したログからパラグラフにしたテキストを作成するステップと、
作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解するステップと、
分解した形態素から助詞、副詞、無意味記号を排除するステップと、
分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出するステップと、
抽出した特定数の上位のリンク数をランク(順位)付けするステップと、
前記ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを作成するステップと、
べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とし、
得られたb値及び/又はr値を得るステップとを有し、
事前に決定された基準値を基に数値判断して前記文章等を評価することを特徴とする一貫した文脈を持つ広範な文章の評価方法。
請求項1又は5に示す発明によれば、会議等のように1つないし複数の議題に対する議論がなされた場合の当該議題に対して議論が充分になされたか否か、どの程度まで議論されたか等の議論の進捗状況等の判断に用いることができる一貫した文脈を持つ広範な文章の評価方法及び評価システムを提供することができる。
請求項2又は6に示す発明によれば、特定の評価基準である前記(a)〜(d)により評価する構成により、文章中の話題の広がり又は集中度、話題の収束度から一貫した文脈を持つ広範な文章を評価することができる。
請求項3又は7に示す発明によれば、経験値、過去の評価結果の値、予測値の少なくとも一つの値からなる操作変数を設定することにより前記b値及び/又はr値の調整を行う構成により、評価の確度を向上させることができる。
請求項4又は8に示す発明によれば、電子会議における議事内容(発言)に限らず、パブリックコメント、会議における議事内容をログ化したもの、研究論文・批評・評論・白書・小説・物語等の一般的文書等のように一貫した文脈を持つ文章であれば、当該文章の評価を行うことができる。
本発明に係る一貫した文脈を持つ広範な文章の評価方法及び評価システムは、電子会議における議事内容(発言)、パブリックコメント、会議における議事内容、研究論文・批評・評論・白書・小説・物語等の一般的文書の如き一貫した文脈を持つ広範な文章の評価を行う方法及びシステムであり、例えば、一貫した文脈を持つ広範な文章が電子会議における議事内容(発言)であれば、1つないし複数の議題に対する議論がなされた場合の当該議題に対して議論が充分になされたか否か、どの程度まで議論されたか等の議論の進捗状況等の判断を行うことができるものである。
以下、一貫した文脈を持つ広範な文章が電子会議における議事内容(発言)である場合の実施例を説明する。
図1は本発明に係る一貫した文脈を持つ広範な文章の評価システムの一実施例を示す構成図、図2は電子会議における議事内容(発言)の評価を行う場合のフロー図、図3は電子データ化した文章のログを採取した状態のPC(パソコン)画面の表示の一例を示す図、図4は採取したログからパラグラフにしたテキストを作成した状態のPC画面の表示の一例を示す図、図5は作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解し、分解した形態素から助詞、副詞、無意味記号を排除した状態のPC画面の表示の一例を示す図、図6は分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出した状態のPC画面の表示の一例を示す図、図7は抽出した特定数の上位のリンクの一覧の一例を示す図、図8は図7の一覧からリンク数のランク(順位)付けの一覧の一例を示す図、図9はランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフの一例を示す図である。
電子会議を相互に関連を持った言語の集積と見た場合、成長するネットワークであり、絶えず新たなノード(言葉/単語)を追加していくこと(成長する言語的ネットワークとしての電子会議)、追加する新たな言葉が電子会議にある既存の言葉との間にリンクを張ると電子会議の一つのテーマとなり、既に多くのリンクが張られている言葉ほど新しいリンク先として選択される確率が高く(優先的選択原理の存在)、時間的な展開から見ると、言葉に次々とリンクが集中していく中からリンク数の高い特定の言葉が現れるパターンが生じ、更に特定の言葉の集合に対するリンクを増やしていくこと(ミクロ−マクロの循環原理)になり、べき乗分布を創発する可能性が高い。本発明は、このべき乗分布から特定の値を見出すことにより電子会議の議事内容(発言)の評価を行うものである。
本実施例では、図1に示すような構成を有するシステムを用いた。即ち、電子会議の参加者である発言者のPC、該PCがインターネット等のネットワークを介して接続されるサーバ、該サーバに接続されて参加者の発言のログが記録・蓄積されるデータベース、該データベースに接続されて該データベース内のログに基き発言を解析・分析する評価装置PCとを有して構成されている。発言者のPCは、発言者が日常的に家庭又は職場等で使用しているPCでもよいし、電子会議を主催する側が用意したPCでもよい。システムを構成する各PCやサーバ等はインターネット等のネットワークを介して通信を行う一般的なネットワークシステムに必要なPCやサーバ等の構成を有するものを用いることができる。
次に、上記構成のシステムを用いて行った電子会議の議事内容(発言)を解析・分析して該議事内容(発言)の評価を行う方法及びシステムの一実施例について、図2に示すフロー図、並びに図3〜図9に示す図に基き説明する。
先ず、電子会議の全発言が電子データ化されて記録・蓄積されたデータベースから全発言のログ(例えば、好ましくはhtmlベース)を採取する(図3参照)。
採取したログから改行等を削除して一発言を一パラグラフにした全発言のテキストを作成する(図4参照)。
作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解し、分解した形態素から助詞、副詞、無意味記号を排除する(図5参照)。形態素解析ソフトとしては、公知公用の形態素解析ソフトを用いることができ、好ましいものとしては、例えば、日本語形態素解析システム「茶筅」{奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松本研究室)}が挙げられる。
分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出する(図6参照)。キーワード抽出ソフトとしては、公知公用のキーワード抽出ソフトを用いることができ、好ましいキーワード抽出ソフトとしては、例えば、言語学で広く用いられている形態素解析アプリケーション「KeyGraph」(構造計画研究所創造工学部)が挙げられる。
抽出した特定数の上位のリンク数をランク(順位)付けする。図7は抽出した特定数の上位のリンクの一覧に示し、図8はリンクの一覧からリンク数のランク(順位)付けの一覧を示す。
前記ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを作成し、べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とし、得られたb値及び/又はr値から議事内容(発言)の評価を行う。図9はランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを示す。
議事内容(発言)の評価は、例えば、下記の評価基準(a)〜(d)により評価する。
[評価基準]
(a)b値が小(原点に対して回帰直線の傾きが緩やか)のとき、言葉の関連に隔たりが無く話題が広がっている状態を示す。
(b)b値が大(原点に対して回帰直線の傾きが急)のとき、特定の言葉に偏っており話題が集中している状態を示す。
(c)r値は特定の話題の収束度であり、該r値が大のとき前記特定の話題が収束にむかっている乃至は収束している状態を示す。
(d)r値は特定の話題の収束度であり、該r値が小のとき前記特定の話題が未だ収束していない状態を示す。
上記b値の「大」、「小」の判断基準は、リンク数決定のアルゴリズムによって基準値が異なる。従って、モデル例等を基に指標の値を事前に決定して、これよりも「大」か「小」かで定めるものとする。同じく上記r値の「大」、「小」の判断基準はモデル例等を基に指標の値を事前に決定して、これよりも「大」か「小」かで定めるものとする。
指標の一例として、リンク数の決定に前述の「KeyGraph」を用いた場合の数値としては、b値は通常1.5〜3.5の間を変動する。この中で、1.5〜1.9:集中度は低、2.0〜2.5:集中度は普通、2.6〜3.0:集中度は高、と判定することができる。同様にr値は通常は0.91〜0.99の間を変動する。この中で、0.91〜0.93:収束度は低、0.94〜0.96:収束度は普通、0.97〜0.99:収束度は高、と判定することができる。
即ち、電子会議のテーマに広がりがあった場合等にはb値は小さくなり、具体的事例等が議事内容(発言)として上がった場合等に議論が集中した場合等にはb値は大きくなる。また、踏み込んだ発言等があって議論がある程度収束した場合等にはr値は小さくなり、踏み込んだ発言等が無く発言者の持論の展開程度で収束は未だ未だという状態である場合等にはr値は大きくなる。
以上のようにb値とr値とから、電子会議における議事内容(発言)を解析・分析することにより該電子会議の議事内容(発言)の評価を行うことができる。かかる評価によって、会議等のように1つないし複数の議題に対する議論がなされた場合の当該議題に対して議論が充分になされたか否か、どの程度まで議論されたか等の議論の進捗状況等を判断することができる。
特定の議題に対して、複数回の会議を経て議論を尽くす場合等では、その会議の前期においては、自由な討論や意見の開陳が重要であると考えられる場合には、集中度であるb値と収束度であるr値とは大であることが望ましいものではない。また、会議の後期においては、結論に結びつくことが重要であると考えられることが多いため、集中度であるb値と収束度であるr値とは共に大であることが望ましく、特に議論を尽くした状態であることが望ましいため、集中度であるb値よりも収束度であるr値が大であることが望ましく重要である。
本発明に係る一貫した文脈を持つ広範な文章の評価方法及び評価システムは上記実施例に限定されず、本発明の範囲内において種々の態様を採ることができる。
例えば、前記一貫した文脈を持つ広範な文章として上記実施例では電子会議における議事内容(発言)を挙げたが、本発明はこれに限定されず、パブリックコメント、会議における議事内容、研究論文・批評・評論・白書・小説・物語等の一般的文書についても本発明の一貫した文脈を持つ広範な文章の評価方法及び評価システムを用いて評価することができる。電子会議ではない会議における議事内容や一般的文書の場合、電子データ化した後に評価する。
例えば、研究論文・批評・評論・白書・小説・物語等の一般的文書について本発明の一貫した文脈を持つ広範な文章の評価方法及び評価システムを用いて評価してみると、人間の合理的行動がポアオン分布的に作り出す累積過程としてのミクロ−マクロフィードバックに基いた創発的パターンとしての「べき乗則」が認められること、及び、一般的文書のジャンルに即して適切と想定される「べき乗則」の指標の値のあることが判る。従って、これらの一般的文書を解析・分析することで、例えば、読み易い文章のグレーディングや編集方針の策定、利用目的の特定、文章のジャンルの区分等を把握するために用いることができる。
一般的文書の評価において、b値の「大」、「小」の判断基準は、リンク数決定のアルゴリズムによって基準値が異なる。従って、モデル例等を基に指標の値を事前に決定して、これよりも「大」か「小」かで定めるものとする。同じく上記r値の「大」、「小」の判断基準はモデル例等を基に指標の値を事前に決定して、これよりも「大」か「小」かで定めるものとする。
指標の一例として、リンク数の決定に前述の「KeyGraph」を用いた場合の数値としては、b値は通常1.0〜3.0の間を変動する。この中で、1.0〜1.5:集中度は低/ファンタジックな小説や通俗的な小説等が取るべき数値、1.6〜2.0:集中度は普通/批評・評論、高踏的な小説等が取るべき数値、2.1〜3.0:集中度は高/白書、哲学書、研究論文等が取るべき数値、と判定することができる。同様にr値は通常は0.91〜0.99の間を変動する。この中で、0.91〜0.93:収束度は低/ファンタジックな小説や通俗的な小説等が取るべき数値、0.94〜0.96:収束度は普通/批評・評論、高踏的な小説等が取るべき数値、0.97〜0.99:収束度は高/白書、哲学書、研究論文等が取るべき数値、と判定することができる。
また、評価の確度をより向上させるために、経験値、過去の評価結果の値、予測値の少なくとも一つの値からなる操作変数を設定することにより前記b値及び/又はr値の調整を行うことも好ましい。操作変数による調整は、b値とr値の結果に対して後付けで観測・評価してもよいし、電子会議等の実施中に操作変数を設定しながら随時、期待された値としてのb値とr値を得るように調整してもよい。即ち、電子会議の結果を評価するだけでなく、電子会議等の操作的な手段としても用いることができる。
電子会議等の操作的な手段として用いる場合、例えば、具体的には議論の集中度を上げるために電子会議の中に条例や計画の具体的なテキストを投稿し、これをめぐって議論するように誘導することや、集中度の高い議論が得意な専門家、或いは集中度を低くしてより幅広い話題を提供できる専門家等、電子会議の政策形成における位置付け等に併せて適合的な専門家の参加を選択的に求める等を行うこともできる。
また、研究論文・批評・評論・白書・小説・物語等の一般文書のジャンル標準値に基いた評価・修正のために用いることもできる。この場合、指標値の繰り返しの提示により修文・加筆等のためのフィードバックに適用することができる。
以下、本発明の一貫した文脈を持つ広範な文章の評価方法及び評価システムを用いて特定の4つの電子会議の議事内容(発言)について評価した評価結果を示す対数グラフ(図9〜図12)から、各議事内容(発言)の評価結果について説明する。
「安全・安心なまちづくり県民会議室」(新潟県県民生活・環境部県民生活課)の電子会議(期間:平成17年3月1日〜4月30日、参加者数:60人、発言数:127)の議事内容(発言)の電子データを用いて当該電子会議の議事内容(発言)について評価したところ、図9の対数グラフが得られた。
図9に示す対数グラフでは、b値=2.0129、r値=0.9283であり、b値が小であり、r値も小であることから、電子会議のテーマに広がりがあったが、議論がある程度収束し状態を示している。
「食品安全条例制定に係る県民会議室」(新潟県福祉保健部生活衛生課)の電子会議(期間:平成17年6月1日〜6月30日、参加者数:63人、発言数:171)の議事内容(発言)の電子データを用いて当該電子会議の議事内容(発言)について評価したところ、図10の対数グラフが得られた。
図10に示す対数グラフでは、b値=2.0157、r値=0.9699であり、b値が小であるが、r値が大であることから、電子会議のテーマに広がりがあり、議論が未だ収束しておらず、議論が充分になされたとは云えない状態を示している。
「災害ボランティア県民会議室」(新潟県県民生活課社会活動推進係)の電子会議(期間:平成17年9月1日〜9月30日、参加者数:61人、発言数:95)の議事内容(発言)の電子データを用いて当該電子会議の議事内容(発言)について評価したところ、図11の対数グラフが得られた。
図11に示す対数グラフでは、b値=3.0687、r値=0.9177であり、b値がより大であるが、r値が小であることから、電子会議の議論が特定のテーマ等に集中し、しかも議論が収束し、議論が充分になされた状態を示している。
「新潟県政策プラン県民電子会議室」(新潟県総合政策部企画課)の電子会議(期間:平成17年10月17日〜11月19日、参加者数:66人、発言数:44)の議事内容(発言)の電子データを用いて当該電子会議の議事内容(発言)について評価したところ、図12の対数グラフが得られた。
図12に示す対数グラフでは、b値=1.8528、r値=0.9149であり、b値がより小であり、r値も小であることから、電子会議のテーマにかなりの広がりがあったが、議論がある程度収束した状態を示している。
次に、本発明の一貫した文脈を持つ広範な文章の評価方法及び評価システムを用いて、特定の議題に対して電子会議の議事内容(発言)とパブリックコメントの内容(発言)とを併せた内容について評価した評価結果を示す対数グラフ(図13)から、評価結果について説明する。
「新潟県防犯カメラ県民電子会議室」(新潟県県民生活・環境部県民生活課安全・安心なまちづくり班)の電子会議(期間:平成17年11月15日〜12月14日、参加者数:59人、発言数:114)の議事内容(発言)とパブリック・コメントの電子データを用いて当該電子会議の議事内容(発言)とパブリックコメントの発言とを併せて評価したところ、図13の対数グラフが得られた。
図13に示す対数グラフでは、b値=2.6046、r値=0.9404であり、b値が大であり、r値も大であることから、電子会議の議論が特定のテーマに集中したが、議論が未だ収束しておらず、議論が充分になされたとは云えない状態を示している。評価結果を斟酌して、議事内容(発言)とパブリックコメントの内容を調べたところ、ある問題について賛成と反対の2つの意見のグループに別れ、二つの議論が対立している状態であることが判った。
次に、一貫した文脈を持つ広範な文章が、研究論文・批評・評論・白書・小説・物語等の一般的文書から各種取り混ぜて、「ごんぎつね」、「高野聖」、「一円本」、「比較言語」、「山月記」、「絶対矛盾」について電子データ化したものを、本発明の一貫した文脈を持つ広範な文章の評価方法及び評価システムを用いて評価したところ、下記に示すような数値が得られた。
b値 r
ごんぎつね 1.0934 0.912
高野聖 1.1892 0.9567
一円本 1.7682 0.8882
比較言語 1.781 0.9665
山月記 2.2274 0.9235
絶対矛盾 2.6987 0.9682
上記数値から、前述したb値の指標(1.0〜1.5:集中度は低/ファンタジックな小説や通俗的な小説等が取るべき数値、1.6〜2.0:集中度は普通/批評・評論、高踏的な小説等が取るべき数値、2.1〜3.0:集中度は高/白書、哲学書、研究論文等が取るべき数値)、とr値の指標(0.91〜0.93:収束度は低/ファンタジックな小説や通俗的な小説等が取るべき数値、0.94〜0.96:収束度は普通/批評・評論、高踏的な小説等が取るべき数値、0.97〜0.99:収束度は高/白書、哲学書、研究論文等が取るべき数値)に基き各文書について評価することができる。
本発明に係る一貫した文脈を持つ広範な文章の評価システムの一実施例を示す構成図 電子会議における議事内容(発言)の評価を行う場合のフロー図 電子データ化した文章のログを採取した状態のPC(パソコン)画面の表示の一例を示す図 採取したログからパラグラフにしたテキストを作成した状態のPC画面の表示の一例を示す図 作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解し、分解した形態素から助詞、副詞、無意味記号を排除した状態のPC画面の表示の一例を示す図 分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出した状態のPC画面の表示の一例を示す図 抽出した特定数の上位のリンクの一覧の一例を示す図 図7の一覧からリンク数のランク(順位)付けの一覧の一例を示す図 ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフの一例を示す図 他の内容の議事内容(発言)におけるランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフの一例を示す図 他の内容の議事内容(発言)におけるランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフの一例を示す図 他の内容の議事内容(発言)におけるランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフの一例を示す図 他の内容の議事内容(発言)におけるランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフの一例を示す図

Claims (8)

  1. 一貫した文脈を持つ広範な文章の評価方法であって、
    前記文章が電子化されたもの又は前記文章を電子データ化したものを用い、
    電子データ化した文章のログを採取し、
    採取したログからパラグラフにしたテキストを作成し、
    作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解し、
    分解した形態素から助詞、副詞、無意味記号を排除し、
    分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出し、
    抽出した特定数の上位のリンク数をランク(順位)付けし、
    前記ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを作成し、
    べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とし、
    得られたb値及び/又はr値から前記文章等を評価することを特徴とする一貫した文脈を持つ広範な文章の評価方法。
  2. 前記評価が、下記の評価基準(a)〜(d)により評価されることを特徴とする請求項1に記載の一貫した文脈を持つ広範な文章の評価方法。
    [評価基準]
    (a)b値が小(原点に対して回帰直線の傾きが緩やか)のとき、言葉の関連に隔たりが無く話題が広がっている状態を示す。
    (b)b値が大(原点に対して回帰直線の傾きが急)のとき、特定の言葉に偏っており話題が集中している状態を示す。
    (c)r値は特定の話題の収束度であり、該r値が大のとき前記特定の話題が収束にむかっている乃至は収束している状態を示す。
    (d)r値は特定の話題の収束度であり、該r値が小のとき前記特定の話題が未だ収束していない状態を示す。
  3. 経験値、過去の評価結果の値、予測値の少なくとも一つの値からなる操作変数を設定することにより前記b値及び/又はr値の調整を行うことを特徴とする請求項1又は2に記載の一貫した文脈を持つ広範な文章の評価方法。
  4. 前記一貫した文脈を持つ広範な文章が、電子会議における議事内容(発言)、パブリックコメント、会議における議事内容、研究論文・批評・評論・白書・小説・物語等の一般的文書のいずれかであることを特徴とする請求項1〜3のいずれかに記載の一貫した文脈を持つ広範な文章の評価方法。
  5. 一貫した文脈を持つ広範な文章の評価システムであって、
    前記文章が電子化されたもの又は前記文章を電子データ化したものを用いて該電子データ化した文章からログを採取する手段と、
    採取したログからパラグラフにしたテキストを作成する手段と、
    作成したテキストを、形態素解析ソフトにより形態素(品詞)単位に分解する手段と、
    分解した形態素から助詞、副詞、無意味記号を排除する手段と、
    分解した形態素(品詞)を、キーワード抽出ソフトにより特定数の上位のノードに対するリンクの計算を行い、特定数の上位のリンク数を解析して抽出する手段と、
    抽出した特定数の上位のリンク数をランク(順位)付けする手段と、
    前記ランク(順位)をx軸とし、前記リンク数をy軸とするべき乗分布を示す対数グラフを作成する手段と、
    べき乗分布を示す対数グラフから得られる回帰直線の傾きの絶対値をb値とし、相関係数をr値とする前記文章等を評価する数値を算出する手段と
    を有して構成されることを特徴とする一貫した文脈を持つ広範な文章の評価システム。
  6. 前記評価する数値が、下記の評価基準(a)〜(d)により評価されることを特徴とする請求項5に記載の一貫した文脈を持つ広範な文章の評価システム。
    [評価基準]
    (a)b値が小(原点に対して回帰直線の傾きが緩やか)のとき、言葉の関連に隔たりが無く話題が広がっている状態を示す。
    (b)b値が大(原点に対して回帰直線の傾きが急)のとき、特定の言葉に偏っており話題が集中している状態を示す。
    (c)r値は特定の話題の収束度であり、該r値が大のとき前記特定の話題が収束にむかっている乃至は収束している状態を示す。
    (d)r値は特定の話題の収束度であり、該r値が小のとき前記特定の話題が未だ収束していない状態を示す。
  7. 経験値、過去の評価結果の値、予測値の少なくとも一つの値からなる操作変数を設定することにより前記b値及び/又はr値の調整を行う調整手段を有することを特徴とする請求項5又は6に記載の一貫した文脈を持つ広範な文章の評価システム。
  8. 前記一貫した文脈を持つ広範な文章が、電子会議における議事内容(発言)、パブリックコメント、会議における議事内容、研究論文・批評・評論・白書・小説・物語等の一般的文書のいずれかであることを特徴とする請求項5〜7のいずれかに記載の一貫した文脈を持つ広範な文章の評価システム。
JP2006058041A 2006-03-03 2006-03-03 一貫した文脈を持つ広範な文章等の評価方法及び評価システム Pending JP2007233947A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006058041A JP2007233947A (ja) 2006-03-03 2006-03-03 一貫した文脈を持つ広範な文章等の評価方法及び評価システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006058041A JP2007233947A (ja) 2006-03-03 2006-03-03 一貫した文脈を持つ広範な文章等の評価方法及び評価システム

Publications (1)

Publication Number Publication Date
JP2007233947A true JP2007233947A (ja) 2007-09-13

Family

ID=38554441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006058041A Pending JP2007233947A (ja) 2006-03-03 2006-03-03 一貫した文脈を持つ広範な文章等の評価方法及び評価システム

Country Status (1)

Country Link
JP (1) JP2007233947A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015114855A (ja) * 2013-12-12 2015-06-22 日本電信電話株式会社 議論支援装置および議論支援プログラム
WO2016067334A1 (ja) * 2014-10-27 2016-05-06 株式会社日立製作所 文書検索システム、ディベートシステム、文書検索方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015114855A (ja) * 2013-12-12 2015-06-22 日本電信電話株式会社 議論支援装置および議論支援プログラム
WO2016067334A1 (ja) * 2014-10-27 2016-05-06 株式会社日立製作所 文書検索システム、ディベートシステム、文書検索方法
JPWO2016067334A1 (ja) * 2014-10-27 2017-04-27 株式会社日立製作所 文書検索システム、ディベートシステム、文書検索方法

Similar Documents

Publication Publication Date Title
Hamidian et al. Rumor detection and classification for twitter data
Thelwall The Heart and soul of the web? Sentiment strength detection in the social web with SentiStrength
Rangel et al. Overview of the 3rd Author Profiling Task at PAN 2015
Agerri et al. Q-WordNet: Extracting Polarity from WordNet Senses.
Rangel Pardo et al. Overview of the 3rd Author Profiling Task at PAN 2015
Murray et al. Generating and validating abstracts of meeting conversations: a user study
JP5897240B2 (ja) 顧客対応システム、並びに会話サーバ
Xu et al. Understanding online health groups for depression: social network and linguistic perspectives
CN106021387A (zh) 对话线程的概述
CN108920455A (zh) 一种汉语自动生成文本的自动评价方法
JP2017215943A (ja) 情報共有支援システム、情報共有支援装置、情報共有支援方法及びプログラム
Benamara et al. Automatic detection of depressive users in social media
Tang et al. Exploring repost features of police-generated microblogs through topic and sentiment analysis
Guerini et al. Corps: A corpus of tagged political speeches for persuasive communication processing
Bednarek 19. Approaching the data of pragmatics
Capozzi et al. “contro l’odio”: A platform for detecting, monitoring and visualizing hate speech against immigrants in Italian social media
Kucher et al. Visual Analysis of Sentiment and Stance in Social Media Texts.
Sotudeh et al. Mentsum: A resource for exploring summarization of mental health online posts
Belkaroui et al. Towards events tweet contextualization using social influence model and users conversations
Brooks Human centered tools for analyzing online social data
Al-Hashedi et al. Cyberbullying detection based on emotion
JP2017134686A (ja) 解析システム、解析方法、及び解析プログラム
Morales-Ramirez et al. Discovering Speech Acts in Online Discussions: A Tool-supported method.
Waldhör et al. etBlogAnalysis—Mining virtual communities using statistical and linguistic methods for quality control in tourism
JP2007233947A (ja) 一貫した文脈を持つ広範な文章等の評価方法及び評価システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120424