JP5930217B2

JP5930217B2 - 特定のテーマに依存して危険表現となりうる表現を検出する方法、並びに、当該表現を検出するための電子装置及びその電子装置用プログラム

Info

Publication number: JP5930217B2
Application number: JP2013208264A
Authority: JP
Inventors: 豊島　浩文; 浩文豊島; 笑子竹内; 大介宅間
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2013-10-03
Filing date: 2013-10-03
Publication date: 2016-06-08
Anticipated expiration: 2033-10-03
Also published as: US10275447B2; US20150100306A1; US11010552B2; US20170091172A1; US9575959B2; US20190147040A1; JP2015072614A

Description

本発明は、特定のテーマに依存して危険表現となりうる表現を検出する技法に関する。また、本発明は、特定のテーマ及び特定の期間に依存して危険表現となりうる表現を検出する技法に関する。

スマートフォンやタブレットの普及によって、例えばソーシャル・ネットワーキング・サービス（ＳＮＳ）（例えば、Ｆａｃｅｂｏｏｋ（登録商標））、Ｔｗｉｔｔｅｒ（登録商標））を通じて個人が容易に情報発信をすることができるようになってきている。これら情報の中には、日常的な会話レベルの情報から、インターネット上に一旦拡散すれば、その影響が深刻である情報まで種々多様である。影響が深刻である情報は例えば、不確実な情報、事実に反する情報、秘密情報、他人、企業若しくは国家を誹謗中傷するような情報、企業活動若しくは選挙活動を妨害するような情報、又は事件性を予想させるような情報である。

インターネット上に一旦拡散された情報は削除することがほぼ不可能に近い。従って、影響が深刻である情報がインターネット上に公開されることを如何にして管理するかが問題となっている。

日本においても、インターネット等の普及に鑑み、選挙運動期間における候補者に関する情報の充実、有権者の政治参加の促進等を図るために、２０１３年４月１９日からインターネット等を利用する方法による選挙運動（以下、インターネット選挙運動という）が解禁された。インターネット選挙運動が解禁されたことで、インターネット上での書き込みによって選挙に与えられる影響がより一層深刻になると考えられている。

下記特許文献１は、単数又は複数の素性を入力すると、学習結果記憶手段に格納された機械学習結果データを参照して、所定の対象に対する風評情報か否かを判定する所定の機械学習モジュールを備えた機械学習判定手段を備えている風評情報抽出装置を記載し、当該風評情報抽出装置は、該素性抽出手段が抽出した素性を該機械学習判定手段に入力し、その収集データに対する風評情報か否かの判定結果を得ると共に、風評情報と判定された収集データの少なくとも一部、又はそれが公開されているサーバ装置の名称若しくはネットワークアドレス、又はその収集データのファイル情報、の少なくともいずれかを出力する風評情報出力手段を備えていることを記載する（請求項１）。

下記特許文献２は、特定の評価対象についての評価が記述されたテキストから、前記特定の評価対象に対する評価者の嗜好を示す嗜好表現を検出する表現検出システムを記載し、当該表現検出システムが、各々の前記テキストから、前記特定の評価対象の評価を示す評価表現を抽出する表現抽出部と、前記表現抽出部が抽出した評価表現が、前記特定の評価対象に対する肯定的な評価を示す正極性か、又は、前記特定の評価対象に対する否定的な評価を示す負極性かを判断する極性判断部と、前記嗜好表現を検出する対象として指定されるテキストの属性を入力する属性入力部と、前記表現抽出部が抽出した評価表現のうち、前記属性入力部により入力された属性を有するテキストから検出された評価表現を前記嗜好表現として検出し、当該属性を有するテキストにおいて当該嗜好表現が正極性又は負極性と判断された頻度に対応付けて出力する嗜好表現検出部とを備えていることを記載する（請求項１）。

下記特許文献３は、風説情報を監視する風説監視システムを記載し、当該風説監視システムは、風説情報に対して、風説情報の利用者にとっての新規性を示す新規性スコア、風説情報の信憑性を示す信憑性スコア、風説情報の公衆への影響度を示す影響度スコア、及び風説情報の利用者への危険度を示す危険度スコアのいずれかひとつ以上のスコアを計算し、前記スコアに基づいて、風説情報の風説価値を計算する風説情報価値判定手段を有することを記載する（請求項１）。

下記特許文献４及び５は、通信ネットワークを介して電子掲示板に投稿される投稿記事のデータを受信し、その投稿記事の内容を監視する電子掲示板監視システムを記載する（いずれも請求項１）。特許文献４に記載の電子掲示板監視システムは、監視対象となる要監視ワードに対して監視の注意喚起レベルに応じた重み付けが設定された採点用辞書フィルタデータを記憶する採点用辞書フィルタデータ記憶部、およびその採点用辞書フィルタデータに基づいて採点された後の投稿記事を公開するか否かを判断するために一時的に記憶する公開判断待ち記憶部を備えた監視用データベースを有することを記載する（請求項１）。特許文献５に記載の電子掲示板監視システムは、監視対象となる要監視ワードに対して監視の注意喚起レベルに応じた重み付けが設定された採点用辞書フィルタデータを記憶する採点用辞書フィルタデータ記憶部、その採点用辞書フィルタデータに基づいて採点された後の投稿記事を公開するか否かを判断するために一時的に記憶する公開判断待ち記憶部、および投稿者の識別データに対応付けて、当該投稿者の投稿記事が公開拒否された回数を示す非公開回数と、公開許可された回数を示す公開回数と、投稿者の注意喚起レベルを示すステータスフラグとを記憶する要注意投稿者データ記憶部を備えた監視用データベースを有することを記載する（請求項１）。

下記特許文献６は、インターネット上のウェブ文書等から最新の評判情報を抽出して通知することを記載する（段落０００１）。

下記特許文献７は、大量の情報の中から特定の情報を自動的に抽出する技術を記載する（段落０００１）。

下記特許文献８は、インターネット上の掲示板の記述内容に基づいて掲示板を分析する技術を記載する（段落０００１）。

特開２００８−１６５５９９号公報特開２００６−１４６５６７号公報特開２００８−１６５２８４号公報特開２００８−１５８７３５号公報特開２００９−１５８６６号公報特開２００８−２３４０９０号公報国際公開第０３／０４６７６４号特開２０１０−２３１４７１号公報

ある単語又はフレーズがその文字の表層からはネガティブな情報（例えば、文字の表層から誹謗中傷であると判定できる語又はフレーズ）でない場合であっても、当該ある単語又はフレーズが、特定のテーマに関連する文脈において又は特定のテーマに関連する文脈及び特定の期間において使用されることによって危険表現となりうる場合がある。

例えば、震災後の復興支援の重要性を主張しているある評論家がいたとする。あるユーザが、「当該評論家がコンビニで電池のまとめ買いをしていた」との書き込みを電子掲示板に書き込んだとする。しかしながら、当該書き込みの内容が虚偽であったり、又は人違いによるものであったりしたとする。このような状況下において、結果的には、上記あるユーザの書き込み内容が真偽であるかどうかに関わらず、当該書き込みは当該評論家の評判を落としたり、名誉毀損に該当したりする場合がある。

また、例えば、ある企業のある製品についての書き込み、又は、ある企業、ある公的機関若しくはある飲食店のサポート若しくはサービスについての書き込みにおいても、その内容や書き込みが行われた期間によっては、上記と同様に、当該企業、公的機関又は飲食店の評判を落としたりする場合がある。

また、例えば、国家、コミュニティ、又は特定の人（例えば、選挙立候補者、同僚、若しくは友達）についての書き込みにおいても、その内容や書き込みが行われた期間によっては、上記と同様に、当該国家、コミュニティ、又は特定の人の評判を落としたり、トラブルの元になったり、法律上問題となったりする場合がある。

従って、文字の表層から誹謗中傷であると判定できる語又はフレーズだけでなく、特定のテーマに依存して又は特定のテーマ及び特定の期間に依存して危険表現となりうる単語やフレーズを検出し、当該検出した危険表現の投稿を管理可能にすることが、例えばＳＮＳを管理する側及びＳＮＳを利用する側にとっても重要である。

そこで、本発明は、特定のテーマに依存して危険表現となりうる単語やフレーズを検出することを目的とする。さらには、本発明は、特定のテーマ及び特定の期間に依存して危険表現となりうる単語やフレーズを検出することを目的とする。

本発明は、特定のテーマに依存して危険表現となりうる表現を検出するための技法を提供する。当該技法は、上記特定のテーマに依存して危険表現となりうる表現を検出する方法、特定のテーマに依存して危険表現となりうる表現を検出するための電子装置及び電子装置システム、並びに、その電子装置用プログラム及び電子装置用プログラム製品を包含しうる。

本発明の実施態様は、下記に示す（１）危険表現学習フェーズ、及び（２）危険表現検出フェーズを含む。

（１）危険表現学習フェーズでは、電子装置は、学習用のテキスト・データを用いて、特定のテーマに依存して危険表現となりうる表現を抽出し、危険表現リストを作成する。

（２）危険表現検出フェーズでは、電子装置は、危険表現学習フェーズで作成された危険表現リストを用いて、分析対象のテキスト・データ中に特定のテーマに依存して危険表現となりうる表現が存在するかどうかを検出する。

本発明の実施態様において、上記危険表現学習フェーズが第１の電子装置上で実施され、且つ上記危険表現検出フェーズが当該第１の電子装置と異なる第２の電子装置上で実施されてもよく、又は、上記危険表現学習フェーズと上記危険表現検出フェーズとが同じ電子装置（例えば、上記第１の電子装置）上で実施されてもよい。

（第１の電子装置が危険表現学習フェーズを実施する場合）

本発明に従う第１の実施態様（危険表現学習フェーズ）において、特定のテーマに依存して危険表現となりうる表現を検出する方法は、第１の電子装置が、
学習用のテキスト・データから、上記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得するステップと、
上記取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出するステップと、
上記抽出されたテキスト・データから、（１）当該抽出されたテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）当該抽出されたテキスト・データ中の出現頻度の高い単語若しくはフレーズを、上記特定のテーマに依存して危険表現となりうる表現として抽出するステップ
を実行することを含む。

（第１の電子装置が危険表現検出フェーズを実施する場合）

本発明に従う第２の実施態様（危険表現検出フェーズ）において、特定のテーマに依存して危険表現となりうる表現を検出する方法は、上記第１の電子装置が、
分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得するステップと、
上記分析対象のテキスト・データから取得した上記部分集合において、上記危険表現となりうる表現が存在することを検出するステップと
を実行することを含む。

本発明に従う上記第２の実施態様（危険表現検出フェーズ）において、特定のテーマに依存して危険表現となりうる表現を検出する方法は、上記第１の電子装置が、
上記分析対象のテキスト・データから取得した上記部分集合から、ネガティブ情報を有するテキスト・データを抽出するステップ
をさらに実行することを含み、
上記分析対象のテキスト・データから取得した上記部分集合において、上記危険表現となりうる表現が存在することを検出するステップが、
上記分析対象のテキスト・データからの上記抽出したテキスト・データにおいて、上記危険表現となりうる表現が存在することを検出するステップ
を含みうる。

（第２の電子装置が危険表現検出フェーズを実施する場合）

本発明に従う第３の実施態様（危険表現検出フェーズ）において、特定のテーマに依存して危険表現となりうる表現を検出する方法は、上記第２の電子装置が、
分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得するステップと、
上記分析対象のテキスト・データから取得した上記部分集合において、上記危険表現となりうる表現が存在することを検出するステップと
を実行することを含む。

本発明に従う上記第３の実施態様（危険表現検出フェーズ）において、特定のテーマに依存して危険表現となりうる表現を検出する方法は、上記第２の電子装置が、
上記分析対象のテキスト・データから取得した上記部分集合から、ネガティブ情報を有するテキスト・データを抽出するステップ
をさらに実行することを含み、
上記分析対象のテキスト・データから取得した上記部分集合において、上記危険表現となりうる表現が存在することを検出するステップが、
上記分析対象のテキスト・データからの上記抽出したテキスト・データにおいて、上記危険表現となりうる表現が存在することを検出するステップ
を含みうる。

本発明に従う第４の実施態様（危険表現学習フェーズ）において、特定のテーマに依存して危険表現となりうる表現を検出するための第１の電子装置は、
学習用のテキスト・データから、上記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得する第１の部分集合取得手段と、
上記第１の部分集合取得手段が取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出する第１のテキスト・データ抽出手段と、
上記テキスト・データ抽出手段が抽出したテキスト・データから、（１）当該抽出したテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）当該抽出したテキスト・データ中の出現頻度の高い単語若しくはフレーズを、上記特定のテーマに依存して危険表現となりうる表現として抽出する第１の危険表現抽出手段と
を備えている。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、特定のテーマの為に用いられる単語若しくはフレーズを含むテーマ特定辞書を用いて、上記特定のテーマに関連付けられたテキスト・データを特定しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、上記学習用のテキスト・データ中に存在し且つ上記テーマ特定辞書に含まれる単語若しくはフレーズの前後の所定の文字数若しくは所定の単語数にある範囲を、又は、
上記テーマ特定辞書に含まれる単語若しくはフレーズを含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を
上記特定のテーマに関連付けられたテキスト・データ（テキスト・データ１という）として特定しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、上記学習用のテキスト・データから、学習済みの学習モデルを用いて、上記特定のテーマに関連付けられたテキスト・データ（テキスト・データ２という）を特定しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、上記テキスト・データ１、上記テキスト・データ２、及び特定の期間情報に関連付けられたテキスト・データのうちの少なくとも２つについて集合演算（例えば、集合積又は集合和）をして、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段が、
上記第１の部分集合取得手段が取得した上記部分集合において、上記ネガティブ情報に該当する単語若しくはフレーズを特定し、
上記特定された単語若しくはフレーズを有するテキスト・データを抽出しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段が、
ネガティブ情報であることを判定可能な単語若しくはフレーズを含むネガティブ情報辞書を用いて、上記第１の部分集合取得手段が取得した部分集合において、上記ネガティブ情報に該当する単語若しくはフレーズを特定しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段が、
上記第１の部分集合取得手段が上記取得した部分集合から、学習済みの機械学習モデルを用いて、上記ネガティブ情報に該当する単語若しくはフレーズを有するテキスト・データを抽出しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１の危険表現抽出手段が、上記抽出した危険表現を危険表現リストに格納しうる。

本発明に従う上記第４の実施態様（危険表現学習フェーズ）において、上記第１の電子装置では、
上記第１の危険表現抽出手段がさらに、上記特定のテーマをさらに抽出しうる。

本発明に従う第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段がさらに、分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得し、
上記第１の危険表現抽出手段がさらに、上記第１の部分集合取得手段が上記分析対象のテキスト・データから取得した上記部分集合において、上記危険表現となりうる表現が存在することを検出しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、特定のテーマの為に用いられる単語若しくはフレーズを含むテーマ特定辞書を用いて、上記特定のテーマに関連付けられたテキスト・データを特定しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、上記分析対象のテキスト・データ中に存在する上記テーマ特定辞書に含まれる単語若しくはフレーズの前後の所定の文字数若しくは所定の単語数にある範囲を、又は、
上記テーマ特定辞書に含まれる単語若しくはフレーズを含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を
上記特定のテーマに関連付けられたテキスト・データ（テキスト・データ１という）として特定しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、上記分析対象のテキスト・データから、学習済みの学習モデルを用いて、上記特定のテーマに関連付けられたテキスト・データ（テキスト・データ２という）を特定しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１の部分集合取得手段が、上記テキスト・データ１、上記テキスト・データ２、及び特定の期間情報に関連付けられたテキスト・データのうちの少なくとも２つについて集合演算（例えば、集合積又は集合和）をして、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段が、
上記第１の部分集合取得手段が取得した上記部分集合において、上記ネガティブ情報に該当する単語若しくはフレーズを特定し、
上記特定された単語若しくはフレーズを有するテキスト・データを抽出しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段がさらに、上記第１の部分集合取得手段が上記分析対象のテキスト・データから取得した上記部分集合において、ネガティブ情報を有するテキスト・データを抽出し、
上記第１の危険表現抽出手段がさらに、上記第１のテキスト・データ取得手段が抽出した上記分析対象のテキスト・データからのテキスト・データにおいて、上記危険表現となりうる表現が存在することを検出しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段が、
ネガティブ情報であることを判定可能な単語若しくはフレーズを含むネガティブ情報辞書を用いて、上記第１の部分集合取得手段が取得した部分集合において、上記ネガティブ情報に該当する単語若しくはフレーズを特定しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１のテキスト・データ取得手段が、
上記第１の部分集合取得手段が上記取得した部分集合から、学習済みの機械学習モデルを用いて、上記ネガティブ情報に該当する単語若しくはフレーズを有するテキスト・データを抽出しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置では、
上記第１の危険表現抽出手段がさらに、上記特定のテーマをさらに抽出しうる。

本発明に従う上記第５の実施態様（危険表現検出フェーズ）において、上記第１の電子装置は
上記危険表現となりうる表現が存在することに応じて、上記分析対象のテキスト・データをネットワーク上に送信又はアップロードすることを中止又は中断すること、
上記危険表現となりうる表現が存在することに応じて、上記分析対象のテキスト・データが上記危険表現を有していることを示す表示を画面上に表示すること、
上記危険表現となりうる表現が存在することに応じて、上記分析対象のテキスト・データが上記危険表現を有していることを示すメッセージを上記分析対象のテキストを提供したユーザの電子装置に送信すること、
上記危険表現となりうる表現が存在することに応じて、上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示を画面上に表示すること
のうちの少なくとも１つをさらに実行する特定処理実行手段をさらに備えうる。

本発明に従う第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置が、
分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得する第２の部分集合取得手段と、
上記第２の部分集合取得手段が取得した上記部分集合において、上記第１の電子装置の上記第１の危険表現抽出手段が抽出した危険表現となりうる表現が存在することを検出する第２の危険表現検出手段と
を備えている。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２の部分集合取得手段が、特定のテーマの為に用いられる単語若しくはフレーズを含むテーマ特定辞書を用いて、上記特定のテーマに関連付けられたテキスト・データを特定しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２の部分集合取得手段が、上記分析対象のテキスト・データ中に存在する上記テーマ特定辞書に含まれる単語若しくはフレーズの前後の所定の文字数若しくは所定の単語数にある範囲を、又は、
上記テーマ特定辞書に含まれる単語若しくはフレーズを含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を
上記特定のテーマに関連付けられたテキスト・データ（テキスト・データ１という）として特定しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２の部分集合取得手段が、上記分析対象のテキスト・データから、学習済みの学習モデルを用いて、上記特定のテーマに関連付けられたテキスト・データ（テキスト・データ２という）を特定しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２の部分集合取得手段が、上記テキスト・データ１、上記テキスト・データ２、及び特定の期間情報に関連付けられたテキスト・データのうちの少なくとも２つについて集合演算（例えば、集合積又は集合和）をして、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２のテキスト・データ取得手段が、
上記第２の部分集合取得手段が取得した上記部分集合において、上記ネガティブ情報に該当する単語若しくはフレーズを特定し、
上記特定された単語若しくはフレーズを有するテキスト・データを抽出しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置が、
上記第２の部分集合取得手段が取得した上記部分集合から、ネガティブ情報を有するテキスト・データを抽出する第２のテキスト・データ取得手段をさらに備えており、
上記第２の危険表現検出手段が、上記第２のテキスト・データ取得手段が抽出したテキスト・データにおいて、上記危険表現となりうる表現が存在することを検出しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２のテキスト・データ取得手段が、
ネガティブ情報であることを判定可能な単語若しくはフレーズを含むネガティブ情報辞書を用いて、上記第１の部分集合取得手段が取得した部分集合において、上記ネガティブ情報に該当する単語若しくはフレーズを特定しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２のテキスト・データ取得手段が、
上記第２の部分集合取得手段が上記取得した部分集合から、学習済みの機械学習モデルを用いて、上記ネガティブ情報に該当する単語若しくはフレーズを有するテキスト・データを抽出しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置では、
上記第２の危険表現抽出手段がさらに、上記特定のテーマをさらに抽出しうる。

本発明に従う上記第６の実施態様（危険表現検出フェーズ）において、上記第２の電子装置は
上記危険表現となりうる表現が存在することに応じて、上記分析対象のテキスト・データをネットワーク上に送信又はアップロードすることを中止又は中断すること、
上記危険表現となりうる表現が存在することに応じて、上記分析対象のテキスト・データが上記危険表現を有していることを示す表示を画面上に表示すること、
上記危険表現となりうる表現が存在することに応じて、上記分析対象のテキスト・データが上記危険表現を有していることを示すメッセージを上記分析対象のテキストを提供したユーザの電子装置に送信すること、
上記危険表現となりうる表現が存在することに応じて、上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示を画面上に表示すること
のうちの少なくとも１つをさらに実行する特定処理実行手段をさらに備えうる。

（第１の電子装置が危険表現学習フェーズを実施し且つ第２の電子装置が危険表現検出フェーズを実施する電子装置システムの場合）

本発明に従う第７の実施態様において、特定のテーマに依存して危険表現となりうる表現を検出するための電子装置システムは、危険表現学習フェーズを実施する第１の電子装置と、危険表現検出フェーズを実施する第２の電子装置とを備えており、
上記第１の電子装置が、
学習用のテキスト・データから、上記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得する第１の部分集合取得手段と、
上記取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出する第１のテキスト・データ抽出手段と、
上記抽出されたテキスト・データから、（１）当該抽出されたテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）当該抽出されたテキスト・データ中の出現頻度の高い単語若しくはフレーズを、上記特定のテーマに依存して危険表現となりうる表現として抽出する第１の危険表現抽出手段と
を備えており、
上記第２の電子装置が、
分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得する第２の部分集合取得手段と、
上記第２の部分集合取得手段が取得した上記部分集合において、上記第１の危険表現抽出手段が抽出した危険表現となりうる表現が存在することを検出する第２の危険表現検出手段と
を備えている。

本発明に従う上記第７の実施態様において、危険表現検出フェーズを実施する上記第２の電子装置が、
上記第２の部分集合取得手段が取得した上記部分集合から、ネガティブ情報を有するテキスト・データを抽出する第２のテキスト・データ取得手段をさらに備えており、及び、
上記第２の危険表現検出手段が、上記第２のテキスト・データ取得手段が抽出したテキスト・データにおいて、上記危険表現となりうる表現が存在することを検出しうる。

（第１の電子装置に危険表現学習フェーズ及び危険表現検出フェーズを実施させる電子装置用プログラムの場合）

本発明に従う第８の実施態様において、特定のテーマに依存して危険表現となりうる表現を検出するための電子装置用プログラム（例えば、コンピュータ・プログラム）又は電子装置用プログラム製品（例えば、コンピュータ・プログラム製品）は、上記第１の電子装置に、上記第１の実施態様に記載の方法の各ステップを実行させ、且つ任意的に、当該上記第１の電子装置に、上記第２の実施態様に記載の方法の各ステップを実行させる。

本発明に従う第９の実施態様において、特定のテーマに依存して危険表現となりうる表現を検出するための電子装置用プログラム又は電子装置用プログラム製品は、上記第１の電子装置に上記第１の実施態様に記載の方法の各ステップを実施させ、且つ任意的に、上記第２の電子装置に、上記第３の実施態様に記載の方法の各ステップを実行させる。

本発明に従う上記第８及び第９の各実施態様に従う電子装置用プログラムはそれぞれ、一つ又は複数のフレキシブル・ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＤＶＤ、ＢＤ、ハードディスク装置、ＵＳＢに接続可能なメモリ媒体、ＲＯＭ、ＭＲＡＭ、ＲＡＭ等の任意の電子装置読み取り可能な記録媒体（例えば、コンピュータ読み取り可能な記録媒体）に格納することができる。当該電子装置用プログラムは、上記記録媒体への格納のために、通信回線で接続する他の電子装置、例えばサーバ・コンピュータからダウンロードしたり、又は他の記録媒体から複製したりすることができる。また、本発明の実施態様に従う電子装置用プログラムは、圧縮し、又は複数に分割して、単一又は複数の記録媒体に格納することもできる。また、様々な形態で、本発明の実施態様に従う電子装置用プログラム製品を提供することも勿論可能であることにも留意されたい。本発明の実施態様に従う電子装置用プログラム製品は、例えば、上記電子装置用プログラムを記録した記憶媒体、又は、上記電子装置用プログラムを伝送する伝送媒体を包含しうる。

本発明の上記概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの構成要素のコンビネーション又はサブコンビネーションもまた、本発明となりうることに留意すべきである。

本発明の実施態様において使用される電子装置の各ハードウェア構成要素を、複数のマシンと組み合わせ、それらに機能を配分し実施する等の種々の変更は当業者によって容易に想定され得ることは勿論である。それらの変更は、当然に本発明の思想に包含される概念である。ただし、これらの構成要素は例示であり、そのすべての構成要素が本発明の必須構成要素となるわけではない。

また、本発明は、ハードウェア、ソフトウェア、又は、ハードウェア及びソフトウェアの組み合わせとして実現可能である。ハードウェアとソフトウェアとの組み合わせによる実行において、上記電子装置用プログラムのインストールされた電子装置における実行が典型的な例として挙げられる。かかる場合、当該電子装置用プログラムが当該電子装置のメモリにロードされて実行されることにより、当該電子装置用プログラムは、当該電子装置を制御し、本発明にかかる処理を実行させる。当該電子装置用プログラムは、任意の言語、コード、又は、表記によって表現可能な命令群から構成されうる。そのような命令群は、当該コンピュータが特定の機能を直接的に、又は、１．他の言語、コード若しくは表記への変換及び、２．他の媒体への複製、のいずれか一方若しくは双方が行われた後に、本発明の実施態様に従う処理を実行することを可能にするものである。

本発明の実施態様に従うと、特定のテーマに依存して危険表現となりうる表現を検出することが可能になる。また、本発明の実施態様に従うと、特定のテーマ及び特定の期間に依存して危険表現となりうる表現を検出することが可能になる。上記検出を可能にすることは、例えばＳＮＳを管理する管理サーバが、ユーザの投稿内容が危険表現となりうる表現を含むことを予め当該ユーザに知らせるサービスを提供することを可能にする。また、上記検出を可能にすることは、例えばＳＮＳを利用するユーザのユーザ端末が、投稿前に、当該投稿内容が危険表現となりうる表現を含むことを当該ユーザに知らせるサービスを提供することを可能にする。さらに、上記検出を可能にすることは、危険表現となりうる表現の傾向分析をする為のツールを提供することを可能にする。

本発明の実施態様において使用されうる電子装置（上記第１の電子装置又は上記第２の電子装置）を実現するためのハードウェア構成の一例であり、当該電子装置が例えばコンピュータである場合を示した図である。本発明の実施態様において使用されうる電子装置（上記第１の電子装置又は上記第２の電子装置）を実現するためのハードウェア構成の一例であり、当該電子装置が例えばタブレット端末、スマートフォン、携帯電話、パーソナル・ディジタル・アシスタント（ＰＤＡ）、医療機器端末、ゲーム端末、カー・ナビゲーション・システム、ポータブル・ナビゲーション・システム若しくはキヨスク端末である場合を示した図である。本発明の実施態様に従い、学習用のテキスト・データを用いて、特定のテーマに依存して危険表現となりうる表現を抽出し、危険表現リストを作成する危険表現学習フェーズの処理の流れを示すフローチャートである。本発明の実施態様に従う危険表現学習フェーズの処理の流れにおいて、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データの部分集合を取得する為の処理の流れを示すフローチャートである。本発明の実施態様に従う危険表現学習フェーズの処理において、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データを特定するために用いられる学習済みの学習モデルを作成することのモデル図を示す。本発明の実施態様に従う危険表現学習フェーズの処理において、学習用のテキスト・データから、学習済みの学習モデルを用いて、特定のテーマに関連付けられたテキスト・データを特定することのモデル図を示す。本発明の実施態様に従う危険表現学習フェーズの処理において、ネガティブ情報に該当する単語又はフレーズを特定すること、ネガティブ情報を有するテキスト・データを抽出すること、及び、当該抽出されたデータから上記特定のテーマに依存して危険表現となりうる表現を抽出することのモデル図を示す。本発明の実施態様に従い、分析対象のテキスト・データから、特定のテーマに依存して危険表現となりうる表現が存在するかどうかを検出する危険表現検出フェーズの処理の流れを示すフローチャートである。本発明の実施態様に従う危険表現検出フェーズ処理において、例えばＳＮＳの管理サーバが、特定のテーマ（震災）に依存して危険表現となりうる表現（批判となりうる表現）の書き込みを未然に防ぐサービスをＳＮＳのユーザに対して提供する実施例を示す。本発明の実施態様に従う危険表現検出フェーズ処理において、例えば情報の発信者が、特定のテーマ（震災）に依存して危険表現となりうる表現（批判となりうる表現）の書き込みを予め認識する実施例を示す。本発明の実施態様に従う危険表現検出フェーズ処理において、例えばＳＮＳの管理サーバが、特定のテーマ、当該特定のテーマに依存して危険表現となりうる表現、及び当該危険表現となりうる表現の出現回数を示す実施例を示す。図１に従うハードウェア構成を好ましくは備えており、本発明の実施態様に従う危険表現学習フェーズ処理、及び任意的に本発明の実施態様に従う危険表現検出フェーズ処理を実行する第１の電子装置の機能ブロック図の一例を示した図である。図１に従うハードウェア構成を好ましくは備えており、本発明の実施態様に従う危険表現検出フェーズ処理を実行する第２の電子装置の機能ブロック図の一例を示した図である。

本発明の実施形態を、以下に図面に従って説明する。以下の図を通して、特に断らない限り、同一の符号は同一の対象を指す。本発明の実施形態は、本発明の好適な態様を説明するためのものであり、本発明の範囲をここで示すものに限定する意図はないことを理解されたい。

本発明の実施態様において使用されうる上記第１の電子装置は、上記危険表現学習フェーズの処理、及び任意的に上記危険表現検出フェーズの処理を実施することができる電子装置であれば特に限定されない。当該第１の電子装置は例えば、例えば、コンピュータ（例えば、サーバ・コンピュータ、デスクトップ・コンピュータ、ノート・コンピュータ若しくは一体型パソコン）、又は、タブレット端末（例えば、アンドロイド（登録商標）端末、Ｗｉｎｄｏｗｓ（登録商標）タブレット、若しくはｉＯＳ（登録商標）端末）、スマートフォン、携帯電話、パーソナル・ディジタル・アシスタント（ＰＤＡ）、医療機器端末、ゲーム端末、カー・ナビゲーション・システム、ポータブル・ナビゲーション・システム若しくはキヨスク端末でありうる。

本発明の実施態様において使用されうる上記第２の電子装置は、上記危険表現検出フェーズの処理を実施することができる電子装置であれば特に限定されない。当該第２の電子装置は、上記第１の電子装置と同様に、例えば、例えば、コンピュータ（例えば、サーバ・コンピュータ、デスクトップ・コンピュータ、ノート・コンピュータ若しくは一体型パソコン）、又は、タブレット端末（例えば、アンドロイド（登録商標）端末、Ｗｉｎｄｏｗｓ（登録商標）タブレット、若しくはｉＯＳ（登録商標）端末）、スマートフォン、携帯電話、パーソナル・ディジタル・アシスタント（ＰＤＡ）、医療機器端末、ゲーム端末、カー・ナビゲーション・システム、ポータブル・ナビゲーション・システム若しくはキヨスク端末でありうる。

図１Ａ及び図１Ｂは、本発明の実施態様において使用されうる電子装置（第１の電子装置又は第２の電子装置）を実現するためのハードウェア構成の一例を示した図である。

図１Ａは、本発明の実施態様において使用されうる上記電子装置のうちコンピュータ、例えばデスクトップ・コンピュータ、ノート・コンピュータ又は一体型パソコンの一例を示した図である。

電子装置（１０１）は、ＣＰＵ（１０２）とメイン・メモリ（１０３）とを備えており、これらはバス（１０４）に接続されている。ＣＰＵ（１０２）は好ましくは、３２ビット又は６４ビットのアーキテクチャに基づくものである。当該ＣＰＵ（１０２）は例えば、インテル社のＣｏｒｅ（商標）ｉシリーズ、Ｃｏｒｅ（商標）２シリーズ、Ａｔｏｍ（商標）シリーズ、Ｘｅｏｎ（登録商標）シリーズ、Ｐｅｎｔｉｕｍ（登録商標）シリーズ若しくはＣｅｌｅｒｏｎ（登録商標）シリーズ、ＡＭＤ（Advanced Micro Devices）社のＡシリーズ、Ｐｈｅｎｏｍ（商標）シリーズ、Ａｔｈｌｏｎ（商標）シリーズ、Ｔｕｒｉｏｎ（登録商標）シリーズ若しくはＳｅｍｐｒｏｎ（商標）、又は、インターナショナル・ビジネス・マシーンズ・コーポレーションのＰｏｗｅｒ（商標）シリーズでありうる。

バス（１０４）には、ディスプレイ・コントローラ（１０５）を介して、ディスプレイ（１０６）、例えば液晶ディスプレイ（ＬＣＤ）が接続されうる。また、液晶ディスプレイ（ＬＣＤ）は例えば、タッチパネル・ディスプレイ又はフローティング・タッチ・ディスプレイであってもよい。ディスプレイ（１０６）は、電子装置（１０１）上で動作中のソフトウェア（例えば、本発明の実施態様に従う電子装置用プログラム又は当該電子装置（１０１）上で動作中の各種電子装置用プログラム）が稼働することによって表示されるオブジェクトを、適当なグラフィック・インタフェースで表示するために使用されうる。

バス（１０４）には任意的に、例えばＳＡＴＡ又はＩＤＥコントローラ（１０７）を介して、ディスク（１０８）、例えばハードディスク又はソリッド・ステート・ドライブ（ＳＳＤ）が接続されうる。

バス（１０４）には任意的に、例えばＳＡＴＡ又はＩＤＥコントローラ（１０７）を介して、ドライブ（１０９）、例えばＣＤ、ＤＶＤ又はＢＤドライブが接続されうる。

バス（１０４）には、周辺装置コントローラ（１１０）を介して、例えばキーボード・マウス・コントローラ又はＵＳＢバスを介して、任意的に、キーボード（１１１）及びマウス（１１２）が接続されうる。

ディスク（１０８）には、オペレーティング・システム、例えばＷｉｎｄｏｗｓ（登録商標）ＯＳ、ＵＮＩＸ（登録商標）、ＭａｃＯＳ（登録商標）、及びＪ２ＥＥなどのＪａｖａ（登録商標）処理環境、Ｊａｖａ（登録商標）アプリケーション、Ｊａｖａ（登録商標）仮想マシン（ＶＭ）、Ｊａｖａ（登録商標）実行時（ＪＩＴ）コンパイラを提供するプログラム、本発明の実施態様に従うコンピュータ・プログラム、及びその他のプログラム、並びにデータが、メイン・メモリ（１０３）にロード可能なように記憶されうる。

ディスク（１０８）は、電子装置（１０１）内に内蔵されていてもよく、当該電子装置（１０１）がアクセス可能なようにケーブルを介して接続されていてもよく、又は、当該電子装置（１０１）がアクセス可能なように有線又は無線ネットワークを介して接続されていてもよい。

ドライブ（１０９）は、必要に応じて、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ又はＢＤからプログラム、例えばオペレーティング・システム、アプリケーション又は本発明の実施態様に従う電子装置用プログラムをディスク（１０８）にインストールするために使用されうる。

通信インタフェース（１１４）は、例えばイーサネット（登録商標）・プロトコルに従う。通信インタフェース（１１４）は、通信コントローラ（１１３）を介してバス（１０４）に接続され、電子装置（１０１）を通信回線（１１５）に有線又は無線接続する役割を担い、電子装置（１０１）のオペレーティング・システムの通信機能のＴＣＰ／ＩＰ通信プロトコルに対して、ネットワーク・インタフェース層を提供する。なお、通信回線は例えば、無線ＬＡＮ接続規格に基づく無線ＬＡＮ環境、ＩＥＥＥ８０２．１１ａ／ｂ／ｇ／ｎなどのＷｉ-Ｆｉ無線ＬＡＮ環境、又は携帯電話網環境（例えば、３Ｇ又は４Ｇ環境）でありうる。

図１Ｂは、本発明の実施態様において使用されうる上記電子装置のうち、例えば、タブレット端末、スマートフォン、携帯電話、パーソナル・ディジタル・アシスタント（ＰＤＡ）、医療機器端末、ゲーム端末、カー・ナビゲーション・システム、ポータブル・ナビゲーション・システム若しくはキヨスク端末の一例を示した図である。

図１Ｂに示す電子装置（１２１）のＣＰＵ（１２２）、メイン・メモリ（１２３）、バス（１２４）、ディスプレイ・コントローラ（１２５）、ディスプレイ（１２６）、ＳＳＤ（１２８）、通信コントローラ（１３３）、通信インタフェース（１３４）及び通信回線（１３５）はそれぞれ、図１Ａに示す電子装置（１０１）のＣＰＵ（１０２）、メイン・メモリ（１０３）、バス（１０４）、ディスプレイ・コントローラ（１０５）、ディスプレイ（１０６）、ＳＳＤ（１０８）、通信コントローラ（１１３）、通信インタフェース（１１４）及び通信回線（１１５）に対応する。

タブレット端末等の場合、ＣＰＵ（１２２）は例えば、スマートフォン、携帯電話若しくはタブレット端末用のＣＰＵ、又はアップル社のＡシリーズでありうる。

ＳＳＤ（１２８）ディスクには例えば、スマートフォン用ＯＳ（例えば、アンドロイド（登録商標）ＯＳ、Ｗｉｎｄｏｗｓ（登録商標）ＰｈｏｎｅＯＳ若しくはＷｉｎｄｏｗｓ（登録商標）ＯＳ、又はｉＯＳ（登録商標））、本発明の実施態様に従うアプリケーション・プログラム、及びその他のプログラム、並びにデータが、メイン・メモリ（１２３）にロード可能なように記憶されうる。

キーボード実現手段（１３０）は、アプリの一つとして、ディスプレイ（１２６）上にソフトウェアキーボードを表示する。

図２Ａは、本発明の実施態様に従い、学習用のテキスト・データを用いて、特定のテーマに依存して危険表現となりうる表現を抽出し、危険表現リストを作成する危険表現学習フェーズの処理の流れを示すフローチャートである。

以下に示す図２Ａ及び図２Ｂの説明において電子装置という場合には、当該電子装置は、危険表現学習フェーズの処理を実施する上記第１の電子装置を意味する。

ステップ２０１において、電子装置は、危険表現学習フェーズの処理を開始する。

ステップ２０２において、電子装置は、特定のテーマに依存して危険表現となりうる表現を抽出する為に、学習用のテキスト・データ（２９１）を受け取る。電子装置は、当該学習用のテキスト・データを、例えば、サーバ・コンピュータを介して、又は、記録媒体（例えば、ＣＤ，ＤＶＤ，ＵＳＢメモリ、若しくはハードディスク）を介して受け取りうる。学習用のテキスト・データは例えば、誹謗中傷の抽出対象となるテキスト・データの集合であり、例えばブログや掲示板のデータの集合でありうる。学習用のテキスト・データは例えば、Ｔｗｉｔｔｅｒ（登録商標）のツイートの集合、又は、ＦＡＣＥＢＯＯＫ（登録商標）やＬＩＮＥ（商標）の１メッセージの集合でありうる。

ステップ２０３において、電子装置は、ステップ２０２で受け取った学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データの部分集合を取得する。電子装置は例えば、テーマ特定辞書（２９２）を使用して、特定のテーマに関連付けられたテキスト・データを特定し、上記テキスト・データの部分集合を取得しうる。

特定のテーマに関連付けられたテキスト・データは例えば、特定のテーマに関連付けられた文脈を有するテキスト・データでありうる。

特定のテーマは例えば、震災、復興、節電、地震若しくは津波；特定の企業の製品名若しくはサービス名；又は、秘密情報に関する語でありうるが、これらに限定されるものでない。例えば、語「震災」、語「復興」は、特定のテーマ「震災」の文脈を特定する為に用いられうる。

テーマ特定辞書（２９２）は、特定のテーマの為に用いられる単語又はフレーズを含みうる。

ステップ２０３の詳細、すなわち、特定のテーマに関連付けられたテキスト・データの部分集合を取得する処理の詳細については、下記図２Ｂの説明において説明する。

ステップ２０４において、電子装置は、表層的（文字面的）なネガティブ情報を用いてネガティブ情報を有するテキスト・データ（ネガティブ情報の文脈を有するテキスト・データ）に絞り込む為に、最初に、ステップ２０３において取得したテキスト・データの部分集合（すなわち、特定のテーマに関連付けられたテキスト・データ）において、ネガティブ情報に該当する単語又はフレーズを特定する。電子装置は例えば、ネガティブ情報辞書（２９３）を使用して、ネガティブ情報に該当する単語又はフレーズを特定しうる。

ネガティブ情報は、文脈に関係なく、例えば、誹謗中傷に該当する語句（例えば、詐欺、問題、止めて欲しい、辞めて欲しい、迷惑、悲しい、醜い、馬鹿、無能、嘘つき、悲しい、許せない、悪い、最悪、偽善者、仲間外れ、コネ）、規制語句（例えば、政府又は企業によって策定されている規制語句）、風評情報に該当する語句（例えば、商品の欠陥、サービスの低下）、情報漏洩に該当する語句（例えば、情報漏洩、情報流出、秘密情報、社外秘、部外秘、特許出願前）、又は事件性を予想させるような語句（例えば、自殺、殺人）でありうる。

ネガティブ情報辞書（２９３）は、上記ネガティブ情報に該当する単語又はフレーズを含みうる。

ステップ２０４の具体例、すなわち、ネガティブ情報に該当する単語又はフレーズを特定する例については、下記図５に示す。

ステップ２０５において、電子装置は、表層的（文字面的）なネガティブ情報を用いてネガティブ情報を有するテキスト・データ（ネガティブ情報の文脈を有するテキスト・データ）に絞り込む為に、次に、ステップ２０３で取得した部分集合から、ステップ２０４において特定した単語又はフレーズを含むテキスト・データを抽出する。

ステップ２０５の具体例、すなわち、ネガティブ情報を有するテキスト・データを抽出する例については、下記図５に示す。

ステップ２０６において、電子装置は、ステップ２０５で抽出したテキスト・データ（すなわち、特定のテーマに関連付けられたテキスト・データであって且つネガティブ情報を有するテキスト・データ）から、下記単語又はフレーズを特定する：
（１）ステップ２０５で抽出したテキスト・データに相関が高い単語若しくはフレーズ；又は、
（２）ステップ２０５で抽出したテキスト・データ中の出現頻度の高い単語若しくはフレーズ。

テキスト・データに相関が高い単語若しくはフレーズを特定する方法は、当業者に知られている任意の手法を用いることができる。当該テキスト・データに相関が高い単語若しくはフレーズは例えば、以下の方法で特定されうる。テキスト・データ全体の文書数をＤ、当該テキスト・データの部分集合の文書数をＡ、ある単語若しくはフレーズｗを含む文書の数をＢ、及び、上記テキスト・データの部分集合の文書のうちｗを含む文書の数をＣとした場合に、ＣＤ／ＡＢが１に比べて大きいことをもって、ｗを、上記テキスト・データに相関が高い単語若しくはフレーズとして特定する。

電子装置は、当該テキスト・データにおける上記単語又はフレーズの特定において、少なくも２つの単語の共起表現を危険表現となりうる表現として特定しうる。当該テキスト・データに相関が高い単語若しくはフレーズの共起は例えば、以下の方法で特定されうる。テキスト・データ全体の文書数をＤ、当該テキスト・データの部分集合の文書数をＡ、ある単語若しくはフレーズｗ１及びｗ２を２つとも含む文書の数をＢ、及び、上記テキスト・データの部分集合の文書のうちｗ１及びｗ２を２つとも含む文書の数をＣとした場合に、ＣＤ／ＡＢが１に比べて大きいことをもって、共起（ｗ１，ｗ２）を、上記テキスト・データに相関が高い単語若しくはフレーズの共起として特定する。

ステップ２０７において、電子装置は、ステップ２０６で特定した単語又はフレーズを、ステップ２０３で使用した特定のテーマに依存して危険表現となりうる表現として抽出する。また、電子装置は、上記危険表現となりうる表現とともに、ステップ２０３で使用された特定のテーマを抽出しうる。

特定のテーマに依存して危険表現となりうる表現とは、テキスト・全体ではネガティブ情報（例えば、上記誹謗中傷に該当する語句）ではないが、特定のテーマに依存して危険表現となりうる表現（例えば、上記ネガティブ情報誹謗中傷になりうる表現、その中でも例えば上記誹謗中傷になりうる表現）である。

電子装置は、上記抽出した危険表現となりうる表現を上記特定のテーマに紐付けて（関連付けて）、危険表現リスト（２９４）中に保存しうる。従って、危険表現リスト（２９４）は、特定のテーマと、当該特定のテーマに関連付けられた危険表現となりうる少なくとも１つの表現とを１組とするデータを有している。危険表現リスト（２９４）は、下記図６に示す危険表現検出フェーズの処理において使用される（図６のステップ６０７を参照）。

任意ステップであるステップ２０８において、電子装置は、危険表現検出フェーズの処理を引き続き行うかどうかを判断するために、分析対象のテキスト・データがあるかどうかを判定する。電子装置は、分析対象のテキスト・データが存在することに応じて、処理を図６に記載のステップ６０２に進める。一方、電子装置は、分析対象のテキスト・データが存在しないことに応じて、処理を終了ステップ２０９に進める。

ステップ２０９において、電子装置は、危険表現学習フェーズの処理を終了する。

図２Ｂは、図２Ａに示す危険表現学習フェーズの処理の流れのステップ２０３（学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データの部分集合を取得する為の処理）の処理の詳細を示すフローチャートである。

ステップ２１１において、電子装置は、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データの部分集合を取得する為の処理を開始する。

ステップ２１２において、電子装置は、下記１−１の判定方法を用いて上記テキスト・データの部分集合を取得するかどうかを判断する。当該１−１の判定方法は下記の通りである：
（１）学習用のテキスト・データ（２９１）中に存在するテーマ特定辞書（２９２）に含まれる単語若しくはフレーズの前後の所定の文字数若しくは所定の単語数にある範囲を特定のテーマに関連付けられたテキスト・データ１として特定する：又は、
（２）テーマ特定辞書（２９２）に含まれる単語若しくはフレーズを含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を、特定のテーマに関連付けられたテキスト・データ１として特定する。

電子装置は、上記１−１の判定方法を用いて上記テキスト・データの部分集合を取得することに応じて、処理をステップ２１３に進める。一方、電子装置は、上記１−１の判定方法を用いて上記テキスト・データの部分集合を取得しないことに応じて、処理をステップ２１４に進める。

ステップ２１３において、電子装置は、上記１−１の判定方法を用いて、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データ１を取得する。

上記１−１の判定方法のうちの前者は、学習用のテキスト・データ（２９１）中に出現し且つテーマ特定辞書（２９２）に含まれる単語若しくはフレーズの前後の所定の文字数又は所定の単語数にある範囲を、特定のテーマに関連付けられたテキスト・データとして特定する。従って、上記特定されたテキスト・データは、句読点によって区切られた完全な文でない場合がありうる。当該特定されたテキスト・データは、当該特定のテーマに関連する文脈でもある。例えば、特定のテーマ「震災」に関連付けられたテキスト・データを特定する為に、テーマ特定辞書（２９２）中に含まれており且つ学習用のテキスト・データ（２９１）中に存在する語「復興」が用いられているとする。電子装置は、例えばテキスト・データが日本語で記載されている場合、語「復興」（日本語）の前後の所定の文字数若しくは所定の単語数にある範囲、語「復興」（日本語）の前後の例えば６０文字又は語「復興」（日本語）の前後の例えば２０単語にある範囲を、特定のテーマ「震災」に関連付けられたテキスト・データ１として特定しうる。また、電子装置は、例えばテキスト・データが英語で記載されている場合、語「reconstruction」（英語）の前後の例えば１２０文字又は語「reconstruction」（英語）の前後の例えば２０語にある範囲を、特定のテーマ「震災」に関連付けられたテキスト・データ１として特定しうる。

上記１−１の判定方法のうちの後者は、テーマ特定辞書（２９２）に含まれる単語若しくはフレーズを含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を、特定のテーマに関連付けられたテキスト・データとして特定する。当該特定されたテキスト・データは、当該特定のテーマに関連する文脈でもある。上記文書は、例えばＴｗｉｔｔｅｒ（登録商標）、ＦＡＣＥＢＯＯＫ（登録商標）又はＬＩＮＥの一つのメッセージ、メールソフトで送信する一つのメッセージ、又は電子掲示板への１回の書き込みを含む。例えば、特定のテーマ「震災」に関連付けられたテキスト・データを特定する為に、テーマ特定辞書（２９２）中に含まれており且つ学習用のテキスト・データ（２９１）中に存在する語「震災」が用いられているとする。電子装置は、語「震災」を含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を、特定のテーマ「震災」に関連付けられたテキスト・データ１として特定する。

ステップ２１４において、電子装置は、下記１−２の判定方法を用いて上記テキスト・データの部分集合を取得するかどうかを判断する。当該１−２の判定方法は下記の通りである：
学習済みの学習モデルを用いて、上記特定のテーマに関連付けられたテキスト・データ２を特定する。

電子装置は、上記１−２の判定方法を用いて上記テキスト・データの部分集合を取得することに応じて、処理をステップ２１５に進める。一方、電子装置は、上記１−２の判定方法を用いて上記テキスト・データの部分集合を取得しないことに応じて、処理をステップ２１６に進める。

ステップ２１５において、電子装置は、上記１−２の判定方法を用いて、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データ２を取得する。

上記学習済みの学習モデルは、当業者に知られている任意の機械学習の手法を用いて生成される。学習済みの学習モデルの生成方法の例は、下記図３において説明する。また、学習済みの学習モデルを用いて、上記特定のテーマに関連付けられたテキスト・データ２を特定する方法は、下記図４において説明する。

ステップ２１６において、電子装置は、下記１−３の判定方法を用いて上記テキスト・データの部分集合を取得するかどうかを判断する。当該１−３の判定方法は下記の通りである：
特定の期間情報を用いて、上記特定のテーマに関連付けられたテキスト・データ３を特定する。

電子装置は、上記１−３の判定方法を用いて上記テキスト・データの部分集合を取得することに応じて、処理をステップ２１７に進める。一方、電子装置は、上記１−３の判定方法を用いて上記テキスト・データの部分集合を取得しないことに応じて、処理をステップ２１８に進める。

ステップ２１７において、電子装置は、上記１−３の判定方法を用いて、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データ３を取得する。

特定の期間情報は、期間と特定のテーマの文脈との対応付けを可能にする情報でありうる。特定の期間情報は例えば、２０１１年３月１１日（日本国で発生した東日本大震災）以降である。当該特定の期間情報「２０１１年３月１１日」は、特定のテーマ「震災」に関連付けられる為に、当該特定のテーマ「震災」に関連付けられたテキスト・データを特定するために使用されうる。

ステップ２１８において、電子装置は、ステップ２１３、ステップ２１５及びステップ２１７でそれぞれ取得したテキスト・データ１、２及び３について、集合演算をする。集合演算は例えば、集合積又は集合和を含む。電子装置は、当該集合演算をして、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得する。なお、取得したテキスト・データがテキスト・データ１、２及び３のいずれか一つである場合には、電子装置は、当該一つのテキスト・データを上記特定のテーマに関連付けられたテキスト・データの部分集合とする。

ステップ２１９において、電子装置は、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データの部分集合を取得する為の処理を終了する。

図３は、本発明の実施態様に従う危険表現学習フェーズの処理において、学習用のテキスト・データから、特定のテーマに関連付けられたテキスト・データを特定するために用いられる学習済みの学習モデルを作成することのモデル図を示す。

学習済みの学習モデルは、上記第１の電子装置、又は当該第１の電子装置以外の電子装置において作成されうる。以下に示す図３の説明において電子装置という場合には、当該電子装置は、上記第１の電子装置、又は当該第１の電子装置以外の電子装置を意味する。

ステップＡにおいて、電子装置は、学習機へ入力するための元データ、すなわち「文脈学習用ラベル付きテキスト・データ」の元データのグループ（３０１）を受け取る。電子装置は、当該元データのグループ（３０１）を、例えば、サーバ・コンピュータを介して、又は、記録媒体（例えば、ＣＤ，ＤＶＤ，ＵＳＢメモリ、若しくはハードディスク）を介して受け取りうる）。図３に示す例では、上記元データのグループ（３０１）が元データ（３１１）〜（３１５）を含むように示しているが、これらに限定されるものではないことに留意されたい。

元データのグループ（３１１）は、図２Ａのステップ２０２に示す学習用のテキスト・データとは別に用意される文書データ集合である。元データのグループ（３１１）は、Ｔｗｉｔｔｅｒ（登録商標）のツイートの集合、又は、ＦＡＣＥＢＯＯＫ（登録商標）やＬＩＮＥ（商標）の１メッセージの集合でありうる。図３に示すように、元データ（３１１）〜（３１５）にはそれぞれ、０個（３１１）又は１個以上（３１２〜３１５）のタグが与えられている。当該タグは例えば、元データが「震災」に該当するテキスト・データかどうかを示すものでありうる。当該タグは、必要に応じて、元データに対して電子装置によって自動的に又はユーザによって手動的に与えられうる。

ステップＢにおいて、電子装置は、上記受け取った各元データ（３１１）〜（３１５）から学習モデルを作成する為に、文脈学習用ラベル付きテキスト・データのグループ（３２１）を作成する。図３に示す例では、文脈学習用ラベル付きテキスト・データのグループ（３２１）が文脈学習用ラベル付きテキスト・データ（３３１）〜（３３５）を含むように示しているが、これらに限定されるものではないことに留意されたい。

文脈学習用ラベル付きテキスト・データ（３３１）〜（３３５）はそれぞれ、元データ（３１１）〜（３１５）それぞれ中の各単語及びその出現数の情報（bag-of-words）を有している。

また、電子装置は、例えば、元データが特定のテーマ「震災」に該当するテキスト・データである場合には、すなわち元データが「東日本大震災」、「earthquake」、又は「復興支援」のタグを有している場合には、当該元データに対応する文脈学習用ラベル付きテキスト・データに「震災」のラベルを付与する。従って、図３に示す例では、文脈学習用ラベル付きテキスト・データ（３３１）〜（３３５）のうち、文脈学習用ラベル付きテキスト・データ（３３２）、（３３４）及び（３３５）に「震災」のラベルが付与されている。

電子装置は、学習機（例えば、ロジスティック回帰モデル）に、元データ（３１１）〜（３１５）それぞれ中の上記各単語及びその出現数の情報（bag-of-words）と、文脈学習用ラベル付きテキスト・データ（３３１）〜（３３５）が「震災」に該当するテキスト・データであるかどうかのラベル（ｙｅｓ／ｎｏ）を入力する。すなわち、電子装置は、文脈学習用ラベル付きテキスト・データ（３３１）〜（３３５）をbag-of-wordsでベクトル化し、学習機（例えば、ロジスティック回帰モデル）に、上記ベクトルを従属変数として、文脈学習用ラベル付きテキスト・データ（３３１）〜（３３５）が特定のテーマ「震災」に該当するかしないか（ｙｅｓ／ｎｏ）を目的変数として入力して、当該学習機を学習させる。電子装置は、学習機として、当業者に知られている任意の学習機を使用しうる。

電子装置は、学習機への上記入力によって、学習済みの学習モデルを作成する。

上記では、ロジスティック回帰モデルを述べたが、その他に例えば、ｋ近傍法、シンプルベイズ法、決定リスト法、最大エントロピー法、サポートベクトルマシン法、ニューラルネットワーク法、重回帰分析法による各手法を用いることができる。上記手法はいずれも当業者に知られている手法であるので、本明細書ではその説明を省略する。

図４は、本発明の実施態様に従う危険表現学習フェーズの処理において、学習用のテキスト・データから、学習済みの学習モデルを用いて、特定のテーマに関連付けられたテキスト・データを特定することのモデル図を示す。以下に示す図４の説明において、電子装置という場合には、当該電子装置は上記第１の電子装置を意味する。

電子装置は、図３に示すようにして作成した学習済みの学習モデル（４０３）を用いて、学習用のテキスト・データ（４０１）が、特定のテーマに関連付けられたテキスト・データであるかどうかを判定する。

電子装置は、図３に示した方法と同様にして、学習用のテキスト・データ（４０１）をbag-of-wordsでベクトル化する。そして、電子装置は、学習用のテキスト・データ（４０１）をテキスト・データ毎にbag-of-wordsの形式（４１１）で上記学習済みの学習機（４０２）へ入力する。

学習機（４０２）は、各テキスト・データが特定のテーマに関連付けられたテキスト・データであるかどうかの出力（Ｙｅｓ＝特定のテーマに関連付けられたテキスト・データである，Ｎｏ＝特定のテーマに関連付けられたテキスト・データでない）を電子装置に返す。

電子装置は、学習機（４０２）から上記出力（Ｙｅｓ，Ｎｏ）を取得し、当該出力がｙｅｓであるテキスト・データの集合を、特定のテーマに関連付けられた部分集合として取得する。

図５は、本発明の実施態様に従う危険表現学習フェーズの処理において、ネガティブ情報に該当する単語又はフレーズを特定すること（ステップ２０４）、ネガティブ情報を有するテキスト・データを抽出すること（ステップ２０５）、及び、当該抽出されたデータから上記特定のテーマに依存して危険表現となりうる表現を抽出すること（ステップ２０６，２０７）のモデル図を示す。以下に示す図５の説明において、電子装置という場合には、当該電子装置は上記第１の電子装置を意味する。

図５に示すテキスト・データのグループ（５０１）は、図２に示すステップ２０３において取得したテキスト・データ（すなわち、特定のテーマ「震災」に関連付けられたテキスト・データ）の部分集合の一部である。テキスト・データのグループ（５０１）は、テキスト・データ（５１１）〜（５１５）を有している。

電子装置は、テキスト・データのグループ（５０１）において、ネガティブ情報辞書（２９３）を使用して、ネガティブ情報に該当する単語又はフレーズを特定する（ステップ２０４を参照）。テキスト・データ（５１１）〜（５１５）のネガティブ情報はそれぞれ、「問題」、「迷惑」、「やめてほしい」、「詐欺」、及び「悲しい」である（下線一重線で特定されている部分）。

電子装置は、ネガティブ情報「問題」、「迷惑」、「やめてほしい」、「詐欺」、及び「悲しい」をそれぞれ有するテキスト・データ（５１１）〜（５１５）を抽出する（ステップ２０５）。図５において示していないが、ネガティブ情報を有していないテキスト・データは抽出されない。

次に、電子装置は、上記抽出されたテキスト・データ（５１１）〜（５１５）中の出現頻度の高い単語を特定する。電子装置は、出現頻度の高い単語として、「電池」及び「買う」の共起表現を特定する（ステップ２０６）。

そして、電子装置は、上記特定した単語「電池」及び「買う」を、特定のテーマ「震災」に依存して危険表現となりうる表現として抽出する。また、電子装置は、上記特定のテーマ「震災」を抽出する。

電子装置は、上記抽出した危険表現となりうる表現「電池」及び「買う」を上記特定のテーマ「震災」に紐付けて、危険表現リスト（２９４）中に保存する。

上記では、電子装置が、テキスト・データのグループ（５０１）において、ネガティブ情報辞書（２９３）を使用して、ネガティブ情報に該当する単語又はフレーズを特定し、そして当該ネガティブ情報に該当する単語又はフレーズをそれぞれ有するテキスト・データを抽出する手法を説明した。当該手法の代わりに、電子装置は、学習済みの学習モデルを用いて、テキスト・データのグループ（５０１）から、ネガティブ情報に該当する単語又はフレーズを有するテキスト・データを抽出しうる（図示せず）。以下に、学習済みの学習モデルを用いて、テキスト・データのグループから、ネガティブ情報に該当する単語又はフレーズを有するテキスト・データを抽出する手法を説明する。

上記学習済みの学習モデルは、図２Ｂのステップ２１５と同様に、当業者に知られている任意の機械学習の手法を用いて生成される。

学習済みの学習モデルは、上記第１の電子装置、又は当該第１の電子装置以外の電子装置において作成されうる。以下に示す学習済みの学習モデルの生成方法の説明において電子装置という場合には、当該電子装置は、上記第１の電子装置、又は当該第１の電子装置以外の電子装置を意味する。

ステップＡにおいて、電子装置は、学習機へ入力するための元データ、すなわち「ネガティブ情報学習用ラベル付きテキスト・データ」の元データのグループを受け取る。電子装置は、当該元データのグループを、例えば、サーバ・コンピュータを介して、又は、記録媒体（例えば、ＣＤ，ＤＶＤ，ＵＳＢメモリ、若しくはハードディスク）を介して受け取りうる。

上記元データのグループは、図２Ａのステップ２０２に示す学習用のテキスト・データとは別に用意される文書データ集合である。元データのグループは、Ｔｗｉｔｔｅｒ（登録商標）のツイートの集合、又は、ＦＡＣＥＢＯＯＫ（登録商標）やＬＩＮＥ（商標）の１メッセージの集合でありうる。上記元データにはそれぞれ、ラベルが予め与えられている。当該ラベルは、元データがネガティブ情報を有するか又は有しないかを示すものでありうる。代替的には、当該ラベルは、元データが既知のネガティブ情報に該当する単語又はフレーズを含むか又は含んでいないかを示すものでありうる。

ステップＢにおいて、電子装置は、上記受け取った各元データから学習モデルを作成する為に、ネガティブ情報学習用ラベル付きテキスト・データのグループを作成する。

ネガティブ情報学習用ラベル付きテキスト・データはそれぞれ、上記元データそれぞれ中の各単語及びその出現数の情報（bag-of-words）を有している。

電子装置は、学習機（例えば、ロジスティック回帰モデル）に、上記元データそれぞれ中の上記各単語及びその出現数の情報（bag-of-words）と、当該ネガティブ情報学習用ラベル付きテキスト・データがネガティブ情報を有するかどうかのラベル（ｙｅｓ／ｎｏ）を入力する。すなわち、電子装置は、ネガティブ情報学習用ラベル付きテキスト・データそれぞれをbag-of-wordsでベクトル化し、学習機（例えば、ロジスティック回帰モデル）に、上記ベクトルを従属変数として、ネガティブ情報学習用ラベル付きテキスト・データそれぞれがネガティブ情報を有するかどうか（ｙｅｓ／ｎｏ）を目的変数として入力して、当該学習機を学習させる。電子装置は、学習機として、当業者に知られている任意の学習機を使用しうる。

次に、電子装置は、上記のようにして作成された学習済みの学習モデルを用いて、テキスト・データのグループ（例えば、上記５０１）から、ネガティブ情報に該当する単語又はフレーズを有するテキスト・データを抽出しうる。

電子装置は、学習用のテキスト・データをbag-of-wordsでベクトル化する。そして、電子装置は、学習用のテキスト・データをテキスト・データ毎にbag-of-wordsの形式で上記学習済みの学習機へ入力する。

学習機は、各テキスト・データがネガティブ情報を有するかどうかの出力（Ｙｅｓ＝ネガティブ情報を有する，Ｎｏ＝ネガティブ情報を有していない）を電子装置に返す。

電子装置は、学習機から上記出力（Ｙｅｓ，Ｎｏ）を取得し、当該出力がｙｅｓであるテキスト・データの集合を、ネガティブ情報に該当する単語又はフレーズを有するテキスト・データとして取得する。

次に、電子装置は、上記取得されたテキスト・データそれぞれ中の出現頻度の高い単語を特定する。

そして、電子装置は、上記特定した単語を、特定のテーマ「震災」に依存して危険表現となりうる表現として抽出する。また、電子装置は、上記特定のテーマ「震災」を抽出する。

図５に示すテキスト・データのグループ（５２１）は、図２に示すステップ２０３において取得したテキスト・データ（すなわち、特定のテーマ「earthquake」に関連付けられたテキスト・データ）が英語である場合を示す。電子装置は、テキスト・データが英語で記述されている場合においても、日本語と同様に、ネガティブ情報に該当する単語又はフレーズを特定すること（ステップ２０４）、ネガティブ情報を有するテキスト・データを抽出すること（ステップ２０５）、及び、当該抽出されたデータから特定のテーマ「震災」に依存して危険表現となりうる表現を抽出すること（ステップ２０６，２０７）を行う。そして、電子装置は、抽出した危険表現となりうる表現「battery」及び「buy」を特定のテーマ「earthquake」に紐付けて、危険表現リスト（２９４）中に保存する。

代替的には、電子装置は、学習済みの学習モデルを使用して、テキスト・データのグループ（５０１）から、ネガティブ情報に該当する単語又はフレーズを有するテキスト・データを抽出し、当該抽出されたデータから特定のテーマ「震災」に依存して危険表現となりうる表現を抽出することを行う。そして、電子装置は、抽出した危険表現となりうる表現「battery」及び「buy」を特定のテーマ「earthquake」に紐付けて、危険表現リスト（２９４）中に保存する。

図６は、本発明の実施態様に従い、分析対象のテキスト・データから、特定のテーマに依存して危険表現となりうる表現が存在するかどうかを検出する危険表現検出フェーズの処理の流れを示すフローチャートである。

以下に示す図６の説明において電子装置という場合には、当該電子装置は、危険表現検出フェーズの処理を実施する上記第１の電子装置又は上記第２の電子装置を意味する。

ステップ６０１において、電子装置は、危険表現検出フェーズの処理を開始する。

ステップ６０２において、電子装置は、特定のテーマに依存して危険表現となりうる表現を検出する為に、分析対象のテキスト・データ（６９１）を受け取る。電子装置は、当該分析対象のテキスト・データを、例えば、ユーザの当該電子装置への入力（例えば、Ｔｗｉｔｔｅｒ（登録商標）のツイート、若しくはＦＡＣＥＢＯＯＫ（登録商標）やＬＩＮＥ（商標）のメッセージ入力）を通じて、又は、ユーザのクライアント・コンピュータを介して、若しくは、記録媒体（例えば、ＣＤ，ＤＶＤ，ＵＳＢメモリ、若しくはハードディスク）を介して受け取りうる。分析対象のテキスト・データは例えば、Ｔｗｉｔｔｅｒ（登録商標）のツイート、又は、ＦＡＣＥＢＯＯＫ（登録商標）やＬＩＮＥ（商標）のメッセージでありうる。

ステップ６０３において、電子装置は、ステップ６０２で受け取った分析対象のテキスト・データから、特定のテーマに関連付けられたテキスト・データの部分集合を取得する。電子装置は例えば、テーマ特定辞書（６９２）を使用して、特定のテーマに関連付けられたテキスト・データを特定し、上記テキスト・データの部分集合を取得しうる。テーマ特定辞書（６９２）は、図２Ａに示すテーマ特定辞書（２９２）と同じでありうる。

ステップ６０３の詳細、すなわち、特定のテーマに関連付けられたテキスト・データの部分集合を取得する処理は、上記図２Ｂで説明したものと同様の手法を用いて行われうる。

ステップ６０４において、電子装置は、ステップ６０３において取得したテキスト・データの部分集合（すなわち、特定のテーマに関連付けられたテキスト・データ）において、ネガティブ情報に該当する単語又はフレーズを特定する処理を実行するかどうかを判断する。危険表現検出フェーズの処理の実施においては、ステップ６０４を実行しなくてもよい。なぜならば、ステップ６０３において、特定のテーマに関連付けられたテキスト・データの部分集合が取得されているために、危険表現となりうる表現を当該取得された部分集合から検出すれば、特定のテーマに依存して危険表現となりうる表現を抽出することが可能でありうるからである。電子装置は、ネガティブ情報に該当する単語又はフレーズを特定する処理を実行することに応じて、処理をステップ６０５に進める。一方、電子装置は、ネガティブ情報に該当する単語又はフレーズを特定する処理を実行しないことに応じて、処理をステップ６０７に進める。

ステップ６０５において、電子装置は、表層的（文字面的）なネガティブ情報を用いてネガティブ情報を有するテキスト・データ（ネガティブ情報の文脈を有するテキスト・データ）を絞り込む為に、最初に、ステップ６０３において取得したテキスト・データの部分集合（すなわち、特定のテーマに関連付けられたテキスト・データ）において、ネガティブ情報に該当する単語又はフレーズを特定する。電子装置は例えば、ネガティブ情報辞書（６９３）を使用して、ネガティブ情報に該当する単語又はフレーズを特定しうる。ネガティブ情報辞書（６９３）は、図２Ａに示すネガティブ情報辞書（２９３）と同じでありうる。

ステップ６０６において、電子装置は、表層的（文字面的）なネガティブ情報を用いてネガティブ情報を有するテキスト・データ（ネガティブ情報の文脈を有するテキスト・データ）に絞り込む為に、次に、ステップ６０３で取得した部分集合から、ステップ６０５において特定した単語又はフレーズを含むテキスト・データを抽出する。

ステップ６０７において、電子装置は、ステップ６０３で取得したテキスト・データの部分集合（すなわち、特定のテーマに関連付けられたテキスト・データ）又はステップ６０６で抽出したテキスト・データ（すなわち、特定のテーマに関連付けられたテキスト・データであって且つネガティブ情報を有するテキスト・データ）から、危険表現リスト（６９４）中にあり且つ特定のテーマに関連付けられた危険表現となりうる表現が存在するかどうかを検出する。

ステップ６０８において、電子装置は、危険表現リスト（６９４）中の危険表現となりうる表現が存在することを検出するかどうかを判断する。電子装置は、危険表現となりうる表現が存在することを検出することに応じて、処理をステップ６０９に進める。一方、電子装置は、危険表現となりうる表現が存在することを検出しないことに応じて、処理を終了ステップ６１０に進める。

ステップ６０９において、電子装置は、危険表現となりうる表現が存在することを検出したことに応じて、特定の処理を実行する。特定の処理は例えば、下記の通りであるがこれらに限定されるものでない：
・危険表現検出フェーズの処理を上記第１の電子装置が実行する場合であって、当該第１の電子装置が分析対象のテキスト・データを提供したユーザ・クライアントの電子装置である場合：
−上記分析対象のテキスト・データを当該第１の電子装置に接続されたネットワーク上に送信又はアップロードすることを中止又は中断する；
−上記分析対象のテキスト・データが上記危険表現となりうる表現を有していることを示す表示（例えば、警告表示）を画面上に表示する；若しくは、
−上記危険表現となりうる表現が存在することに応じて、上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示を画面上に表示する；又は、
・危険表現検出フェーズの処理を上記第１の電子装置が実行する場合であって、当該第１の電子装置が分析対象のテキスト・データを提供したユーザ・クライアントの電子装置に接続されているサーバ・コンピュータである場合：
−上記分析対象のテキスト・データを当該第１の電子装置に接続されたネットワーク上に送信又はアップロードすることをユーザ・クライアントの電子装置に中止又は中断させる；
−上記分析対象のテキスト・データが上記危険表現となりうる表現を有していることを示すメッセージ（例えば、警告表示）をユーザ・クライアントの電子装置の画面上に表示するように指示する；若しくは、
−上記危険表現となりうる表現が存在することに応じて、上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示をユーザ・クライアントの電子装置の画面上に表示するように指示する；
又は、
・危険表現検出フェーズの処理を上記第２の電子装置が実行する場合：
−上記分析対象のテキスト・データを当該第１の電子装置に接続されたネットワーク上に送信又はアップロードすることを中止又は中断する；
−上記分析対象のテキスト・データが上記危険表現となりうる表現を有していることを示す表示（例えば、警告表示）を画面上に表示する；若しくは、
上記危険表現となりうる表現が存在することに応じて、上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示を画面上に表示する。

ステップ６１０において、電子装置は、危険表現検出フェーズの処理を終了する。

図７は、本発明の実施態様に従う危険表現検出フェーズ処理において、例えばＳＮＳの管理サーバが、特定のテーマ（震災）に依存して危険表現となりうる表現（批判となりうる表現）の書き込みを未然に防ぐサービスをＳＮＳのユーザに対して提供する実施例を示す。

画面（７０１）は、ＳＮＳサイトを利用するユーザが、ユーザ・コンピュータ上でテキスト・データであるブログ書き込みメッセージ（７１１）を入力し、当該入力したブログ書き込みメッセージ（７１１）を投稿しようとしている画面を示す。上記ユーザは、画面（７０１）上の「投稿」ボタンをクリックしたとする。ユーザ・コンピュータは、当該クリックに応じて、上記入力されたブログ書き込みメッセージ（７１１）を、ＳＮＳサイトの管理サーバ（上記第２の電子装置に該当する）に送信する。

ＳＮＳサイトの管理サーバは、上記ユーザ・コンピュータから、分析対象のテキスト・データであるブログ書き込み・メッセージ（７１１）を受け取ったとする。当該管理サーバは、テーマ特定辞書（６９２）を参照し、当該ブログ書き込み・メッセージ（７１１）が「復興」という語を有していることから、当該ブログ書き込み・メッセージ（７１１）が、特定のテーマ「震災」に関連付けられているものであると判断する。当該管理サーバは、危険表現リスト（６９４）を参照し、ブログ書き込み・メッセージ（７１１）中に、特定のテーマ「震災」に関連付けられた危険表現となりうる表現が存在するかどうかを検出する。管理サーバは、ブログ書き込み・メッセージ（７１１）中に、特定のテーマ「震災」に関連付けられた危険表現となりうる共起表現「電池」及び「買う」が存在することを検出する。当該管理サーバは、特定のテーマ「震災」に関連付けられた危険表現となりうる共起表現が存在することを検出することに応じて、ユーザ・コンピュータ上で、ユーザに投稿するかどうかを確認するための確認画面を表示させる命令を送信する。

ユーザ・コンピュータは、上記命令を受信することに応じて、表示装置上に確認画面（７２１）を表示する。確認画面（７２１）は、警告メッセージ（７３１）、危険表現となりうる表現（７３２）、特定のテーマ（７３３）、及びブログ書き込み・メッセージ（７３４）を有する。警告メッセージ（７３１）は、ユーザに対して、ブログ書き込み・メッセージ（７１１）が投稿されることによって生じる問題をユーザに伝えるためのメッセージでありうる。危険表現となりうる表現（７３２）は、ブログ書き込み・メッセージ（７１１）中の、特定のテーマ「震災」に依存して危険表現となりうる表現を示す。特定のテーマ（７３３）は、ブログ書き込み・メッセージ（７１１）のテーマを示す。ブログ書き込み・メッセージ（７３４）は、ユーザによって入力されたブログ書き込み・メッセージ（７１１）に対応し、当該メッセージ中（７３４）において、危険表現となりうる表現（７３２）が強調表示（例えば、斜体、色付け、強調表示）されている。

ユーザは、上記確認画面（７２１）中の警告メッセージ（７３１）を参照し、投稿を継続するか（ボタン「ＯＫ」）、投稿内容を変更するか（ボタン「再編集」）、又は投稿をキャンセルするか（ボタン「キャンセル」）を選択しうる。

上記のようにして、上記管理サーバは、ブログ書き込み・メッセージ（７１１）中に特定のテーマ「震災」に依存して危険表現となりうる表現「電池」及び「買う」があることを、ユーザに知らせることが可能になる。従って、上記管理サーバは、特定のテーマ「震災」に依存して、批判となりうる書き込みを未然に防ぐサービスをユーザに対して提供することが可能になる。

図８は、本発明の実施態様に従う危険表現検出フェーズ処理において、例えば情報の発信者が、特定のテーマ（震災）に依存して危険表現となりうる表現（批判となりうる表現）の書き込みを予め認識する実施例を示す。

画面（８０１）は、ユーザが、ユーザ・コンピュータ上でテキスト・データであるマイクロ・ブログ書き込みメッセージ（８１１）を入力し、当該入力したマイクロ・ブログ書き込みメッセージ（８１１）を投稿しようとしている画面を示す。上記ユーザは、画面（８０１）上の「投稿」ボタンをクリックしたとする。

ユーザ・コンピュータは、特定の期間情報を参照し、当該マイクロ・ブログ書き込み・メッセージ（８１１）が「作成日時：２０１１年３月２０日」という語を有している又は当該マイクロ・ブログ書き込み・メッセージ（８１１）に関連付けられている（例えば、当該マイクロ・ブログ書き込み・メッセージ（８１１）中に、「作成日時：２０１１年３月２０日」という語が属性値として埋め込まれている）ことから、当該ブログ書き込み・メッセージ（８１１）が、特定のテーマ「震災」に関連付けられているものであると判断する。当該ユーザ・コンピュータは、危険表現リスト（６９４）を参照し、マイクロ・ブログ書き込み・メッセージ（８１１）中に、特定のテーマ「震災」に関連付けられた危険表現となりうる表現が存在するかどうかを検出する。当該ユーザ・コンピュータは、マイクロ・ブログ書き込み・メッセージ（８１１）中に、特定のテーマ「震災」に関連付けられた危険表現となりうる共起表現「水」及び「買う」が存在することを検出する。

上記ユーザ・コンピュータは、特定のテーマ「震災」に関連付けられた危険表現となりうる共起表現が存在することを検出することに応じて、ユーザに投稿するかどうかを確認するための確認画面（８２１）を表示装置上に表示する。確認画面（８２１）は、警告メッセージ（８３１）、危険表現となりうる表現（８３２）、特定のテーマ（８３３）、及びマイクロ・ブログ書き込み・メッセージ（８３４）を有する。警告メッセージ（８３１）は、ユーザに対して、マイクロ・ブログ書き込み・メッセージ（８１１）が投稿されることによって生じる問題をユーザに伝えるためのメッセージでありうる。危険表現となりうる表現（８３２）は、マイクロ・ブログ書き込み・メッセージ（８１１）中の、特定のテーマ「震災」に依存して危険表現となりうる表現を示す。特定のテーマ（８３３）は、マイクロ・ブログ書き込み・メッセージ（８１１）のテーマを示す。ブログ書き込み・メッセージ（８３４）は、ユーザによって入力されたマイクロ・ブログ書き込み・メッセージ（８１１）に対応し、当該メッセージ中（８３４）において、危険表現となりうる表現（８３２）が強調表示（例えば、斜体、色付け、強調表示）されている。

ユーザは、上記確認画面（８２１）中の警告メッセージ（８３１）を参照し、投稿を継続するか（ボタン「ＯＫ」）、投稿内容を変更するか（ボタン「再編集」）、又は投稿をキャンセルするか（ボタン「キャンセル」）を選択しうる。

上記のようにして、ユーザ・コンピュータは、マイクロ・ブログ書き込み・メッセージ（８１１）中に特定のテーマ「震災」に依存して危険表現となりうる表現「水」及び「買う」があることを、ユーザに知らせることが可能になる。従って、ユーザは、特定のテーマ「震災」に依存して、批判となりうる書き込みを予め認識することが可能になる。

図９は、本発明の実施態様に従う危険表現検出フェーズ処理において、例えばＳＮＳの管理サーバが、特定のテーマ、当該特定のテーマに依存して危険表現となりうる表現、及び当該危険表現となりうる表現の出現回数を示す実施例を示す。

ＳＮＳの管理サーバは、傾向分析のツールとして使用する為に、特定のテーマ（９１１、９２１、９３１）、及び当該特定のテーマ（９１１、９２１、９３１）それぞれに依存して危険表現となりうる表現（９１２、９２２、９３２）、及び任意的に、当該危険表現となりうる表現（９１２、９２２、９３２）それぞれの出現回数（９１３、９２３、９３３）を画面（９０１）上に提示する。ＳＮＳの管理者は、上記画面（９０１）を参照し、上記特定のテーマ（９１１、９２１、９３１）、上記危険表現となりうる表現（９１２、９２２、９３２）、及び出現回数（９１３、９２３、９３３）を見ることによって、どの文脈でどの程度の数の危険表現となりうる表現が出ているかを調べることが可能になる。

図１０は、図１に従うハードウェア構成を好ましくは備えており、本発明の実施態様に従う危険表現学習フェーズ処理、及び任意的に本発明の実施態様に従う危険表現検出フェーズ処理を実行する第１の電子装置（１００１）の機能ブロック図の一例を示した図である。

第１の電子装置（１００１）は、第１の部分集合取得手段（１０１１）、第１のテキスト・データ抽出手段（１０１２）、及び第１の危険表現抽出手段（１０１３）、並びに任意的に、第２の部分集合取得手段（１０２１）、第２のテキスト・データ抽出手段（１０２２）、第２の危険表現抽出手段（１０２３）、及び特定処理実行手段（１０２４）を備えている。

第１の部分集合取得手段（１０１１）は、危険表現学習フェーズにおいて、学習用のテキスト・データから、上記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得する。

第１の部分集合取得手段（１０１１）は、図２Ａに示すステップ２０２及び２０３、並びに、図２Ｂに示す各ステップを実行しうる。

第１のテキスト・データ抽出手段（１０１２）は、危険表現学習フェーズにおいて、第１の部分集合取得手段（１０１１）が取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出する。

第１のテキスト・データ抽出手段（１０１２）は、図２Ａに示すステップ２０４及び２０５を実行しうる。

第１の危険表現抽出手段（１０１３）は、危険表現学習フェーズにおいて、第１のテキスト・データ抽出手段（１０１２）が抽出したテキスト・データから、（１）当該抽出されたテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）当該抽出されたテキスト・データ中の出現頻度の高い単語若しくはフレーズを、上記特定のテーマに依存して危険表現となりうる表現として抽出する。

第１の危険表現抽出手段（１０１３）は、図２Ａに示すステップ２０６及び２０７を実行しうる。

第２の部分集合取得手段（１０２１）は、危険表現検出フェーズにおいて、分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得する。なお、第１の部分集合取得手段（１０１１）が、第２の部分集合取得手段（１０２１）の機能を包含していてもよい。

第２の部分集合取得手段（１０２１）は、図６に示すステップ６０２及び６０３を実行しうる。

第２のテキスト・データ抽出手段（１０２２）は、危険表現検出フェーズにおいて、第２の部分集合取得手段（１０２１）が取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出する。なお、第１のテキスト・データ抽出手段（１０１２）が、第２のテキスト・データ抽出手段（１０２２）の機能を包含していてもよい。

第２のテキスト・データ抽出手段（１０２２）は、図６に示すステップ６０４、６０５及び６０６を実行しうる。

第２の危険表現抽出手段（１０２３）は、危険表現検出フェーズにおいて、第２の部分集合取得手段（１０２１）が取得したテキスト・データの部分集合において、又は、第２のテキスト・データ抽出手段（１０２２）が抽出したテキスト・データにおいて、第１の危険表現抽出手段（１０１３）が抽出した危険表現となりうる表現が存在することを検出する。なお、第１の危険表現抽出手段（１０１３）が、第２の危険表現抽出手段（１０２３）の機能を包含していてもよい。

第２の危険表現抽出手段（１０２３）は、図６に示すステップ６０７及び６０８を実行しうる。

特定処理実行手段（１０２４）は、上記危険表現となりうる表現が存在することに応じて、下記に示す処理のうちの少なくとも１つを実行しうる：
上記分析対象のテキスト・データをネットワーク上に送信又はアップロードすることを中止又は中断すること；
上記分析対象のテキスト・データが上記危険表現を有していることを示す表示を画面上に表示すること；
上記分析対象のテキスト・データが上記危険表現を有していることを示すメッセージを上記分析対象のテキストを提供したユーザの電子装置に送信すること；及び
上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示を画面上に表示すること。

特定処理実行手段（１０２４）は、図６に示すステップ６０９を実行しうる。

図１１は、図１に従うハードウェア構成を好ましくは備えており、本発明の実施態様に従う危険表現検出フェーズ処理を実行する第２の電子装置（１１０１）の機能ブロック図の一例を示した図である。

第２の電子装置（１１０１）は、第２の部分集合取得手段（１１２１）、第２のテキスト・データ抽出手段（１１２２）、第２の危険表現抽出手段（１１２３）、及び特定処理実行手段（１１２４）を備えている。

第２の部分集合取得手段（１１２１）は、危険表現検出フェーズにおいて、分析対象のテキスト・データから、上記特定のテーマに関連付けられたテキスト・データの部分集合を取得する。

第２の部分集合取得手段（１１２１）は、図６に示すステップ６０２及び６０３を実行しうる。

第２のテキスト・データ抽出手段（１１２２）は、危険表現検出フェーズにおいて、第２の部分集合取得手段（１０２１）が取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出する。

第２のテキスト・データ抽出手段（１１２２）は、図６に示すステップ６０４、６０５及び６０６を実行しうる。

第２の危険表現抽出手段（１１２３）は、危険表現検出フェーズにおいて、第２の部分集合取得手段（１０２１）が取得したテキスト・データの部分集合において、又は、第２のテキスト・データ抽出手段（１０２２）が抽出したテキスト・データにおいて、第１の危険表現抽出手段（１０１３）が抽出した危険表現となりうる表現が存在することを検出する。

第２の危険表現抽出手段（１１２３）は、図６に示すステップ６０７及び６０８を実行しうる。

特定処理実行手段（１１２４）は、上記危険表現となりうる表現が存在することに応じて、下記に示す処理のうちの少なくとも１つを実行しうる：
上記分析対象のテキスト・データをネットワーク上に送信又はアップロードすることを中止又は中断すること；
上記分析対象のテキスト・データが上記危険表現を有していることを示す表示を画面上に表示すること；
上記分析対象のテキスト・データが上記危険表現を有していることを示すメッセージを上記分析対象のテキストを提供したユーザの電子装置に送信すること；及び
上記特定のテーマと上記危険表現となりうる表現の出現数とを示す表示を画面上に表示すること。

特定処理実行手段（１１２４）は、図６に示すステップ６０９を実行しうる。

Claims

特定のテーマに依存して危険表現となりうる表現を検出する方法であって、電子装置が、
学習用のテキスト・データから、前記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得するステップと、
前記取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出するステップと、
（１）前記学習用のテキスト・データにおいて当該抽出されたテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）当該抽出されたテキスト・データ中の出現頻度の高い単語若しくはフレーズを、前記特定のテーマに依存して危険表現となりうる表現として、前記抽出されたテキスト・データから抽出するステップ
を実行することを含む、前記方法。
前記電子装置が第１の電子装置であり、
前記第１の電子装置又は前記第１の電子装置と異なる第２の電子装置が、
分析対象のテキスト・データから、前記特定のテーマに関連付けられたテキスト・データの部分集合を取得するステップと、
前記分析対象のテキスト・データから取得した前記部分集合において、前記危険表現となりうる表現が存在することを検出するステップと
を実行することを含む、請求項１に記載の方法。
前記第１の電子装置又は前記第２の電子装置が、
前記分析対象のテキスト・データから取得した前記部分集合から、ネガティブ情報を有するテキスト・データを抽出するステップ
をさらに実行することを含み、
前記分析対象のテキスト・データから取得した前記部分集合において、前記危険表現となりうる表現が存在することを検出するステップが、
前記分析対象のテキスト・データからの前記抽出したテキスト・データにおいて、前記危険表現となりうる表現が存在することを検出するステップ
を含む、
請求項２に記載の方法。
前記第１の電子装置又は前記第２の電子装置が、
前記危険表現となりうる表現が存在することに応じて、前記分析対象のテキスト・データをネットワーク上に送信又はアップロードすることを中止又は中断するステップ、
前記危険表現となりうる表現が存在することに応じて、前記分析対象のテキスト・データが前記危険表現となりうる表現を有していることを示す表示を画面上に表示するステップ、
前記危険表現となりうる表現が存在することに応じて、前記分析対象のテキスト・データが前記危険表現となりうる表現を有していることを示すメッセージを前記分析対象のテキストを提供したユーザの電子装置に送信するステップ、
前記危険表現となりうる表現が存在することに応じて、前記特定のテーマと前記危険表現となりうる表現の出現数とを示す表示を画面上に表示するステップ
のうちの少なくとも１つをさらに実行することを含む、請求項２に記載の方法。
前記危険表現となりうる表現が存在することを検出するステップが、
前記特定のテーマをさらに抽出するステップ
をさらに含む、請求項１に記載の方法。
前記危険表現となりうる表現が共起表現を含む、請求項１に記載の方法。
前記ネガティブ情報を有するテキスト・データを抽出するステップが、
前記取得した部分集合において、前記ネガティブ情報に該当する単語若しくはフレーズを特定するステップと、
前記特定された単語若しくはフレーズを有するテキスト・データを抽出するステップと
を含む、請求項１に記載の方法。
前記ネガティブ情報に該当する単語若しくはフレーズを特定するステップが、
ネガティブ情報であることを判定可能な単語若しくはフレーズを含むネガティブ情報辞書を用いて行われる、請求項７に記載の方法。
前記ネガティブ情報を有するテキスト・データを抽出するステップが、
前記取得した部分集合から、学習済みの機械学習モデルを用いて、前記ネガティブ情報に該当する単語若しくはフレーズを有するテキスト・データを抽出するステップ
を含む、請求項１に記載の方法。
前記テキスト・データの部分集合を取得するステップが、
特定のテーマの為に用いられる単語若しくはフレーズを含むテーマ特定辞書を用いて、前記特定のテーマに関連付けられたテキスト・データを特定するステップ
を含む、請求項１に記載の方法。
前記テキスト・データの部分集合を取得するステップが、
前記学習用のテキスト・データ中に存在し且つ前記テーマ特定辞書に含まれる単語若しくはフレーズの前後の所定の文字数若しくは所定の単語数にある範囲を、又は、
前記テーマ特定辞書に含まれる単語若しくはフレーズを含むテキスト・データを有する同一の文、同一の段落、同一の項目若しくは同一の文書を
前記特定のテーマに関連付けられたテキスト・データとして特定するステップ
を含む、請求項１０に記載の方法。
前記テキスト・データの部分集合を取得するステップが、
前記学習用のテキスト・データから、学習済みの学習モデルを用いて、前記特定のテーマに関連付けられたテキスト・データを特定するステップ
を含む、請求項１に記載の方法。
前記テキスト・データの部分集合を取得するステップが、
（１）特定のテーマの為に用いられる単語若しくはフレーズを含むテーマ特定辞書を用いて、前記特定のテーマに関連付けられたテキスト・データを特定するステップ、
（２）前記学習用のテキスト・データから、学習済みの学習モデルを用いて、前記特定のテーマに関連付けられたテキスト・データを特定するステップ、及び、
（３）特定の期間情報に関連付けられたテキスト・データを特定するステップ
のうちの少なくとも２つのステップにおいて特定されたテキスト・データの集合演算をして、前記特定のテーマに関連付けられたテキスト・データの部分集合を取得するステップ
を含む、請求項１に記載の方法。
前記テキスト・データの部分集合を取得するステップが、
前記特定のテーマに関連付けられたテキスト・データと前記特定の期間情報に関連付けられたテキスト・データについて集合演算をして、前記特定のテーマに関連付けられたテキスト・データの部分集合を取得するステップ
を含む、請求項１に記載の方法。
特定のテーマに依存して危険表現となりうる表現を検出するための電子装置であって、
学習用のテキスト・データから、前記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得する部分集合取得手段と、
前記部分集合取得手段が取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出するテキスト・データ抽出手段と、
（１）前記学習用のテキスト・データにおいて前記テキスト・データ抽出手段が抽出したテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）前記テキスト・データ抽出手段が抽出した前記テキスト・データ中の出現頻度の高い単語若しくはフレーズを、前記特定のテーマに依存して危険表現となりうる表現として、前記テキスト・データ抽出手段が抽出した前記テキスト・データから抽出する危険表現抽出手段と
を備えている、前記電子装置。
前記部分集合取得手段がさらに、分析対象のテキスト・データから、前記特定のテーマに関連付けられたテキスト・データの部分集合を取得し、
前記危険表現抽出手段がさらに、前記部分集合取得手段が前記分析対象のテキスト・データから取得した前記部分集合において、前記危険表現となりうる表現が存在することを検出する、
請求項１５に記載の電子装置。
前記テキスト・データ取得手段がさらに、前記部分集合取得手段が前記分析対象のテキスト・データから取得した前記部分集合において、ネガティブ情報を有するテキスト・データを抽出し、
前記危険表現抽出手段がさらに、前記テキスト・データ取得手段が抽出した前記分析対象のテキスト・データからのテキスト・データにおいて、前記危険表現となりうる表現が存在することを検出する、
請求項１６に記載の電子装置。
特定のテーマに依存して危険表現となりうる表現を検出するための電子装置システムであって、
第１の電子装置と、
第２の電子装置と
を備えており、
前記第１の電子装置が、
学習用のテキスト・データから、前記特定のテーマ及び任意的に特定の期間情報に関連付けられたテキスト・データの部分集合を取得する第１の部分集合取得手段と、
前記取得した部分集合から、ネガティブ情報を有するテキスト・データを抽出する第１のテキスト・データ抽出手段と、
（１）前記学習用のテキスト・データおいて前記抽出されたテキスト・データに相関が高い単語若しくはフレーズを、又は、（２）当該抽出されたテキスト・データ中の出現頻度の高い単語若しくはフレーズを、前記特定のテーマに依存して危険表現となりうる表現として、前記抽出されたテキスト・データから抽出する第１の危険表現抽出手段と
を備えており、
前記第２の電子装置が、
分析対象のテキスト・データから、前記特定のテーマに関連付けられたテキスト・データの部分集合を取得する第２の部分集合取得手段と、
前記取得した前記部分集合において、前記第１の危険表現抽出手段が抽出した危険表現となりうる表現が存在することを検出する第２の危険表現検出手段と
を備えている、前記電子装置システム。
前記第２の電子装置が、
前記第２の部分集合取得手段が取得した前記部分集合から、ネガティブ情報を有するテキスト・データを抽出する第２のテキスト・データ取得手段
をさらに備えており、
前記第２の危険表現検出手段が、
前記第２のテキスト・データ取得手段が抽出したテキスト・データにおいて、前記危険表現となりうる表現が存在することを検出する、
請求項１８に記載の前記電子装置システム。
特定のテーマに依存して危険表現となりうる表現を検出するための電子装置用プログラムであって、電子装置に、請求項１及び５〜１４のいずれか一項に記載の方法の各ステップを実行させる、前記電子装置用プログラム。