JP2011170578A - 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 - Google Patents
検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 Download PDFInfo
- Publication number
- JP2011170578A JP2011170578A JP2010033208A JP2010033208A JP2011170578A JP 2011170578 A JP2011170578 A JP 2011170578A JP 2010033208 A JP2010033208 A JP 2010033208A JP 2010033208 A JP2010033208 A JP 2010033208A JP 2011170578 A JP2011170578 A JP 2011170578A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- search
- dependency
- learning
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】特定カテゴリに属さない複数の正当学習文章情報と、特定カテゴリに属する複数の不当学習文章情報とを蓄積した学習文章蓄積手段を有し、検索キーワードを含む学習文章情報を検索し、その検索キーワードに対する係り受けキーワードを抽出し、係り受けキーワード毎に、全ての学習文章情報の数に対する正当学習文章情報の数の正当割合を算出し、正当割合が所定閾値以上となる係り受けキーワードを非検索キーワードとして登録する非検索キーワード辞書を生成する。これにより、検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにする。
【選択図】図2
Description
特定カテゴリに属さない複数の正当学習文章情報と、特定カテゴリに属する複数の不当学習文章情報とを蓄積した学習文章蓄積手段と、
学習文章蓄積手段を用いて、検索キーワードを含む学習文章情報を検索する学習文章キーワード検索手段と、
検索キーワードを含む学習文章情報について、検索キーワードに対する係り受けキーワードを抽出する学習係り受け解析手段と、
単語のノードがツリー状に構成された概念辞書記憶手段と、
概念辞書記憶手段を用いて、係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する係り受け関連キーワード抽出手段と、
係り受けキーワード及び係り受け関連キーワードの全てのキーワード毎に、正当学習文章情報の数と、不当学習文章情報の数とを計数し、全ての学習文章情報の数に対する正当学習文章情報の数の正当割合を算出する正当割合算出手段と、
正当割合が所定閾値以上となる係り受けキーワード及び係り受け関連キーワードを非検索キーワードとして登録する非検索キーワード辞書手段と
してコンピュータを機能させ、検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにコンピュータを機能させることを特徴とする。
係り受け関連キーワード抽出手段は、概念辞書記憶手段を用いて、係り受けキーワードに対応するノードよりも少なくとも1階層上の上位概念のノードから見て、下位概念となる複数の係り受け関連キーワードを抽出するようにコンピュータを機能させることも好ましい。
係り受け関連キーワード抽出手段は、概念辞書記憶手段を用いて、係り受けキーワードに対応するノードの階層nの高さに基づいて、当該階層nから何階層上の上位概念のノードから見るかを決定するようにコンピュータを機能させることも好ましい。
係り受け関連キーワード抽出手段は、係り受けキーワードの品詞に基づいて、概念辞書記憶手段を用いて、当該階層nから何階層上の上位概念のノードから見るかを決定するようにコンピュータを機能させることも好ましい。
係り受け関連キーワード抽出手段は、係り受け関連キーワードの品詞に基づいて、係り受け関連キーワードとして抽出するか否かを決定するようにコンピュータを機能させることも好ましい。
概念辞書記憶手段を用いて、検索キーワードに対応するノードよりも下位概念となる複数の検索関連キーワードを抽出する検索関連キーワード抽出手段を更に有し、
学習文章キーワード検索手段は、学習文章蓄積手段を用いて、検索関連キーワードを含む学習文章情報を更に検索し、
学習係り受け解析手段は、検索関連キーワードを含む学習文章情報について、検索関連キーワードに対する係り受けキーワードを更に抽出する
ようにコンピュータを機能させることも好ましい。
解析対象となる対象文章情報を入力する対象文章入力手段と、
対象文章情報が、検索キーワード辞書手段に蓄積された検索キーワードを含むか否かを判定する対象文章キーワード検索手段と、
検索キーワードを含む対象文章情報について、検索キーワードに対する係り受けキーワードを抽出する対象係り受け解析手段と、
抽出された係り受けキーワードが、非検索キーワード辞書手段に登録された非検索係り受けキーワードと一致するか否かを判定する非検索キーワード判定手段と、
対象文章キーワード検索手段によって偽と判定された対象文章情報と、対象文章キーワード検索手段によって真と判定されると共に非検索キーワード判定手段によって真と判定された対象文章情報とを、特定カテゴリに属さない文章情報として分類する文章情報分類手段と
してコンピュータを機能させることも好ましい。
非検索キーワード辞書手段は、登録された係り受けキーワード毎に、正当割合算出手段によって算出された正当割合を対応付けて登録しており、
非検索キーワード判定手段は、抽出された係り受けキーワードが、非検索キーワード辞書手段に登録された係り受けキーワードと一致し、且つ、当該係り受けキーワードにおける正当割合が所定閾値以上である場合に、当該係り受けキーワードに対して真と判定するようにコンピュータを機能させることも好ましい。
検索キーワードは、カテゴリ分類を目的として設定されたキーワードであり、
学習文章蓄積手段における特定カテゴリは、カテゴリ分類に基づく文章情報の群であるようにコンピュータを機能させることも好ましい。
検索キーワードは、違法・有害なキーワードであり、
学習文章蓄積手段における特定カテゴリは、違法・有害な文章情報の群であるようにコンピュータを機能させることも好ましい。
検索キーワードは、ユーザによって指定されたキーワードであり、
学習文章蓄積手段における特定カテゴリは、ユーザによって指定された文章情報の群であるようにコンピュータを機能させることも好ましい。
対象文章情報は、ネットワークを介して公開されているブログ(Weblog)、掲示板及び/又はクチコミコメントにおける不特定多数のユーザによって記述された文章情報であることも好ましい。
特定カテゴリに属さない複数の正当学習文章情報と、特定カテゴリに属する複数の不当学習文章情報とを蓄積した学習文章蓄積手段と、
学習文章蓄積手段を用いて、検索キーワードを含む学習文章情報を検索する学習文章キーワード検索手段と、
検索キーワードを含む学習文章情報について、検索キーワードに対する係り受けキーワードを抽出する学習係り受け解析手段と、
単語のノードがツリー状に構成された概念辞書記憶手段と、
概念辞書記憶手段を用いて、係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する係り受け関連キーワード抽出手段と、
係り受けキーワード及び係り受け関連キーワードの全てのキーワード毎に、正当学習文章情報の数と、不当学習文章情報の数とを計数し、全ての学習文章情報の数に対する正当学習文章情報の数の正当割合を算出する正当割合算出手段と、
正当割合が所定閾値以上となる係り受けキーワード及び係り受け関連キーワードを非検索キーワードとして登録する非検索キーワード辞書手段と
を有し、検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにすることを特徴とする。
特定カテゴリに属さない複数の正当学習文章情報と、特定カテゴリに属する複数の不当学習文章情報とを、学習文章蓄積部に蓄積しており、
単語のノードがツリー状に構成された概念辞書を、概念辞書記憶部に記憶しており、
学習文章蓄積手段を用いて、検索キーワードを含む学習文章情報を検索する第1のステップと、
検索キーワードを含む学習文章情報について、検索キーワードに対する係り受けキーワードを抽出する第2のステップと、
概念辞書記憶手段を用いて、係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する第3のステップと、
係り受けキーワード及び係り受け関連キーワードの全てのキーワード毎に、正当学習文章情報の数と、不当学習文章情報の数とを計数し、全ての学習文章情報の数に対する正当学習文章情報の数の正当割合を算出する第4のステップと、
正当割合が所定閾値以上となる係り受けキーワード及び係り受け関連キーワードを非検索キーワードとして登録する第5のステップと
を有し、検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにすることを特徴とする。
図2は、本発明における非検索キーワードの生成を表す説明図である。以下では、図1の説明と共に、図2の内容が説明される。
例えば、特定カテゴリが違法・有害な文章情報の群である場合、学習文章蓄積部110は、以下のような文章情報の群を混在して蓄積する。
(1)違法・有害カテゴリに属さない文章情報の群
=各文章情報に「正当」フラグが付加されている
=正当学習文章情報の群
(2)違法・有害カテゴリに属する文章情報の群
=各文章情報に「不当」フラグが付加されている
=不当学習文章情報の群
勿論、特定カテゴリがユーザによって指定された文章情報の群である場合、学習文章蓄積部110は、以下のような文章情報の群を混在して蓄積する。
(1)ユーザ指定の特定カテゴリに属さない文章情報の群
=各文章情報に「正当」フラグが付加されている
=正当学習文章情報の群
(2)ユーザ指定の特定カテゴリに属する文章情報の群
=各文章情報に「不当」フラグが付加されている
=不当学習文章情報の群
学習文章情報a:「不当」フラグが付加(違法・有害カテゴリに属する)
「爆破」<-「学校」
学習文章情報b:「正当」フラグが付加(違法・有害カテゴリに属さない)
「爆破」<-「鉱山」
学習文章情報c:「正当」フラグが付加(違法・有害カテゴリに属さない)
「爆破」<-「駄目」
これによって、以下のようなキーワード組が、係り受け関連キーワード抽出部114へ出力される。
「検索キーワード<-係り受けキーワード:正当/不当」
「 爆破 <- 学校 :不当」
「 爆破 <- 鉱山 :正当」
「 爆破 <- 駄目 :正当」
「学校」->「小学校」「専門学校」
係り受け関連キーワード抽出部114は、検索キーワード「爆破」に対する係り受けキーワード「学校」及び係り受け関連キーワード「小学校」「専門学校」を、正当割合算出部115へ出力する。
「爆破」<-「学校」 :正当学習文章情報の数=40個
不当学習文章情報の数=1960個
正当割合=40/2000=2%
「爆破」<-「小学校」 :正当学習文章情報の数=10個
不当学習文章情報の数=990個
正当割合=10/1000=1%
「爆破」<-「専門学校」:正当学習文章情報の数=5個
不当学習文章情報の数=95個
正当割合=5/100=5%
「爆破」<-「炭坑」 :正当学習文章情報の数=90個
不当学習文章情報の数=10個
正当割合=90/100=90%
「爆破」<-「鉱山」 :正当学習文章情報の数=99個
不当学習文章情報の数=1個
正当割合=99/100=99%
そして、正当割合算出部115は、係り受けキーワード毎の正当割合を、非検索キーワード辞書部116へ出力する。
「爆破」<-「学校」 :2%
<-「小学校」 :1%
<-「専門学校」:5%
<-「炭坑」 :90%
<-「鉱山」 :99%
検索キーワード「爆破」<-非検索・係り受けキーワード「学校」 :2%
<-非検索・係り受け関連キーワード「小学校」 :1%
<-非検索・係り受け関連キーワード「専門学校」:5%
<-非検索・係り受けキーワード「炭坑」 :90%
<-非検索・係り受け関連キーワード「鉱山」 :99%
<-非検索・係り受けキーワード「駄目」 :60%
図3は、本発明における対象文章情報の分類を表す説明図である。以下では、図1の説明と共に、図3の内容が説明される。
対象文章情報:「爆破」<-「鉱山」
抽出された係り受けキーワード「鉱山」は、対象文章情報と共に、非検索キーワード判定部123へ出力される。
「子供」-> 「娘」「初子」「お祖母さん子」「隠し子」「子弟」「次女」「双子」
「殺す」->「暗殺する」「殺虫」「損なう」「潰す」「間引く」「除ける」
s(w')=s(w)×f(d(w'))
f(x)=cx
s(w):係り受けキーワードのスコア
d(w'):係り受けキーワードと係り受け関連キーワードとの重み付け距離
c:定数(例えば0.8)
w=「学校」、s(w)=2
w’=「小学校」
d(w'):「学校」に対する「小学校」の重み付け距離
このとき、「学校」に対する「小学校」のスコアは、以下のように表される。
d(w')=0.2+0.2=0.4
f(d(w'))=c0.4=0.80.4=0.92
s(w')=s(w)×f(d(w'))=2×0.80.4=1.83
d(w')=0.6+0.2=0.8
f(d(w'))=c0.8=0.80.8=0.84
s(w')=s(w)×f(d(w'))=2×0.80.8=1.67
(S702)検索キーワードを含む学習文章情報について、検索キーワードに対する係り受けキーワードを抽出する。
(S703)単語のノードがツリー状に構成された概念辞書を用いて、係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する。
(S704)係り受けキーワード毎に、正当学習文章情報の数と、不当学習文章情報の数とが計数され、全ての学習文章情報の数に対する正当学習文章情報の数の正当割合が算出される。
(S705)そして、正当割合が所定閾値以上となる係り受けキーワードが、非検索キーワードとして登録される。
(S706)端末3は、利用者の操作に応じて、対象文章情報を、Webサーバ2へ送信する。
(S707)文章解析サーバ1は、Webサーバ2から、解析対象となる対象文章情報を受信する。その対象文章情報は、対象文章分類機能部12へ出力される。
(S708)対象文章情報が、検索キーワード辞書に蓄積された検索キーワードを含むか否かを判定する。
(S709)検索キーワードを含む対象文章情報について、検索キーワードに対する係り受けキーワードを抽出する。
(S710)抽出された係り受けキーワードが、非検索キーワード辞書に登録された非検索係り受けキーワードと一致するか否かを判定する。
(S711)そして、S708によって偽と判定された対象文章情報と、S708によって真と判定されると共にS710によって真と判定された対象文章情報とを、特定カテゴリに属さない文章情報として分類する。これによって、検索キーワードに対する係り受けキーワードが、非検索キーワード辞書に登録された非検索キーワードである場合、その文章情報は、特定カテゴリに属さないとして検索されないようになされる。
10 検索キーワード辞書部
11 非検索辞書生成機能部
110 学習文章蓄積部
111 学習文章キーワード検索部
112 学習係り受け解析部
113 概念辞書記憶部
114 係り受け関連キーワード抽出部
115 正当割合算出部
116 非検索キーワード辞書部
12 対象文章分類機能部
120 対象文章入力部
121 対象文章キーワード検索部
122 対象係り受け解析部
123 非検索キーワード判定部
124 文章情報分類部
13 通信インタフェース部
2 Webサーバ
3 端末
Claims (14)
- 検索キーワードを蓄積した検索キーワード辞書手段を有し、当該検索キーワードを含む文章情報を検索するようにコンピュータを機能させる文章検索プログラムであって、
特定カテゴリに属さない複数の正当学習文章情報と、前記特定カテゴリに属する複数の不当学習文章情報とを蓄積した学習文章蓄積手段と、
前記学習文章蓄積手段を用いて、前記検索キーワードを含む学習文章情報を検索する学習文章キーワード検索手段と、
前記検索キーワードを含む学習文章情報について、前記検索キーワードに対する係り受けキーワードを抽出する学習係り受け解析手段と、
単語のノードがツリー状に構成された概念辞書記憶手段と、
前記概念辞書記憶手段を用いて、前記係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する係り受け関連キーワード抽出手段と、
前記係り受けキーワード及び前記係り受け関連キーワードの全てのキーワード毎に、前記正当学習文章情報の数と、前記不当学習文章情報の数とを計数し、全ての学習文章情報の数に対する前記正当学習文章情報の数の正当割合を算出する正当割合算出手段と、
前記正当割合が所定閾値以上となる前記係り受けキーワード及び前記係り受け関連キーワードを非検索キーワードとして登録する非検索キーワード辞書手段と
してコンピュータを機能させ、前記検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにすることを特徴とする文章検索プログラム。 - 前記係り受け関連キーワード抽出手段は、前記概念辞書記憶手段を用いて、前記係り受けキーワードに対応するノードよりも少なくとも1階層上の上位概念のノードから見て、下位概念となる複数の係り受け関連キーワードを抽出するようにコンピュータを機能させることを特徴とする請求項1に記載の文章検索プログラム。
- 前記係り受け関連キーワード抽出手段は、前記概念辞書記憶手段を用いて、前記係り受けキーワードに対応するノードの階層nの高さに基づいて、当該階層nから何階層上の上位概念のノードから見るかを決定するようにコンピュータを機能させることを特徴とする請求項2に記載の文章検索プログラム。
- 前記係り受け関連キーワード抽出手段は、前記係り受けキーワードの品詞に基づいて、前記概念辞書記憶手段を用いて、当該階層nから何階層上の上位概念のノードから見るかを決定するようにコンピュータを機能させることを特徴とする請求項2に記載の文章検索プログラム。
- 前記係り受け関連キーワード抽出手段は、前記係り受け関連キーワードの品詞に基づいて、前記係り受け関連キーワードとして抽出するか否かを決定するようにコンピュータを機能させることを特徴とする請求項4に記載の文章検索プログラム。
- 前記概念辞書記憶手段を用いて、前記検索キーワードに対応するノードよりも下位概念となる複数の検索関連キーワードを抽出する検索関連キーワード抽出手段を更に有し、
前記学習文章キーワード検索手段は、前記学習文章蓄積手段を用いて、前記検索関連キーワードを含む学習文章情報を更に検索し、
前記学習係り受け解析手段は、前記検索関連キーワードを含む学習文章情報について、前記検索関連キーワードに対する係り受けキーワードを更に抽出する
ようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載の文章検索プログラム。 - 解析対象となる対象文章情報を入力する対象文章入力手段と、
前記対象文章情報が、前記検索キーワード辞書手段に蓄積された前記検索キーワードを含むか否かを判定する対象文章キーワード検索手段と、
前記検索キーワードを含む対象文章情報について、前記検索キーワードに対する係り受けキーワードを抽出する対象係り受け解析手段と、
抽出された前記係り受けキーワードが、前記非検索キーワード辞書手段に登録された非検索係り受けキーワードと一致するか否かを判定する非検索キーワード判定手段と、
前記対象文章キーワード検索手段によって偽と判定された前記対象文章情報と、前記対象文章キーワード検索手段によって真と判定されると共に前記非検索キーワード判定手段によって真と判定された前記対象文章情報とを、前記特定カテゴリに属さない文章情報として分類する文章情報分類手段と
してコンピュータを機能させることを特徴とする請求項1から6のいずれか1項に記載の文章検索プログラム。 - 前記非検索キーワード辞書手段は、登録された係り受けキーワード毎に、前記正当割合算出手段によって算出された前記正当割合を対応付けて登録しており、
前記非検索キーワード判定手段は、抽出された前記係り受けキーワードが、前記非検索キーワード辞書手段に登録された係り受けキーワードと一致し、且つ、当該係り受けキーワードにおける前記正当割合が所定閾値以上である場合に、当該係り受けキーワードに対して真と判定する
ようにコンピュータを機能させることを特徴とする請求項7に記載の文章検索プログラム。 - 前記検索キーワードは、カテゴリ分類を目的として設定されたキーワードであり、
前記学習文章蓄積手段における前記特定カテゴリは、前記カテゴリ分類に基づく文章情報の群であるようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載の文章検索プログラム。 - 前記検索キーワードは、違法・有害なキーワードであり、
前記学習文章蓄積手段における前記特定カテゴリは、違法・有害な文章情報の群であるようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載の文章検索プログラム。 - 前記検索キーワードは、ユーザによって指定されたキーワードであり、
前記学習文章蓄積手段における前記特定カテゴリは、ユーザによって指定された文章情報の群であるようにコンピュータを機能させることを特徴とする請求項1から8のいずれか1項に記載の文章検索プログラム。 - 前記対象文章情報は、ネットワークを介して公開されているブログ(Weblog)、掲示板及び/又はクチコミコメントにおける不特定多数のユーザによって記述された文章情報であるようにコンピュータを機能させることを特徴とする請求項1から11のいずれか1項に記載の文章検索プログラム。
- 検索キーワードを蓄積した検索キーワード辞書手段を有し、他の公開サーバからネットワークを介して取得した文章情報から、当該検索キーワードを含む文章情報を検索する文章解析サーバであって、
特定カテゴリに属さない複数の正当学習文章情報と、前記特定カテゴリに属する複数の不当学習文章情報とを蓄積した学習文章蓄積手段と、
前記学習文章蓄積手段を用いて、前記検索キーワードを含む学習文章情報を検索する学習文章キーワード検索手段と、
前記検索キーワードを含む学習文章情報について、前記検索キーワードに対する係り受けキーワードを抽出する学習係り受け解析手段と、
単語のノードがツリー状に構成された概念辞書記憶手段と、
前記概念辞書記憶手段を用いて、前記係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する係り受け関連キーワード抽出手段と、
前記係り受けキーワード及び前記係り受け関連キーワードの全てのキーワード毎に、前記正当学習文章情報の数と、前記不当学習文章情報の数とを計数し、全ての学習文章情報の数に対する前記正当学習文章情報の数の正当割合を算出する正当割合算出手段と、
前記正当割合が所定閾値以上となる前記係り受けキーワード及び前記係り受け関連キーワードを非検索キーワードとして登録する非検索キーワード辞書手段と
を有し、前記検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにすることを特徴とする文章解析サーバ。 - 検索キーワードを蓄積した検索キーワード辞書を有し、当該検索キーワードを含む文章情報を、コンピュータを用いて検索する文章検索方法であって、
特定カテゴリに属さない複数の正当学習文章情報と、前記特定カテゴリに属する複数の不当学習文章情報とを、学習文章蓄積部に蓄積しており、
単語のノードがツリー状に構成された概念辞書を、概念辞書記憶部に記憶しており、
前記学習文章蓄積手段を用いて、前記検索キーワードを含む学習文章情報を検索する第1のステップと、
前記検索キーワードを含む学習文章情報について、前記検索キーワードに対する係り受けキーワードを抽出する第2のステップと、
前記概念辞書記憶手段を用いて、前記係り受けキーワードに対応するノードから見て、下位概念となる複数の係り受け関連キーワードを抽出する第3のステップと、
前記係り受けキーワード及び前記係り受け関連キーワードの全てのキーワード毎に、前記正当学習文章情報の数と、前記不当学習文章情報の数とを計数し、全ての学習文章情報の数に対する前記正当学習文章情報の数の正当割合を算出する第4のステップと、
前記正当割合が所定閾値以上となる前記係り受けキーワード及び前記係り受け関連キーワードを非検索キーワードとして登録する第5のステップと
を有し、前記検索キーワードに対する係り受けキーワードとして非検索キーワードが含まれている文章情報は検索されないようにすることを特徴とする文章検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010033208A JP5364010B2 (ja) | 2010-02-18 | 2010-02-18 | 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010033208A JP5364010B2 (ja) | 2010-02-18 | 2010-02-18 | 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170578A true JP2011170578A (ja) | 2011-09-01 |
JP5364010B2 JP5364010B2 (ja) | 2013-12-11 |
Family
ID=44684647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010033208A Expired - Fee Related JP5364010B2 (ja) | 2010-02-18 | 2010-02-18 | 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5364010B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013161105A1 (ja) * | 2012-04-27 | 2013-10-31 | 楽天株式会社 | タグ管理装置、タグ管理方法、タグ管理プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 |
CN106686447A (zh) * | 2015-11-06 | 2017-05-17 | 广州视源电子科技股份有限公司 | 筛除频道的方法和筛除频道的装置 |
JP2018041297A (ja) * | 2016-09-08 | 2018-03-15 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
CN109800308A (zh) * | 2019-01-22 | 2019-05-24 | 四川长虹电器股份有限公司 | 一种基于词性和模糊模式识别组合的短文本分类方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282797A (ja) * | 2000-03-31 | 2001-10-12 | Digital Arts Inc | インターネット閲覧制御方法、その方法を実施するプログラムを記録した媒体およびインターネット閲覧制御装置 |
JP2002117135A (ja) * | 2000-08-02 | 2002-04-19 | Masunaga Sogo Keikaku:Kk | ウェブサイトセキュリティシステム |
JP2005004300A (ja) * | 2003-06-10 | 2005-01-06 | Fujitsu Ltd | 情報検索支援装置 |
JP2005275560A (ja) * | 2004-03-23 | 2005-10-06 | Techno Network Shikoku Co Ltd | 形容詞キーワード拡充システムと、これを用いた形容詞情報から検索者の意図理解検索システムと、形容詞情報から検索者の意図推論検索システム。 |
JP2009026083A (ja) * | 2007-07-19 | 2009-02-05 | Fujifilm Corp | コンテンツ検索装置 |
JP2009163303A (ja) * | 2007-12-28 | 2009-07-23 | Mitsubishi Electric Corp | 検索フィルタリング装置及び検索フィルタリングプログラム |
-
2010
- 2010-02-18 JP JP2010033208A patent/JP5364010B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282797A (ja) * | 2000-03-31 | 2001-10-12 | Digital Arts Inc | インターネット閲覧制御方法、その方法を実施するプログラムを記録した媒体およびインターネット閲覧制御装置 |
JP2002117135A (ja) * | 2000-08-02 | 2002-04-19 | Masunaga Sogo Keikaku:Kk | ウェブサイトセキュリティシステム |
JP2005004300A (ja) * | 2003-06-10 | 2005-01-06 | Fujitsu Ltd | 情報検索支援装置 |
JP2005275560A (ja) * | 2004-03-23 | 2005-10-06 | Techno Network Shikoku Co Ltd | 形容詞キーワード拡充システムと、これを用いた形容詞情報から検索者の意図理解検索システムと、形容詞情報から検索者の意図推論検索システム。 |
JP2009026083A (ja) * | 2007-07-19 | 2009-02-05 | Fujifilm Corp | コンテンツ検索装置 |
JP2009163303A (ja) * | 2007-12-28 | 2009-07-23 | Mitsubishi Electric Corp | 検索フィルタリング装置及び検索フィルタリングプログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013161105A1 (ja) * | 2012-04-27 | 2013-10-31 | 楽天株式会社 | タグ管理装置、タグ管理方法、タグ管理プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 |
JP2013232108A (ja) * | 2012-04-27 | 2013-11-14 | Rakuten Inc | タグ管理装置、タグ管理方法、タグ管理プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 |
CN106686447A (zh) * | 2015-11-06 | 2017-05-17 | 广州视源电子科技股份有限公司 | 筛除频道的方法和筛除频道的装置 |
JP2018041297A (ja) * | 2016-09-08 | 2018-03-15 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
CN109800308A (zh) * | 2019-01-22 | 2019-05-24 | 四川长虹电器股份有限公司 | 一种基于词性和模糊模式识别组合的短文本分类方法 |
CN109800308B (zh) * | 2019-01-22 | 2022-04-15 | 四川长虹电器股份有限公司 | 一种基于词性和模糊模式识别组合的短文本分类方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5364010B2 (ja) | 2013-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bharti et al. | Sarcastic sentiment detection in tweets streamed in real time: a big data approach | |
Al-Twairesh et al. | AraSenTi: Large-scale Twitter-specific Arabic sentiment lexicons | |
Poudyal et al. | ECHR: Legal corpus for argument mining | |
Annett et al. | A comparison of sentiment analysis techniques: Polarizing movie blogs | |
US8402036B2 (en) | Phrase based snippet generation | |
CN111581355B (zh) | 威胁情报的主题检测方法、装置和计算机存储介质 | |
Banik et al. | Evaluation of naïve bayes and support vector machines on bangla textual movie reviews | |
Brahimi et al. | Data and Text Mining Techniques for Classifying Arabic Tweet Polarity. | |
Dumani et al. | A framework for argument retrieval: Ranking argument clusters by frequency and specificity | |
JP4911599B2 (ja) | 風評情報抽出装置及び風評情報抽出方法 | |
Alawneh et al. | Sentiment analysis-based sexual harassment detection using machine learning techniques | |
Srinivas et al. | A weighted tag similarity measure based on a collaborative weight model | |
Basha et al. | Evaluating the impact of feature selection on overall performance of sentiment analysis | |
JP5364010B2 (ja) | 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 | |
KR101543680B1 (ko) | 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법 | |
Samonte | Polarity analysis of editorial articles towards fake news detection | |
Torshizi et al. | Automatic Twitter rumor detection based on LSTM classifier | |
JP5477910B2 (ja) | 検索キーワード辞書及び係り受けキーワード辞書を用いた文章検索プログラム、装置、サーバ及び方法 | |
Campbell et al. | Content+ context networks for user classification in twitter | |
Bellaachia et al. | Learning from twitter hashtags: Leveraging proximate tags to enhance graph-based keyphrase extraction | |
Liu et al. | An improved topic detection method for chinese microblog based on incremental clustering. | |
Kalender et al. | THINKER-entity linking system for Turkish language | |
Kannan et al. | Text document clustering using statistical integrated graph based sentence sensitivity ranking algorithm | |
Ishtiaq | Sentiment analysis of twitter data using sentiment influencers | |
Mukherjee et al. | An improved information retrieval approach to short text classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5364010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |