JP2009037420A - 有害コンテンツの評価付与装置、プログラム及び方法 - Google Patents
有害コンテンツの評価付与装置、プログラム及び方法 Download PDFInfo
- Publication number
- JP2009037420A JP2009037420A JP2007201181A JP2007201181A JP2009037420A JP 2009037420 A JP2009037420 A JP 2009037420A JP 2007201181 A JP2007201181 A JP 2007201181A JP 2007201181 A JP2007201181 A JP 2007201181A JP 2009037420 A JP2009037420 A JP 2009037420A
- Authority
- JP
- Japan
- Prior art keywords
- harmful
- content
- vocabulary
- black
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims description 19
- 230000000007 visual effect Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001473 noxious effect Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract description 18
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
Images
Abstract
【解決手段】予め定義された有害サイトのURLリストを入力とし、インターネット上の様々な有害サイトを自動的に探索(クロール)するクローラ部を備える。そして、探索したURLのコンテンツのデータをコンテンツ・リポジトリ部(データベース)に蓄積、格納する。さらに、コンテンツ・リポジトリ部からコンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算する語彙有害評価付与部を備える。さらに、語彙有害評価付与部が計算した語彙の有害度数から前記コンテンツの有害度数を計算するコンテンツ有害評価付与部を備えている。
【選択図】図1
Description
所定の有害URLリストを取得し、該有害URLリストに含まれるURLを随時アクセスして該URLサイトのコンテンツを収集するクローラ部と、
前記コンテンツのデータを格納するコンテンツ・リポジトリ部と、
前記コンテンツ・リポジトリ部から前記コンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算する語彙有害評価付与部と、
前記語彙有害評価付与部が計算した前記語彙の有害度数から前記コンテンツの有害度数を計算するコンテンツ有害評価付与部と、
を備えたことを特徴とする、評価付与装置。
Blacki: i番目のブラック・ワード
R(X,Y):単語またはフレーズXと単語またはフレーズYのシンプソン係数
m:ブラック・ワードの数
n:グレー・ワードの数
γ:総単語またはフレーズに占めるSO(t)>0の単語またはフレーズの比率
l:コンテンツ内のSO(t)>0の単語またはフレーズ数
コンピュータに、
所定の有害URLリストを取得し、該有害URLリストに含まれるURLを随時アクセスして該URLサイトのコンテンツを収集するステップと、
前記コンテンツのデータを格納するステップと、
前記格納されたデータから前記コンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算するステップと、
前記計算した前記語彙の有害度数から前記コンテンツの有害度数を計算するステップと、
を実行させることを特徴とする、コンピュータ・プログラム。
所定の有害URLリストを取得し、該有害URLリストに含まれるURLを随時アクセスして該URLサイトのコンテンツを収集するステップと、
前記コンテンツのデータを格納するステップと、
前記格納されたデータから前記コンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算するステップと、
前記計算した前記語彙の有害度数から前記コンテンツの有害度数を計算するステップと、
を含むことを特徴とする、方法。
図1は、評価付与装置10の機能ブロックの概略を示す図である。本装置は、入力部11、クローラ部12、コンテンツ・リポジトリ部13、語彙有害評価付与部14、コンテンツ有害評価付与部15、出力部16を含んで構成される。
(1)外部サイトなどから有害URLリストをクローラ部が取り込む。
(2)クローラ部はインターネット上にURLへのリクエストを発行する。
(3)(有害)コンテンツを取得する。
(4)(有害)コンテンツをコンテンツ・リポジトリに格納する。
(5)語彙の有害評価付与処理を行う。
(6)コンテンツの有害評価付与処理を行う。
図3は、コンテンツの有害評価付与のイメージを示す図である。まず、クローラ部12によって収集された有害URLコンテンツ30は、形態素解析(品詞フィルタリング)処理を行って、形態素解析済み語彙リスト40を生成する。次に、語彙の有害評価付与計算では、予め定義されたブラック・ワードリスト50、グレー・ワードリスト60を用いる。ここで、グレー・ワードリストとは、ブラックかどうかの判定が難しい語を意味する。
本方式では以下の2つの仮定を前提としている。
(仮定1)ブラック・ワードが出現するコンテンツでは、異なるブラック・ワードも出現しやすい。
例えば、URL、http://www.△△△△.com/dera/○○○○.htmlのコンテンツは、以下のような内容を含んでいる。
「フ○○ラチオ」と「フ○○ラテク」の共起ヒット数→51,700件
「フ○○ラチオ」と「ザー○メン」の共起ヒット数→513,000件
「フ○○ラテク」と「ザー○メン」の共起ヒット数→54,300件
例えば、URL、http://blogs.▲▲▲▲.co.jp/■■■■.htmlのコンテンツは以下のような内容を含んでいる。
具体的には、語彙有害評価付与部14の演算手段は、下記数5〜7式によって、語彙の有害評価付与度を求める。
t:単語またはフレーズ(形態素)
α、β:閾値
Blacki: i番目のブラック・ワード
R(X,Y):数8式で表される単語またはフレーズXと単語またはフレーズYのシンプソン係数(1に近いほど関連性が高い)。
SO(t):tの有害度(0〜1の範囲)。1に近いほどブラック度が高い。
・Black軸に寄っているほどスコアが高い。(Bによる影響)
・AVG_Black(t)が大きいほどスコアが高い。(Aによる影響)
が挙げられる。
・Black軸に寄っているほど、SO(t)は大きくなる。
例えば、(AVG_Black(t),AVG_Gray(t))=(0.9,0.3)の場合は、SO(t)は0.8538となり、同様に、(0.3,0.9)の場合は、0.0948となる。
・AVG_Black(t)が大きいほど、SO(t)は大きくなる。
例えば、(0.9,0.3)→0.8538、(0.5,0.3)→0.4287となる。
・AVG_Gray(t)が小さいほど、SO(t)は大きくなる。
例えば、(0.9,0.3)→0.8538、(0.9,0.1)→0.8944となる。
・角度θが同じ場合、AVG_Black(t)が大きいほど、SO(t)は大きくなる。
例えば、(1.0,1.0)→0.7071、(0.5,0.5)→0.3535となる。
データとしては、一般有害用語辞書(例えば、アダルト、グラビア、出会い系)や有害検索キーワードを母集団とする。語彙の選別方法としては、
・形態素解析
・日本語の単語またはフレーズ(Alphabet以外)の抽出
・「バスト」、「ソープ」など、ダイエットやファッションの用途で使われている場合がほとんどである語の除去
以上の選別によって、今回収集できた語彙数は441語であった。
まず、目視チェックによって、5人中4人以上がブラックと判定し、次に、URLフィルタリング判定(対象語のWeb検索結果URLに対するチェック)やワードフィルタリング判定などのツールによるブラック判定を行った。その結果、今回収集できた語彙数は22語となった。このようにして、生成されたブラック・ワードリストは評価付与装置10の語彙有害評価付与部14の入力として用いられる。なお、上記の判定の順序は入れ替えて行ってもよい。
(1) 有害URLを収集する。
(2) 対象語のウェブ検索結果のURLをチェックし、(1)で収集したURLが含まれているかチェックする。
(3) (2)でURLが含まれていればブラックとする。
(1) 有害ワードを収集する。
(2) 対象語が(1)に含まれているかをチェックする。
(3) (2)で含まれていればブラックとする。
まず、目視チェックとして、5人中1人以上がブラックと判定し、次に、URLフィルタリング判定(対象語のWeb検索結果URLに対するチェック)やワードフィルタリング判定などのツールによるブラックでない判定を行った。その結果、今回収集できた語彙数は293語となった。このようにして、生成されたグレー・ワードリストは評価付与装置10の語彙有害評価付与部14の入力として用いられる。URLフィルタリング判定、ワードフィルタリング判定については、前述のステップと同様である。なお、上記の判定の順序は入れ替えて行ってもよい。
具体的には、コンテンツ有害評価付与部15の演算手段は、コンテンツcの有害評価付与度SO(c)を下記の数9式で求める。
c:コンテンツ
γ:総単語またはフレーズに占めるSO(t)>0の単語またはフレーズの比率、または0≦γ≦1の任意の値で調整可能
l:コンテンツ内のSO(t)>0の単語またはフレーズ数
SO(t):tの有害度(0〜1の範囲)。1に近いほどブラック性が高い。
SO(c):cの有害度(0〜1の範囲)。1に近いほどブラック性が高い。
図5、図6、図7は、実際のURLサンプルの評価付与計算例を示した図である。なお、以降の記載では、固有名詞、及び記載するのに差しさわりのある用語は、一部を伏せ字に置き換えている。
図10は、サンプル適用例1として、「ランジェリー」で通常のブログ検索した場合の検索結果の画面を示す図である。この検索結果で図中のかっこ内の数値が求められたコンテンツの有害度であり、コンテンツのタイトル欄の横に表示されている。
図11は、サンプル適用例2として、「ランジェリー」で通常のブログ検索した結果に、更に有害フィルタをかけた場合の検索結果の画面を示す図である。ここで、有害フィルタの閾値α、βとして0.02を用いているが、この値は、管理者または利用者が変更可能とする。この検索結果では、図中のかっこ内の数値が求められたコンテンツの有害度であるが、閾値以上の有害度を示すコンテンツを持つページは、検索結果から削除されて表示されている。このように、有害度を単に検索結果に表示するだけでなく、所定の閾値を超えたページを自動的に表示させないことで、子供などの利用者にも安心して検索エンジンを使用させることができる。
なお、本発明は、以下のような応用(一部)も可能である。
・有害語彙の検知を行う。
文書分類やクラスタリングなどで、どの語が原因で有害と判定されたかの分析を行う。また、有害用語であるかどうか判断が難しい語彙の裏付けを行う。
・検索問題への適用
有害度の高いページの検索ランキングを低くしたり、排除したりする。また、有害度の低いページを積極的に上位に露出させる。あるいは、リンク解析技術と組み合わせて検索結果のランキングを行う。
・文書分類・クラスタリング問題への適用
有害か、そうでないかというような2値分類とは異なる分類を行う。または、有害ページの検知を行う。
図12は、本発明の好適な実施形態の一例に係る評価付与装置10のハードウェア構成を示す図である。
11 入力部
12 クローラ部
13 コンテンツ・リポジトリ部
14 語彙有害評価付与部
15 コンテンツ有害評価付与部
16 出力部
20 有害URLリスト
30 有害URLコンテンツ
40 形態素解析済み語彙リスト
50 ブラック・ワードリスト
60 グレー・ワードリスト
Claims (10)
- インターネット上のサイトの有害語彙及び有害コンテンツの評価付与を行う評価付与装置であって、
所定の有害URLリストを取得し、該有害URLリストに含まれるURLを随時アクセスして該URLサイトのコンテンツを収集するクローラ部と、
前記コンテンツのデータを格納するコンテンツ・リポジトリ部と、
前記コンテンツ・リポジトリ部から前記コンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算する語彙有害評価付与部と、
前記語彙有害評価付与部が計算した前記語彙の有害度数から前記コンテンツの有害度数を計算するコンテンツ有害評価付与部と、
を備えたことを特徴とする、評価付与装置。 - 前記ブラック・ワードは、複数のブラック・ワード候補の語彙に対して、操作員の目視判定結果と、該ブラック・ワード候補の語彙を含むサイトのURLをフィルタリングするツールの判定結果と、有害語辞書による判定結果を、それぞれ組み合わせることによって選別して、ブラック・ワードリストとして入力されることを特徴とする、請求項2に記載の評価付与装置。
- 前記グレー・ワードは、複数のグレー・ワード候補の語彙に対して、操作員のブラックでないという目視判定結果と、該グレー・ワード候補の語彙を含むサイトのURLをフィルタリングするツールのブラックでないという判定結果と、有害語辞書によるブラックでないという判定結果を、それぞれを組み合わせることによって選別して、グレー・ワードリストとして入力されることを特徴とする、請求項3に記載の評価付与装置。
- ウェブページにおける検索結果のリストから有害と判定されたウェブサイトを下位に表示するか、または削除して前記検索結果の画面に表示する、請求項1乃至7に記載の評価付与装置。
- インターネット上のサイトの有害語彙及び有害コンテンツの評価付与を行うためのコンピュータ・プログラムであって、
コンピュータに、
所定の有害URLリストを取得し、該有害URLリストに含まれるURLを随時アクセスして該URLサイトのコンテンツを収集するステップと、
前記コンテンツのデータを格納するステップと、
前記格納されたデータから前記コンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算するステップと、
前記計算した前記語彙の有害度数から前記コンテンツの有害度数を計算するステップと、
を実行させることを特徴とする、コンピュータ・プログラム。 - インターネット上のサイトの有害語彙及び有害コンテンツの評価付与を行うための方法であって、
所定の有害URLリストを取得し、該有害URLリストに含まれるURLを随時アクセスして該URLサイトのコンテンツを収集するステップと、
前記コンテンツのデータを格納するステップと、
前記格納されたデータから前記コンテンツの文字データに含まれる語彙を抽出し、該語彙の所定のブラック度数と所定のグレー度数を求めて、語彙の有害度数を計算するステップと、
前記計算した前記語彙の有害度数から前記コンテンツの有害度数を計算するステップと、
を含むことを特徴とする、方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007201181A JP4859779B2 (ja) | 2007-08-01 | 2007-08-01 | 有害コンテンツの評価付与装置、プログラム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007201181A JP4859779B2 (ja) | 2007-08-01 | 2007-08-01 | 有害コンテンツの評価付与装置、プログラム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009037420A true JP2009037420A (ja) | 2009-02-19 |
JP4859779B2 JP4859779B2 (ja) | 2012-01-25 |
Family
ID=40439264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007201181A Active JP4859779B2 (ja) | 2007-08-01 | 2007-08-01 | 有害コンテンツの評価付与装置、プログラム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4859779B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122931A (ja) * | 2007-11-14 | 2009-06-04 | Ntt Resonant Inc | Spam特徴情報生成装置、spam情報フィルタリング装置および情報検索装置およびその方法 |
JP2011134254A (ja) * | 2009-12-25 | 2011-07-07 | Yahoo Japan Corp | クロールシステム、サーバ及び有害urlリスト更新方法 |
JP2011527062A (ja) * | 2009-07-15 | 2011-10-20 | ネオパッド インコーポレーション | ホームページ統合サービス提供システム及び方法 |
WO2012023541A1 (ja) * | 2010-08-20 | 2012-02-23 | 楽天株式会社 | 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 |
JP2014002447A (ja) * | 2012-06-15 | 2014-01-09 | Nippon Telegraph & Telephone West Corp | 通信装置及びurl評価システム |
WO2014050981A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
US9749352B2 (en) | 2012-12-20 | 2017-08-29 | Foundation Of Soongsil University-Industry Cooperation | Apparatus and method for collecting harmful website information |
US9756064B2 (en) | 2012-12-20 | 2017-09-05 | Foundation Of Soongsil University-Industry Cooperation | Apparatus and method for collecting harmful website information |
JP2021033428A (ja) * | 2019-08-19 | 2021-03-01 | ヤフー株式会社 | 抽出装置、抽出方法及び抽出プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01188934A (ja) * | 1988-01-22 | 1989-07-28 | Nec Corp | 文書自動分類装置 |
JPH1131150A (ja) * | 1997-07-10 | 1999-02-02 | Matsushita Electric Ind Co Ltd | 登録済み通信アドレス更新装置 |
JP2001028006A (ja) * | 1999-07-15 | 2001-01-30 | Kdd Corp | 情報自動フィルタリング方法および装置 |
JP2003521065A (ja) * | 2000-01-28 | 2003-07-08 | ウエブセンス インコーポレイテッド | インターネットサイトへのアクセスを制御するシステムおよび方法 |
JP2004021605A (ja) * | 2002-06-17 | 2004-01-22 | Yamaha Corp | 情報分類装置、方法及びプログラム |
JP2004310494A (ja) * | 2003-04-08 | 2004-11-04 | Surfmonkey Asia Inc | フィルタリング装置、システム、方法及びプログラム |
-
2007
- 2007-08-01 JP JP2007201181A patent/JP4859779B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01188934A (ja) * | 1988-01-22 | 1989-07-28 | Nec Corp | 文書自動分類装置 |
JPH1131150A (ja) * | 1997-07-10 | 1999-02-02 | Matsushita Electric Ind Co Ltd | 登録済み通信アドレス更新装置 |
JP2001028006A (ja) * | 1999-07-15 | 2001-01-30 | Kdd Corp | 情報自動フィルタリング方法および装置 |
JP2003521065A (ja) * | 2000-01-28 | 2003-07-08 | ウエブセンス インコーポレイテッド | インターネットサイトへのアクセスを制御するシステムおよび方法 |
JP2004021605A (ja) * | 2002-06-17 | 2004-01-22 | Yamaha Corp | 情報分類装置、方法及びプログラム |
JP2004310494A (ja) * | 2003-04-08 | 2004-11-04 | Surfmonkey Asia Inc | フィルタリング装置、システム、方法及びプログラム |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122931A (ja) * | 2007-11-14 | 2009-06-04 | Ntt Resonant Inc | Spam特徴情報生成装置、spam情報フィルタリング装置および情報検索装置およびその方法 |
JP2011527062A (ja) * | 2009-07-15 | 2011-10-20 | ネオパッド インコーポレーション | ホームページ統合サービス提供システム及び方法 |
JP2011134254A (ja) * | 2009-12-25 | 2011-07-07 | Yahoo Japan Corp | クロールシステム、サーバ及び有害urlリスト更新方法 |
US9064014B2 (en) | 2010-08-20 | 2015-06-23 | Rakuten, Inc. | Information provisioning device, information provisioning method, program, and information recording medium |
WO2012023541A1 (ja) * | 2010-08-20 | 2012-02-23 | 楽天株式会社 | 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 |
KR101307105B1 (ko) * | 2010-08-20 | 2013-09-11 | 라쿠텐 인코포레이티드 | 정보 제공 장치, 정보 제공 방법, 및 정보 기록 매체 |
JP2014002447A (ja) * | 2012-06-15 | 2014-01-09 | Nippon Telegraph & Telephone West Corp | 通信装置及びurl評価システム |
WO2014050981A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
CN104685493A (zh) * | 2012-09-27 | 2015-06-03 | 日本电气株式会社 | 用于监视文本信息的字典创建装置、用于监视文本信息的字典创建方法和用于监视文本信息的字典创建程序 |
JPWO2014050981A1 (ja) * | 2012-09-27 | 2016-08-22 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
US9749352B2 (en) | 2012-12-20 | 2017-08-29 | Foundation Of Soongsil University-Industry Cooperation | Apparatus and method for collecting harmful website information |
US9756064B2 (en) | 2012-12-20 | 2017-09-05 | Foundation Of Soongsil University-Industry Cooperation | Apparatus and method for collecting harmful website information |
JP2021033428A (ja) * | 2019-08-19 | 2021-03-01 | ヤフー株式会社 | 抽出装置、抽出方法及び抽出プログラム |
JP7260439B2 (ja) | 2019-08-19 | 2023-04-18 | ヤフー株式会社 | 抽出装置、抽出方法及び抽出プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4859779B2 (ja) | 2012-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4859779B2 (ja) | 有害コンテンツの評価付与装置、プログラム及び方法 | |
US8458198B1 (en) | Document analysis and multi-word term detector | |
US7805303B2 (en) | Question answering system, data search method, and computer program | |
US7526474B2 (en) | Question answering system, data search method, and computer program | |
US7519588B2 (en) | Keyword characterization and application | |
US9720904B2 (en) | Generating training data for disambiguation | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US20130218914A1 (en) | System and method for providing recommendations based on information extracted from reviewers' comments | |
US9081765B2 (en) | Displaying examples from texts in dictionaries | |
KR102324048B1 (ko) | 커뮤니티 질의 응답 데이터의 검증 방법, 장치, 컴퓨터 기기 및 저장 매체 | |
WO2009096523A1 (ja) | 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム | |
US20040098385A1 (en) | Method for indentifying term importance to sample text using reference text | |
Kaisser et al. | Improving search results quality by customizing summary lengths | |
US20070061322A1 (en) | Apparatus, method, and program product for searching expressions | |
JP2002245061A (ja) | キーワード抽出 | |
JP5136910B2 (ja) | 情報分析装置、情報分析方法、情報分析用プログラム、及び検索システム | |
Versley et al. | Not just bigger: Towards better-quality Web corpora | |
JP5226241B2 (ja) | タグを付与する方法 | |
Dąbrowski et al. | Mining and searching app reviews for requirements engineering: Evaluation and replication studies | |
JP5073349B2 (ja) | 専門用語抽出装置、方法及びプログラム | |
JP2007164635A (ja) | 同義語彙獲得方法及び装置及びプログラム | |
US8195458B2 (en) | Open class noun classification | |
JP2008123062A (ja) | コンテンツを分類する装置、方法、プログラム | |
Thelwall | Text characteristics of English language university web sites | |
Taslimipoor et al. | Using Noun Similarity to Adapt an Acceptability Measure for Persian Light Verb Constructions. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4859779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |