JP4926130B2 - メッセージ判定装置、方法及びプログラム - Google Patents
メッセージ判定装置、方法及びプログラム Download PDFInfo
- Publication number
- JP4926130B2 JP4926130B2 JP2008163805A JP2008163805A JP4926130B2 JP 4926130 B2 JP4926130 B2 JP 4926130B2 JP 2008163805 A JP2008163805 A JP 2008163805A JP 2008163805 A JP2008163805 A JP 2008163805A JP 4926130 B2 JP4926130 B2 JP 4926130B2
- Authority
- JP
- Japan
- Prior art keywords
- harmful
- url
- dictionary
- determination
- judgment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Description
本実施形態は、図1の機能ブロック図に示すように、ブログや電子掲示板などのメッセージサービスを実現する機能部やサーバ(1ほか)などに対し、投稿者A1やA2などから入力されたメッセージの有害性を判定する機能を提供するメッセージ判定装置2(以下「本装置」と呼ぶ)に関するもので、本装置に対応する方法及びコンピュータプログラムとしても把握可能である。
まず、第一の概要について説明する。すなわち、本装置2において、有害URLリスト10は、予め判明していて有害とするウェブページのURLを記録したものである。そして、URL判定手段15は、メッセージサービス(ブログ、電子掲示板、電子メール、メッセンジャーなど)で入力(新規投稿や発信だけでなく到着や受信も含む)されたメッセージ(コメント、投稿、メールなど)内に含まれるURLについて、有害URLリスト10と照合し一致するものがあれば有害と判定する有害判定を行う(この処理を方法の観点から「URL判定処理」と呼ぶ。以下同様)。
すなわち、この再帰的処理手順は、制御ルーチンなどの制御手段80による制御に基づいて、未知URLについて、
(1)そのURLの指すウェブページをページ読込手段20が読み込み、
(2)読み込んだウェブページについて有害判定手段30が有害か無害か判定し、
(3)有害と判定した場合は、末尾除去手段50が、そのURLを所定の記憶領域に一時記憶するとともに、URL末尾における所定の階層区切り記号以降の一階層分の文字列をカットすることにより、残る上位階層部分のURLに加工したうえ、加工したURLについて再度前記(1)からの処理を行わせるが、
(4)無害と判定し、かつ、有害と判定したURLが前記一時記憶されている場合は、前記末尾判定登録手段が、その一時記憶されているURLを前記有害URLリストに登録する。
ここで、第一の概要を上記のような再帰的処理手順で実現する場合の処理手順を、図3のフローチャートに示す。この例は、ブログなどに投稿されたコメントのチェック時には応答の迅速性を優先して有害URLリストとの照合だけ行い(図3(1))、有害URLリストと一致がなく無害と回答した未知URLのチェックを、バッチなどで別途まとめて処理するものである(図3(2))。
また、ショートURLにおけるリダイレクト元とリダイレクト先を関連付けるとともに、末尾の除去を一階層に限定して効率よく有害登録する処理手順の例を図4のフローチャートに示す。
第二の概要は、個々のURLに対応するウェブページの有害性判定において、ウェブページのデータ容量に応じた有害判定手段を利用するものである。
上記のように用いる複数の有害判定手段は、既に述べたSVMなど機械学習に基づくもの(例えば有害判定手段33)を利用可能であるが、図1に示すように、少なくとも一部の有害判定手段(例えば31,32)としては、データ容量範囲に対応し、互いに異なる有害語句群を収録語とした有害判定辞書D1,D2を設け、URLに対応するウェブページ記述ファイルの内容について、有害判定辞書D1又はD2と照合しその収録語との一致に基づいて有害か否かを判定するように構成することができる。
また、上記のような複数の有害判定手段は、択一的な選択には限定されず、例えば、複数の有害判定手段や有害判定基準を用いて、双方で有害と判定されるAND条件でURLを有害としたり、いずれか一方で有害と判定されれば有害とする(OR条件)など、自由に定めることができる。
上記のように、データ容量に応じて有害判定手段や基準を使い分ける処理手順の一例を、図6のフローチャートに例示する。このフローチャートは、図3(2)のステップS62に対応するものである。
また、本装置は、API(Application Program Interface)により多様なサービスからの呼出し利用が可能である。すなわち、API受渡し手段70(APIインターフェース部)が、各々サービスを実現し呼び出し元となるプロセスもしくはシステム(図1に示す電子掲示板などの機能部又はサーバなど)から、入力されたメッセージをパラメータに含むAPIの呼出しを受け付けるとともに、呼出しに対するAPIの返り値として呼び出し元に対し、有害判定の結果を返信する(API受渡し処理)。
(1)有害サイトURLとの一致
(2)有害判定:アダルト表現、出会い系
(3)有害判定:誹謗・中傷・差別
(4)有害判定:自殺や暴力、薬物乱用の肯定と助長
(5)有害判定:射幸心をあおるビジネス情報
のような有害の類型にそれぞれ対応する複数のパラメータの組合せとし、各パラメータごとに、その項目に関する有害判定辞書収録語との一致数に応じたポイントなどパラメータ値の組合せを返すようにしてもよい。この場合、個々のパラメータごとに100ポイントを満点として、あるウェブページはアダルト表現という観点のパラメータは50ポイント、ビジネス情報の観点のパラメータは34ポイント、のようなパターンが考えられる。
なお、上記実施形態は例示に過ぎず、本発明は、上記実施形態に限定されるものではないので、次に例示するような例やさらに他の例も含むものである。例えば、メッセージ判定装置は、上記各手段などの各機能を担当する複数のコンピュータやサーバの組合せ・連携により実現してもよい。
B ブログの管理者
1 ブログの機能部又はサーバ
2 メッセージ判定装置
10 有害URLリスト
15 URL判定手段
20 ページ読込手段
30(31,32,33) 有害判定手段
D(D1,D2) 有害判定手段
45 容量判定手段
47 選択手段
50 末尾除去手段
60 末尾判定登録手段
65 有害通知手段
70 API受渡し手段
80 制御手段
Claims (4)
- ウェブページの有害性を判定する複数の有害判定手段と、
メッセージサービスに入力されたメッセージ内に含まれるURLに基づいて、対応するウェブページを通信ネットワークを経て読み込むページ読込手段と、
読み込んだ前記ウェブページのウェブページ記述ファイルのデータ容量範囲を、一又は二以上の基準値に基づいて判定する容量判定手段と、
判定された前記データ容量範囲に応じて、前記複数の有害判定手段のうちいずれかを選択することにより、そのウェブページの有害性を判定させる、選択手段と、
をコンピュータにより実現し、
前記複数の有害判定手段は、低容量向けの有害判定辞書を有する有害判定手段と、一般ページ用の有害判定辞書を有する有害判定手段であって、前記低容量向けの有害判定辞書と一般ページ用の有害判定辞書は互いに異なる有害語句群を収録語とし、
いずれの前記有害判定辞書もそれぞれ、有害度の違いに応じたブラックワード辞書とグレーワード辞書とを有し、
前記複数の有害判定手段は、前記URLに対応する前記ウェブページ記述ファイルの内容について、それぞれの前記有害判定辞書におけるブラックワード辞書及びグレーワード辞書と照合しその収録語との一致に基づいて有害か否かを判定するにあたり、前記ブラックワード辞書の収録語については1語でも一致すれば前記URLを有害と判定し、前記グレーワード辞書の収録語については予め定められた数の語が一致すれば前記URLを有害と判定し、
低容量向けの前記有害判定手段の前記有害判定辞書は半角カタカナを含むことを特徴とするメッセージ判定装置。 - 呼び出し元となる情報処理のプロセスもしくはシステムから、入力されたメッセージをパラメータに含むAPI(Application Program Interface)の呼出しを受け付けるとともに、前記呼出しに対するAPIの返り値として前記呼び出し元に対し、前記有害判定の結果を返信する、API受渡し手段を、前記コンピュータで実現し、
前記API受渡し手段は、前記APIの返り値を、有害の類型にそれぞれ対応する複数のパラメータの組合せとし、各パラメータごとに、その項目に関する有害判定辞書収録語との一致数に応じたパラメータ値の組合せを返すことを特徴とする請求項1記載のメッセージ判定装置。 - メッセージサービスに入力されたメッセージ内に含まれるURLに基づいて、対応するウェブページを通信ネットワークを経て読み込むページ読込処理と、
読み込んだ前記ウェブページのウェブページ記述ファイルのデータ容量範囲を、一又は二以上の基準値に基づいて判定する容量判定処理と、
判定された前記データ容量範囲に応じて、ウェブページの有害性を判定する互いに異なる複数の有害判定処理のうち一又は二以上を、選択することにより、そのウェブページの有害性を判定させる、選択処理と、
をコンピュータにより実行し、
前記複数の有害判定処理は、低容量向けの有害判定辞書を用いる有害判定処理と、一般ページ用の有害判定辞書を用いる有害判定処理であって、前記低容量向けの有害判定辞書と一般ページ用の有害判定辞書は互いに異なる有害語句群を収録語とし、
いずれの前記有害判定辞書もそれぞれ、有害度の違いに応じたブラックワード辞書とグレーワード辞書とを有し、
前記複数の有害判定処理は、前記URLに対応する前記ウェブページ記述ファイルの内容について、それぞれの前記有害判定辞書におけるブラックワード辞書及びグレーワード辞書と照合しその収録語との一致に基づいて有害か否かを判定するにあたり、前記ブラックワード辞書の収録語については1語でも一致すれば前記URLを有害と判定し、前記グレーワード辞書の収録語については予め定められた数の語が一致すれば前記URLを有害と判定し、
低容量向けの前記有害判定処理の前記有害判定辞書は半角カタカナを含むことを特徴とするメッセージ判定方法。 - コンピュータを制御することにより、
メッセージサービスに入力されたメッセージ内に含まれるURLに基づいて、対応するウェブページを通信ネットワークを経て読み込むページ読込処理と、
読み込んだ前記ウェブページのウェブページ記述ファイルのデータ容量範囲を、一又は二以上の基準値に基づいて判定する容量判定処理と、
判定された前記データ容量範囲に応じて、ウェブページの有害性を判定する互いに異なる複数の有害判定処理のうち一又は二以上を、選択することにより、そのウェブページの有害性を判定させる、選択処理と、
を実行させ、
前記複数の有害判定処理は、低容量向けの有害判定辞書を用いる有害判定処理と、一般ページ用の有害判定辞書を用いる有害判定処理であって、前記低容量向けの有害判定辞書と一般ページ用の有害判定辞書は互いに異なる有害語句群を収録語とし、
いずれの前記有害判定辞書もそれぞれ、有害度の違いに応じたブラックワード辞書とグレーワード辞書とを有し、
前記複数の有害判定処理は、
前記URLに対応する前記ウェブページ記述ファイルの内容について、それぞれの前記有害判定辞書におけるブラックワード辞書及びグレーワード辞書と照合しその収録語との一致に基づいて有害か否かを判定するにあたり、前記ブラックワード辞書の収録語については1語でも一致すれば前記URLを有害と判定し、前記グレーワード辞書の収録語については予め定められた数の語が一致すれば前記URLを有害と判定し、
低容量向けの前記有害判定処理の前記有害判定辞書は半角カタカナを含むことを特徴とするメッセージ判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008163805A JP4926130B2 (ja) | 2008-05-27 | 2008-05-27 | メッセージ判定装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008163805A JP4926130B2 (ja) | 2008-05-27 | 2008-05-27 | メッセージ判定装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009289246A JP2009289246A (ja) | 2009-12-10 |
JP4926130B2 true JP4926130B2 (ja) | 2012-05-09 |
Family
ID=41458364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008163805A Expired - Fee Related JP4926130B2 (ja) | 2008-05-27 | 2008-05-27 | メッセージ判定装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4926130B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5492270B2 (ja) * | 2012-09-21 | 2014-05-14 | ヤフー株式会社 | 情報処理装置及び方法 |
CN104991896A (zh) * | 2015-05-26 | 2015-10-21 | 百度在线网络技术(北京)有限公司 | 一种解析二维码的方法与装置 |
JP2019053784A (ja) * | 2018-12-28 | 2019-04-04 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7519668B2 (en) * | 2003-06-20 | 2009-04-14 | Microsoft Corporation | Obfuscation of spam filter |
JP4500285B2 (ja) * | 2006-03-02 | 2010-07-14 | ヤフー株式会社 | スパム除去方法 |
-
2008
- 2008-05-27 JP JP2008163805A patent/JP4926130B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009289246A (ja) | 2009-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6744480B2 (ja) | ネットワークベースの広告データトラフィックレイテンシ削減 | |
JP5600160B2 (ja) | フィッシング疑惑ウェブサイトを識別するための方法及びシステム | |
US20180351995A1 (en) | Fake web addresses and hyperlinks | |
JP4395848B2 (ja) | 廃棄可能なeメールアドレスを生成し、処理するための方法、システム、及びコンピュータ・プログラム | |
US8132151B2 (en) | Action tags | |
US6832245B1 (en) | System and method for analyzing communications of user messages to rank users and contacts based on message content | |
JP4824352B2 (ja) | 外向き通信が特定の内容を含む時を検出する方法およびシステム | |
US8615802B1 (en) | Systems and methods for detecting potential communications fraud | |
US8732614B2 (en) | Toolbar document content sharing | |
US9369418B2 (en) | Determining additional information associated with geographic location information | |
US20050198180A1 (en) | Method and system for providing automatic email address book | |
CN113692597B (zh) | 电子邮件内容修改系统 | |
JP2010511217A (ja) | 単語予測 | |
CN101194277A (zh) | 在基于对话的电子邮件系统中显示对话 | |
US20140047315A1 (en) | Method for identifying potential defects in a block of text using socially contributed pattern/message rules | |
JP4500285B2 (ja) | スパム除去方法 | |
JP4926130B2 (ja) | メッセージ判定装置、方法及びプログラム | |
JP4979643B2 (ja) | メッセージ判定装置、方法及びプログラム | |
JP6721314B2 (ja) | ネットワークシステム、サーバ、および端末 | |
JP5676522B2 (ja) | 文字列変換方法及びプログラム | |
JP4564916B2 (ja) | フィッシング詐欺対策方法、端末、サーバ及びプログラム | |
CN106485520A (zh) | 跨渠道通讯控制方法及服务器 | |
JP2009093325A (ja) | 情報編集装置及びプログラム | |
US20170171128A1 (en) | Method and electronic device for email processing | |
JP5178077B2 (ja) | 議論状況把握支援装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4926130 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |