JP6730395B2 - 情報処理装置、情報処理方法、プログラム、記憶媒体 - Google Patents

情報処理装置、情報処理方法、プログラム、記憶媒体 Download PDF

Info

Publication number
JP6730395B2
JP6730395B2 JP2018179127A JP2018179127A JP6730395B2 JP 6730395 B2 JP6730395 B2 JP 6730395B2 JP 2018179127 A JP2018179127 A JP 2018179127A JP 2018179127 A JP2018179127 A JP 2018179127A JP 6730395 B2 JP6730395 B2 JP 6730395B2
Authority
JP
Japan
Prior art keywords
information
suitability
image
text
blog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018179127A
Other languages
English (en)
Other versions
JP2020052546A (ja
Inventor
陽司 山本
陽司 山本
亮太 吉田
亮太 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Priority to JP2018179127A priority Critical patent/JP6730395B2/ja
Publication of JP2020052546A publication Critical patent/JP2020052546A/ja
Application granted granted Critical
Publication of JP6730395B2 publication Critical patent/JP6730395B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は情報処理装置、情報処理方法、プログラム、記憶媒体に関し、特にブログを管理するサーバ装置への適用に好適な技術に関する。
インターネットを利用したサービスの1つとしてブログ環境を提供するサービスが知られている。ユーザはブログとしての任意の文章や画像による記事をサーバにアップロードし、当該ユーザの書き込み記事として保存してもらう。保存されたブログは、例えばウェブページの形式で一般に公開される。
多くのユーザは、自己発信のツールとしたり、或いは個人的な日記代わりなどとして、このようなブログサービスを利用している。
また、ブログを提供するサービス側では、ブログページに広告を掲載することも行われている。
なお下記特許文献1,2,3にはウェブコンテンツに関連する広告を表示するための技術が開示されている。
特開2008−186215号公報 特開2008−187419号公報 特開2006−500699号公報
ところでブログ等、サービス運営団体以外の一般ユーザが作成し、投稿するようなコンテンツの場合、例えば公序良俗に反するコンテンツの掲載、拡散等が起こる可能性があるため、そのコンテンツを無条件にウェブページ掲載することはできない。そのためサービス運営団体では、スタッフがコンテンツ内容を確認してウェブページ掲載の適否を判定するような作業を行っている。
ところがこれはコンテンツ数の増加に伴って非常に重い作業負担となり、業務効率の低下、運営コストの上昇などを引き起こしている。また、迅速なコンテンツ提供ができず、サービスの質の低下の懸念もある。
また、同時に広告等のコンテンツを掲載する場合、コンテンツ同士の相性の問題もある。例えば主たるコンテンツであるブログの内容が、広告主にとって望ましくないような場合も考えられる。例えばベジタリアン推奨のブログにステーキレストランの広告が載ってしまうような場合である。
ところが膨大な広告コンテンツとブログコンテンツの組み合わせにおいて、このようなコンテンツ同士の相性としての適否判定をスタッフが行うことは困難で、またそのような不適切な組み合わせの掲載が生じないようにコントロールすることは困難である。
そこで本発明は、不適切な掲載が行われないようにするための技術として、主コンテンツのウェブページ掲載の適否や主コンテンツと副コンテンツの相性の適否を的確に判定する技術を提供することを目的とする。
本発明に係る情報処理装置は、画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成するテキスト判定部と、前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する画像判定部と、前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う適否判定部とを備える。
主コンテンツとは例えばブログ記事などであってテキストデータと画像データを備えるコンテンツを対象としている。このような主コンテンツについて、テキストデータについての適否情報と、画像データについての適否情報をそれぞれ生成する。そして両者を判定要素として用いてウェブページ掲載に関する適否判定を行う。
例えば投稿されたブログ記事などの主コンテンツ自体が、ウェブページ掲載するにあたって不適なものでないかを判定する。
上記した情報処理装置においては、前記所定の観点とは、ウェブページ掲載に係る公序良俗の観点であることが考えられる。
例えば投稿されたブログ記事などの主コンテンツ自体が、差別用語を含んだり、犯罪を促す内容であったりするなど、公序良俗の観点でウェブページ掲載するにあたって不適なものでないかを判定する。
上記した情報処理装置においては、前記テキスト判定部は、前記主コンテンツのテキストデータの解析を行い、他の所定の観点における適否に関する情報であるテキスト適否情報を生成し、前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記他の所定の観点における適否に関する情報である画像適否情報を生成し、前記適否判定部は、前記他の所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツとともに同じウェブページに掲載されようとする副コンテンツについて、前記主コンテンツとともにウェブページ掲載を行うことの適否判定を行うことが考えられる。
例えば投稿されたブログ記事などの主コンテンツ自体に対して、広告コンテンツなど、同じウェブページ掲載する副コンテンツについて、その主コンテンツとともに掲載することが不適切でないか否かを判定する。
上記した情報処理装置においては、前記他の所定の観点とは、前記副コンテンツが提示する商品又は商品分野にとって前記主コンテンツが適切か否かの観点であることが考えられる。
例えば投稿されたブログ記事などの主コンテンツが、副コンテンツとしての広告の商品又は商品分野(ジャンル)にとって相性がよいものか否かを判定する。
上記した情報処理装置においては、端末装置から要求された前記主コンテンツを前記端末装置においてウェブページとして提示させるための処理を行う提示制御部を備え、前記適否判定部は、適否判定の結果を含む適否判定情報を記憶する処理を行うとともに、前記提示制御部は、要求された前記主コンテンツについて記憶されている適否判定情報を参照して、前記副コンテンツの商品又は商品分野単位での取得条件を付したウェブページデータを生成し、前記端末装置に送信することが考えられる。
例えば適否判定部は、ブログ記事投稿などとして受信された主コンテンツについて適否判定を行い、適否判定情報を記憶しておく。そして主コンテンツの閲覧が要求されたときに、その適否判定情報に応じた処理(相性のよい副コンテンツの表示)が行われるようにする。
上記した情報処理装置においては、前記テキスト判定部は、前記主コンテンツのジャンルに応じた否定的テキスト情報を用いてテキスト適否情報を生成し、前記画像判定部は、前記主コンテンツのジャンルについての不適切画像を入力する学習により得られた否定的特徴量を用いて画像適否情報を生成することが考えられる。
例えばブログ記事等の主コンテンツのテキスト解析などにより、まずコンテンツ内容のジャンルを特定する。その後、ジャンルに応じた不適切ワードや不適切表現等の否定的テキスト情報を用いてテキスト適否情報を生成する。また、ジャンルに応じた不適切画像の学習結果としての否定的特徴量を用いて画像適否情報を生成する(図8、図11参照)。
上記した情報処理装置においては、前記画像判定部は、前記主コンテンツの画像データについて、前記所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成することが考えられる。
また、上記した情報処理装置においては、前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成することが考えられる。
例えば公序良俗の観点や広告ジャンルとの相性などの所定の観点で適切とされた画像を入力する学習結果としての肯定的特徴量を用いる。
上記した情報処理装置においては、前記適否判定部は、前記主コンテンツとしてブログ記事単位で適否判定を行うことが考えられる。
ブログには複数の記事が含まれることが多いが、その個々の記事毎に適否判定を行う。
本発明に係る情報処理方法は、情報処理装置が、画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成し、前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成し、前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う。
これにより主コンテンツのウェブページ掲載の適否や、主コンテンツと副コンテンツを共にウェブページ掲載することの適否を自動的に判定する。
本発明に係るプログラムは、この情報処理方法の処理を情報処理装置に実行させるプログラムである。
本発明に係る記憶媒体は、上記プログラムを記憶した記憶媒体である。
このプログラムグラムや記憶媒体により本発明の情報処理装置の実現及び提供を容易とする。
本発明によれば、画像の適否判定を学習によって精度を高めつつ、テキスト解析で補完することで、精度の高い適否判定を実現できる。そしてこれによりスタッフのウェブページ掲載の適否判定の作業負担を低減できる。
本発明の実施の形態のシステム構成のブロック図である。 実施の形態のコンピュータ装置のブロック図である。 実施の形態のブログサーバの機能構成の説明図である。 実施の形態のブログを提示するウェブページの例の説明図である。 実施の形態の管理データベースの説明図である。 実施の形態の適否判定情報の説明図である。 実施の形態の判定基準情報データベースの説明図である。 実施の形態の判定基準情報データベースの他の例の説明図である。 実施の形態の適否判定基準学習処理のフローチャートである。 実施の形態のブログ投稿時の適否判定処理のフローチャートである。 実施の形態のブログ投稿時の適否判定処理のフローチャートである。 実施の形態の広告ジャンル毎の適否判定処理のフローチャートである。 実施の形態のブログ閲覧要求時の処理のフローチャートである。 実施の形態のブログ表示の際の広告取得処理のフローチャートである。
以下、実施の形態を次の順序で説明する。
<1.システム構成>
<2.ブログサーバ及びデータベース>
<3.適否判定基準学習処理>
<4.ブログ記事投稿時の処理>
<5.ブログ記事についての広告ジャンル適否判定>
<6.ブログ閲覧時の処理>
<7.まとめ及び変形例>
<8.プログラム及び記憶媒体>
なお、以下の説明において、“ブログ”とは、ウェブログあるいは単にブログと呼ばれる日記形式のウェブページのことである。より具体的には、ブログサーバはユーザに対してブログを形成する環境(記憶容量やウェブページ)を提供し、ユーザは投稿等の形式で文章や画像による記事を自分のブログにアップロードする。ブログサーバは通常、当該記事を一般(又は限定した範囲)の閲覧に供する。但し非公開のものとしてもよい。
記事の内容については特に限定されない。ユーザが情報発信に用いる内容でも、個人的な日記等の内容でもよい。また「ブログ」と呼ばれていないものであっても、同等のものを含む。
“ブログ記事”(単に“記事”とも表記する)とは、ブログを構成する要素であって、文章や画像によって構成された1つの単位(例えば投稿単位)のことを指す。内容には関わらない。なお、必ずしも1つの話題としての記事ではなく、1又は複数の話題について1つのURLで閲覧される記事群を指すものと考えても良い。
本実施の形態の処理は、主に文章と画像の両方を含む記事を対象とする。
“ユーザ”とは、自己のブログに記事を書き込む記述者としてのユーザ(いわゆるブロガー)と、他人又は自己のブログを閲覧する閲覧者としてのユーザが想定される。これらを区別する場合、記事を書くユーザを「ブロガー」と表記し、ブログ閲覧者としてのユーザについては「閲覧者」と表記する。
もちろん一人のユーザがある時点ではブロガーとなり、ある時点では閲覧者となることが通常に想定される。
<1.システム構成>
図1に実施の形態のブログサーバ1を含むネットワークシステムの構成例を示す。
本実施の形態に係るネットワークシステムは、ブログサーバ1と複数のユーザ端末5がネットワーク2により相互に通信可能に接続されている。
またブログサーバ1は各種データベースにアクセス可能とされている。なお、以下「データベース」については「DB」と表記する。図ではブログサーバ1がアクセス可能なDBとしてブログDB51、画像DB52、管理DB53、判定基準情報DB54を例示している。
ネットワーク2の構成は多様な例が想定される。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、CATV(Community Antenna TeleVision)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が想定される。
またネットワーク2の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線等の有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
ブログサーバ1は、ユーザに対するブログサービスの管理運営を行う組織によって用いられる情報処理装置である。ブログサーバ1は、ユーザ(ブロガー)へのブログ環境の提供やユーザ(閲覧者)のアクセス要求に応じたブログ記事ページ等のウェブページデータの配信を行う。
具体的にはブログを開設したいユーザに対しては、そのユーザのブログとしてのウェブページの設定やユーザ情報の登録などを行う。既にブログ開設済のユーザ(ブロガー)に対しては、ブロガーが投稿する記事の保存を行う。
また一般の閲覧者となるユーザからのアクセス要求に応じて、該当のウェブページに係るウェブページデータを配信する。
このブログサーバ1が、本発明請求項の情報処理装置の実施の形態に相当する。
ユーザ端末5は、ブロガーや閲覧者としてのユーザが使用する端末である。このユーザ端末5は、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistant)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどが想定される。
ユーザ端末5では、必要に応じて各種の送受信処理や表示処理などが実行される。
閲覧者は、ユーザ端末5においてウェブブラウザを介して、関心のあるブログの閲覧を任意に行うことができる。
ブロガーは、ユーザ端末5により自分のブログページにアクセスし、閲覧したり、新規に記事を投稿することができる。
ユーザ端末5ではこれらの動作のための通信処理や表示処理等を行うことになる。
広告サーバ3はウェブページ上に掲載する広告コンテンツ(説明上、単に「広告」ともいう)を配信するサーバである。
例えばブログサーバ1は、ブログページ上に広告表示を行うことができる。即ちユーザ端末5の表示部に表示されるブログページには1又は複数の広告領域が設けられており、この広告領域には、広告サーバ3から配信される広告コンテンツが表示される。
広告サーバ3からは、ブログとしてのウェブページを表示させるユーザ端末5のブラウザを介した要求などに応じて広告配信を行う。
広告DB4は、広告コンテンツやその管理情報を保存するDBである。広告サーバ3は広告DB4から選択した広告コンテンツをユーザ端末5に配信し、ブログページ上に表示されるようにする。
図1に示したブログサーバ1、広告サーバ3、ユーザ端末5等を構成する情報処理装置のハードウエア構成を図2に示す。ブログサーバ1やユーザ端末5として示した各装置は、情報処理および情報通信が可能な図2に示すようなコンピュータ装置によって実現される。
図2において、コンピュータ装置のCPU(Central Processing Unit)101は、ROM( Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM( Random Access Memory )103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インタフェース105も接続されている。
入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109が接続されている。
入力部106はキーボード、マウス、タッチパネルなどにより構成される。
出力部107はLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどにより構成される。
記憶部108はHDD(Hard Disk Drive)やフラッシュメモリ装置などにより構成される。
通信部109はネットワーク2を介しての通信処理や機器間通信を行う。
入出力インタフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
このようなコンピュータ装置では、通信部109による通信によりデータやプログラムのアップロード、ダウンロードが行われる。またリムーバブルメディア111を介したデータやプログラムの受け渡しが可能である。
CPU101が各種のプログラムに基づいて処理動作を行うことで、ブログサーバ1やユーザ端末5としての必要な情報処理や通信が実行される。
なお、ブログサーバ1やユーザ端末5を構成する情報処理装置は、図2のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、LAN等によりシステム化されていてもよいし、インターネット等を利用したVPN等により遠隔地に配置されたものでもよい。複数の情報処理装置には、クラウドコンピューティングサービスによって利用可能なサーバ群(クラウド)としての情報処理装置が含まれてもよい。
<2.ブログサーバ及びデータベース>
図3に1又は複数の情報処理装置で構成されるブログサーバ1としての機能構成および各種のDBを示す。
ブログサーバ1としての各機能は、情報処理装置においてCPU101でプログラムに応じて実行される処理により実現される機能である。但し以下説明する全部又は一部の各構成の処理をハードウエアにより実現してもよい。
また各機能をソフトウエアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。1つのプログラムにより複数の機能の処理が実行されてもよいし、1つの機能が複数のプログラムモジュールの連携で実現されてもよい。
また各機能は複数の情報処理装置に分散されていてもよい。さらに機能の1つが、複数の情報処理装置によって実現されてもよい。
ブログサーバ1は、図示するようにブログ管理部11、テキスト判定部12、画像学習部13、画像判定部14、適否判定部15、提示制御部16としての機能を備える。
ブログ管理部11は、ブログサービスを提供するサーバとして必要な処理を実行する。例えばユーザへのブログ環境の提供、記述者としてのユーザの情報の管理、作成されたブログの記憶管理、各ブログに関する情報管理、アクセス要求に応じたブログ(記事)のウェブページの配信などを行う。
またブログ管理部11は管理DB53の情報の更新や読み出しを逐次行う。
テキスト判定部12は、画像データ及びテキストデータを含むブログ記事について、テキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成する。テキスト適否情報は、例えばテキストデータ内容の適否を示す2値であったり、適否の度合いを示すスコアであったりする。
所定の観点とは、例えば公序良俗で適切か否かの観点であったり、各種の広告ジャンルにとって適切か否かの観点などである。広告ジャンルとは、食品業、家電販売、自動車販売、旅行サービス等の広告商品の業種を示すジャンルでもよいし、より細分化したジャンルでもよい。さらには個々の商品/サービスにまで細分化したものでもよい。或いは、製造業、サービス業など、非常に大まかなくくりのジャンルでもよい。
また所定の観点とは、これら以外に、所定の掲載目的にとって適切か否かなど、多様に考えられる。
画像学習部13は所定の観点についての不適切画像を入力する学習、例えばディープラーニングにより否定的特徴量を求め、判定基準情報DB54に記憶させる処理を行う。
また画像学習部13は所定の観点についての適切な画像を入力する学習、例えばディープラーニングにより肯定的特徴量を求め、判定基準情報DB54に記憶させる処理を行う。
画像判定部14は、ブログ記事における画像データについて、所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、その所定の観点における適否に関する情報である画像適否情報を生成する処理を行う。画像適否情報は、例えば画像データの内容の適否を示す2値であったり、適否の度合いを示すスコアであったりする。
適否判定部15はテキスト判定部12が生成したテキスト適否情報と、画像判定部14が生成した画像適否情報を用いて、ウェブページ掲載に関する適否判定を行う。
ウェブページ掲載に関する適否判定としては、例えば、判定対象のブログ記事自体が、ウェブページ掲載に適しているかの判定がある。またウェブページ掲載に関する適否判定としては、或る広告についての或るブログ記事とともに掲載することに関する適否判定がある。なお、このようなブログ記事と広告の同一ウェブページ掲載の適否について、説明上、“相性”という表現も用いる。例えば「相性が悪い」とは、或る広告が或るブログ記事と同じウェブページに掲載することが望ましくないことを指す。
提示制御部16は、ユーザ端末5から要求されたブログ記事をユーザ端末5においてウェブページとして提示させるための処理を行う。即ち提示制御部16は、ユーザ端末5からのページ要求に応じて、要求されたブログ記事のウェブページをユーザ端末5に送信する。ユーザ端末5では、例えばウェブブラウザの機能により当該ウェブページが表示され、ユーザの閲覧に供される。
この場合、提示制御部16は、要求されたブログ記事について管理DB53に記憶されている適否判定情報を参照して、広告コンテンツの商品又は商品分野単位での取得条件を付したウェブページデータを生成し、ユーザ端末5に送信する場合もある。これは、そのブログ記事に相性の悪い広告が表示されないようにするための処理である。
ユーザ端末5において表示されるブログ記事のウェブページ例を図4に示している。
ウェブページ(ブログページ)70としては、例えばタイトルエリア71、記事エリア72、広告エリア73などが設けられる。
タイトルエリア71にはブログタイトル等が表示される。
記事エリア72にはブログ記事が表示される。ブログ記事はテキストエリア72Tと画像エリア72Iが設けられ、画像と文章により記事内容が構成されている。
この図4では記事エリア72が2つ存在する例としているが、個々の記事毎の異なるウェブページとされる場合もある。
広告エリア73には広告サーバ3から送信された広告が表示される。上記の“相性”とは、このように1つのウェブページ上に掲載される記事と広告の相性のこととなる。
図3ではブログサーバ1がアクセスするDBとしてブログDB51、画像DB52、管理DB53、判定基準情報DB54を示している。
ブログDB51は、各ブロガーについてのブログデータを保存するDBである。各ブログのウェブページデータが保存され、また各ブログについては、ブロガーの投稿に応じて記事が追加されていく。
ブログを形成するウェブページのデータは、例えば、HTML(HyperText Markup Language)やXHTML(Extensible HyperText Markup Language)などの構造化文書ファイルである。構造化文書ファイルには、ブロガーが投稿した記事のテキストデータや各種画像等の画像データの指定情報と、それらの配置や表示態様(文字色やフォントや大きさや装飾など)が記述されている。
またブログに対しては閲覧者がコメントを投稿することもできる。そのような閲覧者からのコメントデータもブログやブログ内の個々の記事に紐づけてブログDB51に保存される。
ブログサーバ1は、ユーザ端末5から或るブログについてのアクセス要求があった場合は、要求されたブログページをブログDB51から読み出してユーザ端末5に配信することになる。
画像DB52は、ブログに添付された画像データ(静止画データや動画データ)を保存するDBである。
ブログ内の記事には、画像を添付することができるが、例えばブログDB51には記事データ及び記事データに対応した画像の指定情報(リンク情報)が記憶される。そして画像データ自体は画像DB52に保存される。
画像が添付されたブログ記事へのアクセス要求の場合、そのウェブページデータがユーザ端末5においてブラウザにより表示されるが、その際、ユーザ端末5はウェブページ上のリンク設定により画像データをブログサーバ1に要求する。ブログサーバ1は当該要求に応じて画像データを画像DB52から読み出し、ユーザ端末5に配信する。これによりユーザ端末5上で、画像付きのブログ記事が表示される。
なおこれは一例であり、予め画像データを含むウェブページデータをブログDB51に格納するようにしてもよい。
管理DB53は、各ブログの管理のための情報を格納するDBである。
管理DB53の内容の一例を図5に示す。
1つのブログについてはブログID(Identification)が設定され、ブログIDにより付随する情報が管理される。例えばブログ(ブログID)毎に、ブロガー情報、ブロガー評価情報、ブログ管理情報、ブログ分野情報、サイズ情報、適否判定情報、ブログ実績情報などが、逐次更新されながら管理される。
ブロガー情報は、ブログを開設したユーザ(ブログ管理者)の情報である。例えばブロガー情報としては、ユーザID、管理者としてのログインパスワード、ユーザの住所、氏名、年齢等の属性情報、管理者としてのログイン日時、などの情報が含まれる。
ブロガー評価情報は、各種の観点での適否判定の結果を用いたブロガーの評価情報である。例えば優良ブロガーや要注意ブロガーを示す情報、その程度を示す情報などである。
ここでいう要注意とは、例えば公序良俗の観点で不適切な記事を投稿する可能性が高いブロガーというような意味である。
またブロガーが、広告ジャンルとの相性の観点で、相性のよい記事をよく書くブロガーであるか、相性の悪い記事をよく書くブロガーであるか等の情報もブロガー評価情報となる。
ブログ管理情報は、ブログ自体の属性情報である。例えばブログのURL(Uniform Resource Locator)、ブログ及び各記事のジャンル情報、ブログの開設日時、ブログに含まれる記事数、更新日時情報、ブログのレイアウト情報、リンク設定情報等が含まれる。
ブログ分野情報はブログ及びブログに含まれる各記事についての分野(ジャンル)を示す情報である。なお、ジャンルは、「スポーツ」「芸能」「社会」のように大まかなものでもよいし、例えば「野球」「サッカー」「テニス」など、より細分化されたジャンルでもよい。さらには特定の話題にまで細分化されてもよい。
サイズ情報は、そのブログ全体のデータサイズの情報である。また各記事のサイズ情報を記憶しても良い。サイズ情報は、ブログの更新に応じて更新される。
なお、サイズ情報としてブログDB51に記憶したデータサイズと画像DB52に記憶した画像データのデータサイズを合わせて管理してもよいし、それぞれ別個に管理してもよい。
適否判定情報は、ブログの各記事についての適否判定の結果が記憶される。
図6Aは或るブログIDのブログに対応して管理DB53に記憶される適否判定情報の例を示している。
適否判定情報としては、そのブログおける記事(記事ナンバ)毎に、公序良俗の観点での適否の情報や、広告ジャンル毎の広告との相性の点での適否判定の結果が記憶される。
例えば公序良俗の観点での判定結果が“0”又は“1”として記憶される。例えば適否判定結果はデフォルトで“0”とされ、不適と判定された場合に“1”に更新されるとする。従って図6Bに示すように“1”が不適、“0”は問題なし(不適ではない)という情報となる。
この図6Aの例では、例えば記事ナンバ4の記事が公序良俗の観点で不適と判定された場合を示している。
広告との相性は、例えば広告のジャンルGad1、Gad2、Gad3・・・毎に判定される。ここでは広告ジャンルGad1、Gad2、Gad3・・・の例として、食品、自動車、家電、旅行、情報通信・・・などの商品・サービスの分野を示している。もちろん、より大まかな分類のジャンルや、より細分化されたジャンルでもよい。
各記事ナンバの記事について、これらの広告ジャンル毎に相性という意味での適否判定が行われ、その結果としての“0”“1”が記憶される。例えば記事ナンバ3の記事は自動車や家電の分野の広告とは相性がよくないという意味で不適(“1”)と判定されたが、食品や旅行などの他の分野については問題なし(“0”)と判定された場合を示している。
なお、図6Aの場合、最下段に不適比率(%)を示している。これは不適(“1”)とされた比率である。例えばこのブログの場合、100個の記事の内、2個の記事が公序良俗の観点で不適とされたことで、公序良俗の観点での不適比率が2%となっている。
例えば上述したブロガー評価情報は、このような不適比率の情報を用いて生成することが考えられる。
広告ジャンル毎にも不適比率が示される。これによっては当該ブログのブロガーが、どの広告ジャンルとの相性がよいか、或いは悪いかがわかるため、この情報を用いてブロガー評価情報を生成することもできる。
ところでこの図6Aは、図6Bのように“0”“1”の2値の値としたが、例えば図6Cのように、“00”“01”“10”“11”の4値とし、「問題なし」「不適」「適」「−(例えば未判定)」としてもよい。即ち、特に相性がよい場合などは「適」とする情報を加える。
また図6Dのように4値として「不適」「適1」「適2」「最適」のように、不適から最適までを段階的に示すような情報としてもよい。
図5のブログ実績情報としては、例えばブログの総ページビュー数、アクセスしたユニークユーザ数、総被リンク数、総コメント数、広告クリック数などである。また各記事についてのページビュー数、アクセスしたユニークユーザ数、被リンク数、記事のページランクを示す値などもある。
図3における判定基準情報DB54は、テキスト判定部12がテキスト適否情報を生成する際に用いる情報や、画像判定部14が画像適否情報を生成する際に用いる情報が記憶されている。
判定基準情報DB54の一例を図7に示す・
適否判定の観点として、公序良俗の観点や、広告ジャンルGad1、Gad2、Gad3・・・毎に、画像の否定的特徴量情報SPIN(SPIN−0、SPIN−1・・・)、否定的テキスト情報WN(WN−0,WN−1・・・)、画像の肯定的特徴量情報SPIP(SPIP−1、SPIP2・・・)が記憶される。
否定的テキスト情報WNは、テキスト判定部12がテキスト適否情報を生成する際に用いる情報である。例えば不適切なワード、表現、言い回しなどが観点毎に記憶される。
例えば公序良俗の観点に対応しての否定的テキスト情報WN−0として、差別的であったり犯罪を推奨するようなワードや表現等が記憶されている。
また広告ジャンルGad1として食品の広告に対応する否定的テキスト情報WN−1としては、食品の広告にとって望ましくない表現、食品分野での問題を示すワード、ブランドイメージを損なう恐れのあるワードなどが記憶される。
他の否定的テキスト情報WN−2以降としても、それぞれの対応する広告ジャンルにとって望ましくないワード等が記憶されている。
画像の否定的特徴量情報SPINは、画像判定部14が画像適否情報を生成する際に用いる情報である。即ち不適切な画像の学習によって得られた不適切な画像の特徴量の情報である。
例えば公序良俗の観点に対応しての画像の否定的特徴量情報SPIN−0は、公序良俗を損なう恐れのある多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
また広告ジャンルGad1として食品の広告に対応する画像の否定的特徴量情報SPIN−1は、食品広告の観点で同ページ掲載に好ましくない多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
他の否定的特徴量情報SPIN−2以降も、それぞれの対応する広告ジャンルにとって同ページ掲載に好ましくない多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
この例では各広告ジャンルに対応して、画像の肯定的特徴量情報SPIPも記憶されるものとしている。
広告ジャンルGad1として食品の広告に対応する画像の肯定的特徴量情報SPIP−1は、食品広告の観点で同ページ掲載に好ましい多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
他の肯定的特徴量情報SPIN−2以降も、それぞれの対応する広告ジャンルにとって同ページ掲載に好ましい多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
なお図7の例では、公序良俗の観点に関しては画像の否定的特徴量情報SPIN−0と否定的テキスト情報WN−0を記憶するとしたが、肯定的特徴量情報を記憶するようにしてもよい。
また公序良俗の観点については特にジャンル分けをしていないが、図8に示すように、記事ジャンル毎に分けてもよい。
図8の例では、政治、社会、芸能、スポーツなどの記事ジャンル毎に、否定的テキスト情報WN−G1、WN−G2・・・や、画像の否定的特徴量情報SPIN−G1、SPIN−G2・・・が記憶されるようにしている。
例えば「政治」ジャンルに対応する否定的テキスト情報WN−G1としては、政治記事としての不適切ワードや不適切な言い回し等が記憶される。
また「政治」ジャンルに対応する否定的特徴量情報SPIN−G1としては、政治記事
としての不適切な画像を多数入力したディープラーニングにより得られた特徴量情報となる。
以上の各DB(ブログDB51、画像DB52、管理DB53、判定基準情報DB54)は、ブログサーバ1がアクセス可能とされていればどのような形態で実現されていてもよい。例えばブログサーバ1と同一システム内の記憶部に各DBのすべてが形成されていてもよいし、各DBの一部又は全部が別体、遠隔地等のコンピュータシステムに設けられていてもよい。もちろん各DBが一つの装置(例えば一つのHDD等)内に形成されている必要はない。また各DBのそれぞれが、それぞれ1つのDBとして構成される必要もない。例えば管理DB53として記憶される情報が、複数のDB(例えばブログに関するユーザ管理用のDBとブログ管理用のDBなど)により記憶管理されてもよい。以上の各DBは、実施の形態の処理に関連する情報の記憶部を、それぞれ1つのDBの形態で例示したものに過ぎない。
<3.適否判定基準学習処理>
ブログサーバ1の処理として、画像学習部13の機能により実行される適否判定基準学習処理の例を図9で説明する。この図9は、判定基準情報DB54に記憶される画像の否定的特徴量情報SPIN、肯定的特徴量情報SPIPを求める処理である。
なお、ここではブログサーバ1が行う処理として説明するが、図9の処理は必ずしもブログサーバ1としての情報処理装置で行われなくてもよい。即ちブログサーバ1は画像学習部13としての機能は備えなくてもよい。その場合、他の情報処理装置において以下の処理を行い、その処理で学習した情報が判定基準情報DB54に記憶され、ブログサーバ1が参照できるようにすればよい。
図9のステップS101でブログサーバ1は、適否観点を選択する。これは図7に示した「公序良俗」か、或いは広告ジャンルについての「Gad1:食品」「Gad2:自動車」・・・等の別である。
例えば「公序良俗」を選択すると、以降の処理で得られる画像の否定的特徴量情報SPINは、公序良俗の観点での否定的特徴量情報SPIN−0とされることになる。
また例えば「Gad1:食品」を選択すると、以降の処理で得られる画像の否定的特徴量情報SPINは、食品という広告ジャンルとの相性という観点での否定的特徴量情報SPIN−1とされることになる。
このようなステップS101の選択はオペレータ操作に応じて実行してもよいし、各観点について自動的に順次選択していってもよい。
ステップS102でブログサーバ1は、不適切画像を取得する。
例えばステップS101で「公序良俗」を選択した場合は、ブログサーバ1は公序良俗の観点で不適切とされる多数の画像を取得する。
またステップS101で「Gad1:食品」を選択した場合は、ブログサーバ1は食品広告との同ページ掲載という観点で不適切とされる多数の画像を取得する。
これらの不適切画像はオペレータが選択して入力してもよいし、ブログサーバ1が学習用の画像を供給するデータベースにアクセスして取得するようにしてもよい。
ステップS103でブログサーバ1は、取得した多数の不適切画像についてディープラーニングを行い、特徴量情報を算出する。例えば教師無し学習として、入力された多数の不適切画像を学習データとし、多数の学習データに共通する特徴を取得する。そして認識した特徴に基づいて、学習データにどのような特徴があるかを数値化した特徴量を算出する。
ステップS104でブログサーバ1は、特徴量情報を判定基準情報DB54に記憶する。即ちこの場合、不適切画像を用いた学習であるので、求められた特徴量情報は、画像の否定的特徴量情報SPINとして判定基準情報DB54に記憶されることになる。
例えばステップS101で「公序良俗」を選択していた場合は、ブログサーバ1は公序良俗の観点での不適切画像を判定する基準として画像の否定的特徴量情報SPIN−0を記憶する。
またステップS101で「Gad1:食品」を選択していた場合は、ブログサーバ1は食品広告との同ページ掲載という観点での不適切画像を判定する基準として画像の否定的特徴量情報SPIN−1を記憶する。
ステップS105では、判定基準の学習の観点が、公序良俗であるか広告ジャンルとの相性であるかにより処理を分岐する。
公序良俗について不適切画像を学習していた場合は、図7のような判定基準情報DB54の例では、肯定的特徴量情報SPIPを記憶しないので、ステップS105から図9の処理を終える。
広告ジャンル毎の学習の場合は、引き続き肯定的特徴量情報SPIPの学習に移るためステップS105からS106に進む。
ステップS106でブログサーバ1は、適切画像を取得する。
例えばステップS101で「Gad1:食品」を選択していた場合は、ブログサーバ1は食品広告との同ページ掲載という観点で好ましい多数の画像を取得する。
これらの適切画像はオペレータが選択して入力してもよいし、ブログサーバ1が学習用の画像を供給するデータベースにアクセスして取得するようにしてもよい。
ステップS107でブログサーバ1は、取得した多数の適切画像についてディープラーニングを行い、特徴量情報を算出する。
ステップS108でブログサーバ1は、特徴量情報を判定基準情報DB54に記憶する。即ちこの場合、適切画像を用いた学習であるので、求められた特徴量情報は、画像の肯定的特徴量情報SPIPとして判定基準情報DB54に記憶されることになる。
例えばステップS101で「Gad1:食品」を選択していた場合は、ブログサーバ1は食品広告との同ページ掲載という観点での望ましい画像を判定する基準として画像の肯定的特徴量情報SPIP−1を記憶する。
以上により処理を終える。
例えば図7の公序良俗の観点や各広告ジャンルの観点、或いは図8の記事ジャンル毎の公序良俗の観点について、それぞれ図9の処理を行うことで、画像の否定的特徴量情報SPINや肯定的特徴量情報SPIPを判定基準情報DB54に記憶できる。
なお、否定的テキスト情報WN(WN−0、WN−1・・・)については、共通のワードの抽出などによるものとすればよい。
例えば公序良俗の観点や各広告ジャンルの観点で不適切な文章とされた多数のテキストデータのうちで、共通するワードを抽出したり、形態素解析により不適切な言い回し、表現等を抽出する。これらを集めて否定的テキスト情報WNとすればよい。
またオペレータが、各観点で不適切なワード等を入力し、それを否定的テキスト情報WN(WN−0、WN−1・・・)として判定基準情報DB54に記憶してもよい。
<4.ブログ記事投稿時の処理>
続いてブロガーからブログ記事が投稿された際のブログサーバ1の処理例を図10により説明する。これは、ブログサーバ1が主にテキスト判定部12、画像判定部14、適否判定部15の機能により実行する処理である。そしてこの処理は、投稿されたブログ記事について、公序良俗の観点でウェブページ掲載の適否判定を行う処理としている。
ブログ記事が投稿された場合、ブログサーバ1はステップS200からS201に進み、投稿されたブログ記事にテキストデータと画像データが共に含まれているか否かを確認する。
記事がテキストデータのみ、もしくは画像データのみであった場合は、ステップS201から他の判定処理に進む。
テキストデータと画像データの両方が含まれている記事であった場合、ステップS201からS202に進み、本実施の形態の技術による適否判定を行うことになる。
ステップS202でブログサーバ1は、判定基準情報DB54から、公序良俗の観点での否定的テキスト情報WN−0を取得する。
ステップS203でブログサーバ1は、投稿されたブログ記事におけるテキストデータを抽出する。
ステップS204でブログサーバ1は、ブログ記事におけるテキストデータを解析する。具体的には、ブログ記事におけるテキストデータにおいて、否定的テキスト情報WN−0として挙げられているワードや言い回しが含まれているか否か、いくつ含まれているか、或いは類似のワード等が含まれているか、等を解析する。
そしてステップS205でブログサーバ1は、解析結果を用いてテキスト適否スコアStを算出する。
テキスト適否スコアStは、例えば0〜100のスコアとして、不適切であることの度合いを示す値とする。例えば否定的テキスト情報WN−0に挙げられたワード等との共通するワード等の存在によりスコア値を加算していく。もちろん不適切なワード等にも程度があるため、ワード等によって加算値に重み付けしてもよい。
或いはテキスト適否スコアStは、例えば“0”(問題なし)、“1”(不適切)という2値のスコアとしてもよい。例えば1つでも(もしくは所定数以上)、否定的テキスト情報WN−0に挙げられたワード等との共通するワード等があれば“1”とするなどである。
またテキスト適否スコアStは、例えば初期値を“50”として、不適切なワード等に応じてスコア値を加算し、望ましいワード等に応じてスコア値を減算していくなどし、“0”(最適)、“100”(最も不適切)のようなものとしてもよい。
他にもテキスト適否スコアStの態様は多様に考えられる。
次にステップS206でブログサーバ1は、投稿されたブログ記事における画像データを抽出する。
ステップS207でブログサーバ1は、判定基準情報DB54から、公序良俗の観点での画像の否定的特徴量情報SPIN−0を取得する。
ステップS208でブログサーバ1は、ブログ記事における画像データを解析する。具体的には、ブログ記事における画像データにおいて、画像の否定的特徴量情報SPIN−0と共通する特徴量を解析する。
そしてステップS209でブログサーバ1は、解析結果を用いて画像適否スコアSiを算出する。
画像適否スコアSiは、テキスト適否スコアStと同様に、例えば0〜100のスコアとして、不適切であることの度合いを示す値とする。
或いは画像適否スコアSiは、“0”(問題なし)、“1”(不適切)という2値のスコアとしてもよい。
また画像適否スコアSiは、例えば初期値を“50”として、特徴量情報に応じて増減され、“0”(最適)、“100”(最も不適切)のようなものとしてもよい。
他にも画像適否スコアSiの態様は多様に考えられる。
ステップS210でブログサーバ1は、テキスト適否スコアSt及び画像適否スコアSiを用いて、適否判定を行う。即ちこの場合、投稿されたブログ記事が公序良俗の観点でウェブサイト掲載に適しているか否かを判定することになる。
判定は、例えば(k1・St)+(k2・Si)の値と、所定の閾値thとを比較して行う。係数k1,k2は、テキストと画像の重み付けのための係数である。
上述のように例えばテキスト適否スコアStと画像適否スコアSiが、不適切であることの度合いを示す値(即ち値が大きい程、不適切)とした場合、(k1・St)+(k2・Si)の値が閾値th以上であれば不適切とする。
もちろんこれは一例であり、適否判定の演算手法は多様に考えられる。
例えばkb{(k1・St)+(k2・Si)}として、係数kbをブロガー評価情報に基づいて可変し、この値が閾値th以上であれば不適切と判定することも考えられる。例えば公序良俗の観点で要注意のブロガーは、優良ブロガーよりも不適切判定が行われ易くするような例である。もちろん閾値thをブロガー評価情報に応じて変更するようにしてもよい。
またテキスト適否スコアStや画像適否スコアSiが、“0”“1”の2値の情報である場合、アンド条件で“1”となったら、不適切と判定することも考えられる。
ステップS211でブログサーバ1は、適否判定情報を更新する。例えば図6の適否判定情報における該当のブログIDにおいて、今回の新たな記事投稿に対応して新規の記事ナンバを設定し、当該記事ナンバの公序良俗の観点での適否判定結果“0”又は“1”を登録する。
またこれに応じて不適比率も計算しなおして更新する。これをブロガー評価情報に反映させる場合、図5のブロガー評価情報も更新する場合があることになる。
ステップS212では、今回の判定が不適とされたか否かで処理を分岐する。
今回、不適判定されなかった場合は、ステップS212からS213に進んで、ブログサーバ1は、投稿された記事を新規投稿の記事として通常受け付け処理を行う。即ち記事コンテンツのブロクDB51や画像DB52への登録や、新規投稿に伴う管理DB53の更新も行う。そして記事投稿時の処理を終える。
この場合、閲覧者としてのユーザは、当該記事を通常に閲覧できるようになる。
一方、今回、不適判定された場合は、ステップS212からS214に進んで、ブログサーバ1は不適対応処理を行う。
この不適対応処理は以下のような各種の例が考えられる。
・投稿を受け付けない
・投稿は受け付けるが閲覧制限をかける。例えば年齢確認できるユーザであって所定の年齢以上のユーザにのみ閲覧可能とする。
・投稿受付を保留してブロガーに不適切箇所の修正を求める通知を行う。再投稿の場合は同様に適否判定を行う。
・スタッフが目視で確認し、実際に掲載に問題があるか否かを最終判定する。問題がなければ閲覧可能とする。
不適対応処理の例としてこれらの処理があるが、他にも各種の例が考えられる。
以上の図10の処理によれば、投稿された記事に対して公序良俗の観点でウェブページ掲載の適否が自動判定される。これにより公序良俗の観点で望ましくない記事を、スタッフが全件を目視で確認していかなくとも、公開しないようにすることができる。
その上、テキスト判定と画像判定を用いることで、判定信頼性を上げることができる。特に画像判定は、図9のようなAI(Artificial Intelligence)学習により得られた画像の否定的特徴量情報SPIN−0を用いて行うが、ワード抽出等によるテキスト判定と組み合わせることで判定信頼性を向上させている。
図11は図10と同じく投稿された記事に対するブログサーバ1の他の処理例である。図10と同じ処理については同じステップ番号を付し重複説明を避ける。
この処理は図8のように公序良俗に関する判定基準情報(否定的テキスト情報WN及び画像の否定的特徴量情報SPIN)が記事ジャンル毎に記憶されていることに対応する処理例である。
図11の場合、ブログサーバ1は、テキストデータと画像データを含む記事が投稿された場合に、まずステップS220で記事ジャンルを判定する。例えば記事のタイトル、テキストデータの解析、頻出ワードなどにより、記事ジャンルを判定する。
ステップS221でブログサーバ1は、判定した記事ジャンルの情報を図5の管理DB53におけるブログ分野情報において、投稿された記事に対応するジャンル情報を記憶する。なおこの処理はステップS211の時点など、後に行ってもよい。
ステップS222でブログサーバ1は、判定した記事ジャンルに応じた否定的テキスト情報WNを判定基準情報DB54から取得する。
例えば判定した記事ジャンルが「政治」であれば否定的テキスト情報WN−G1を取得する。
そしてブログサーバ1は、ステップS203で投稿されたブログ記事におけるテキストデータを抽出し、ステップS204で抽出したテキストデータを否定的テキスト情報WN−G1を用いて解析する。さらに解析結果に基づいてブログサーバ1はステップS205でテキスト適否スコアStを算出する。
次にブログサーバ1はステップS206で投稿されたブログ記事における画像データを抽出する。
ステップS207Aでブログサーバ1は、判定基準情報DB54から、判定した記事ジャンルに対応する画像の否定的特徴量情報SPINを取得する。
例えば判定した記事ジャンルが「政治」であれば画像の否定的特徴量情報SPIN−G1を取得する。
ステップS208でブログサーバ1は、ブログ記事における画像データを解析する。具体的には、ブログ記事における画像データにおいて、画像の否定的特徴量情報SPIN−G1と共通する特徴量を解析する。
そしてステップS209でブログサーバ1は、解析結果を用いて画像適否スコアSiを算出する。
ステップS210以降は図10と同様である。即ちブログサーバ1は、テキスト適否スコアStと画像適否スコアSiを用いて適否判定を行い、適否判定に応じた処理を行う。
この図11の処理によれば、投稿記事のジャンルに応じて、公序良俗の観点でのウェブページ掲載の適否が判定される。即ちジャンルに応じた基準で掲載適否が判定できることになる。
<5.ブログ記事についての広告ジャンル適否判定>
続いて、ブログ記事について広告ジャンル毎に相性の点での適否を判定する処理を図12で説明する。この図12の処理は、例えば上記の図10又は図11に引き続いてブログサーバ1が主にテキスト判定部12、画像判定部14、適否判定部15の機能により実行する処理である。例えば投稿を受け付けた個々の記事に対して実行する。
図12は処理対象とした1つの記事に対する処理として示している。
ブログサーバ1はステップS250で、処理対象とした記事のテキストデータを抽出する。
ステップS251でブログサーバ1は変数n=1とする。変数nは、図6に示した各広告ジャンルGad1、Gad2・・・を指定する変数であり、その最大値nmaxは、広告ジャンルの数である。
ステップS252でブログサーバ1は、広告ジャンルGad(n)の否定的テキスト情報WN−(n)を判定基準情報DB54(図7A参照)から取得する。
ステップS253でブログサーバ1は、処理対象のブログ記事におけるテキストデータを解析する。具体的には、記事におけるテキストデータにおいて、否定的テキスト情報WN−(n)として挙げられているワードや言い回しが含まれているか否か、いくつ含まれているか、或いは類似のワード等が含まれているか、等を解析する。
そしてステップS254でブログサーバ1は、解析結果を用いて広告ジャンルGad(n)に対してのテキスト適否スコアStG(n)を算出し、内部レジスタ等に一時的に記憶する。
テキスト適否スコアStG(n)の態様は、先の図10,図11のテキスト適否スコアStと同様に多様に考えられる。
ステップS255でブログサーバ1は変数nが最大値nmaxに達しているか否かを確認し、達していなければステップS256で変数nをインクリメントしてステップS252に戻る。そして処理対象としている記事のテキストデータについて、次の広告ジャンルGad(n)について、同様にステップS252〜S254の処理を行う。
従って、処理対象としている記事のテキストデータについて、広告ジャンルGad1〜Gad(nmax)のそれぞれに対応して、テキスト適否スコアStG1〜StG(nmax)が順次算出されていくことになる。
ブログサーバ1の処理は、テキスト適否スコアStG(nmax)が算出された後に、ステップS255からS257に進むことになる。ステップS257では変数n=1とする。そしてステップS258でブログサーバ1は処理対象としている記事の画像データを抽出する。
ステップS259でブログサーバ1は、判定基準情報DB54から、広告ジャンルGad(n)の画像の否定的特徴量情報SPIN−(n)、及び画像の肯定的特徴量情報SPIP−(n)を取得する。
ステップS260でブログサーバ1は、処理対象のブログ記事における画像データを解析する。具体的には、ブログ記事における画像データにおいて、画像の否定的特徴量情報SPIN−(n)と共通する特徴量、及び画像の肯定的特徴量情報SPIP−(n)と共通する特徴量を解析する。
そしてステップS261でブログサーバ1は、解析結果を用いて広告ジャンルGad(n)に対しての画像適否スコアSiG(n)を算出し、内部レジスタ等に一時的に記憶する。
画像適否スコアSiG(n)の態様は、先の図10,図11の画像適否スコアSiと同様に多様に考えられる。
なお画像適否スコアSiG(n)の算出に、画像の否定的特徴量情報SPIN−(n)と画像の肯定的特徴量情報SPIP−(n)の両方を用いることで、例えば広告ジャンルと画像の相性を肯定面でも評価できる。但し画像の否定的特徴量情報SPIN−(n)のみを用いて、否定面を抽出して相性を評価したり、画像の肯定的特徴量情報SPIP−(n)のみを用いて、肯定面を抽出して相性を評価するということも考えられる。
ステップS262でブログサーバ1は変数nが最大値nmaxに達しているか否かを確認し、達していなければステップS263で変数nをインクリメントしてステップS259に戻る。そして処理対象としている記事の画像データについて、次の広告ジャンルGad(n)について、同様にステップS259〜S261の処理を行う。
従って、処理対象としている記事の画像データについて、広告ジャンルGad1〜Sad(nmax)のそれぞれに対応して、画像適否スコアSiG1〜SiG(nmax)が順次算出されていくことになる。
ブログサーバ1の処理は、画像適否スコアSiG(nmax)が算出された後に、ステップS262からS264に進むことになる。
ステップS264でブログサーバ1は、処理対象の記事について、ジャンルGad1〜Gad(nmax)のそれぞれに対応する適否判定を行う。
即ちブログサーバ1は、当該記事について、テキスト適否スコアStG1及び画像適否スコアSiG1を用いて、広告ジャンルGad1(食品)に対する適否判定を行う。判定は、例えば(k1・StG1)+(k2・SiG1)の値と、所定の閾値thとを比較して行う。係数k1,k2は、テキストと画像の重み付けのための係数である。
もちろんこれは一例で、先の公序良俗の観点での適否判定と同様に、例えばブロガー評価情報を係数に用いたり、テキスト適否スコアStG1と画像適否スコアSiG1のアンド条件などによって判定を行ってもよい。
この判定結果は、食品ジャンルの商品・サービスの広告にとって、当該記事が同一ページ掲載に適しているか否かの判定結果となる。
同様にブログサーバ1は、当該記事について、テキスト適否スコアStG2及び画像適否スコアSiG2を用いて、広告ジャンルGad2(自動車)に対する適否判定を行う。
同様にブログサーバ1は、当該記事について、テキスト適否スコアStG3及び画像適否スコアSiG3を用いて、広告ジャンルGad3(家電)に対する適否判定を行う。
このように、各広告ジャンルGad1〜Gad(nmax)について、当該記事の相性という観点で適否判定結果を算出する。
各広告ジャンルについて適否判定を行ったら、ブログサーバ1は、その適否判定結果を反映するように適否判定情報(図6参照)を更新する。
即ち、ある記事ナンバの記事について、各広告ジャンルGad1、Gad2・・・について、例えば“0”“1”等の適否判定情報を記憶させる。
またこれに応じて各広告ジャンルGad1、Gad2・・・についての不適比率も計算しなおして更新する。これをブロガー評価情報に反映させる場合、図5のブロガー評価情報、即ちブロガーにとっての相性のよいジャンル、相性の悪いジャンルの情報を更新する場合もある。
<6.ブログ閲覧時の処理>
続いてユーザ端末5からブログが閲覧要求された場合のブログサーバ1の処理を説明する。図13はユーザ端末5からブログアクセス要求があった場合のブログサーバ1の処理を示している。この処理例は、ユーザ端末5において、提示される記事とともに相性の悪い広告が表示されないようにする処理である。
ユーザ端末5から或るブログ記事に対するアクセス要求があった場合、ブログサーバ1の処理はステップS300からS301に進む。
ステップS301でブログサーバ1は、管理DB53から提示させるブログ記事についての適否判定情報(図6参照)を取得する。
ステップS302でブログサーバ1は、適否判定情報から、不適とされた広告ジャンルの有無を確認する。
特に不適とされた広告ジャンルがなければステップS304に進んで、当該ブログ記事のページのページデータを生成する。即ち該当記事としてのテキストデータ及び画像データをブログDB51、画像DB52から読み出し、例えばHTMLやXHTMLなどウェブページデータを生成する。
そしてブログサーバ1はステップS305で、生成したページデータを要求元のユーザ端末5に送信する。これにより、ユーザ端末5においてユーザが所望したブログ記事が図4のように表示される。
またブログページ70の広告エリア73には、広告サーバ3から配信された広告が表示される。例えばユーザ端末5のブラウザが、当該ページデータに記載された広告要求指示に従って広告サーバ3に広告要求を行い、配信される広告を取得し、表示させる。この場合、当該ブログページ70としてのページデータに広告取得条件が付加されていないことで、どの広告ジャンルの広告も掲載が制限されない。
なお、このときユーザ端末5は、ユーザ情報(例えばユーザの購買履歴等から推定した趣味、嗜好、購買傾向等)を広告サーバ3に送信することで、ユーザに適した広告を広告サーバ3に要求する場合もある。ユーザ情報はブログサーバ1がページデータとともにユーザ端末5に供給したり、或いはユーザ端末5自体が記憶するウェブ閲覧履歴などに基づいて生成したりすることが考えられる。
一方、要求されたブログ記事について不適とされた広告ジャンルが存在する場合は、ブログサーバ1は、ステップS303で、広告取得条件として、不適とされた特定の広告ジャンルを不可とする情報を設定する。例えば図6の記事ナンバ3の記事のように、自動車、家電の広告ジャンルについて不適とされている場合、自動車関連の広告や家電関連の広告については掲載不可とする広告取得条件を設定する。
そしてブログサーバ1は、ステップS304でのページデータ生成の際に、当該広告取得条件の情報をページデータに付加する。
例えばHTMLページに、JavaScript(ジャバスクリプト)等のプグラム言語により、広告取得条件に基づいての広告アクセスを行うようにユーザ端末5に指示するプログラムを加えるようにする。
ブログサーバ1はステップS305で、生成したページデータを要求元のユーザ端末5に送信する。これにより、ユーザ端末5においてユーザが所望したブログ記事が図4のように表示される。
この場合、ブログページ70の広告エリア73には、相性が悪いとして不適と判定された広告ジャンルの広告は表示されない。例えばユーザ端末5のブラウザは、当該ページデータに記載された広告要求指示に従って広告サーバ3に広告要求を行うが、広告取得条件が設定されていることで、特定の広告ジャンルを除いた要求を広告サーバ3に対して行う。広告サーバ3は、これに応じて、不可とされたジャンル以外のジャンルの広告をユーザ端末5に送信する。例えば図6の記事ナンバ3の記事の場合、その記事と同じページの広告エリア73には、自動車関連の広告や家電関連の広告は掲載されないことになる。
なお図6C、図6Dのように、適否判定情報として望ましい広告ジャンルを示す場合もある。そのような望ましい広告ジャンルの情報をページデータに付加し、ユーザ端末5(ブラウザ)が広告サーバ3に広告要求する場合に、望ましい広告ジャンルの広告が得られやすくするような要求を行うようにしてもよい。
以上の図13は、ブログサーバ1が適否判定情報に基づいて広告取得条件を設定してページデータに付加することで、ユーザ端末5がその広告取得条件に従った配信を広告サーバ3に要求する例を述べたが、ブログサーバ1が広告サーバ3から広告配信を受け、広告を含めたページデータを生成し、それをユーザ端末5に配信するという例も考えられる。その場合は、ステップS304のページデータ生成の際に、ステップS303で設定した広告取得条件に従って広告サーバ3に対して広告要求を行うようにすればよい。
また図14のように、ユーザ端末5(ブラウザ)側で適否判定情報を参照して広告を選択することも考えられる。
図14はユーザ端末5の処理である。ユーザ端末5はユーザ操作に従い、ステップS400でブログの或る記事のページをブログサーバ1に要求する。これに応じてブログサーバ1は該当の記事のページデータを送信してくる。ユーザ端末5はステップS401でページデータを受信取得し、ステップS402でブログページを表示する処理を行う。
このページデータには広告エリア73が設定され広告取得指示が含まれていることで、ユーザ端末5(ブラウザ)はステップS403として広告サーバ3に広告要求を行う。
ステップS404でユーザ端末5は広告サーバ3から送信されてくる広告を取得する。 ここでユーザ端末5はステップS405で、取得した広告のジャンルを特定する。例えば広告サーバ3から広告コンテンツに含まれて送られてくる広告の属性情報から当該広告のジャンルを判定する。
ステップS406でユーザ端末5は、適否判定情報を参照して、当該広告ジャンルが当該ブログ記事にとって相性がいいものであるか否かを判定する。
この処理は、ユーザ端末5がブログサーバ1に広告ジャンルの情報を送信し、当該記事との適否判定情報を参照して、その参照結果をユーザ端末5に通知するものとしてもよい。
或いは、記事と広告ジャンルの組み合わせによる適否判定情報をAPI(Application Programming Interface)によりユーザ端末5から問い合わせ可能としてもよい。
或いは、ユーザ端末5が当該ブログ記事についての適否判定情報を直接管理DB53から取得できるようにしてもよい。
さらには、例えばブログサーバ1が記事のページデータをユーザ端末5に送信する際に、その記事に対応する適否判定情報を共にユーザ端末に送信するようにしてもよい。
これらの手法により、ユーザ端末5では、受信した広告が、表示させるブログ記事と相性がよいものであるか否か判定できる。
相性がよいものであれば、ユーザ端末5はステップS407からS409に進み、受信した広告を広告エリア73に表示させる処理を行う。
受信した広告がブログ記事と相性が悪いものであった場合は、ユーザ端末5はステップS407からS408に進み、広告サーバ3に対して異なるジャンルの広告を送信するように要求する。そしてステップS404でユーザ端末5は広告を取得し、ステップS405,S406の処理を同様に行う。
このような処理によっても、ブログ記事に対して相性の悪い広告が同じページに表示されないようにすることができる。
特に図14のような処理は、ブログ閲覧用のアプリケーションソフトウエアとして提供され、ユーザ端末5で機能するようにされることで、容易に実現可能である。
なお、例えばユーザ端末5(ブラウザ)が、ブログサーバ1が提供するAPIにアクセスすること等により広告取得条件を取得した場合、それに応じて特定のジャンルの広告を除く配信を広告サーバ3に要求するようにするような処理も可能である。その場合、広告サーバ3からは相性の悪い広告は送信されないため、図14のステップS407,S408は不要となり、広告取得及び表示までの処理を迅速化できる。
<7.まとめ及び変形例>
以上の実施の形態によれば、次のような効果が得られる。
実施の形態のブログサーバ1(情報処理装置)は、画像データ及びテキストデータを含むブログ記事(主コンテンツ)について、テキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否スコアStを生成するテキスト判定部12と、ブログ記事の画像データについて、所定の観点についての不適切画像を入力する学習により得られた否定的特徴量SPINを用いた解析を行い、所定の観点における適否に関する情報である画像適否スコアSiを生成する画像判定部14を有する。またブログサーバ1は、テキスト適否スコアSt及び画像適否スコアSiを用いて、ウェブページ掲載に関する適否判定を行う適否判定部15を備える。
不適切画像の学習(実施の形態ではディープラーニング)による画像判定は、学習を進めることによって精度を高めることができるが、過学習という懸念もある。本実施の形態の場合は、画像の学習精度をある程度に抑えたうえで、テキスト解析で補完するということができる。そして両解析を合わせて所定の観点について適否判定する。この場合、過学習を抑え目的にそった適切な適否判断が実行できる確度を高めることができる。
なお学習は深層学習(ディープラーニング)に限らない。機械学習(マシンラーニング)の範疇の他の手法でもよい。
実施の形態では、ブログサーバ1はブログ記事自体のウェブページ掲載の適否判定を行う例を述べた(図10,図11参照)。
例えば投稿されたブログ記事が、ウェブページ掲載するにあたって不適なものでないかを判定する。
これによりブロガーが投稿する記事など、ブログサーバ1側が制作するものではないコンテンツについて、ウェブページ掲載に不適切なものを判定でき、対応処理をとることができる。例えばウェブページ掲載の不実行、掲載停止、掲載削除、閲覧制限の設定、或いは制作者への修正依頼などが可能となる。このような判定を自動で行うことで、ブログサーバ1側のスタッフの作業負担も著しく低減される。
特に上述のように判定精度が高められていることで、これらの効果は顕著なものとなる。
実施の形態では、所定の観点として、ウェブページ掲載に係る公序良俗の観点により適否判定を行う例を挙げた(図10,図11参照)。例えば投稿されたブログ記事が、差別用語を含んだり、犯罪を促す内容であったりするなど、公序良俗の観点でウェブページ掲載するにあたって不適なものでないかを判定する。
具体的には、テキスト解析では、差別用語などの不適切ワードや不適切な表現・文意を解析する。画像については、公序良俗の観点で不適切な画像を入力した学習によって得られた特徴量を用いて、ブログ記事における画像が不適切であるか否かを解析する。これらの結果のテキスト適否スコア及び画像適否スコアを用いて、公序良俗の観点での適否判定を行うようにしている。
これによりウェブページ掲載にとって公序良俗の観点で不適切なものを判定でき、対応処理をとることができる。
実施の形態では、ブログ記事(主コンテンツ)とともに同じウェブページに掲載されようとする広告(副コンテンツ)について、ブログ記事とともにウェブページ掲載を行うことの適否判定を行う例を述べた(図12、図13参照)
これによりブログ記事と共に掲載される広告の相性が判定されることになる。
例えばベジタリアンを推奨するブログ記事とともにステーキレストランの広告を載せたり、列車事故の話題のブログ記事とともに鉄道旅行の広告を載せたりすることは、ブロガーと広告主の双方にとって望ましくないものとなる。
これらの例のようにブログと広告の相性が悪いと、ブロガーや閲覧者は、ブログ記事内容にそぐわない広告が掲載されることで不快に思ったり、場合によってはブロガーの評判低下が生ずるという懸念もある。
また広告主からみれば、広告効果が期待できない場合や、企業イメージやブランドイメージの低下といったことを引き起こす可能性も考えられる。
そこで実施の形態では、ブログ記事と広告の相性としての適否判定を行うようにすることで、不適切なマッチングによるウェブページ掲載が行われないようにすることができ、これによってブロガー、閲覧者、広告主のそれぞれにとって望ましいウェブページ掲載環境を実現できることになる。
実施の形態では、所定の観点として、広告が提示する商品又は商品分野にとってブログ記事が適切か否かの観点とする例を述べた。
例えば投稿されたブログ記事と広告の商品又は商品分野(ジャンル)の相性がよいか否かを判定する。
具体的には、図13の例では、ブログ記事に対して不適とされた広告ジャンルの有無を確認し、そのような相性として不適な広告がブログ記事に対して掲載されないようにしている。また図14の例ではブログ記事とともに掲載する広告を取得した際に、その広告のジャンルがブログ記事に対して相性として不適であるか否かを確認している。またこれら図13,図14の処理のために、ブログ記事については図12の処理により、相性として不適な広告ジャンルを検出し、適否判定情報を管理するようにしている。
これらの処理により、広告ジャンルとブログ記事内容の相性がよくないマッチングが防止される。
また相性の判定についてテキスト解析では、商品や商品分野(広告ジャンル)にとって好ましくないとされる不適切ワードや不適切な表現・文意を解析する。画像については、商品や商品分野(広告ジャンル)毎に不適切な画像を入力したディープラーニングによって得られた特徴量を用いて行う。広告ジャンルによっては不適切なテキストや画像の内容は異なるため、副コンテンツが提示する商品又は商品分野にとって主コンテンツが適切か否かの観点で判定することで、主副コンテンツの適切なマッチングがはかられるとともに、各広告コンテンツの広告機会もむやみに阻害されない。
例えば野菜販売の広告は、農薬記事には相性が悪い場合があるが、ベジタリアン推奨の記事には相性がよい。列車旅行の広告は列車事故の記事に相性は悪いが、観光記事には相性がよい。これらのように商品又は商品分野によって主コンテンツとの相性は異なるため、商品や商品分野毎に主コンテンツとの相性が適切か否かを判定することが好適となる。
そして相性のよいマッチングでウェブページ掲載を行うことで、広告効果の上昇、ブランドイメージ向上なども期待できる。従ってブログサーバ1やユーザ端末5などのハードウエア資源の有効利用にもつながる。
実施の形態のブログサーバ1は、ユーザ端末5から要求されたブログ記事をユーザ端末5においてウェブページとして提示させるための処理を行う提示制御部16を備える。そして適否判定部15は、ブログ記事に対して行った広告ジャンル毎の相性の面での適否判定の結果を含む適否判定情報を管理DB53に記憶する処理(図12)を行う。また提示制御部16は、要求されたブログ記事について記憶されている適否判定情報を参照して、広告の商品又は商品分野単位での取得条件を付したウェブページデータを生成し、ユーザ端末5に送信する(図13)。
これによりブログ記事がユーザ端末5から要求されたときに、提示制御部16は適否判定情報を参照して、広告ジャンルとしての取得条件を付したウェブページデータを生成し、ユーザ端末5に送信すればよく、これによって当該ブログ記事とは相性のよくない広告が表示されないようにすることができる。そしてブログ記事要求時に適否判定を行うものではないためブログサーバ1のウェブページ送信処理負荷は重くならない。これによりレスポンスのよいブログ閲覧環境をユーザに提供できることになる。
実施の形態では、ブログ記事のジャンルに応じた否定的テキスト情報WN−G1、WN−G2・・・を用いてテキスト適否スコアSt生成し、またブログ記事のジャンルについての不適切画像を入力するディープラーニングにより得られた画像の否定的特徴量情報SPIN−G1、SPIN−G2・・・を用いて画像適否スコアSiを生成する例を述べた(図8,図11参照)。
例えばブログ記事のテキスト解析などにより、まず記事内容のジャンルを特定する。その後、記事ジャンルに応じた不適切ワードや不適切表現等の否定的テキスト情報を用いてテキスト適否情報を生成する。また、記事ジャンルに応じた不適切画像の学習結果としての否定的特徴量を用いて画像適否情報を生成する。
これにより、ブログ記事のジャンル毎の事情に応じた適否判定ができる。例えば映画紹介のブログでは不適切でなくても、子供向けのブログでは不適切な言葉や表現はある。子供向けのブログを基準として全てのブログ記事を判定してしまうと、無用に不適切と判定されるブログ記事が増えてしまうようなことも考えられる。ジャンルに応じた否定的テキスト情報や否定的特徴量を用いて判定することで、このような事態を防止できる。
実施の形態では、ブログ記事の画像データについて、所定の観点についての適切画像を入力する学習により得られた画像の肯定的特徴量情報SPIPも用いて画像適否スコアSiを生成する例を述べた(図12参照)。
例えば公序良俗の観点や広告ジャンルとの相性などの所定の観点で適切とされた画像を入力する学習結果としての肯定的特徴量を用いる。
これにより、ウェブページ掲載に相応しい主コンテンツの判定や、副コンテンツ(広告等)の主コンテンツに対しての相性の良さの判定も可能となる。これによって例えば広告掲載を想定すれば、ブログ記事内容との相乗効果で、より広告効果を高めるような掲載も実現できる。例えば車の性能を肯定的に評価するブログ記事とともに車の広告を掲載することで、ブログと広告の双方に高い付加価値が生まれる。
実施の形態では、ブログサーバ1はブログ記事単位で適否判定を行う例を述べた(図10〜図13参照)。
ブログは記事毎に話題が異なり、公序良俗あるいは広告との相性などの観点での適否は記事毎に異なる。記事毎に適否判定を行うことで、記事毎に適したコンテンツ提示制御が可能となる。もちろん或る記事のみ内容の傾向が異なるような場合にも適切に対応できる。
なお実施の形態では、ブロガーに対して判定を行っておき、その情報をブロガー評価情報として管理DB53に記憶するようにもした。このブロガー評価情報を適否判定に用いることもできる。例えば公序良俗の観点でほぼ心配のないブロガーと注意すべきブロガーによって、テキスト適否スコアStや画像適否スコアStの係数を変更することで、注意すべきブロガーの場合は若干不適判定されやすくし、それを抽出してスタッフが判定することにするなど対応できるようにすることが考えられる。
またブロガーによって相性のよい商品ジャンルや相性のよくない商品ジャンルを管理しておき、それにより広告掲載ジャンルを推奨又は制限することも考えられる。
実施の形態の図14の処理として、ユーザ端末5が、ブログ記事とともに同じウェブページに掲載されようとする或る広告コンテンツについて、ブログ記事とともにウェブページ掲載を行うことが適切でないと判定した場合、他の広告コンテンツをブログ記事とともに掲載する候補とする処理を行う例を述べた。
例えば図14のステップS408のように他の広告コンテンツを要求する。同様に適否判断を行うことで、ブログ記事に適した広告が選択できることになる。
実施の形態の処理例は一例であり、他にも各種の変形例が想定される。
上記では、適否判定のための観点として、公序良俗や広告ジャンルとの相性という例を挙げたが、「所定の観点」としては他にも各種考えられる。
例えば所定の掲載目的にとって適切か否かなどである。
女性向けのブログとしての適否や、子供向けのブログとしての適否など、閲覧者の属性に適しているかという観点で適否判定を行うことは有用である。
またスポーツ、経済など、ブログの主たる分野としての適否判定も考えられる。
本発明の技術はブログに限らず、テキストと画像を含む主コンテンツの適否判定に適用できる。また主コンテンツと副コンテンツを共に掲載する場合の相性としての適否に広く利用できる。
<8.プログラム及び記憶媒体>
実施の形態のプログラムは、ブログサーバ1における少なくともテキスト判定部12、画像判定部14、適否判定部15の処理を情報処理装置(CPU等)に実行させるプログラムである。
実施の形態のプログラムは、画像データ及びテキストデータを含む主コンテンツについて、テキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否スコアStを生成する処理(S202〜S205、S252〜S254)と、主コンテンツの画像データについて、所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、所定の観点における適否に関する情報である画像適否スコアSiを生成する処理(S206〜S209、S258〜S261)と、テキスト適否スコアSt及び画像適否スコアSiを用いて、ウェブページ掲載に関する適否判定を行う処理(S210、S264)とを情報処理装置に実行させるプログラムである。
即ちこのプログラムは、情報処理装置に対して図10又は図11や、図12等で説明した処理を実行させるプログラムである。
このようなプログラムにより、上述したブログサーバ1としての1又は複数の情報処理装置を実現できる。
そしてこのようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。あるいはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
1…ブログサーバ、2…ネットワーク、3…広告サーバ、4…広告DB、5…ユーザ端末、11…ブログ管理部、12…テキスト判定部、13…画像学習部、14…画像判定部、15…適否判定部、16…提示制御部、51…ブログDB、52…画像DB、53…管理DB、54…判定基準情報DB

Claims (12)

  1. 画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成するテキスト判定部と、
    前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する画像判定部と、
    前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う適否判定部と、を備えた
    情報処理装置。
  2. 前記所定の観点とは、ウェブページ掲載に係る公序良俗の観点である
    請求項1に記載の情報処理装置。
  3. 前記テキスト判定部は、前記主コンテンツのテキストデータの解析を行い、他の所定の観点における適否に関する情報であるテキスト適否情報を生成し、
    前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記他の所定の観点における適否に関する情報である画像適否情報を生成し、
    前記適否判定部は、前記他の所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツとともに同じウェブページに掲載されようとする副コンテンツについて、前記主コンテンツとともにウェブページ掲載を行うことの適否判定を行う
    請求項1に記載の情報処理装置。
  4. 前記他の所定の観点とは、前記副コンテンツが提示する商品又は商品分野にとって前記主コンテンツが適切か否かの観点である
    請求項3に記載の情報処理装置。
  5. 端末装置から要求された前記主コンテンツを前記端末装置においてウェブページとして提示させるための処理を行う提示制御部を備え、
    前記適否判定部は、適否判定の結果を含む適否判定情報を記憶する処理を行うとともに、
    前記提示制御部は、要求された前記主コンテンツについて記憶されている適否判定情報を参照して、前記副コンテンツの商品又は商品分野単位での取得条件を付したウェブページデータを生成し、前記端末装置に送信する
    請求項4に記載の情報処理装置。
  6. 前記テキスト判定部は、前記主コンテンツのジャンルに応じた否定的テキスト情報を用いてテキスト適否情報を生成し、
    前記画像判定部は、前記主コンテンツのジャンルについての不適切画像を入力する学習により得られた否定的特徴量を用いて画像適否情報を生成する
    請求項1又は請求項2に記載の情報処理装置。
  7. 前記画像判定部は、前記主コンテンツの画像データについて、前記所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成する
    請求項1乃至請求項6のいずれかに記載の情報処理装置。
  8. 前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成する
    請求項3に記載の情報処理装置。
  9. 前記適否判定部は、前記主コンテンツとしてブログ記事単位で適否判定を行う
    請求項1乃至請求項8のいずれかに記載の情報処理装置。
  10. 情報処理装置が行う情報処理方法として、
    画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成し、
    前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成し、
    前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う情報処理方法。
  11. 画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成する処理と、
    前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する処理と、
    前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う処理と、
    を情報処理装置に実行させるプログラム。
  12. 画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成する処理と、
    前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する処理と、
    前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う処理と、
    をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
JP2018179127A 2018-09-25 2018-09-25 情報処理装置、情報処理方法、プログラム、記憶媒体 Active JP6730395B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018179127A JP6730395B2 (ja) 2018-09-25 2018-09-25 情報処理装置、情報処理方法、プログラム、記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018179127A JP6730395B2 (ja) 2018-09-25 2018-09-25 情報処理装置、情報処理方法、プログラム、記憶媒体

Publications (2)

Publication Number Publication Date
JP2020052546A JP2020052546A (ja) 2020-04-02
JP6730395B2 true JP6730395B2 (ja) 2020-07-29

Family

ID=69997137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018179127A Active JP6730395B2 (ja) 2018-09-25 2018-09-25 情報処理装置、情報処理方法、プログラム、記憶媒体

Country Status (1)

Country Link
JP (1) JP6730395B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967493B (zh) * 2020-06-29 2024-08-16 北京百度网讯科技有限公司 图像审核方法、装置、电子设备和存储介质
JP7061328B1 (ja) 2021-07-30 2022-04-28 株式会社Jx通信社 情報処理装置、情報処理システムおよびプログラム
JP7284336B1 (ja) 2022-12-27 2023-05-30 ヤフー株式会社 コンテンツ提供装置、コンテンツ提供方法、およびプログラム

Also Published As

Publication number Publication date
JP2020052546A (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
JP5618404B2 (ja) 情報提供装置、情報提供方法、情報提供プログラム、及び情報提供プログラムが記録された記録媒体
US9836178B2 (en) Social web browsing
US9454614B2 (en) Search information providing apparatus and search information providing method
JP6027039B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP5571145B2 (ja) 広告配信装置および広告配信方法
US20090216639A1 (en) Advertising selection and display based on electronic profile information
JP4859892B2 (ja) 商品広告配信装置、商品広告配信方法、及び商品広告配信制御プログラム
US20150066940A1 (en) Providing relevant online content
JP6730395B2 (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
US11205195B2 (en) Information processing device, information processing method, and information processing program
JP2007272814A (ja) 広告配信システム、広告配信方法及び広告配信プログラム
US10078706B2 (en) Information processing apparatus, information processing method, information processing program, and recording medium storing thereon information processing program which classifies and displays a plurality of elements constituting a list on a plurality of pages
JP6679250B2 (ja) 決定装置、決定方法および決定プログラム
JP5106499B2 (ja) ユーザ抽出装置および方法
US11816701B2 (en) Techniques for targeting a user based on a psychographic profile
JP6159492B1 (ja) 情報処理システム、情報処理方法、及び情報処理プログラム
JP4859893B2 (ja) 広告配信装置、広告配信方法、及び広告配信制御プログラム
KR20050050016A (ko) 온라인 광고 시스템 및 방법
JP6737887B2 (ja) 関心分野別趣向検索案内システム
WO2012002349A1 (ja) 情報提供装置、報酬支払処理方法、報酬支払処理プログラム、及び報酬支払処理プログラムが記録された記録媒体
WO2014155681A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20140200979A1 (en) Information providing device, information providing method, information providing program, and recording medium
US7660784B1 (en) Geographically resolving a keyword query
Tian et al. Recommendation algorithm for mobile E-commerce based on cone depth learning
KR20190010278A (ko) 관심 분야별 취향 검색안내 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180926

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200702

R150 Certificate of patent or registration of utility model

Ref document number: 6730395

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250