JP6730395B2 - 情報処理装置、情報処理方法、プログラム、記憶媒体 - Google Patents
情報処理装置、情報処理方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JP6730395B2 JP6730395B2 JP2018179127A JP2018179127A JP6730395B2 JP 6730395 B2 JP6730395 B2 JP 6730395B2 JP 2018179127 A JP2018179127 A JP 2018179127A JP 2018179127 A JP2018179127 A JP 2018179127A JP 6730395 B2 JP6730395 B2 JP 6730395B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- suitability
- image
- text
- blog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 50
- 238000003860 storage Methods 0.000 title claims description 18
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000000034 method Methods 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 60
- 238000012545 processing Methods 0.000 claims description 59
- 238000004458 analytical method Methods 0.000 claims description 15
- 235000013305 food Nutrition 0.000 description 23
- 101150014889 Gad1 gene Proteins 0.000 description 20
- 238000011156 evaluation Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 13
- 238000013135 deep learning Methods 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 101150106793 GAD2 gene Proteins 0.000 description 8
- 101100072790 Mus musculus Irf4 gene Proteins 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 101100447571 Caenorhabditis elegans gad-3 gene Proteins 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 108050003288 Spindlin-2 Proteins 0.000 description 2
- 102100023505 Spindlin-2A Human genes 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
多くのユーザは、自己発信のツールとしたり、或いは個人的な日記代わりなどとして、このようなブログサービスを利用している。
また、ブログを提供するサービス側では、ブログページに広告を掲載することも行われている。
なお下記特許文献1,2,3にはウェブコンテンツに関連する広告を表示するための技術が開示されている。
ところがこれはコンテンツ数の増加に伴って非常に重い作業負担となり、業務効率の低下、運営コストの上昇などを引き起こしている。また、迅速なコンテンツ提供ができず、サービスの質の低下の懸念もある。
ところが膨大な広告コンテンツとブログコンテンツの組み合わせにおいて、このようなコンテンツ同士の相性としての適否判定をスタッフが行うことは困難で、またそのような不適切な組み合わせの掲載が生じないようにコントロールすることは困難である。
主コンテンツとは例えばブログ記事などであってテキストデータと画像データを備えるコンテンツを対象としている。このような主コンテンツについて、テキストデータについての適否情報と、画像データについての適否情報をそれぞれ生成する。そして両者を判定要素として用いてウェブページ掲載に関する適否判定を行う。
例えば投稿されたブログ記事などの主コンテンツ自体が、ウェブページ掲載するにあたって不適なものでないかを判定する。
例えば投稿されたブログ記事などの主コンテンツ自体が、差別用語を含んだり、犯罪を促す内容であったりするなど、公序良俗の観点でウェブページ掲載するにあたって不適なものでないかを判定する。
例えば投稿されたブログ記事などの主コンテンツ自体に対して、広告コンテンツなど、同じウェブページ掲載する副コンテンツについて、その主コンテンツとともに掲載することが不適切でないか否かを判定する。
例えば投稿されたブログ記事などの主コンテンツが、副コンテンツとしての広告の商品又は商品分野(ジャンル)にとって相性がよいものか否かを判定する。
例えば適否判定部は、ブログ記事投稿などとして受信された主コンテンツについて適否判定を行い、適否判定情報を記憶しておく。そして主コンテンツの閲覧が要求されたときに、その適否判定情報に応じた処理(相性のよい副コンテンツの表示)が行われるようにする。
例えばブログ記事等の主コンテンツのテキスト解析などにより、まずコンテンツ内容のジャンルを特定する。その後、ジャンルに応じた不適切ワードや不適切表現等の否定的テキスト情報を用いてテキスト適否情報を生成する。また、ジャンルに応じた不適切画像の学習結果としての否定的特徴量を用いて画像適否情報を生成する(図8、図11参照)。
また、上記した情報処理装置においては、前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成することが考えられる。
例えば公序良俗の観点や広告ジャンルとの相性などの所定の観点で適切とされた画像を入力する学習結果としての肯定的特徴量を用いる。
ブログには複数の記事が含まれることが多いが、その個々の記事毎に適否判定を行う。
これにより主コンテンツのウェブページ掲載の適否や、主コンテンツと副コンテンツを共にウェブページ掲載することの適否を自動的に判定する。
本発明に係るプログラムは、この情報処理方法の処理を情報処理装置に実行させるプログラムである。
本発明に係る記憶媒体は、上記プログラムを記憶した記憶媒体である。
このプログラムグラムや記憶媒体により本発明の情報処理装置の実現及び提供を容易とする。
<1.システム構成>
<2.ブログサーバ及びデータベース>
<3.適否判定基準学習処理>
<4.ブログ記事投稿時の処理>
<5.ブログ記事についての広告ジャンル適否判定>
<6.ブログ閲覧時の処理>
<7.まとめ及び変形例>
<8.プログラム及び記憶媒体>
記事の内容については特に限定されない。ユーザが情報発信に用いる内容でも、個人的な日記等の内容でもよい。また「ブログ」と呼ばれていないものであっても、同等のものを含む。
本実施の形態の処理は、主に文章と画像の両方を含む記事を対象とする。
もちろん一人のユーザがある時点ではブロガーとなり、ある時点では閲覧者となることが通常に想定される。
図1に実施の形態のブログサーバ1を含むネットワークシステムの構成例を示す。
本実施の形態に係るネットワークシステムは、ブログサーバ1と複数のユーザ端末5がネットワーク2により相互に通信可能に接続されている。
またブログサーバ1は各種データベースにアクセス可能とされている。なお、以下「データベース」については「DB」と表記する。図ではブログサーバ1がアクセス可能なDBとしてブログDB51、画像DB52、管理DB53、判定基準情報DB54を例示している。
またネットワーク2の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線等の有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
具体的にはブログを開設したいユーザに対しては、そのユーザのブログとしてのウェブページの設定やユーザ情報の登録などを行う。既にブログ開設済のユーザ(ブロガー)に対しては、ブロガーが投稿する記事の保存を行う。
また一般の閲覧者となるユーザからのアクセス要求に応じて、該当のウェブページに係るウェブページデータを配信する。
このブログサーバ1が、本発明請求項の情報処理装置の実施の形態に相当する。
ユーザ端末5では、必要に応じて各種の送受信処理や表示処理などが実行される。
閲覧者は、ユーザ端末5においてウェブブラウザを介して、関心のあるブログの閲覧を任意に行うことができる。
ブロガーは、ユーザ端末5により自分のブログページにアクセスし、閲覧したり、新規に記事を投稿することができる。
ユーザ端末5ではこれらの動作のための通信処理や表示処理等を行うことになる。
例えばブログサーバ1は、ブログページ上に広告表示を行うことができる。即ちユーザ端末5の表示部に表示されるブログページには1又は複数の広告領域が設けられており、この広告領域には、広告サーバ3から配信される広告コンテンツが表示される。
広告サーバ3からは、ブログとしてのウェブページを表示させるユーザ端末5のブラウザを介した要求などに応じて広告配信を行う。
広告DB4は、広告コンテンツやその管理情報を保存するDBである。広告サーバ3は広告DB4から選択した広告コンテンツをユーザ端末5に配信し、ブログページ上に表示されるようにする。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インタフェース105も接続されている。
入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109が接続されている。
入力部106はキーボード、マウス、タッチパネルなどにより構成される。
出力部107はLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどにより構成される。
記憶部108はHDD(Hard Disk Drive)やフラッシュメモリ装置などにより構成される。
通信部109はネットワーク2を介しての通信処理や機器間通信を行う。
入出力インタフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
CPU101が各種のプログラムに基づいて処理動作を行うことで、ブログサーバ1やユーザ端末5としての必要な情報処理や通信が実行される。
なお、ブログサーバ1やユーザ端末5を構成する情報処理装置は、図2のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、LAN等によりシステム化されていてもよいし、インターネット等を利用したVPN等により遠隔地に配置されたものでもよい。複数の情報処理装置には、クラウドコンピューティングサービスによって利用可能なサーバ群(クラウド)としての情報処理装置が含まれてもよい。
図3に1又は複数の情報処理装置で構成されるブログサーバ1としての機能構成および各種のDBを示す。
ブログサーバ1としての各機能は、情報処理装置においてCPU101でプログラムに応じて実行される処理により実現される機能である。但し以下説明する全部又は一部の各構成の処理をハードウエアにより実現してもよい。
また各機能をソフトウエアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。1つのプログラムにより複数の機能の処理が実行されてもよいし、1つの機能が複数のプログラムモジュールの連携で実現されてもよい。
また各機能は複数の情報処理装置に分散されていてもよい。さらに機能の1つが、複数の情報処理装置によって実現されてもよい。
またブログ管理部11は管理DB53の情報の更新や読み出しを逐次行う。
また所定の観点とは、これら以外に、所定の掲載目的にとって適切か否かなど、多様に考えられる。
また画像学習部13は所定の観点についての適切な画像を入力する学習、例えばディープラーニングにより肯定的特徴量を求め、判定基準情報DB54に記憶させる処理を行う。
ウェブページ掲載に関する適否判定としては、例えば、判定対象のブログ記事自体が、ウェブページ掲載に適しているかの判定がある。またウェブページ掲載に関する適否判定としては、或る広告についての或るブログ記事とともに掲載することに関する適否判定がある。なお、このようなブログ記事と広告の同一ウェブページ掲載の適否について、説明上、“相性”という表現も用いる。例えば「相性が悪い」とは、或る広告が或るブログ記事と同じウェブページに掲載することが望ましくないことを指す。
この場合、提示制御部16は、要求されたブログ記事について管理DB53に記憶されている適否判定情報を参照して、広告コンテンツの商品又は商品分野単位での取得条件を付したウェブページデータを生成し、ユーザ端末5に送信する場合もある。これは、そのブログ記事に相性の悪い広告が表示されないようにするための処理である。
ウェブページ(ブログページ)70としては、例えばタイトルエリア71、記事エリア72、広告エリア73などが設けられる。
タイトルエリア71にはブログタイトル等が表示される。
記事エリア72にはブログ記事が表示される。ブログ記事はテキストエリア72Tと画像エリア72Iが設けられ、画像と文章により記事内容が構成されている。
この図4では記事エリア72が2つ存在する例としているが、個々の記事毎の異なるウェブページとされる場合もある。
広告エリア73には広告サーバ3から送信された広告が表示される。上記の“相性”とは、このように1つのウェブページ上に掲載される記事と広告の相性のこととなる。
ブログを形成するウェブページのデータは、例えば、HTML(HyperText Markup Language)やXHTML(Extensible HyperText Markup Language)などの構造化文書ファイルである。構造化文書ファイルには、ブロガーが投稿した記事のテキストデータや各種画像等の画像データの指定情報と、それらの配置や表示態様(文字色やフォントや大きさや装飾など)が記述されている。
またブログに対しては閲覧者がコメントを投稿することもできる。そのような閲覧者からのコメントデータもブログやブログ内の個々の記事に紐づけてブログDB51に保存される。
ブログサーバ1は、ユーザ端末5から或るブログについてのアクセス要求があった場合は、要求されたブログページをブログDB51から読み出してユーザ端末5に配信することになる。
ブログ内の記事には、画像を添付することができるが、例えばブログDB51には記事データ及び記事データに対応した画像の指定情報(リンク情報)が記憶される。そして画像データ自体は画像DB52に保存される。
画像が添付されたブログ記事へのアクセス要求の場合、そのウェブページデータがユーザ端末5においてブラウザにより表示されるが、その際、ユーザ端末5はウェブページ上のリンク設定により画像データをブログサーバ1に要求する。ブログサーバ1は当該要求に応じて画像データを画像DB52から読み出し、ユーザ端末5に配信する。これによりユーザ端末5上で、画像付きのブログ記事が表示される。
なおこれは一例であり、予め画像データを含むウェブページデータをブログDB51に格納するようにしてもよい。
管理DB53の内容の一例を図5に示す。
1つのブログについてはブログID(Identification)が設定され、ブログIDにより付随する情報が管理される。例えばブログ(ブログID)毎に、ブロガー情報、ブロガー評価情報、ブログ管理情報、ブログ分野情報、サイズ情報、適否判定情報、ブログ実績情報などが、逐次更新されながら管理される。
ここでいう要注意とは、例えば公序良俗の観点で不適切な記事を投稿する可能性が高いブロガーというような意味である。
またブロガーが、広告ジャンルとの相性の観点で、相性のよい記事をよく書くブロガーであるか、相性の悪い記事をよく書くブロガーであるか等の情報もブロガー評価情報となる。
ブログ分野情報はブログ及びブログに含まれる各記事についての分野(ジャンル)を示す情報である。なお、ジャンルは、「スポーツ」「芸能」「社会」のように大まかなものでもよいし、例えば「野球」「サッカー」「テニス」など、より細分化されたジャンルでもよい。さらには特定の話題にまで細分化されてもよい。
なお、サイズ情報としてブログDB51に記憶したデータサイズと画像DB52に記憶した画像データのデータサイズを合わせて管理してもよいし、それぞれ別個に管理してもよい。
図6Aは或るブログIDのブログに対応して管理DB53に記憶される適否判定情報の例を示している。
適否判定情報としては、そのブログおける記事(記事ナンバ)毎に、公序良俗の観点での適否の情報や、広告ジャンル毎の広告との相性の点での適否判定の結果が記憶される。
例えば公序良俗の観点での判定結果が“0”又は“1”として記憶される。例えば適否判定結果はデフォルトで“0”とされ、不適と判定された場合に“1”に更新されるとする。従って図6Bに示すように“1”が不適、“0”は問題なし(不適ではない)という情報となる。
この図6Aの例では、例えば記事ナンバ4の記事が公序良俗の観点で不適と判定された場合を示している。
各記事ナンバの記事について、これらの広告ジャンル毎に相性という意味での適否判定が行われ、その結果としての“0”“1”が記憶される。例えば記事ナンバ3の記事は自動車や家電の分野の広告とは相性がよくないという意味で不適(“1”)と判定されたが、食品や旅行などの他の分野については問題なし(“0”)と判定された場合を示している。
例えば上述したブロガー評価情報は、このような不適比率の情報を用いて生成することが考えられる。
広告ジャンル毎にも不適比率が示される。これによっては当該ブログのブロガーが、どの広告ジャンルとの相性がよいか、或いは悪いかがわかるため、この情報を用いてブロガー評価情報を生成することもできる。
また図6Dのように4値として「不適」「適1」「適2」「最適」のように、不適から最適までを段階的に示すような情報としてもよい。
判定基準情報DB54の一例を図7に示す・
適否判定の観点として、公序良俗の観点や、広告ジャンルGad1、Gad2、Gad3・・・毎に、画像の否定的特徴量情報SPIN(SPIN−0、SPIN−1・・・)、否定的テキスト情報WN(WN−0,WN−1・・・)、画像の肯定的特徴量情報SPIP(SPIP−1、SPIP2・・・)が記憶される。
例えば公序良俗の観点に対応しての否定的テキスト情報WN−0として、差別的であったり犯罪を推奨するようなワードや表現等が記憶されている。
また広告ジャンルGad1として食品の広告に対応する否定的テキスト情報WN−1としては、食品の広告にとって望ましくない表現、食品分野での問題を示すワード、ブランドイメージを損なう恐れのあるワードなどが記憶される。
他の否定的テキスト情報WN−2以降としても、それぞれの対応する広告ジャンルにとって望ましくないワード等が記憶されている。
例えば公序良俗の観点に対応しての画像の否定的特徴量情報SPIN−0は、公序良俗を損なう恐れのある多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
また広告ジャンルGad1として食品の広告に対応する画像の否定的特徴量情報SPIN−1は、食品広告の観点で同ページ掲載に好ましくない多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
他の否定的特徴量情報SPIN−2以降も、それぞれの対応する広告ジャンルにとって同ページ掲載に好ましくない多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
広告ジャンルGad1として食品の広告に対応する画像の肯定的特徴量情報SPIP−1は、食品広告の観点で同ページ掲載に好ましい多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
他の肯定的特徴量情報SPIN−2以降も、それぞれの対応する広告ジャンルにとって同ページ掲載に好ましい多数の画像を入力したディープラーニングにより得られた特徴量情報となる。
図8の例では、政治、社会、芸能、スポーツなどの記事ジャンル毎に、否定的テキスト情報WN−G1、WN−G2・・・や、画像の否定的特徴量情報SPIN−G1、SPIN−G2・・・が記憶されるようにしている。
例えば「政治」ジャンルに対応する否定的テキスト情報WN−G1としては、政治記事としての不適切ワードや不適切な言い回し等が記憶される。
また「政治」ジャンルに対応する否定的特徴量情報SPIN−G1としては、政治記事
としての不適切な画像を多数入力したディープラーニングにより得られた特徴量情報となる。
ブログサーバ1の処理として、画像学習部13の機能により実行される適否判定基準学習処理の例を図9で説明する。この図9は、判定基準情報DB54に記憶される画像の否定的特徴量情報SPIN、肯定的特徴量情報SPIPを求める処理である。
例えば「公序良俗」を選択すると、以降の処理で得られる画像の否定的特徴量情報SPINは、公序良俗の観点での否定的特徴量情報SPIN−0とされることになる。
また例えば「Gad1:食品」を選択すると、以降の処理で得られる画像の否定的特徴量情報SPINは、食品という広告ジャンルとの相性という観点での否定的特徴量情報SPIN−1とされることになる。
このようなステップS101の選択はオペレータ操作に応じて実行してもよいし、各観点について自動的に順次選択していってもよい。
例えばステップS101で「公序良俗」を選択した場合は、ブログサーバ1は公序良俗の観点で不適切とされる多数の画像を取得する。
またステップS101で「Gad1:食品」を選択した場合は、ブログサーバ1は食品広告との同ページ掲載という観点で不適切とされる多数の画像を取得する。
これらの不適切画像はオペレータが選択して入力してもよいし、ブログサーバ1が学習用の画像を供給するデータベースにアクセスして取得するようにしてもよい。
例えばステップS101で「公序良俗」を選択していた場合は、ブログサーバ1は公序良俗の観点での不適切画像を判定する基準として画像の否定的特徴量情報SPIN−0を記憶する。
またステップS101で「Gad1:食品」を選択していた場合は、ブログサーバ1は食品広告との同ページ掲載という観点での不適切画像を判定する基準として画像の否定的特徴量情報SPIN−1を記憶する。
公序良俗について不適切画像を学習していた場合は、図7のような判定基準情報DB54の例では、肯定的特徴量情報SPIPを記憶しないので、ステップS105から図9の処理を終える。
ステップS106でブログサーバ1は、適切画像を取得する。
例えばステップS101で「Gad1:食品」を選択していた場合は、ブログサーバ1は食品広告との同ページ掲載という観点で好ましい多数の画像を取得する。
これらの適切画像はオペレータが選択して入力してもよいし、ブログサーバ1が学習用の画像を供給するデータベースにアクセスして取得するようにしてもよい。
ステップS108でブログサーバ1は、特徴量情報を判定基準情報DB54に記憶する。即ちこの場合、適切画像を用いた学習であるので、求められた特徴量情報は、画像の肯定的特徴量情報SPIPとして判定基準情報DB54に記憶されることになる。
例えばステップS101で「Gad1:食品」を選択していた場合は、ブログサーバ1は食品広告との同ページ掲載という観点での望ましい画像を判定する基準として画像の肯定的特徴量情報SPIP−1を記憶する。
例えば図7の公序良俗の観点や各広告ジャンルの観点、或いは図8の記事ジャンル毎の公序良俗の観点について、それぞれ図9の処理を行うことで、画像の否定的特徴量情報SPINや肯定的特徴量情報SPIPを判定基準情報DB54に記憶できる。
例えば公序良俗の観点や各広告ジャンルの観点で不適切な文章とされた多数のテキストデータのうちで、共通するワードを抽出したり、形態素解析により不適切な言い回し、表現等を抽出する。これらを集めて否定的テキスト情報WNとすればよい。
またオペレータが、各観点で不適切なワード等を入力し、それを否定的テキスト情報WN(WN−0、WN−1・・・)として判定基準情報DB54に記憶してもよい。
続いてブロガーからブログ記事が投稿された際のブログサーバ1の処理例を図10により説明する。これは、ブログサーバ1が主にテキスト判定部12、画像判定部14、適否判定部15の機能により実行する処理である。そしてこの処理は、投稿されたブログ記事について、公序良俗の観点でウェブページ掲載の適否判定を行う処理としている。
記事がテキストデータのみ、もしくは画像データのみであった場合は、ステップS201から他の判定処理に進む。
テキストデータと画像データの両方が含まれている記事であった場合、ステップS201からS202に進み、本実施の形態の技術による適否判定を行うことになる。
ステップS203でブログサーバ1は、投稿されたブログ記事におけるテキストデータを抽出する。
ステップS204でブログサーバ1は、ブログ記事におけるテキストデータを解析する。具体的には、ブログ記事におけるテキストデータにおいて、否定的テキスト情報WN−0として挙げられているワードや言い回しが含まれているか否か、いくつ含まれているか、或いは類似のワード等が含まれているか、等を解析する。
テキスト適否スコアStは、例えば0〜100のスコアとして、不適切であることの度合いを示す値とする。例えば否定的テキスト情報WN−0に挙げられたワード等との共通するワード等の存在によりスコア値を加算していく。もちろん不適切なワード等にも程度があるため、ワード等によって加算値に重み付けしてもよい。
或いはテキスト適否スコアStは、例えば“0”(問題なし)、“1”(不適切)という2値のスコアとしてもよい。例えば1つでも(もしくは所定数以上)、否定的テキスト情報WN−0に挙げられたワード等との共通するワード等があれば“1”とするなどである。
またテキスト適否スコアStは、例えば初期値を“50”として、不適切なワード等に応じてスコア値を加算し、望ましいワード等に応じてスコア値を減算していくなどし、“0”(最適)、“100”(最も不適切)のようなものとしてもよい。
他にもテキスト適否スコアStの態様は多様に考えられる。
ステップS207でブログサーバ1は、判定基準情報DB54から、公序良俗の観点での画像の否定的特徴量情報SPIN−0を取得する。
ステップS208でブログサーバ1は、ブログ記事における画像データを解析する。具体的には、ブログ記事における画像データにおいて、画像の否定的特徴量情報SPIN−0と共通する特徴量を解析する。
そしてステップS209でブログサーバ1は、解析結果を用いて画像適否スコアSiを算出する。
画像適否スコアSiは、テキスト適否スコアStと同様に、例えば0〜100のスコアとして、不適切であることの度合いを示す値とする。
或いは画像適否スコアSiは、“0”(問題なし)、“1”(不適切)という2値のスコアとしてもよい。
また画像適否スコアSiは、例えば初期値を“50”として、特徴量情報に応じて増減され、“0”(最適)、“100”(最も不適切)のようなものとしてもよい。
他にも画像適否スコアSiの態様は多様に考えられる。
判定は、例えば(k1・St)+(k2・Si)の値と、所定の閾値thとを比較して行う。係数k1,k2は、テキストと画像の重み付けのための係数である。
上述のように例えばテキスト適否スコアStと画像適否スコアSiが、不適切であることの度合いを示す値(即ち値が大きい程、不適切)とした場合、(k1・St)+(k2・Si)の値が閾値th以上であれば不適切とする。
例えばkb{(k1・St)+(k2・Si)}として、係数kbをブロガー評価情報に基づいて可変し、この値が閾値th以上であれば不適切と判定することも考えられる。例えば公序良俗の観点で要注意のブロガーは、優良ブロガーよりも不適切判定が行われ易くするような例である。もちろん閾値thをブロガー評価情報に応じて変更するようにしてもよい。
またテキスト適否スコアStや画像適否スコアSiが、“0”“1”の2値の情報である場合、アンド条件で“1”となったら、不適切と判定することも考えられる。
またこれに応じて不適比率も計算しなおして更新する。これをブロガー評価情報に反映させる場合、図5のブロガー評価情報も更新する場合があることになる。
今回、不適判定されなかった場合は、ステップS212からS213に進んで、ブログサーバ1は、投稿された記事を新規投稿の記事として通常受け付け処理を行う。即ち記事コンテンツのブロクDB51や画像DB52への登録や、新規投稿に伴う管理DB53の更新も行う。そして記事投稿時の処理を終える。
この場合、閲覧者としてのユーザは、当該記事を通常に閲覧できるようになる。
この不適対応処理は以下のような各種の例が考えられる。
・投稿を受け付けない
・投稿は受け付けるが閲覧制限をかける。例えば年齢確認できるユーザであって所定の年齢以上のユーザにのみ閲覧可能とする。
・投稿受付を保留してブロガーに不適切箇所の修正を求める通知を行う。再投稿の場合は同様に適否判定を行う。
・スタッフが目視で確認し、実際に掲載に問題があるか否かを最終判定する。問題がなければ閲覧可能とする。
不適対応処理の例としてこれらの処理があるが、他にも各種の例が考えられる。
その上、テキスト判定と画像判定を用いることで、判定信頼性を上げることができる。特に画像判定は、図9のようなAI(Artificial Intelligence)学習により得られた画像の否定的特徴量情報SPIN−0を用いて行うが、ワード抽出等によるテキスト判定と組み合わせることで判定信頼性を向上させている。
この処理は図8のように公序良俗に関する判定基準情報(否定的テキスト情報WN及び画像の否定的特徴量情報SPIN)が記事ジャンル毎に記憶されていることに対応する処理例である。
ステップS221でブログサーバ1は、判定した記事ジャンルの情報を図5の管理DB53におけるブログ分野情報において、投稿された記事に対応するジャンル情報を記憶する。なおこの処理はステップS211の時点など、後に行ってもよい。
例えば判定した記事ジャンルが「政治」であれば否定的テキスト情報WN−G1を取得する。
そしてブログサーバ1は、ステップS203で投稿されたブログ記事におけるテキストデータを抽出し、ステップS204で抽出したテキストデータを否定的テキスト情報WN−G1を用いて解析する。さらに解析結果に基づいてブログサーバ1はステップS205でテキスト適否スコアStを算出する。
ステップS207Aでブログサーバ1は、判定基準情報DB54から、判定した記事ジャンルに対応する画像の否定的特徴量情報SPINを取得する。
例えば判定した記事ジャンルが「政治」であれば画像の否定的特徴量情報SPIN−G1を取得する。
ステップS208でブログサーバ1は、ブログ記事における画像データを解析する。具体的には、ブログ記事における画像データにおいて、画像の否定的特徴量情報SPIN−G1と共通する特徴量を解析する。
そしてステップS209でブログサーバ1は、解析結果を用いて画像適否スコアSiを算出する。
続いて、ブログ記事について広告ジャンル毎に相性の点での適否を判定する処理を図12で説明する。この図12の処理は、例えば上記の図10又は図11に引き続いてブログサーバ1が主にテキスト判定部12、画像判定部14、適否判定部15の機能により実行する処理である。例えば投稿を受け付けた個々の記事に対して実行する。
ブログサーバ1はステップS250で、処理対象とした記事のテキストデータを抽出する。
ステップS251でブログサーバ1は変数n=1とする。変数nは、図6に示した各広告ジャンルGad1、Gad2・・・を指定する変数であり、その最大値nmaxは、広告ジャンルの数である。
ステップS253でブログサーバ1は、処理対象のブログ記事におけるテキストデータを解析する。具体的には、記事におけるテキストデータにおいて、否定的テキスト情報WN−(n)として挙げられているワードや言い回しが含まれているか否か、いくつ含まれているか、或いは類似のワード等が含まれているか、等を解析する。
そしてステップS254でブログサーバ1は、解析結果を用いて広告ジャンルGad(n)に対してのテキスト適否スコアStG(n)を算出し、内部レジスタ等に一時的に記憶する。
テキスト適否スコアStG(n)の態様は、先の図10,図11のテキスト適否スコアStと同様に多様に考えられる。
従って、処理対象としている記事のテキストデータについて、広告ジャンルGad1〜Gad(nmax)のそれぞれに対応して、テキスト適否スコアStG1〜StG(nmax)が順次算出されていくことになる。
ステップS260でブログサーバ1は、処理対象のブログ記事における画像データを解析する。具体的には、ブログ記事における画像データにおいて、画像の否定的特徴量情報SPIN−(n)と共通する特徴量、及び画像の肯定的特徴量情報SPIP−(n)と共通する特徴量を解析する。
そしてステップS261でブログサーバ1は、解析結果を用いて広告ジャンルGad(n)に対しての画像適否スコアSiG(n)を算出し、内部レジスタ等に一時的に記憶する。
なお画像適否スコアSiG(n)の算出に、画像の否定的特徴量情報SPIN−(n)と画像の肯定的特徴量情報SPIP−(n)の両方を用いることで、例えば広告ジャンルと画像の相性を肯定面でも評価できる。但し画像の否定的特徴量情報SPIN−(n)のみを用いて、否定面を抽出して相性を評価したり、画像の肯定的特徴量情報SPIP−(n)のみを用いて、肯定面を抽出して相性を評価するということも考えられる。
従って、処理対象としている記事の画像データについて、広告ジャンルGad1〜Sad(nmax)のそれぞれに対応して、画像適否スコアSiG1〜SiG(nmax)が順次算出されていくことになる。
ステップS264でブログサーバ1は、処理対象の記事について、ジャンルGad1〜Gad(nmax)のそれぞれに対応する適否判定を行う。
即ちブログサーバ1は、当該記事について、テキスト適否スコアStG1及び画像適否スコアSiG1を用いて、広告ジャンルGad1(食品)に対する適否判定を行う。判定は、例えば(k1・StG1)+(k2・SiG1)の値と、所定の閾値thとを比較して行う。係数k1,k2は、テキストと画像の重み付けのための係数である。
もちろんこれは一例で、先の公序良俗の観点での適否判定と同様に、例えばブロガー評価情報を係数に用いたり、テキスト適否スコアStG1と画像適否スコアSiG1のアンド条件などによって判定を行ってもよい。
この判定結果は、食品ジャンルの商品・サービスの広告にとって、当該記事が同一ページ掲載に適しているか否かの判定結果となる。
同様にブログサーバ1は、当該記事について、テキスト適否スコアStG3及び画像適否スコアSiG3を用いて、広告ジャンルGad3(家電)に対する適否判定を行う。
このように、各広告ジャンルGad1〜Gad(nmax)について、当該記事の相性という観点で適否判定結果を算出する。
即ち、ある記事ナンバの記事について、各広告ジャンルGad1、Gad2・・・について、例えば“0”“1”等の適否判定情報を記憶させる。
またこれに応じて各広告ジャンルGad1、Gad2・・・についての不適比率も計算しなおして更新する。これをブロガー評価情報に反映させる場合、図5のブロガー評価情報、即ちブロガーにとっての相性のよいジャンル、相性の悪いジャンルの情報を更新する場合もある。
続いてユーザ端末5からブログが閲覧要求された場合のブログサーバ1の処理を説明する。図13はユーザ端末5からブログアクセス要求があった場合のブログサーバ1の処理を示している。この処理例は、ユーザ端末5において、提示される記事とともに相性の悪い広告が表示されないようにする処理である。
ステップS301でブログサーバ1は、管理DB53から提示させるブログ記事についての適否判定情報(図6参照)を取得する。
ステップS302でブログサーバ1は、適否判定情報から、不適とされた広告ジャンルの有無を確認する。
そしてブログサーバ1はステップS305で、生成したページデータを要求元のユーザ端末5に送信する。これにより、ユーザ端末5においてユーザが所望したブログ記事が図4のように表示される。
またブログページ70の広告エリア73には、広告サーバ3から配信された広告が表示される。例えばユーザ端末5のブラウザが、当該ページデータに記載された広告要求指示に従って広告サーバ3に広告要求を行い、配信される広告を取得し、表示させる。この場合、当該ブログページ70としてのページデータに広告取得条件が付加されていないことで、どの広告ジャンルの広告も掲載が制限されない。
なお、このときユーザ端末5は、ユーザ情報(例えばユーザの購買履歴等から推定した趣味、嗜好、購買傾向等)を広告サーバ3に送信することで、ユーザに適した広告を広告サーバ3に要求する場合もある。ユーザ情報はブログサーバ1がページデータとともにユーザ端末5に供給したり、或いはユーザ端末5自体が記憶するウェブ閲覧履歴などに基づいて生成したりすることが考えられる。
そしてブログサーバ1は、ステップS304でのページデータ生成の際に、当該広告取得条件の情報をページデータに付加する。
例えばHTMLページに、JavaScript(ジャバスクリプト)等のプログラム言語により、広告取得条件に基づいての広告アクセスを行うようにユーザ端末5に指示するプログラムを加えるようにする。
この場合、ブログページ70の広告エリア73には、相性が悪いとして不適と判定された広告ジャンルの広告は表示されない。例えばユーザ端末5のブラウザは、当該ページデータに記載された広告要求指示に従って広告サーバ3に広告要求を行うが、広告取得条件が設定されていることで、特定の広告ジャンルを除いた要求を広告サーバ3に対して行う。広告サーバ3は、これに応じて、不可とされたジャンル以外のジャンルの広告をユーザ端末5に送信する。例えば図6の記事ナンバ3の記事の場合、その記事と同じページの広告エリア73には、自動車関連の広告や家電関連の広告は掲載されないことになる。
図14はユーザ端末5の処理である。ユーザ端末5はユーザ操作に従い、ステップS400でブログの或る記事のページをブログサーバ1に要求する。これに応じてブログサーバ1は該当の記事のページデータを送信してくる。ユーザ端末5はステップS401でページデータを受信取得し、ステップS402でブログページを表示する処理を行う。
ステップS404でユーザ端末5は広告サーバ3から送信されてくる広告を取得する。 ここでユーザ端末5はステップS405で、取得した広告のジャンルを特定する。例えば広告サーバ3から広告コンテンツに含まれて送られてくる広告の属性情報から当該広告のジャンルを判定する。
この処理は、ユーザ端末5がブログサーバ1に広告ジャンルの情報を送信し、当該記事との適否判定情報を参照して、その参照結果をユーザ端末5に通知するものとしてもよい。
或いは、記事と広告ジャンルの組み合わせによる適否判定情報をAPI(Application Programming Interface)によりユーザ端末5から問い合わせ可能としてもよい。
或いは、ユーザ端末5が当該ブログ記事についての適否判定情報を直接管理DB53から取得できるようにしてもよい。
さらには、例えばブログサーバ1が記事のページデータをユーザ端末5に送信する際に、その記事に対応する適否判定情報を共にユーザ端末に送信するようにしてもよい。
これらの手法により、ユーザ端末5では、受信した広告が、表示させるブログ記事と相性がよいものであるか否か判定できる。
受信した広告がブログ記事と相性が悪いものであった場合は、ユーザ端末5はステップS407からS408に進み、広告サーバ3に対して異なるジャンルの広告を送信するように要求する。そしてステップS404でユーザ端末5は広告を取得し、ステップS405,S406の処理を同様に行う。
特に図14のような処理は、ブログ閲覧用のアプリケーションソフトウエアとして提供され、ユーザ端末5で機能するようにされることで、容易に実現可能である。
以上の実施の形態によれば、次のような効果が得られる。
実施の形態のブログサーバ1(情報処理装置)は、画像データ及びテキストデータを含むブログ記事(主コンテンツ)について、テキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否スコアStを生成するテキスト判定部12と、ブログ記事の画像データについて、所定の観点についての不適切画像を入力する学習により得られた否定的特徴量SPINを用いた解析を行い、所定の観点における適否に関する情報である画像適否スコアSiを生成する画像判定部14を有する。またブログサーバ1は、テキスト適否スコアSt及び画像適否スコアSiを用いて、ウェブページ掲載に関する適否判定を行う適否判定部15を備える。
不適切画像の学習(実施の形態ではディープラーニング)による画像判定は、学習を進めることによって精度を高めることができるが、過学習という懸念もある。本実施の形態の場合は、画像の学習精度をある程度に抑えたうえで、テキスト解析で補完するということができる。そして両解析を合わせて所定の観点について適否判定する。この場合、過学習を抑え目的にそった適切な適否判断が実行できる確度を高めることができる。
なお学習は深層学習(ディープラーニング)に限らない。機械学習(マシンラーニング)の範疇の他の手法でもよい。
例えば投稿されたブログ記事が、ウェブページ掲載するにあたって不適なものでないかを判定する。
これによりブロガーが投稿する記事など、ブログサーバ1側が制作するものではないコンテンツについて、ウェブページ掲載に不適切なものを判定でき、対応処理をとることができる。例えばウェブページ掲載の不実行、掲載停止、掲載削除、閲覧制限の設定、或いは制作者への修正依頼などが可能となる。このような判定を自動で行うことで、ブログサーバ1側のスタッフの作業負担も著しく低減される。
特に上述のように判定精度が高められていることで、これらの効果は顕著なものとなる。
具体的には、テキスト解析では、差別用語などの不適切ワードや不適切な表現・文意を解析する。画像については、公序良俗の観点で不適切な画像を入力した学習によって得られた特徴量を用いて、ブログ記事における画像が不適切であるか否かを解析する。これらの結果のテキスト適否スコア及び画像適否スコアを用いて、公序良俗の観点での適否判定を行うようにしている。
これによりウェブページ掲載にとって公序良俗の観点で不適切なものを判定でき、対応処理をとることができる。
これによりブログ記事と共に掲載される広告の相性が判定されることになる。
例えばベジタリアンを推奨するブログ記事とともにステーキレストランの広告を載せたり、列車事故の話題のブログ記事とともに鉄道旅行の広告を載せたりすることは、ブロガーと広告主の双方にとって望ましくないものとなる。
これらの例のようにブログと広告の相性が悪いと、ブロガーや閲覧者は、ブログ記事内容にそぐわない広告が掲載されることで不快に思ったり、場合によってはブロガーの評判低下が生ずるという懸念もある。
また広告主からみれば、広告効果が期待できない場合や、企業イメージやブランドイメージの低下といったことを引き起こす可能性も考えられる。
そこで実施の形態では、ブログ記事と広告の相性としての適否判定を行うようにすることで、不適切なマッチングによるウェブページ掲載が行われないようにすることができ、これによってブロガー、閲覧者、広告主のそれぞれにとって望ましいウェブページ掲載環境を実現できることになる。
例えば投稿されたブログ記事と広告の商品又は商品分野(ジャンル)の相性がよいか否かを判定する。
具体的には、図13の例では、ブログ記事に対して不適とされた広告ジャンルの有無を確認し、そのような相性として不適な広告がブログ記事に対して掲載されないようにしている。また図14の例ではブログ記事とともに掲載する広告を取得した際に、その広告のジャンルがブログ記事に対して相性として不適であるか否かを確認している。またこれら図13,図14の処理のために、ブログ記事については図12の処理により、相性として不適な広告ジャンルを検出し、適否判定情報を管理するようにしている。
これらの処理により、広告ジャンルとブログ記事内容の相性がよくないマッチングが防止される。
また相性の判定についてテキスト解析では、商品や商品分野(広告ジャンル)にとって好ましくないとされる不適切ワードや不適切な表現・文意を解析する。画像については、商品や商品分野(広告ジャンル)毎に不適切な画像を入力したディープラーニングによって得られた特徴量を用いて行う。広告ジャンルによっては不適切なテキストや画像の内容は異なるため、副コンテンツが提示する商品又は商品分野にとって主コンテンツが適切か否かの観点で判定することで、主副コンテンツの適切なマッチングがはかられるとともに、各広告コンテンツの広告機会もむやみに阻害されない。
例えば野菜販売の広告は、農薬記事には相性が悪い場合があるが、ベジタリアン推奨の記事には相性がよい。列車旅行の広告は列車事故の記事に相性は悪いが、観光記事には相性がよい。これらのように商品又は商品分野によって主コンテンツとの相性は異なるため、商品や商品分野毎に主コンテンツとの相性が適切か否かを判定することが好適となる。
そして相性のよいマッチングでウェブページ掲載を行うことで、広告効果の上昇、ブランドイメージ向上なども期待できる。従ってブログサーバ1やユーザ端末5などのハードウエア資源の有効利用にもつながる。
これによりブログ記事がユーザ端末5から要求されたときに、提示制御部16は適否判定情報を参照して、広告ジャンルとしての取得条件を付したウェブページデータを生成し、ユーザ端末5に送信すればよく、これによって当該ブログ記事とは相性のよくない広告が表示されないようにすることができる。そしてブログ記事要求時に適否判定を行うものではないためブログサーバ1のウェブページ送信処理負荷は重くならない。これによりレスポンスのよいブログ閲覧環境をユーザに提供できることになる。
例えばブログ記事のテキスト解析などにより、まず記事内容のジャンルを特定する。その後、記事ジャンルに応じた不適切ワードや不適切表現等の否定的テキスト情報を用いてテキスト適否情報を生成する。また、記事ジャンルに応じた不適切画像の学習結果としての否定的特徴量を用いて画像適否情報を生成する。
これにより、ブログ記事のジャンル毎の事情に応じた適否判定ができる。例えば映画紹介のブログでは不適切でなくても、子供向けのブログでは不適切な言葉や表現はある。子供向けのブログを基準として全てのブログ記事を判定してしまうと、無用に不適切と判定されるブログ記事が増えてしまうようなことも考えられる。ジャンルに応じた否定的テキスト情報や否定的特徴量を用いて判定することで、このような事態を防止できる。
例えば公序良俗の観点や広告ジャンルとの相性などの所定の観点で適切とされた画像を入力する学習結果としての肯定的特徴量を用いる。
これにより、ウェブページ掲載に相応しい主コンテンツの判定や、副コンテンツ(広告等)の主コンテンツに対しての相性の良さの判定も可能となる。これによって例えば広告掲載を想定すれば、ブログ記事内容との相乗効果で、より広告効果を高めるような掲載も実現できる。例えば車の性能を肯定的に評価するブログ記事とともに車の広告を掲載することで、ブログと広告の双方に高い付加価値が生まれる。
ブログは記事毎に話題が異なり、公序良俗あるいは広告との相性などの観点での適否は記事毎に異なる。記事毎に適否判定を行うことで、記事毎に適したコンテンツ提示制御が可能となる。もちろん或る記事のみ内容の傾向が異なるような場合にも適切に対応できる。
またブロガーによって相性のよい商品ジャンルや相性のよくない商品ジャンルを管理しておき、それにより広告掲載ジャンルを推奨又は制限することも考えられる。
例えば図14のステップS408のように他の広告コンテンツを要求する。同様に適否判断を行うことで、ブログ記事に適した広告が選択できることになる。
上記では、適否判定のための観点として、公序良俗や広告ジャンルとの相性という例を挙げたが、「所定の観点」としては他にも各種考えられる。
例えば所定の掲載目的にとって適切か否かなどである。
女性向けのブログとしての適否や、子供向けのブログとしての適否など、閲覧者の属性に適しているかという観点で適否判定を行うことは有用である。
またスポーツ、経済など、ブログの主たる分野としての適否判定も考えられる。
実施の形態のプログラムは、ブログサーバ1における少なくともテキスト判定部12、画像判定部14、適否判定部15の処理を情報処理装置(CPU等)に実行させるプログラムである。
即ちこのプログラムは、情報処理装置に対して図10又は図11や、図12等で説明した処理を実行させるプログラムである。
そしてこのようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。あるいはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
Claims (12)
- 画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成するテキスト判定部と、
前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する画像判定部と、
前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う適否判定部と、を備えた
情報処理装置。 - 前記所定の観点とは、ウェブページ掲載に係る公序良俗の観点である
請求項1に記載の情報処理装置。 - 前記テキスト判定部は、前記主コンテンツのテキストデータの解析を行い、他の所定の観点における適否に関する情報であるテキスト適否情報を生成し、
前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記他の所定の観点における適否に関する情報である画像適否情報を生成し、
前記適否判定部は、前記他の所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツとともに同じウェブページに掲載されようとする副コンテンツについて、前記主コンテンツとともにウェブページ掲載を行うことの適否判定を行う
請求項1に記載の情報処理装置。 - 前記他の所定の観点とは、前記副コンテンツが提示する商品又は商品分野にとって前記主コンテンツが適切か否かの観点である
請求項3に記載の情報処理装置。 - 端末装置から要求された前記主コンテンツを前記端末装置においてウェブページとして提示させるための処理を行う提示制御部を備え、
前記適否判定部は、適否判定の結果を含む適否判定情報を記憶する処理を行うとともに、
前記提示制御部は、要求された前記主コンテンツについて記憶されている適否判定情報を参照して、前記副コンテンツの商品又は商品分野単位での取得条件を付したウェブページデータを生成し、前記端末装置に送信する
請求項4に記載の情報処理装置。 - 前記テキスト判定部は、前記主コンテンツのジャンルに応じた否定的テキスト情報を用いてテキスト適否情報を生成し、
前記画像判定部は、前記主コンテンツのジャンルについての不適切画像を入力する学習により得られた否定的特徴量を用いて画像適否情報を生成する
請求項1又は請求項2に記載の情報処理装置。 - 前記画像判定部は、前記主コンテンツの画像データについて、前記所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成する
請求項1乃至請求項6のいずれかに記載の情報処理装置。 - 前記画像判定部は、前記主コンテンツの画像データについて、前記他の所定の観点についての適切画像を入力する学習により得られた肯定的特徴量も用いて画像適否情報を生成する
請求項3に記載の情報処理装置。 - 前記適否判定部は、前記主コンテンツとしてブログ記事単位で適否判定を行う
請求項1乃至請求項8のいずれかに記載の情報処理装置。 - 情報処理装置が行う情報処理方法として、
画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成し、
前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成し、
前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う情報処理方法。 - 画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成する処理と、
前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する処理と、
前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う処理と、
を情報処理装置に実行させるプログラム。 - 画像データ及びテキストデータを含む主コンテンツについて、前記主コンテンツのテキストデータの解析を行い、所定の観点における適否に関する情報であるテキスト適否情報を生成する処理と、
前記主コンテンツの画像データについて、前記所定の観点についての不適切画像を入力する学習により得られた否定的特徴量を用いた解析を行い、前記所定の観点における適否に関する情報である画像適否情報を生成する処理と、
前記所定の観点における前記テキスト適否情報及び前記画像適否情報が生成された後に、生成された前記テキスト適否情報及び前記画像適否情報を判定要素として用いて、前記主コンテンツのウェブページ掲載に関する適否判定を行う処理と、
をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018179127A JP6730395B2 (ja) | 2018-09-25 | 2018-09-25 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018179127A JP6730395B2 (ja) | 2018-09-25 | 2018-09-25 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020052546A JP2020052546A (ja) | 2020-04-02 |
JP6730395B2 true JP6730395B2 (ja) | 2020-07-29 |
Family
ID=69997137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018179127A Active JP6730395B2 (ja) | 2018-09-25 | 2018-09-25 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6730395B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967493B (zh) * | 2020-06-29 | 2024-08-16 | 北京百度网讯科技有限公司 | 图像审核方法、装置、电子设备和存储介质 |
JP7061328B1 (ja) | 2021-07-30 | 2022-04-28 | 株式会社Jx通信社 | 情報処理装置、情報処理システムおよびプログラム |
JP7284336B1 (ja) | 2022-12-27 | 2023-05-30 | ヤフー株式会社 | コンテンツ提供装置、コンテンツ提供方法、およびプログラム |
-
2018
- 2018-09-25 JP JP2018179127A patent/JP6730395B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020052546A (ja) | 2020-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5618404B2 (ja) | 情報提供装置、情報提供方法、情報提供プログラム、及び情報提供プログラムが記録された記録媒体 | |
US9836178B2 (en) | Social web browsing | |
US9454614B2 (en) | Search information providing apparatus and search information providing method | |
JP6027039B2 (ja) | 抽出装置、抽出方法および抽出プログラム | |
JP5571145B2 (ja) | 広告配信装置および広告配信方法 | |
US20090216639A1 (en) | Advertising selection and display based on electronic profile information | |
JP4859892B2 (ja) | 商品広告配信装置、商品広告配信方法、及び商品広告配信制御プログラム | |
US20150066940A1 (en) | Providing relevant online content | |
JP6730395B2 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
US11205195B2 (en) | Information processing device, information processing method, and information processing program | |
JP2007272814A (ja) | 広告配信システム、広告配信方法及び広告配信プログラム | |
US10078706B2 (en) | Information processing apparatus, information processing method, information processing program, and recording medium storing thereon information processing program which classifies and displays a plurality of elements constituting a list on a plurality of pages | |
JP6679250B2 (ja) | 決定装置、決定方法および決定プログラム | |
JP5106499B2 (ja) | ユーザ抽出装置および方法 | |
US11816701B2 (en) | Techniques for targeting a user based on a psychographic profile | |
JP6159492B1 (ja) | 情報処理システム、情報処理方法、及び情報処理プログラム | |
JP4859893B2 (ja) | 広告配信装置、広告配信方法、及び広告配信制御プログラム | |
KR20050050016A (ko) | 온라인 광고 시스템 및 방법 | |
JP6737887B2 (ja) | 関心分野別趣向検索案内システム | |
WO2012002349A1 (ja) | 情報提供装置、報酬支払処理方法、報酬支払処理プログラム、及び報酬支払処理プログラムが記録された記録媒体 | |
WO2014155681A1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
US20140200979A1 (en) | Information providing device, information providing method, information providing program, and recording medium | |
US7660784B1 (en) | Geographically resolving a keyword query | |
Tian et al. | Recommendation algorithm for mobile E-commerce based on cone depth learning | |
KR20190010278A (ko) | 관심 분야별 취향 검색안내 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200702 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6730395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |