以下、本発明の実施の形態を図面に基づいて説明する。図1は本実施の形態の映像審査システムの構成の一例を示す模式図である。映像審査システムは、広告代理店に設けられたクライアント端末装置10、…、10、媒体社に設けられた情報処理装置としての媒体社端末装置20、20、及び広告用の映像を審査する映像審査装置50が、インターネットなどのネットワーク1を介して接続されている。映像審査装置50は、例えば、媒体社端末装置20に対して、広告用の映像の自動審査をクラウドサービスとして提供することができる。
広告代理店のクライアント端末装置10では、例えば、広告の空枠の確認、広告の申込、広告主からの映像などの広告素材の入稿などの業務が行われる。また、媒体社は、広告配信の管理を行う管理業者であり、媒体社の媒体社端末装置20では、広告の申込の管理、広告素材に不適切な表現が含まれていないかの審査、広告配信のスケジュール管理などの業務が行われる。
審査に合格した広告用の映像は、媒体社の配信担当者によって、媒体社端末装置20を通じて、広告代理店に対して審査合格の通知が行われるとともに、例えば、駅構内や駅ホーム、電車やバス、ビルなどの建物、店舗や映画館などの商業施設、空港など様々な公共施設において、ネットワークに接続された表示装置に配信される。
図2は媒体社端末装置20の構成の一例を示すブロック図である。媒体社端末装置20は、装置全体を制御する制御部21、通信部22、記憶部23、表示パネル24、表示処理部25、及び操作部26を備える。媒体社端末装置20は、例えば、デスクトップ型コンピュータ、ノート型パーソナルコンピュータ、タブレットなどで構成することができる。制御部21は、CPU、ROM及びRAMなどで構成することができる。
通信部22は、ネットワーク1を介して、クライアント端末装置10及び映像審査装置50との間で通信を行う機能を有し、所要の情報の送受信を行うことができる。
記憶部23は、ハードディスク又はフラッシュメモリなどで構成され、広告主を含む広告代理店に関する情報、広告代理店から入稿された映像データ、媒体社端末装置20で行う処理に関連するデータ(例えば、処理結果のデータ)、映像審査装置50から受信したデータなどを記憶することができる。
表示パネル24は、液晶パネル又は有機EL(Electro Luminescence)ディスプレイ等で構成することができる。
表示処理部25は、表示パネル24に所要の情報を表示するための制御を行う。表示処理部25は、例えば、広告代理店毎に入稿された映像が所定の審査条件に合格するか否かの合否情報を表示することができる。この場合、映像審査装置50が所定の審査条件に合格するか否かの判定処理を自動で行う。なお、表示処理部25の表示処理の詳細は後述する。
操作部26は、例えば、ハードウェアキーボード、マウスなどで構成され、表示パネル24に表示されたアイコンなどの操作、文字等の入力などを行うことができる。なお、操作部26は、タッチパネルで構成してもよい。
図3は映像審査装置50の構成の一例を示すブロック図である。映像審査装置50は、装置全体を制御する制御部51、通信部52、メモリ53、フォーマット判定部54、審査DB55、フォーマット変換部56、及び処理部57を備える。処理部57は、学習モデル58、学習処理部59、教師データ生成部60、審査結果出力部61、及び言語処理部62を備える。映像審査装置50は、1又は複数のサーバで構成することができる。制御部51は、CPU、ROM及びRAMなどで構成することができる。
通信部52は、ネットワーク1を介して、クライアント端末装置10及び媒体社端末装置20との間で通信を行う機能を有し、所要の情報の送受信を行うことができる。具体的には、通信部52は、媒体社端末装置20が送信した、広告用の映像(映像データ)を受信することができる。また、通信部52は、広告用の映像の審査の合否情報を媒体社端末装置20へ送信することができる。
メモリ53は、通信部52で受信した映像をフレーム単位で記憶することができる。映像には、画像、文字、音声などが含まれている。フレームレートが、例えば、30fpsの場合、映像には、1秒間に30枚のフレーム(画像)が含まれる。
フォーマット判定部54は、通信部52で受信した映像のフォーマットが、所定のフォーマットに一致するか否かを判定し、判定結果を出力する。所定のフォーマットは、映像を配信するために予め定められたフォーマットである。フォーマットの詳細は後述する。
フォーマット変換部56は、通信部52で受信した映像のフォーマットが、所定のフォーマットに一致しない場合、所定のフォーマットに変換することができる。なお、フォーマット判定部54及びフォーマット変換部56は、映像審査装置50とは別の動画変換サーバ(不図示)などに設けることもできる。
審査DB55は、審査に必要な情報を記憶することができ、例えば、媒体社毎の映像審査基準などの情報を処理部57がアクセスできる形式でデータベース化したものである。また、審査DB55は、自然言語処理に必要な辞書データを記憶している。
次に、処理部57について説明する。なお、処理部57は、例えば、CPU(例えば、複数のプロセッサコアを実装したマルチ・プロセッサなど)、GPU(Graphics Processing Units)、DSP(Digital Signal Processors)、FPGA(Field-Programmable Gate Arrays)などのハードウェアを組み合わせることによって構成することができる。また、量子プロセッサを組み合わせることもできる。
言語処理部62は、音声認識処理機能を備え、映像に含まれる音声をテキストデータ(文字列)に変換することができる。また、言語処理部62は、OCR(Optical Character Recognition/Reader)機能を備え、映像に含まれる文字をテキストデータに変換することができる。なお、通常、音声又は文字は複数のフレームに亘って出力又は表示されるので、言語処理部62によるテキストデータの変換処理は、フレーム単位ではなく、複数のフレームに跨って行われる。なお、言語処理部62は、原稿などの文書を読み込むこともできる。
言語処理部62は、形態素解析機能を備え、辞書データを用いて、変換したテキストデータから意味を持つ最小単位である単語を抽出する。また、言語処理部62は、単語埋め込み処理機能を備え、抽出した単語を所定の次元数のベクトル(所定数のベクトル成分で構成されるベクトル)に変換することができる。
学習モデル58は、多層のニューラルネットワーク(深層学習)を用いることができ、例えば、畳み込みニューラルネットワーク(Convolutional Neural Network)を用いることができるが、他の機械学習を用いてもよい。学習モデル58は、学習処理部59によって学習することにより、広告用の映像が所定の審査条件に合格するのか否かを自動的に判定し、合否情報を出力することができる。本明細書では、学習モデル58は、学習前のもの、学習中のもの、学習済のものを含むものとする。学習モデル58は、例えば、映像に含まれる画像を審査する学習モデル、及び映像から抽出されたテキストを審査する学習モデルを含む。以下、学習モデル58の詳細について説明する。
図4は学習モデル58の構成の第1例を示す模式図である。図4に示す学習モデル58は、画像用の畳み込みニューラルネットワークであり、入力層581、畳み込み層582、プーリング層583、畳み込み層584、プーリング層585、全結合層586、及び出力層587が、この順に接続されている。なお、畳み込み層、プーリング層及び全結合層の数は便宜上のものであり、図4に示す数に限定されない。また、便宜上、活性化関数の層は省略している。入力層581には、映像の画像がフレーム単位で入力される。学習モデル58は、フレーム単位又は複数のフレーム単位で画像が所定の審査条件に合格するか否かを判定することができる。すなわち、出力層587は、フレーム単位で画像の合否情報を出力する。
出力層587を2つの出力ノードで構成し、所定の審査条件に合格する確率、及び不合格となる確率(信頼度)を出力してもよく、あるいは、合格又は不合格の少なくとも一方の信頼度を複数の区分(例えば、信頼度=100%、95%、90%、85%、80%、…、0%の如く)に分けて、区分の数だけ出力ノードを設け、各区分の確率を出力してもよい。
また、出力層587を複数の出力ノードで構成し、それぞれのノードを、画像が所定の審査条件に合格しない理由を定め、各理由の確率を出力してもよい。理由は、例えば、「肌の露出」、「性に関する表現」、「暴力的な表現」などとすることができるが、これらに限定されない。
図5は畳み込み層で行う処理を示す模式図である。畳み込み層の入出力データは、特徴マップとも称され、畳み込み層の入力データを入力特徴マップ、畳み込み層の出力データを出力特徴マップともいう。初段の畳み込み層の入力特徴マップは、入力されたフレーム単位の画像である。畳み込み層で行う処理(「畳み込み演算」ともいう)は、畳み込みフィルタ(「フィルタ」ともいう)によるフィルタ演算である。
図5に示すように、入力特徴マップを、8×8ピクセルとする。また、フィルタの大きさを3×3ピクセルとする。畳み込み演算では、入力特徴マップに対して、フィルタのウィンドウを一定の間隔でスライドさせながら、フィルタの要素と入力特徴マップの対応する要素を乗算し、その和を求め、求めた和を出力特徴マップの対応するピクセルに格納する。図5の例では、入力特徴マップのフィルタF1に対応する領域Sの演算結果が出力特徴マップのピクセルS1に格納される。また、入力特徴マップのフィルタF2に対応する領域Sの演算結果が出力特徴マップのピクセルS2に格納される。同様に、入力特徴マップのフィルタF3に対応する領域Sの演算結果が出力特徴マップのピクセルS3に格納される。フィルタを1ピクセルずつ移動させて同様の演算を行うことにより、出力特徴マップは、6×6ピクセルの大きさとなる。ここで、3つのフィルタF1、F2、F3を用いることにより、3つの出力特徴マップが得られる。
学習モデル58の学習では、フィルタに関するパラメータとして、例えば、フィルタの要素の値、フィルタの数(図5の例では、3)、フィルタの大きさ(図5の例では、3×3)、フィルタの移動幅(「スライド」ともいう、図5の例では、1ピクセル)、入力特徴マップの周囲(端の領域)を0で埋めるパディングなどを最適化する。畳み込み層により、画像の空間的な特徴を抽出することができる。
図6はプーリング層で行う処理を示す模式図である。プーリング層は、畳み込み層から出力された二次元特徴マップの大きさを縮小する処理を行う。具体的には、画像の局所領域を一つの要素に集約する処理を行う。例えば、図6に示すように、6×6ピクセルの特徴マップ(出力特徴マップ)において、2×2の局所領域(ウィンドウW)を、各要素のうちの最大値である「4」に集約している。なお、ウィンドウWのスライドは、ウィンドウWの大きさに等しく、図6の例では、2ピクセルずつスライドするので、6×6ピクセルの特徴マップは、3×3ピクセルに縮小される。プーリング層により、画像内で、例えば、特徴部分が多少変形又は変位していても、その変形又は変位による差異を吸収して特徴部分を抽出することができる。
図7は学習モデル58の構成の第2例を示す模式図である。学習モデル58は、図4に示す構成と図7に示す構成の両方の構成を備えることができる。図7に示す学習モデル58は、テキスト用の畳み込みニューラルネットワークであり、入力層1581、畳み込み層1582、プーリング層1583、全結合層1584、及び出力層1585が、この順に接続されている。なお、畳み込み層、プーリング層及び全結合層の数は便宜上のものであり、図7に示す数に限定されない。入力層1581には、言語処理部62によって、テキストデータから抽出された単語の列が入力される。図7の例では、一連の音声又は文字列から、6つの単語(単語1〜6)が抽出されて入力層1581に入力されている様子を示す。各単語1〜6は、埋め込み表現され、所定数(例えば、kとする)の次元のベクトルで表されている。なお、単語数は6に限定されない。
畳み込み層1582では、例えば、6つのフィルタF11〜F16を用いて、畳み込み演算が行われる。フィルタF11、F12は、4×kのサイズを有し、入力された特徴マップ上で、1ずつスライドすることによって、3つの要素(3×1のサイズ)で構成される特徴マップを出力する。また、フィルタF13、F14は、3×kのサイズを有し、入力された特徴マップ上で、1ずつスライドすることによって、4つの要素(4×1のサイズ)で構成される特徴マップを出力する。同様に、フィルタF15、F16は、2×kのサイズを有し、入力された特徴マップ上で、1ずつスライドすることによって、5つの要素(4×1のサイズ)で構成される特徴マップを出力する。
プーリング層1583では、出力された特徴マップの各要素のうち、最大値の要素を抽出する。
出力層1585を2つの出力ノードで構成し、所定の審査条件に合格する確率、及び不合格となる確率(信頼度)を出力してもよく、あるいは、合格又は不合格の少なくとも一方の信頼度を複数の区分(例えば、信頼度=100%、95%、90%、85%、80%、…、0%の如く)に分けて、区分の数だけ出力ノードを設け、各区分の確率を出力してもよい。なお、テキスト用の学習モデル58は、図7の構成に限定されない。
また、出力層1585を複数の出力ノードで構成し、それぞれのノードを、音声又は文字が所定の審査条件に合格しない理由を定め、各理由の確率を出力してもよい。理由は、例えば、「世界一の」、「業界初の」、「万能」などの表現を意味する文章又は音声の存在とすることができるが、これらに限定されない。
図7に示すような学習モデル58とともに、予め「世界一の」、「業界初の」、「万能」などのキーワードを保存した辞書データベースを準備しておき、入力されたテキストデータの中に辞書データベース内のキーワードに一致する言葉が含まれているかを判定することにより、所定の審査条件に合格するか否かを判定することもできる。すなわち、キーワードを保存した辞書データベースと学習モデル58とを組み合わせてもよい。
また、図7に示すような学習モデル58に代えて、テキスト用の学習モデル58として、例えば、リカレントニューラルネットワーク(RNN)を用いることができる。リカレントニューラルネットワークでは、前の時刻の中間層を次の時刻の入力層と合わせて学習に用いることで複数の単語の時系列情報を考慮することができる。
教師データ生成部60は、合否情報取得部としての機能を有し、取得した映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報を取得して、教師データを生成する。所定の審査条件は、例えば、映像に含まれる画像、文字又は音声が広告表現上、適切な表現であるか否かの条件とすることができる。例えば、不適切な表現が含まれる場合には審査条件に合格しない(不合格となる)。合否情報は、合格及び不合格の判定結果を含む。また、合否情報は、出力層の出力ノードそれぞれに対尾するデータを含む。
学習処理部59は、教師データ(取得した映像及び当該映像に対する合否情報)を用いて学習モデル58を学習させる。これにより、フィルタの要素の値、フィルタの数、フィルタの大きさ、フィルタの移動幅などを最適化することができる。
教師データを用いて学習させた学習モデル58によって広告用の映像を審査させた場合、当該映像が所定の審査条件に合格するのか否かの合否判定を確率で得ることができる。例えば、合格判定の確率が所定の閾値以上であれば、広告用の映像に不適切な表現が含まれていないとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の確率が所定の閾値以上であれば、広告用の映像に不適切な表現が含まれているとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
学習処理部59は、媒体社毎の教師データ(媒体社毎に取得した映像及び当該映像に対する合否情報)を用いて、媒体社毎に学習モデル58を学習させることができる。
媒体社は、広告配信の管理を行う管理業者であり、様々な広告代理店(広告主)から入稿された広告用の映像を審査する必要がある。一方で、広告用の映像に含まれる画像、音声又は文字が、適切な表現であるか否かの審査基準は、媒体社毎に異なる場合があり、例えば、ある媒体社の審査基準は厳しいが、別のある媒体社の審査基準は比較的緩いという場合がある。
学習処理部59は、媒体社毎の教師データを用いて学習モデル58を学習させるので、学習モデル58に含まれるアルゴリズム及びパラメータ(例えば、フィルタに関するパラメータなど)が、媒体社毎に特化した形で最適化された学習モデル58を得ることができる。これにより、媒体社での審査基準にばらつきや違いがある場合でも、媒体社毎に適した学習モデル58を用いることができ、広告用の映像の審査の精度を高めることが可能になる。特に、交通局などの移動体を含むすべての公共場所に広告を配信するような媒体社には、最適な学習モデル58を提供することが可能となる。
また、学習処理部59は、学習モデル58が、取得した映像が審査条件に合格しないと判定した場合、判定結果の信頼度を出力するように、学習モデル58を学習させることができる。
これにより、学習モデル58を用いて、広告用の映像を審査する場合、不合格判定の信頼度(確率)が低いときには、広告用の映像に不適切な表現が含まれている可能性は低いとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の信頼度が高いときには、広告用の映像に不適切な表現が含まれている可能性が高いとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
また、学習処理部59は、学習モデル58が、取得した映像を構成する複数のフレームのうち審査条件に合格しないフレームを識別する識別情報を出力するように、学習モデル58を学習させることができる。
映像の長さ、フレームレートが予め設定されている場合、審査条件に合格しないフレーム(連続する複数のフレームでもよい)が分かれば、例えば、映像の開始から何秒後のフレームに不適切な表現があるか容易に把握することができる。
また、学習処理部59は、学習モデル58が、取得した映像を構成する複数のフレームのうち審査条件に合格しないフレーム内の画像情報又は文字情報を出力するように、学習モデル58を学習させることができる。
例えば、映像内の画像に不適切な表現が描かれている場合、当該画像のサムネイル(画像情報)を出力することができる。また、映像内の音声又は文字に不適切な表現が含まれている場合、当該音声又は文字のテキスト(文字情報)を出力することができる。これにより、映像内の不適切な表現を把握することができる。
次に、学習処理部59で学習した学習モデル58を用いて、広告用の映像を自動審査する場合について説明する。
図8は媒体社端末装置20の表示パネル24に表示されるアップロード画面201の一例を示す模式図である。媒体社端末装置20は、複数の広告代理店から入稿された映像を映像審査装置50にアップロード(送信)することができる。アップロード画面201には、ID、代理店名、広告主名、広告内容、入稿素材(映像)、アップロードを実行するアイコン202が表示される。媒体社の審査担当者は、広告代理店から入稿された入稿素材の一覧の中から、映像審査装置50による自動審査を行う入稿素材を選択して、映像審査装置50に送信することができる。
映像審査装置50の処理部57(具体的には、学習モデル58)は、取得した映像が審査条件に合格するか否かの合否情報を出力する。具体的には、学習モデル58は、取得した映像が所定の審査条件に合格するのか否かの合否判定の確率を出力することができる。映像審査装置50は、通信部52を介して、合否情報を媒体社端末装置20へ送信する。
これにより、媒体社の審査担当者は、合格判定の確率が所定の閾値以上であれば、映像に不適切な表現が含まれていないとして手作業による審査業務を省略することができ、映像の審査時間を短縮化することができる。また、不合格判定の確率が所定の閾値以上であれば、映像に不適切な表現が含まれているとして、当該映像に集中して確認作業を行うことができ、映像の審査時間を短縮化することができる。
また、処理部57は、複数の広告代理店毎に映像を取得した場合、複数の広告代理店毎に取得した映像が審査条件に合格するか否かの合否情報の一覧を出力する。映像審査装置50は、通信部52を介して、合否情報の一覧を媒体社端末装置20へ送信する。
これにより、複数の広告代理店毎に取得した複数の映像のうち、手作業による確認作業を必要とする映像と必要でない映像とを区別することができ、広告用の映像の審査時間を短縮化することができる。
また、処理部57は、取得した映像が審査条件に合格しないと判定した場合、判定結果の信頼度を出力することができる。
図9は媒体社端末装置20の表示パネル24に表示される審査結果一覧画面210の一例を示す模式図である。例えば、審査結果一覧画面210には、ID、代理店名、入稿素材(映像)、審査結果、信頼度、審査結果の詳細画面を表示するためのアイコン211、審査完了通知を、広告代理店のクライアント端末装置10に送信するためのアイコン212などが表示される。
すなわち、表示処理部25は、複数の広告代理店毎に入稿された映像が所定の審査条件に合格するか否かの合否情報(図9の例では、審査結果がOKとその信頼度、及び審査結果がNGとその信頼度)の一覧を表示することができる。これにより、複数の広告代理店毎に取得した複数の映像のうち、手作業による確認作業を必要とする映像と必要でない映像とを区別することができ、広告用の映像の審査時間を短縮化することができる。
また、表示処理部25は、映像が審査条件に合格しないと判定された場合、複数の広告代理店毎に判定結果の信頼度を表示してもよい。これにより、媒体社の審査担当者は、不合格判定の信頼度(確率)が低い場合には、映像に不適切な表現が含まれている可能性は低いとして手作業による審査業務を省略することができ、映像の審査時間を短縮化することができる。また、不合格判定の信頼度が高い場合には、映像に不適切な表現が含まれている可能性が高いとして、当該映像に集中して確認作業を行うことができ、映像の審査時間を短縮化することができる。
図9の例で、審査担当者が、IDがM1の入稿素材(D0001)の審査結果がOKであり、審査結果の信頼度が90%であるから、信頼できると判断した場合、審査完了通知のアイコン212を操作することにより、広告代理店AAAのクライアント端末装置10に審査完了通知が送信される。
すなわち、アイコン212は通知部としての機能を有し、媒体社端末装置20は、取得した映像が審査条件に合格すると判定された場合、当該映像を入稿した広告代理店に対して審査完了(審査合格でもよい)を通知することができる。ここで、審査結果OKの信頼度が、どの程度であれば広告代理店に対して審査完了を通知するかは、審査担当者が適宜決めることができる。
また、予め所定の閾値(例えば、90%)を設定しておき、学習モデル58が、合格判定の確率が所定の閾値以上の審査合格を出力した場合、審査完了(審査合格)通知を自動的にクライアント端末装置10に送信してもよい。
上述の構成により、映像の内容を手作業で確認することなく、広告代理店に審査合格を通知することがでるので、審査担当者の作業効率を向上することができる。
次に、審査結果の詳細情報について説明する。
図10は媒体社端末装置20の表示パネル24に表示される審査結果詳細画面220の一例を示す模式図である。図10の例では、入稿素材がD0005、審査結果がNG、審査結果の信頼度が90%の場合について図示されている。すなわち、図10の審査結果詳細画面220は、図9の例において、IDがM4、広告代理店がEEEの入稿素材D0005の審査結果について詳細画面を表示するためのアイコン211が操作されることによって、表示される。
映像審査装置50の処理部57によって、入稿された映像(入稿素材:D0005)が審査条件に不合格であると判定された場合、映像のどの箇所に不適切な広告表現があるかを、画像領域221と音声・文字領域222で表示することができる。画像領域221では、映像の最初から最後までのフレームが順番に表示され、不適切な描画があるフレーム(複数フレームでもよい)223、224が識別可能に表示される。フレーム223とフレーム224とでは、審査結果がNGの信頼度に応じて表示態様が異なる(便宜上、図では、模様を異ならせている)。例えば、審査結果がNGの信頼度が高いフレームを濃く表示すること、あるいは際立って目立つ色(例えば、赤色)とし、審査結果がNGの信頼度が低いフレームを薄く表示すること、あるいは多少目立つ色(例えば、黄色)とすることができる。
審査結果出力部61は、第2出力部としての機能を有し、取得した映像が審査条件に合格しないと判定された場合、判定結果の信頼度に応じて、識別情報、画像情報又は文字情報を異なる表示態様で出力することができる。例えば、信頼度が高いほど、識別しやすい表示態様で識別情報、画像情報又は文字情報を出力することができる。これにより、手作業による確認作業の優先順位が分かり、作業効率を向上することができる。
また、審査担当者が、フレーム223に対して、所定の操作(例えば、クリック、ダブルクリックなど)を行うと、フレーム223のサムネイル(画像情報)を表示することができる。また、サムネイルの表示態様は、審査結果の信頼度に応じて、異なるようにしてもよい。例えば、信頼度の高いサムネイルは、枠を付けて強調表示し、あるいは目立つ色を付与してもよい。これにより、審査担当者は、実際に画像で不適切な描画を確認することができる。サムネイルの表示は、図示していないが、フレームの近くにポップアップ画面で表示してもよく、審査結果詳細画面220内の所定領域にサムネイル用の領域を予め設けていてもよい。
審査担当者が、スライド227をフレーム223の位置に移動させると、理由説明画面229に、フレーム223の位置(例えば、映像の開始時点からの経過時間:図の例では、2分40秒)、フレーム223に関する審査結果NGの信頼度(図の例では、90%)、審査結果がNGとなる理由(図の例では、肌の露出)などが表示される。審査担当者がスライド227をフレーム224の位置に移動させると、理由説明画面229には、フレーム224についての同様の情報が表示される。
音声・文字領域222では、映像の最初から最後までのフレームが順番に表示され、不適切な音声又は文字があるフレーム(複数フレームでもよい)225、226が識別可能に表示される。フレーム225とフレーム226とでは、審査結果がNGの信頼度に応じて表示態様が異なる(便宜上、図では、模様を異ならせている)。例えば、審査結果がNGの信頼度が高いフレームを濃く表示すること、あるいは際立って目立つ色(例えば、赤色)とし、審査結果がNGの信頼度が低いフレームを薄く表示すること、あるいは多少目立つ色(例えば、黄色)とすることができる。
審査担当者が、スライド228をフレーム226の位置に移動させると、理由説明画面230に、フレーム226の位置(例えば、映像の開始時点からの経過時間:図の例では、3分20秒)、フレーム226に関する審査結果NGの信頼度(図の例では、90%)、審査結果がNGとなる理由(図の例では、「世界一の」の表現)などが表示される。審査担当者がスライド228をフレーム225の位置に移動させると、理由説明画面230には、フレーム225についての同様の情報が表示される。また、「世界一の」などの文字情報の表示態様は、審査結果の信頼度に応じて、異なるようにしてもよい。例えば、信頼度の高い文字情報は、枠を付けて強調表示し、あるいは目立つ色を付与してもよい。
なお、フレーム毎の審査結果NGの信頼度が異なる場合、各フレームについての信頼度の平均を入稿素材全体の審査結果NGの信頼度としてもよく、各フレームについての信頼度のうち、最も信頼度の低いものを入稿素材全体の審査結果NGの信頼度としてもよい。
上述のように、処理部57は、取得した映像を構成する複数のフレームのうち審査条件に合格しないフレームを識別する識別情報を出力することができる。識別情報は、図10に示すように、フレームに色、模様を付してもよく、フレームの枠を強調表示してもよく、フレームの上部又は下部にマークを付してもよい。映像の長さ、フレームレートは予め設定されているので、審査条件に合格しないフレーム(連続する複数のフレームでもよい)が分かれば、例えば、映像の開始から何秒後のフレームに不適切な表現があるか容易に把握することができる。
媒体社端末装置20の操作部26は、受付部としての機能を有し、操作部26は、所定の操作を受け付ける。所定の操作は、例えば、入稿された映像が所定の審査条件に合格するか否かの合否情報の一覧が表示された場合、当該一覧のうち、さらに詳細に合否の内容を確認するための操作とすることができ、図9に例示したように、詳細画面を表示するためのアイコン211に対する操作とすることができる。
表示処理部25は、所定の操作を受け付けた場合、映像を構成する複数のフレームのうち審査条件に合格しないフレームを識別する識別情報を表示することができる。映像の長さ、フレームレートは予め設定されているので、審査条件に合格しないフレーム(連続する複数のフレームでもよい)が分かれば、例えば、映像の開始から何秒後のフレームに不適切な表現があるか容易に把握することができる。これにより、審査に合格しない不適切な表現が含まれるフレームを容易に確認することができる。
また、処理部57は、審査条件に合格しないフレーム内の画像情報を出力することができる。例えば、映像内の画像に不適切な表現が描かれている場合、当該画像のサムネイルを出力することができる。これにより、映像内の不適切な表現を把握することができる。
また、処理部57は、審査条件に合格しないフレーム内の文字情報を出力することができる。例えば、映像内の音声又は文字に不適切な表現が含まれている場合、当該音声又は文字のテキストを出力することができる。これにより、映像内の不適切な表現を把握することができる。
また、処理部57は、審査条件に合格しないと判定したフレームが、審査条件に合格しない理由を示す情報を出力することができる。審査条件に合格しない理由は、例えば、画像の中に広告表現上、不適切な描画が含まれている場合、どのような描画であるかを示す文言とすることができ、音声又は文字の中に不適切な言葉が含まれている場合、当該言葉とすることができる。
表示処理部25は、審査条件に合格しないフレーム内の画像情報(サムネイル)を表示することができる。また、表示処理部25は、審査条件に合格しないフレーム内の文字情報を表示することができる。また、表示処理部25は、フレームが審査条件に合格しない理由を示す情報を表示することができる。これにより、審査担当者は、審査条件に合格しない理由が直ちに分かるので、例えば、媒体社毎に異なる審査基準を調べる必要がなく、審査業務を簡素化し、審査時間を短縮することができる。
図11は媒体社端末装置20の表示パネル24に表示される審査結果一覧画面240の他の例を示す模式図である。図9に例示した審査結果一覧画面210の違いは、フォーマット判定及びフォーマット変換の欄が表示される点である。フォーマット判定部54は、広告用の映像が所定のフォーマットであるか否かを判定する。
図12は映像のフォーマット判定のためのチェック対象の一例を示す説明図である。映像の形式チェック対象(フォーマットのチェック項目)は、動画用パラメータ、音声用パラメータ及び静止画用パラメータに分けることができる。動画用パラメータとしては、例えば、ファイルサイズ、動画の横幅及び縦幅、動画の長さ、ビットレート、フレームレート、及びVBR(Variable Bit Rate)からCBR(Constant Bit Rate)への変換の要否などをチェックし、これらのパラメータが所定の形式でない場合には、所定の形式に変換する。音声用パラメータとしては、例えば、サンプリング周波数、ステレオからモノラルへの変換の要否、ビットレート及び音の良さを決定する量子化ビットなどをチェックし、これらのパラメータが所定の形式でない場合には、所定の形式に変換する。また、静止画用パラメータとしては、例えば、ファイルサイズ、静止画の横幅及び縦幅、及びCMYKからRGBへの変換の要否などをチェックし、これらのパラメータが所定の形式でない場合には、所定の形式に変換する。映像を配信する場合のフォーマットは、所定のフォーマットに定められているが、広告主が制作する映像のフォーマットは、必ずしも配信用のフォーマットと一致しない場合がある。
フォーマット変換部56は、取得した映像のフォーマットが所定のフォーマットと一致しないと判定された場合、取得した映像のフォーマットを所定のフォーマットに変換する。具体的は、フォーマット判定がNGの入稿素材(図11の例では、D0002)のフォーマット変換アイコンを操作することにより、フォーマット変換を行うことができる。
処理部57は、第1出力部としての機能を有し、複数の広告代理店毎に取得した映像が所定のフォーマットであるか否かの判定結果の一覧を出力する。これにより、複数の広告代理店毎に取得した複数の映像のうち、フォーマットの修正を必要とする映像と必要でない映像とを区別することができ、作業効率を向上することができる。
図9又は図11の例において、IDがM2の入稿素材D0002に対して、映像審査装置50の学習モデル58が、審査結果NGの信頼度が80%であると出力しているにも関わらず、審査担当者が、入稿素材D0002の詳細を確認した場合に、媒体社の審査基準に照らすと、不適切な広告表現が含まれていないと判断できることがあり得る。同様に、IDがM4の入稿素材D0004に対して、映像審査装置50の学習モデル58が、審査結果OKの信頼度が80%であると出力しているにも関わらず、審査担当者が、入稿素材D0004の詳細を確認した場合に、媒体社の審査基準に照らすと、不適切な広告表現が含まれていると判断できることがあり得る。このような場合には、学習モデル58を再学習させることができる。
すなわち、学習処理部59は、取得した映像及び学習モデル58が出力した合否情報を修正した修正合否情報を教師データとして学習モデル58を再学習させることができる。例えば、学習モデル58が審査合格と判定した映像に不適切な表現が含まれていた場合、あるいは学習モデル58が審査不合格と判定した映像に不適切な表現が含まれていない場合、学習モデル58が出力した合否情報を修正して学習モデル58を再度学習させることができる。これにより、学習モデル58の判定精度を更に高めることができる。
図13は学習モードでの処理部57の処理手順の一例を示すフローチャートである。学習モードは、学習処理部59により学習モデル58を学習させるモードである。以下では、処理の主体を便宜上、処理部57として説明する。処理部57は、媒体社用の学習モデル58を設定する(S11)。処理部57は、訓練用の映像データを取得し(S12)、訓練用の映像データの合否情報を取得し(S13)、教師データを生成する(S14)。
処理部57は、学習モデルの学習及び更新を行い(S15)、他の媒体社のデータ(訓練データ)の有無を判定する(S16)。他の媒体社のデータがある場合(S16でYES)、処理部57は、ステップS11以降の処理を続け、他の媒体社のデータがない場合(S16でNO)、処理を終了する。
上述の構成により、媒体社毎に最適化された学習モデルを記憶しておくことができ、媒体社毎に審査基準が異なる場合でも、媒体社に適した学習モデルを用いて審査条件の合否の判定を行うことができる。
なお、図示していないが、訓練データ(教師データ)とは別に、テストデータ(映像データ)を準備し、学習させた学習モデル58に対してテストデータを入力し、学習モデル58の評価を行うことができる。
図14は審査モードでの処理部57の処理手順の一例を示すフローチャートである。審査モードは、広告用の映像が所定の審査条件に合格するか否かを判定するモードである。処理部57は、広告代理店毎の映像データを取得し(S21)、映像データのフォーマットを判定する(S22)。
処理部57は、映像データを学習済の学習モデル58に入力し(S23)、映像データの合否情報を記憶する(S24)。映像データが審査条件に合格しない場合、合否情報には、不合格になったフレーム、当該フレーム内の画像情報、文字情報などが含まれる。処理部57は、広告代理店毎の映像データの審査結果を出力し(S25)、審査結果及びフォーマット判定結果を媒体社端末装置20へ送信する(S26)。
処理部57は、学習モデル58の再学習を行うか否かを判定し(S27)、再学習を行う場合(S27でYES)、映像データ及び合否情報を教師データとして学習モデル58を再学習し(S28)、処理を終了する。再学習を行わない場合(S27でNO)、処理部57は、処理を終了する。
図15は媒体社端末装置20の制御部21の処理手順の一例を示すフローチャートである。制御部21は、複数の広告代理店毎の映像データの合否情報を映像審査装置50から受信し(S31)、審査結果一覧画面を表示する(S32)。制御部21は、審査完了通知アイコンの操作の有無を判定し(S33)、審査完了通知アイコンの操作があった場合(S33でYES)、審査完了通知をクライアント端末装置10へ送信し(S34)、後述のステップS35の処理を行う。
審査完了通知アイコンの操作がない場合(S33でNO)、制御部21は、詳細画面アイコンの操作の有無を判定し(S35)、詳細画面アイコンの操作があった場合(S35でYES)、審査結果詳細画面を表示する(S36)。制御部21は、審査結果NGのフレームの選択操作の有無を判定する(S37)。
審査結果NGのフレームの選択操作があった場合(S37でYES)、制御部21は、理由説明画面を表示し(S38)、後述のステップS39の処理を行う。詳細画面アイコンの操作がない場合(S35でNO)、あるいは、審査結果NGのフレームの選択操作がない場合(S37でNO)、制御部21は、処理を終了するか否かを判定する(S39)。
処理を終了しない場合(S39でNO)、制御部21は、ステップS33以降の処理を続け、処理を終了する場合(S39でYES)、処理を終了する。
本実施の形態の制御部51、処理部57、フォーマット判定部54及びフォーマット変換部56は、CPU(プロセッサ)、GPU、RAM(メモリ)などを備えた汎用コンピュータを用いて実現することもできる。すなわち、図13及び図14に示すような、各処理の手順を定めたコンピュータプログラムをコンピュータに備えられたRAM(メモリ)にロードし、コンピュータプログラムをCPU(プロセッサ)で実行することにより、コンピュータ上で制御部51、処理部57、フォーマット判定部54及びフォーマット変換部56を実現することができる。コンピュータプログラムは記録媒体に記録され流通されてもよい。映像審査装置50で学習させた学習モデル58及びそれに基づくコンピュータプログラムを、ネットワーク1を介して、媒体社端末装置20に配信されインストールされてもよい。
上述の実施の形態において、映像審査装置50が、映像の審査だけを行い、学習モデル58の学習を行わない場合には、学習処理部59及び教師データ生成部60は具備しなくてもよい。また、フォーマット判定部54及びフォーマット変換部56は必須の構成ではなく、具備しなくてもよい。
本実施の形態に係る映像審査装置は、広告用の映像を審査する映像審査装置であって、広告用の映像を取得する映像取得部と、前記映像取得部で取得した映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報を取得する合否情報取得部と、前記映像及び合否情報を教師データとして学習モデルを学習させる学習処理部とを備える。
本実施の形態に係るコンピュータプログラムは、コンピュータに、広告用の映像を取得する処理と、取得した映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報を取得する処理と、前記映像及び合否情報を教師データとして学習モデルを学習させる処理とを実行させる。
本実施の形態に係る映像審査方法は、広告用の映像を審査する映像審査方法であって、広告用の映像を取得し、取得された映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報を取得し、前記映像及び合否情報を教師データとして学習モデルを学習させる。
映像取得部は、広告用の映像を取得する。映像は、例えば、動画であり、複数のフレーム(フレーム画像とも称する)で構成される。
合否情報取得部は、取得した映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報を取得する。所定の審査条件は、例えば、映像に含まれる画像、文字又は音声が広告表現上、適切な表現であるか否かの条件とすることができる。例えば、不適切な表現が含まれる場合には審査条件に合格しない(不合格となる)。合否情報は、合格及び不合格を含む。
学習処理部は、取得した映像及び合否情報を教師データとして学習モデルを学習させる。学習モデルは、多層のニューラルネットワーク(深層学習)を用いることができ、例えば、畳み込みニューラルネットワークを用いることができるが、他の機械学習を用いてもよい。
教師データを用いて学習させた学習済の学習モデルによって広告用の映像を審査させた場合、当該映像が所定の審査条件に合格するのか否かの合否判定を確率で得ることができる。例えば、合格判定の確率が所定の閾値以上であれば、広告用の映像に不適切な表現が含まれていないとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の確率が所定の閾値以上であれば、広告用の映像に不適切な表現が含まれているとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る映像審査装置において、前記映像取得部は、媒体社毎に広告用の映像を取得し、前記合否情報取得部は、前記媒体社毎に前記合否情報を取得し、前記学習処理部は、前記媒体社毎に学習モデルを学習させる。
映像取得部は、媒体社毎に広告用の映像を取得する。媒体社は、広告配信の管理を行う管理業者であり、様々な広告代理店(広告主)から入稿された広告用の映像を審査する。
合否情報取得部は、媒体社毎に合否情報を取得する。すなわち、合否情報取得部は、媒体社毎取得した広告用の映像それぞれについて、当該映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報を取得する。不適切な表現であるか否かの審査基準は、媒体社毎に異なる場合があり、例えば、ある媒体社の審査基準は厳しいが、別のある媒体社の審査基準は比較的緩いという場合がある。
学習処理部は、媒体社毎の教師データを用いて学習モデルを学習させる。学習モデルに含まれるアルゴリズム及びパラメータが、媒体社毎に特化した形で最適化された学習モデルを得ることができる。これにより、媒体社での審査基準にばらつきや違いがある場合でも、媒体社毎に適した学習モデルを用いることができ、広告用の映像の審査の精度を高めることが可能になる。
本実施の形態に係る映像審査装置において、前記学習モデルは、取得した映像が前記審査条件に合格しないと判定した場合、判定結果の信頼度を出力する。
学習モデルは、取得した映像が審査条件に合格しないと判定した場合、判定結果の信頼度を出力する。例えば、不合格判定の信頼度(確率)が低い場合には、広告用の映像に不適切な表現が含まれている可能性は低いとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の信頼度が高い場合には、広告用の映像に不適切な表現が含まれている可能性が高いとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る映像審査装置において、前記学習モデルは、取得した映像を構成する複数のフレームのうち前記審査条件に合格しないフレームを識別する識別情報を出力する。
学習モデルは、取得した映像を構成する複数のフレームのうち審査条件に合格しないフレームを識別する識別情報を出力する。映像の長さ、フレームレートが予め設定されている場合、審査条件に合格しないフレーム(連続する複数のフレームでもよい)が分かれば、例えば、映像の開始から何秒後のフレームに不適切な表現があるか容易に把握することができる。
本実施の形態に係る映像審査装置において、前記学習モデルは、取得した映像を構成する複数のフレームのうち前記審査条件に合格しないフレーム内の画像情報又は文字情報を出力する。
学習モデルは、取得した映像を構成する複数のフレームのうち審査条件に合格しないフレーム内の画像情報又は文字情報を出力する。例えば、映像内の画像に不適切な表現が描かれている場合、当該画像のサムネイルを出力することができる。また、映像内の音声又は文字に不適切な表現が含まれている場合、当該音声又は文字のテキストを出力することができる。これにより、映像内の不適切な表現を把握することができる。
本実施の形態に係る映像審査装置は、広告用の映像を審査する映像審査装置であって、広告用の映像を取得する映像取得部と、映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報に基づいて学習した学習モデルとを備え、前記学習モデルは、前記映像取得部で取得した映像が前記審査条件に合格するか否かの合否情報を出力する。
本実施の形態に係るコンピュータプログラムは、コンピュータに、広告用の映像を取得する処理と、映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報に基づいて学習した学習モデルを用いて、取得した映像が前記審査条件に合格するか否かの合否情報を出力する処理とを実行させる。
本実施の形態に係る映像審査方法は、広告用の映像を審査する映像審査方法であって、広告用の映像を取得し、映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報に基づいて学習した学習モデルを用いて、取得された映像が前記審査条件に合格するか否かの合否情報を出力する。
映像取得部は、広告用の映像を取得する。映像は、例えば、動画であり、複数のフレーム(フレーム画像とも称する)で構成される。
学習モデルは、映像に含まれる画像、文字又は音声の少なくとも一つが所定の審査条件に合格するか否かの合否情報に基づいて学習されている。所定の審査条件は、例えば、映像に含まれる画像、文字又は音声が広告表現上、適切な表現であるか否かの条件とすることができる。例えば、不適切な表現が含まれる場合には審査条件に合格しない(不合格となる)。合否情報は、合格及び不合格を含む。
学習モデルは、映像取得部で取得した映像が審査条件に合格するか否かの合否情報を出力する。学習モデルは、当該映像が所定の審査条件に合格するのか否かの合否判定を確率で得ることができる。例えば、合格判定の確率が所定の閾値以上であれば、広告用の映像に不適切な表現が含まれていないとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の確率が所定の閾値以上であれば、広告用の映像に不適切な表現が含まれているとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る映像審査装置において、前記映像取得部は、複数の広告代理店毎の広告用の映像を取得し、前記学習モデルは、前記複数の広告代理店毎に取得した映像が前記審査条件に合格するか否かの合否情報の一覧を出力する。
映像取得部は、複数の広告代理店毎の広告用の映像を取得する。
学習モデルは、複数の広告代理店毎に取得した映像が審査条件に合格するか否かの合否情報の一覧を出力する。これにより、複数の広告代理店毎に取得した複数の映像のうち、手作業による確認作業を必要とする映像と必要でない映像とを区別することができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る映像審査装置は、広告用の映像が所定のフォーマットであるか否かを判定する判定部と、複数の広告代理店毎に取得した映像が前記所定のフォーマットであるか否かの判定結果の一覧を出力する第1出力部とを備える。
判定部は、広告用の映像が所定のフォーマットであるか否かを判定する。フォーマットは、映像(動画及び静止画)を構成するためのファイルの情報であり、例えば、ファイル名(ファイル形式)、圧縮方式、動画ビットレート、フレームレート、解像度、音声、音声ビットレート、周波数、チャンネル、動画の長さなどの情報を含む。映像を配信する場合のフォーマットは、所定のフォーマットに定められているが、広告主が制作する映像のフォーマットは、必ずしも配信用のフォーマットと一致しない場合がある。
第1出力部は、複数の広告代理店毎に取得した映像が所定のフォーマットであるか否かの判定結果の一覧を出力する。これにより、複数の広告代理店毎に取得した複数の映像のうち、フォーマットの修正を必要とする映像と必要でない映像とを区別することができ、作業効率を向上することができる。
本実施の形態に係る映像審査装置において、前記学習モデルは、取得した映像が前記審査条件に合格しないと判定された場合、判定結果の信頼度を出力する。
学習モデルは、取得した映像が審査条件に合格しないと判定された場合、判定結果の信頼度を出力する。例えば、不合格判定の信頼度(確率)が低い場合には、広告用の映像に不適切な表現が含まれている可能性は低いとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の信頼度が高い場合には、広告用の映像に不適切な表現が含まれている可能性が高いとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る映像審査装置において、前記学習モデルは、取得した映像を構成する複数のフレームのうち前記審査条件に合格しないフレームを識別する識別情報を出力する。
学習モデルは、取得した映像を構成する複数のフレームのうち審査条件に合格しないフレームを識別する識別情報を出力する。映像の長さ、フレームレートは予め設定されているので、審査条件に合格しないフレーム(連続する複数のフレームでもよい)が分かれば、例えば、映像の開始から何秒後のフレームに不適切な表現があるか容易に把握することができる。
本実施の形態に係る映像審査装置において、前記学習モデルは、前記審査条件に合格しないフレーム内の画像情報を出力する。
学習モデルは、審査条件に合格しないフレーム内の画像情報を出力する。例えば、映像内の画像に不適切な表現が描かれている場合、当該画像のサムネイルを出力することができる。これにより、映像内の不適切な表現を把握することができる。
本実施の形態に係る映像審査装置において、前記学習モデルは、前記審査条件に合格しないフレーム内の文字情報を出力する。
学習モデルは、審査条件に合格しないフレーム内の文字情報を出力する。例えば、映像内の音声又は文字に不適切な表現が含まれている場合、当該音声又は文字のテキストを出力することができる。これにより、映像内の不適切な表現を把握することができる。
本実施の形態に係る映像審査装置は、取得した映像が前記審査条件に合格しないと判定された場合、判定結果の信頼度に応じて、前記識別情報、画像情報又は文字情報を異なる表示態様で出力する第2出力部を備える。
第2出力部は、取得した映像が審査条件に合格しないと判定した場合、判定結果の信頼度に応じて、識別情報、画像情報又は文字情報を異なる表示態様で出力する。例えば、信頼度が高いほど、識別しやすい表示態様で識別情報、画像情報又は文字情報を出力することができる。これにより、手作業による確認作業の優先順位が分かり、作業効率を向上することができる。
本実施の形態に係る映像審査装置は、前記映像取得部で取得した映像及び前記学習モデルが出力した合否情報を修正した修正合否情報を教師データとして前記学習モデルを再学習させる学習処理部を備える。
学習処理部は、映像取得部で取得した映像及び学習モデルが出力した合否情報を修正した修正合否情報を教師データとして学習モデルを再学習させる。例えば、学習モデルが審査合格と判定した映像に不適切な表現が含まれていた場合、あるいは学習モデルが審査不合格と判定した映像に不適切な表現が含まれていない場合、学習モデルが出力した合否情報を修正して学習モデルを再度学習させることができる。これにより、学習モデルの判定精度を更に高めることができる。
本実施の形態に係る情報処理装置は、表示画面を備える情報処理装置であって、複数の広告代理店毎に入稿された映像が所定の審査条件に合格するか否かの合否情報の一覧を表示する表示処理部を備える。
表示処理部は、複数の広告代理店毎に入稿された映像が所定の審査条件に合格するか否かの合否情報の一覧を表示する。これにより、複数の広告代理店毎に取得した複数の映像のうち、手作業による確認作業を必要とする映像と必要でない映像とを区別することができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る情報処理装置において、前記表示処理部は、前記映像が前記審査条件に合格しないと判定された場合、前記複数の広告代理店毎に判定結果の信頼度を表示する。
表示処理部は、映像が審査条件に合格しないと判定された場合、複数の広告代理店毎に判定結果の信頼度を表示する。例えば、不合格判定の信頼度(確率)が低い場合には、広告用の映像に不適切な表現が含まれている可能性は低いとして手作業による審査業務を省略することができ、広告用の映像の審査時間を短縮化することができる。また、不合格判定の信頼度が高い場合には、広告用の映像に不適切な表現が含まれている可能性が高いとして、当該映像に集中して確認作業を行うことができ、広告用の映像の審査時間を短縮化することができる。
本実施の形態に係る情報処理装置は、所定の操作を受け付ける受付部を備え、前記表示処理部は、前記操作を受け付けた場合、前記映像を構成する複数のフレームのうち前記審査条件に合格しないフレームを識別する識別情報を表示する。
受付部は、所定の操作を受け付ける。所定の操作は、例えば、入稿された映像が所定の審査条件に合格するか否かの合否情報の一覧が表示された場合、当該一覧のうち、さらに詳細に合否の内容を確認するための操作とすることができる。
表示処理部は、当該操作を受け付けた場合、映像を構成する複数のフレームのうち審査条件に合格しないフレームを識別する識別情報を表示する。映像の長さ、フレームレートは予め設定されているので、審査条件に合格しないフレーム(連続する複数のフレームでもよい)が分かれば、例えば、映像の開始から何秒後のフレームに不適切な表現があるか容易に把握することができる。これにより、審査に合格しない不適切な表現が含まれるフレームを容易に確認することができる。
本実施の形態に係る情報処理装置において、前記表示処理部は、前記識別情報で識別されたフレームが前記審査条件に合格しない理由を示す情報を表示する。
表示処理部は、識別情報で識別されたフレームが審査条件に合格しない理由を示す情報を表示する。理由は、例えば、画像の中に広告表現上、不適切な描画が含まれている場合、どのような描画であるかを示す文言とすることができ、音声又は文字の中に不適切な言葉が含まれている場合、当該言葉とすることができる。
本実施の形態に係る情報処理装置は、取得した映像が前記審査条件に合格すると判定された場合、前記映像を入稿した広告代理店に対して審査合格を通知する通知部を備える。
通知部は、取得した映像が審査条件に合格すると判定された場合、当該映像を入稿した広告代理店に対して審査合格を通知する。例えば、学習モデルが、合格判定の確率が所定の閾値以上の審査合格を出力した場合、映像の内容を手作業で確認することなく、広告代理店に審査合格を通知することがでるので、作業効率を向上することができる。