TW202414228A - 資訊處理裝置、資訊處理方法及資訊處理程式 - Google Patents

資訊處理裝置、資訊處理方法及資訊處理程式 Download PDF

Info

Publication number
TW202414228A
TW202414228A TW112125998A TW112125998A TW202414228A TW 202414228 A TW202414228 A TW 202414228A TW 112125998 A TW112125998 A TW 112125998A TW 112125998 A TW112125998 A TW 112125998A TW 202414228 A TW202414228 A TW 202414228A
Authority
TW
Taiwan
Prior art keywords
program
programs
past
information processing
broadcast
Prior art date
Application number
TW112125998A
Other languages
English (en)
Inventor
岸本渉
由子
遠藤研
余根田耕
Original Assignee
日商電通股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商電通股份有限公司 filed Critical 日商電通股份有限公司
Publication of TW202414228A publication Critical patent/TW202414228A/zh

Links

Images

Abstract

提供一種能夠將在對象節目之收視率預測中所使用的相關節目以高精確度來作抽出之資訊處理裝置、資訊處理方法及資訊處理程式。本揭示之其中一個態樣之資訊處理裝置(30),係具備有取得部(31)和抽出部(32)以及預測部(33)。取得部(31),係取得過去節目,該過去節目,係成為在對象節目之收視率預測中所使用的相關節目之候補。抽出部(32),係基於過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從過去節目之中而抽出相關節目。預測部(33),係使用相關節目來預測對象節目之收視率。

Description

資訊處理裝置、資訊處理方法及資訊處理程式
本揭示,係有關於資訊處理裝置、資訊處理方法及資訊處理程式。
例如,在專利文獻1中,係記載有一種將在播送媒體中所播送的廣告時段最佳化之廣告時段最佳化系統。廣告時段最佳化系統,係具備有高度收視率預測裝置(SHARE)。高度收視率預測裝置(SHARE),係構成為以較特定之精確度而更高之精確度來預測目標收視率及/或輸入第3方機關即時性進行測定之收視率資料,並將廣告時段之預測收視率資料及/或緊接於播送之前之收視率資料送訊至目標實際最佳化裝置(TAOS)處。 [先前技術文獻] [專利文獻]
[專利文獻1] 國際公開第2018/131576號
[發明所欲解決之課題]
然而,包含專利文獻1之先前技術,在以高精確度來將在對象節目之收視率預測中所使用的相關節目抽出之觀點上,係仍存在有改良的餘地。
因此,本揭示,係以「提供一種能夠將在對象節目之收視率預測中所使用的相關節目以高精確度來作抽出之資訊處理裝置、資訊處理方法及資訊處理程式」一事,作為其中一個目的。 [用以解決課題之手段]
本揭示之其中一個態樣之資訊處理裝置,係具備有:取得部,係取得過去節目,該過去節目,係成為在對象節目之收視率預測中所使用的相關節目之候補;和抽出部,係基於前述過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從前述過去節目之中而抽出前述相關節目。 [發明的效果]
若依據本揭示之其中一個態樣,則係可提供一種能夠將在對象節目之收視率預測中所使用的相關節目以高精確度來作抽出之資訊處理裝置、資訊處理方法及資訊處理程式。
例如,在電視播送中,係作為廣告而播送有商業訊息(CM:Commercial Message)。在電視CM中,係能夠藉由以聲音和影像來反覆地傳達訊息,而對於視聽者賦予相關於商品或服務等之印象。
電視CM,通常,係藉由將「由身為媒體公司之電視台作為廣告空間所提供的媒體時段」對於廣告公司或廣告主進行販售的媒體時段交易,來作流通。電視CM,係被大致區分為時間CM(time CM)以及檔次CM(spot CM)。
時間CM,係為由廣告主來負擔節目製作費等並以此作為交換來在節目之時間內所播送之CM(以被與節目一體性地作買賣的時段所播送之CM)。時間CM,係亦可被稱作為節目訊息(program commercial)、節目CM、提供CM等。
檔次CM,係指並不提供節目地而主要在節目與節目之間的時間中所被播送之CM(在電視台所制定的CM時段中所被播送之CM)。檔次CM,係被區分成在節目與節目間所被播送的插播(SB:Station Break)、被插入至節目內但是並不附加提供者之顯示的參與(PT:Participation)(或者是參與式CM)等。
於此,電視CM之成本算出,係藉由包含有對象節目之收視率(預測收視率)的計算式而被進行。例如,檔次CM規劃,係以總收視率(GRP:Gross Rating Point)單位來進行。每1GRP的成本,係被稱作百分比成本。一般而言,於各出稿形態(例如,倒L型、每天型、日文「ヨ」字型、日文「コ」字型、一字型、深夜型、每天白天型等)之各者中,百分比成本係互為相異。在選擇了某一出稿形態的情況時之檔次CM之費用,係亦可基於GRP×百分比成本而被算出。
又,對象節目之預測收視率,係使用與對象節目相關連之相關節目(例如,連續劇之直到前一集為止的播送、特別節目之直到前一次為止之播送等)的收視率而被求取出來。因此,本發明者,係為了將在對象節目之收視率預測中所使用的相關節目以高精確度來作抽出,而想到了具備有以下之構成的資訊處理裝置(收視率預測裝置)。
亦即是,本揭示之其中一個態樣之資訊處理裝置(收視率預測裝置),係具備有:取得部,係取得過去節目,該過去節目,係成為在對象節目之收視率預測中所使用的相關節目之候補;和抽出部,係基於前述過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從前述過去節目之中而抽出前述相關節目。
以下,參考所添附之圖面,針對本揭示之實施形態作詳細說明。在以下之說明中,針對相同之部分,係附加相同之元件符號。相同之部分,由於其名稱、功能等係為相同,因此係並不反覆進行詳細之說明。
圖1,係為對於包含有其中一個實施形態之資訊處理裝置(收視率預測裝置)之系統的概略構成之其中一例作展示之圖。系統1,係具備有成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置、收視率管理裝置)30。成本算出裝置10與播送發佈裝置20以及資訊處理裝置30,係經由網路40而被可相互通訊地作連接。
成本算出裝置10,例如,係算出電視CM之成本。成本算出裝置10,係基於包含有「插入電視CM之對象節目」之收視率(預測收視率)的計算式,來算出電視CM之成本。
成本算出裝置10,例如,係取得在某一播送台(係亦可稱作頻道)之特定之期間(例如,一星期間)的檔次CM之各出稿形態的個別之成本。於此,在本揭示中之成本,係亦可為指代表每收視率1GRP(1%)之費用的百分比成本(Cost Per Rating)。出稿形態,係亦可包含有既存之(任意之)出稿形態(例如,倒L型、每天型、日文「ヨ」字型、日文「コ」字型、一字型、深夜型、每天白天型等)。又,成本算出裝置10,係亦可基於從外部而來之輸入(例如,由播送台所進行之設定),來取得關於各出稿形態之成本、構成出稿形態之時間帶等。
成本算出裝置10,係亦可取得(例如,受訊)用以進行成本算出之資訊。例如,成本算出裝置10,係亦可從資訊處理裝置30,而取得(收訊)關連於各廣告時段之收視率之資訊(例如,世代收視率、個別收視率、身為個人全體收視率並且為將即時收視與直到播送後之第7天為止的時光平移(time shift)收視作了加算的收視率(亦可稱作「All&P+C7(Program+Commercial 7)」等)。成本算出裝置10,例如,係亦可基於由播送台所致之A時間之1個廣告之單價之設定、和從資訊處理裝置30所取得之收視率之資訊,來導出A時間之1個時段的成本。於此,所謂「從資訊處理裝置30所取得的收視率之資訊」,係亦可相當於「插入電視CM之對象節目之收視率(預測收視率)」。
成本算出裝置10,係可為行動電話、智慧型手機、平板型終端等之攜帶終端(移動通訊終端),亦可為個人電腦(PC:Personal Computer)、伺服器等之固定通訊終端。亦即是,在本揭示中之成本算出裝置10,係亦可稱作通訊裝置。又,成本算出裝置10,係亦可透過有線及/或無線(例如,LTE(Long Term Evolution)、NR(New Radio)、Wi-Fi(註冊商標)等),來與網路(網際網路等)進行通訊。
播送發佈裝置20,係為對於電視(TV:television)而發佈播送之裝置。於此,電視(電視收像機),係亦可身為具備有受訊地上波播送、由播送衛星(BS:Broadcasting Satellite)/通訊衛星(CS:Communications Satellite)所致之播送、網際網路播送(網際網路電視)等之至少其中一者的功能之裝置。例如,電視,係亦可為多功能電視、智慧型TV、IP(Internet Protocol)TV、機上盒等。另外,播送,係指以經由公眾而直接被受訊一事作為目的的電性通訊之送訊,而亦可包含無線播送、網際網路播送等。
資訊處理裝置30,係為對於在電視上而被播送的節目之實際的收視率進行統計之裝置。又,資訊處理裝置30,係為對於在電視上而將要被播送的節目(對象節目)之收視率進行預測之裝置。收視率,係亦能夠以特定之時間單位(例如,秒、分鐘、小時)而被作記憶。資訊處理裝置30,係亦可經由網路來對於其他之裝置(例如,成本算出裝置10)而送訊關連於收視率之資訊(例如,將電視CM作插入的對象節目之收視率(預測收視率))。
資訊處理裝置30,例如係亦可身為由電視收視率調查者所管理之裝置。資訊處理裝置30,係亦可從被與特定之世代(例如,協助調查世代)之電視作連接的測定機器而取得收視履歷之資料並作管理。另外,係亦可根據該資料而算出或預測收視率。在資訊處理裝置30中,係亦可記錄有各特定之標的(符合特定之屬性的使用者)之收視率(標的之個人收視率)。另外,在本揭示中,所謂標的,係想定為在市場調查之領域中所使用的性別、年齡層區分(C(孩童,Child)層、T(青少年,Teen)層、M(男性,Male) 1-M3層、F(女性,Female)1-F3層),但是,係並不被限定於此分類。
資訊處理裝置30,係使用對於巨量資料(big data)作處理之新的分析手法,來構成為能夠以高精確度來對於電視之「收視者的廣告收視率」作預測。資訊處理裝置30,係能夠具備有輸入資料源頭資訊之資料輸入部、和對於從資料輸入部所輸入之資料源頭資訊施加特定之加工處理而將資料源頭資訊作說明變數化之說明變數化部、和將特定之演算法之程式作安裝之程式安裝、實行部、以及將由程式安裝、實行部所得到的結果作輸出之資料輸出部。使用從資料輸入部所輸入之資料源頭資訊和藉由說明變數化部而進行說明變數化所得到的說明變數,來實行程式安裝、實行部所安裝的程式之演算法,並將實行演算法所得到的預測收視率資料從輸出部來作輸出,而能夠基於所輸出的預測收視率資料來將廣告時段作最佳化。於此,作為用以算出將電視CM作插入的對象節目之收視率(預測收視率)之資料源頭資訊,係可使用與對象節目相關連之相關節目(例如,連續劇之直到前一集為止的播送、特別節目之直到前一次為止之播送等)的收視率。
另外,該系統構成係僅為其中一例,而並不被限定於此。例如,各裝置,在圖1中雖係設為各被包含有1個的構成,但是各機器之數量係並不被限定於此,而亦可存在有複數。系統1,係亦可設為並不包含一部分的裝置之構成,亦可設為藉由複數之裝置來實現1個的裝置之功能的構成。相反的,係亦可設為藉由1個的裝置來實現複數之裝置之功能的構成。例如,係亦可將成本算出裝置10和播送發佈裝置20以及資訊處理裝置30之至少2個,安裝於1個的伺服器上。
圖2,係為對於資訊處理裝置(收視率預測裝置)30之內部構成之其中一例作展示之功能區塊圖。資訊處理裝置30,係具備有取得部31和抽出部32以及預測部33。本揭示之資訊處理方法及資訊處理程式,係藉由使在資訊處理裝置30(取得部31、抽出部32、預測部33)中所包含的電腦實行特定之處理步驟,而被實現。
取得部31,係取得過去節目,該過去節目,係成為在對象節目之收視率預測中所使用的相關節目之候補。取得部31,係能夠並不設置時間性、內容性之限制地而取得成為相關節目之候補之所有的過去節目。
抽出部32,係限縮為取得部31所取得的過去節目之中之「在直到對象節目之播送日期時間之特定時間為止所被播送的節目」,並將此作抽出。抽出部32,例如,在求取「對象節目之播送日期之3天前的預測收視率」的情況時,係限縮為「在直到對象節目之4天前為止所被播送的過去節目」。另外,在系統之安裝時,係能夠使用在預測時間點處所能夠取得之所有的過去節目。又,關於求取對象節目之預測收視率的時期,係存在有自由度,而可進行各種之設計變更。進而,係亦可並不進行與求取對象節目之預測收視率的時期相對應之過去節目之限縮。
抽出部32,係基於過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從過去節目之中而抽出在對象節目之收視率預測中所使用之相關節目。過去節目之播送台、播送日期時間、節目名稱以及節目內容,例如,係可根據VIDEO RESEARCH將OA(on air)結束後之節目名稱、播送分鐘數、播送開始時間、播送日期、播送台名稱等作了資料庫化之VR節目資訊來得到之。又,過去節目之播送台、播送日期時間、節目名稱以及節目內容,例如,係可根據身為「WIREACTION股份有限公司在電視播送的OA(on air)之後,經由獨有的輸入介面來對於在節目中所介紹的企業或商品、店鋪、樂曲、出場者等之實際播送了的內容進行收錄並製作的資料庫」之電視後設資料來得到之。
電視後設資料,係可包含有EPG(電子節目導引,Electronic Program Guide)節目資訊和EPG事先閱覽數量。EPG節目資訊,係為播送台之官方節目資訊,並為Interactive Program Guide(IPG)股份有限公司從全國的播送台來直接獲取節目之相關資訊並對於此資料作了統籌管理者。具體而言,係包含有節目名稱、播送日期時間、節目概要、節目詳細內容、範疇、頻道辨識ID、節目辨識ID等。進而,當對於EPG電子節目導引而在電腦之網頁上進行閱覽或者是在行動智慧型手機之應用程式上進行閱覽時,於最初的顯示階段中,係成為能夠對於電子節目導引之全體(=時間表)進行閱覽的形態,但是,藉由從此階段起而進行節目個別之欄的選擇(點擊等),係能夠對於節目內容的詳細內容進行閱覽。針對在節目播送前而對於此節目之個別的詳細頁面進行了何種程度的存取一事進行了統計之數量,係為EPG事先閱覽數量。
抽出部32,係基於對象節目與過去節目之播送台是否為同一台,來從過去節目之中而抽出相關節目。例如,抽出部32,係從過去節目之中,將與對象節目同一播送台之節目,作為相關節目之候補而作抽出。另一方面,就算是播送台有所相異,也會有在過去節目之中而包含有相關節目的可能性(例如,像是職業棒球或者是東京馬拉松等一般之會在各次而改變播送台之節目,係會有變得無法相互附加關連性的情況),因此,抽出部32,係亦可就算是對象節目與過去節目之播送台為相異,亦仍將該播送台為相異之過去節目作為相關節目之候補而使其殘留。亦即是,抽出部32,係亦可並非構成為僅基於對象節目與過去節目之播送台是否為同一台一事便將過去節目之中之相關節目之候補捨棄(係亦可將對象節目與過去節目之播送台是否為同一台一事作為輔助性之基準)。
抽出部32,係基於在對象節目與過去節目之播送日中是否存在有特定之共通事項、以及對象節目與過去節目之開始時刻、結束時刻、播送分鐘數是否為同一或者是落於特定範圍中,來從過去節目之中而抽出相關節目。
例如,抽出部32,係將「對象節目與過去節目之播送日乃是一個星期中之同一天、或者是年份為相異之相同之月、日(例如,每年的元旦或除夕等)」一事,認識為特定之共通事項,並從過去節目之中,將與對象節目具有特定之共通事項者作為相關節目之候補而作抽出。
例如,抽出部32,當對象節目與過去節目之開始時刻、結束時刻、播送分鐘數之至少其中一者係為同一的情況時,係從過去節目之中,而將開始時刻、結束時刻、播送分鐘數之至少其中一者為與對象節目同一之節目,作為相關節目之候補而作抽出。或者是,抽出部32,係以對象節目之開始時刻、結束時刻、播送分鐘數作為基準,來從過去節目之中,而將落於對象節目之開始時刻、結束時刻、播送分鐘數之特定範圍中之節目,作為相關節目之候補而作抽出。例如,在以開始時刻作為基準的情況時,係亦可將在對象節目之開始時刻之前後2小時以內而被開始的過去節目,作為相關節目之候補而作抽出。又,在以結束時刻作為基準的情況時,係亦可將在對象節目之結束時刻之前後2小時以內而被結束的過去節目,作為相關節目之候補而作抽出。又,在以播送分鐘數作為基準的情況時,係亦可將播送分鐘數為收斂於對象節目之播送分鐘數之特定之相對值中的過去節目,作為相關節目之候補而作抽出。例如,當對象節目之播送分鐘數係為60分鐘,而特定之相對值係為0.6~1.6的情況時,係亦可將播送分鐘數為收斂於36分鐘~96分鐘的過去節目,作為相關節目之候補而作抽出。
抽出部32,係基於用以將對象節目與過去節目之節目名稱編輯為同一之文字列所需要的編輯量是否有超過特定之編輯量,來從過去節目之中而抽出相關節目。抽出部32,係能夠使用身為代表「為了將原本之文字列設為比較對象之文字列,係需要進行幾次之編輯」的指標之「編輯距離」,來從過去節目之中而抽出相關節目。
圖3,係為對於基於編輯距離所進行的相關節目之抽出之其中一例作展示之圖。在圖3之例中,係對於從2019年12月31日之23點45分起直到2020年1月1日之0點45分所播送的『○○○○○倒數計時2019-2020[從△△△△△而現場轉播!][字幕]』之節目名稱的播送與從2016年12月31日之23點45分起直到2017年1月1日之0點45分所播送的『○○○○○倒數計時2016-2017[一年一次!£££££大集合!』之節目名稱的播送作比較。作為前置處理,係將被括弧[ ]所包圍之文字列刪除,並且將[字幕]或[電影]等之標籤刪除。藉由此前置處理,『○○○○○倒數計時2019-2020[從△△△△△而現場轉播!][字幕]』之文字列係被變換為『○○○○○倒數計時2019-2020』,『○○○○○倒數計時2016-2017[一年一次!£££££大集合!』之文字列係被變換為『○○○○○倒數計時2016-2017』。若是對於變換後之文字列作比較,則前者之文字列的西元曆部分之『201<9>-20<2><0>』與後者之文字列之西元曆部分之『201<6>-20<1><7>』之3個文字係有所相異。故而,兩者之編輯距離係成為3。
作為基於編輯距離所進行的相關節目之判定的規則之其中一例,係可考慮有以下之規則。係可構成為:當前置處理後之節目名稱係為未滿20個字的情況時,係將編輯距離為2以內並且為最小之節目,判定為相關節目,當前置處理後之節目名稱係為20個字以上的情況時,係針對節目名稱之開頭之20個字,而將編輯距離為3以內並且為最小之節目,判定為相關節目。圖3之『○○○○○倒數計時2019-2020』與『○○○○○倒數計時2016-2017』由於係為21個字,因此,若是基於後者之規則來進行判定,則由於針對節目名稱之開頭之20個字,係身為編輯距離為3以內並且為最小之節目,因此,係判定為具有對象節目與相關節目之關係。當然的,於此所述之基於編輯距離所進行的相關節目之判定的規則,係僅為其中一例,而可進行各種之設計變更。又,例如,當在節目名稱中存在有代表重播之[重播]之標籤的情況時,係亦可於存在有[重播]之標籤的過去節目之中而尋找相關節目,另一方面,當在節目名稱中係並不存在有[重播]之標籤的情況時,係亦可於並不存在有[重播]之標籤的過去節目之中而尋找相關節目。
圖4,係為對於基於對象節目與過去節目之播送台、播送日期、開始時刻、結束時刻、節目名稱所進行的相關節目之抽出之其中一例作展示之圖。
在圖4中,作為對象節目,係例示有播送台為A、播送日期為2019年○月○日、開始時刻為21點、結束時刻為22點、節目名稱為XXXXX之節目。又,在圖4中,作為成為相關節目之候補之過去節目,係例示有播送台為A、播送日期為2017年△月△日、開始時刻為21點、結束時刻為22點、節目名稱為YYYYY之節目、以及播送台為B、播送日期為2016年£月£日、開始時刻為21點、結束時刻為22點、節目名稱為ZZZZZ之節目。
抽出部32,係基於對象節目與過去節目之播送台、播送日期、開始時刻、結束時刻、節目名稱之一致程度和相關性,來從過去節目之中而抽出相關節目。抽出部32所抽出的相關節目,由於係身為為了以高精確度來對於對象節目之收視率進行預測而作了最佳化者,因此,係成為能夠將對象節目之收視率之預測值(身為3天前預測值之●●●%)與對象節目之收視率之實測值(▲▲▲%)之間的差分(預測-實際差距¢¢¢%)縮至極小。
抽出部32,係使用BERT(基於變換器的雙向編碼器表示技術,Bidirectional Encoder Representations from Transformers),來將對象節目與過去節目之節目名稱、節目概要、節目詳細內容作向量化,並基於向量化後的對象節目與過去節目之餘弦類似度,來從過去節目之中而抽出相關節目。亦即是,係針對節目名稱、節目概要、節目詳細內容之文本(text)詳細地進行解析,並基於所出現的詞彙和意義內容之一致程度和相關性,來從過去節目之中而抽出相關節目(文章之向量化)。BERT,係針對翻譯、文書分類、質問回答等之自然語言處理任務而言為優秀,並且被組入有稱作Transformer之架構(architecture),而能夠藉由針對文章而從雙方向(文章開頭與文章末尾)來進行學習,而實現「讀取出文脈」一事。
圖5,係為對於基於BERT所進行的相關節目之抽出之第1例作展示之圖。如同在圖5中所示一般,係針對對象節目與過去節目之各者,而將節目名稱之文本(於此,係為○○○○○・・・)轉換為節目名稱之768維之向量,並將節目概要之文本(於此,係為△△△△△・・・)轉換為節目概要之768維之向量,並且將節目詳細內容之文本(於此,係為£££££・・・)轉換為節目詳細內容之768維之向量。
圖6,係為對於基於BERT所進行的相關節目之抽出之第2例作展示之圖。在圖6中,係求取出了「對象節目之節目名稱之文本(於此,係為○○○○○・・・)之向量化資料」與「成為相關節目之候補的過去節目之節目名稱之文本(於此,係為●●●●●・・・)之向量化資料」之間的節目名稱餘弦類似度(於此,係為0.99954)。又,係求取出了「對象節目之節目概要之文本(於此,係為△△△△△・・・)之向量化資料」與「成為相關節目之候補的過去節目之節目概要之文本(於此,係為▲▲▲▲▲・・・)之向量化資料」之間的節目概要餘弦類似度(於此,係為0.97011)。又,係求取出了「對象節目之節目詳細內容之文本(於此,係為£££££・・・)之向量化資料」與「成為相關節目之候補的過去節目之節目詳細內容之文本(於此,係為¢¢¢¢¢・・・)之向量化資料」之間的節目詳細內容餘弦類似度(於此,係為0.98688)。另外,在圖6中,雖係將成為相關節目之候補的過去節目僅作1個的例示,但是,實際上,例如,係算出有「基於播送台、開始時刻、結束時刻、播送分鐘數等而作了限縮的所有的過去節目(驗證節目)」之餘弦類似度。餘弦類似度,係有著「若是其之值越大,則與對象節目之間之類似度為越高,若是其之值越小,則與對象節目之間之類似度為越低」之意義。
從成為對象節目之候補的過去節目之群之中,針對節目名稱向量、節目概要向量、節目詳細內容向量之各者,而將與對象節目之間之餘弦類似度為高者抽出,並算出排名(ranking)。之後,例如,基於以下之基準,來從過去節目之群之中而抽出相關節目。 (1)將「與對象節目之間之餘弦類似度之排名係為第1名並且餘弦類似度係為0.99以上」之過去節目,作為相關節目而作抽出。當節目名稱向量、節目概要向量、節目詳細內容向量之餘弦類似度為相異的情況時,係以節目名稱向量之餘弦類似度為優先。 (2)針對節目名稱向量、節目概要向量、節目詳細內容向量之餘弦類似度之各者,而分別設定臨限值。當餘弦類似度並未超過臨限值之項目為存在有2個以上的情況時,並不將該過去節目作為相關節目而抽出。當餘弦類似度有超過臨限值之項目為存在有2個以上的情況時,將該過去節目作為相關節目而抽出。作為其中一例,係可將節目名稱向量之餘弦類似度之臨限值設定為0.97,並將節目概要向量之餘弦類似度之臨限值設定為0.98,並且將節目詳細內容向量之餘弦類似度之臨限值設定為0.99。亦即是,係能夠使節目名稱向量、節目概要向量、節目詳細內容向量之餘弦類似度之臨限值有所相異。 (3)將節目名稱向量、節目概要向量、節目詳細內容向量之餘弦類似度之總計的排名為成為第1名之過去節目,作為相關節目而作抽出。
預測部33,係使用抽出部32所抽出的相關節目,來預測對象節目之收視率。更具體而言,預測部33,係藉由將抽出部32所抽出的相關節目之收視率代入至特定之計算式(演算法)中,來預測對象節目之收視率。作為在對象節目之收視率預測中所使用的「抽出部32所抽出的相關節目之收視率之參數」,例如,係可列舉出節目播送時段重要因素(節目播送週、前4週平均、他台同一時段前4週平均、前一時段前4週平均、前一時段之他台同一時段前4週平均、上週之收視率等)。作為在對象節目之收視率預測中所使用的「抽出部32所抽出的相關節目之收視率以外之參數」,例如,係可列舉出節目內容重要因素(收視感受叢集、登場者資訊、關鍵字範疇(keyword category)、課題範疇(topic category)、資訊形態、人物最大權重、人物總計權重、VR節目範疇、各標的之各別的EPG事先閱覽數、他台同一時段之節目之各標的之各別的事先閱覽數等)。
預測部33所用以對於對象節目之收視率進行預測的計算式(演算法),係只要是能夠得到「成為目標之輸出」、亦即是能夠得到「高精確度之預測收視率」者,則係並不被限定於特定之演算法,但是,例如,作為該計算式(演算法),係能夠使用「隨機森林」。「隨機森林」,係為將由藉由簡單的模型來進行的弱學習機所導出的預測結果作複數之集中並進行學習的被稱作「集團學習」的手法之其中一者,並為具備有「高預測精確度」和「結果之可讀性」的機械學習之手法。在「隨機森林」中,係於個別之弱學習機中使用有「決定樹」,而可以說是在對於「決定樹」之優點有所活用的同時亦對於其之課題作了解決的手法。決定樹,係為以與軸相正交之直線來對空間進行分割,並對於各區間而分配預測值之預測手法。在決定樹中,由於係將空間作直線性的分解,因此係易於將預測結果之理由可視化,故而係廣泛使用來進行簡單之分布的資料之分析。
預測部33所預測到的對象節目之收視率,係經由網路40,來從資訊處理裝置30而被傳輸至成本算出裝置10處。成本算出裝置10,係基於所被傳輸而來之對象節目之預測收視率(例如將每1GRP(1%)之百分比成本作乘算),來算出被插入至對象節目中之電視CM之成本。
在上述之實施形態中所示之資訊處理裝置、資訊處理方法以及資訊處理程式,雖係針對對於電視CM作適用的例子來作了展示,但是,係並不被限定於此。本揭示之上述之實施形態,例如係亦可對於收音機CM、網際網路發佈之CM等作適用。只要是當業者,則應可因應於需要來對於上述實施形態之說明作替換並理解之。例如,在被適用於收音機CM中的情況時,係亦可將本揭示之收視率替換為收聽率。
本揭示之「GRP」,係亦可藉由其他之關連於總收視率之指標來作替換。
另外,本揭示,係亦涵蓋有將「收視率」替換為特定之指標(或者是特定之指標之提升程度、偏位等)的內容。該特定之指標,係亦可為用以對於廣告效果作判斷之指標、用以使廣告主之重要業績指標(KPI:Key Performance Indicators)提升之中間性指標等,例如,係亦可包含有認知率、廣告的到達力、ROAS(Return On Advertising Spend)、ROI(Return on Investment)等。係亦可將「收視率」之記載的至少一部分替換為上述特定之指標之任一者。
圖7,係為對於成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之功能構成之其中一例作展示之圖。如同在圖7中所示一般,成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30,係具備有控制部110、和記憶部120、和通訊部130、和輸入部140、以及輸出部150。另外,在圖7中,係對於成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之功能區塊的其中一例作展示,而亦可具備有在圖7中所並未作描繪之其他之功能區塊。又,係亦可設為並不包含有一部分的功能區塊之構成。
控制部110,係實施成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之控制。控制部110,係可藉由基於在本發明之技術領域中的共通認識所說明的控制器、控制電路或控制裝置來構成之。
記憶部120,係將在成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30處所利用之資訊作記憶。記憶部120,例如係可藉由基於在本發明之技術領域中的共通認識所說明的記憶體、儲存裝置、記憶裝置等來構成之。
通訊部130,係實施成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之通訊(例如兩者之相互通訊)。通訊部130,係可藉由基於在本發明之技術領域中的共通認識所說明的傳輸器/接收器、送收訊電路或送收訊裝置來構成之。另外,通訊部130,係亦可由送訊部以及收訊部來構成。
輸入部140,係受理在成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30處之輸入。又,輸入部140,係亦可被與特定之機器、記憶媒體等作連接,並受理資料之輸入。輸入部140,係亦可將輸入結果例如對於控制部110作輸出。輸入部140,係可藉由基於在本發明之技術領域中的共通認識所說明的鍵盤、滑鼠、按鍵等之輸入裝置、輸入輸出端子、輸入輸出電路等來構成。又,輸入部140,係亦可設為與顯示部成為了一體之構成(例如,觸控面板)。
輸出部150,係進行在成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30處之輸出。例如,輸出部150,係亦可包含有顯示畫像之顯示部、輸出聲音之聲音輸出部等,而構成之。顯示部,例如,係可藉由基於在本發明之技術領域中的共通認識所說明的顯示器、螢幕等之顯示裝置來構成。又,聲音輸出部,例如,係可藉由基於在本發明之技術領域中的共通認識所說明的揚聲器等之輸出裝置來構成。
另外,在上述實施形態之說明中所使用的區塊圖,係對於功能單位之區塊作展示。此些之功能區塊(構成部),係藉由硬體及/或軟體之任意之組合而被實現。又,各功能區塊之實現手段係並未特別作限定。亦即是,各功能區塊,係可藉由物理性地作了結合的1個的裝置來實現,亦可將物理性地相互分離之2個以上的裝置藉由有線或無線來作連接,並藉由此些之複數之裝置來實現。
例如,在本揭示之其中一個實施形態中之裝置(成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30),係亦可作為進行本揭示之資訊處理(收視率預測處理)的電腦來起作用。圖8,係為對於成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之硬體構成之其中一例作展示之圖。上述之成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30,物理性而言,係亦可作為包含有處理器1001、記憶體1002、儲存裝置1003、通訊裝置1004、輸入裝置1005、輸出裝置1006、匯流排1007等的電腦裝置而構成之。
另外,在本揭示中,裝置、電路、元件、單元、伺服器等,係可相互作替換。成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之硬體構成,係亦能夠以將圖中所示之裝置作1個或複數之包含的方式來構成,亦可並不包含一部分之裝置地來構成。
例如,處理器1001,雖係僅圖示有1個,但是,係亦可為複數之處理器。又,處理,係可藉由1個的處理器而被實行,亦可將處理同時地、逐次地或者是使用其他之手法地而藉由2以上的處理器來實行。另外,處理器1001,係亦可藉由1以上之晶片而被作安裝。
在成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30之中之各功能,係藉由在處理器1001、記憶體1002等之硬體上而讀入特定之軟體(程式),來使處理器1001進行演算,並對於由通訊裝置1004所致之通訊、在記憶體1002以及儲存裝置1003處之資料之讀出及/或寫入等作控制,來實現之。
處理器1001,例如,係使作業系統動作並對於電腦全體作控制。處理器1001,係亦可藉由包含有與周邊裝置之間之介面、控制裝置、演算裝置、暫存器等的中央處理裝置(CPU:Central Processing Unit),來構成之。另外,上述之控制部110等之各部,係亦可藉由處理器1001來實現之。
又,處理器1001,係將程式(程式碼)、軟體模組、資料等從儲存裝置1003以及通訊裝置1004之至少其中一方而讀出至記憶體1002處,並且依循於該些而實行各種之處理。作為程式,係使用有使電腦實行在上述之實施形態中所作了說明的動作之至少一部分之程式。例如,控制部110,係亦可藉由被儲存在記憶體1002中並於處理器1001處而動作的控制程式來實現,關於其他之功能區塊,係亦可同樣地被實現。
記憶體1002,係為電腦可讀取之記錄媒體,例如,係亦可藉由ROM(Read Only Memory)、EPROM (Erasable Programmable ROM)、EEPROM(Electrically EPROM)、RAM(Random Access Memory)、其他之適當之記憶媒體之至少其中一者來構成。記憶體1002,係亦可被稱作暫存器、快取、主記憶體(主記憶裝置)等。記憶體1002,係能夠保存為了實施其中一個實施形態之方法而可實行的程式(程式碼)、軟體模組等。
儲存裝置1003,係身為電腦可讀取之記錄媒體,例如,係可藉由軟碟片、Floppy(註冊商標)碟片、光磁碟片(例如,CD光碟(CD-ROM(Compact Disc ROM)等)、數位多用途碟片、Blu-ray(註冊商標)碟片)、可移除碟片、硬碟、智慧記憶卡、快閃記憶裝置(例如,card、stick、key-drive)、磁條、資料庫、伺服器、其他之適當的記憶媒體之至少其中一者,來構成之。儲存裝置1003,係亦可被稱作輔助記憶裝置。另外,上述之記憶部120,係亦可藉由記憶體1002及/或儲存裝置1003來實現之。
通訊裝置1004,係身為用以經由有線網路以及無線網路之至少其中一者來進行與電腦之間之通訊的硬體(送受訊裝置),例如係亦被稱作網路裝置、網路控制器、網路卡、通訊模組等。通訊裝置1004,係亦可包含有SIM卡。另外,上述之通訊部130,係亦可藉由通訊裝置1004來實現之。
輸入裝置1005,係身為受理從外部而來的輸入之輸入裝置(例如,鍵盤、滑鼠等)。輸出裝置1006,係身為實施對於外部之輸出的輸出裝置(例如,顯示器、揚聲器等)。另外,輸入裝置1005以及輸出裝置1006,係亦可身為成為了一體之構成(例如,觸控面板)。另外,上述之輸入部140以及輸出部150,係亦可分別藉由輸入裝置1005以及輸出裝置1006來實現之。
又,處理器1001、記憶體1002等之各裝置,係藉由用以通訊資訊之匯流排1008而被作連接。匯流排1007,係可藉由單一之匯流排來構成,亦可藉由在裝置間而為相異之匯流排來構成。
又,成本算出裝置10、播送發佈裝置20、資訊處理裝置(收視率預測裝置)30,係亦可包含有微處理器、數位訊號處理器(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD (Programmable Logic Device)、FPGA(Field Programmable Gate Array)等之硬體地而被構成,亦可藉由該硬體來實現各功能區塊之一部分或者是全部。例如,處理器1001,係亦可藉由此些之硬體之至少其中一者而被安裝。
(變形例) 另外,關於在本揭示中所作了說明的用語及/或對於本揭示之理解而言為所需要的用語,係亦能夠與具有相同或相類似之意義的用語作置換。
在本揭示中所作了說明的資訊、參數等,係可使用絕對值來作表現,亦可使用相對於特定之值之絕對值來作表現,亦可使用相對應之其他的資訊來作表現。又,在本揭示中,於參數等處所使用之名稱,係不論在任何的意義上均不應作限定性的解釋。
在本揭示中所作了說明的資訊、訊號等,係亦可使用各式各樣的相異之技術之任一者來作表現。例如,在涵蓋上述全體說明所提及的資料、命令、指令、資訊、訊號、位元、符號、碼片等,係亦可藉由電壓、電流、電磁波、磁場或磁性粒子、光場或光子、或者是此些之任意之組合,來作表現。
資訊、訊號等,係亦可經由複數之網路節點而被作輸入輸出。被作了輸入輸出之資訊、訊號等,係可被保存於特定之場所(例如,記憶體)處,亦可使用表來作管理。被作輸入輸出之資訊、訊號等,係可被作覆寫、更新或追加記載。被作了輸出的資訊、訊號等,係亦可被刪除。被作了輸入的資訊、訊號等,係亦可被對於其他之裝置作送訊。
又,特定之資訊之通知(例如「乃為X」之通知),係並不被限定於明示性之通知,而亦可被暗示性(例如,藉由並不進行該特定之資訊之通知、或者是藉由其他之資訊之通知)地進行。
軟體,係被稱作軟體、韌體、中介軟體、微程式、硬體記述語言,但是,就算是被以其他之名稱來作稱呼亦無妨,而應以代表命令、命令組、碼、碼塊、程式碼、程式、次程式、軟體模組、應用程式、軟體應用程式、軟體封裝、常式、次常式、物件、可實行檔案、實行執行緒、程序、功能等的方式來廣義作解釋。
又,軟體、命令、資訊等,係亦可經由傳輸媒體以及訊號波型之至少1者而被作送受訊。例如,軟體,當使用有線技術(同軸纜線、光纖纜線、雙絞線、數位用戶線路(DSL:Digital Subscriber Line)等)以及無線技術(紅外線、微波等)之至少一者而被從網站、伺服器或者是其他之遠端資源送訊而來的情況時,此些之有線技術以及無線技術之至少一者,係被包含於傳輸媒體之定義內。
在本揭示中所使用之「系統」以及「網路」之用語,係可被互換性地作使用。
在本揭示中所作了說明的各態樣/實施形態,係可單獨作使用,亦可組合並作使用,亦可伴隨著實行而作切換使用。又,在本揭示中所作了說明的各態樣/實施形態之處理程序、序列、流程等,只要是不會發生矛盾,則係亦可將順序作替換。例如,關於在本揭示中所作了說明之方法,係使用例示性之順序而提示有各種的步驟之要素,而並不被限定於所提示了的特定之順序。
在本揭示中所使用的「基於」之記載,只要並未另外作明確記載,便並非為代表「僅基於」。換言之,「基於」之記載,係代表「僅基於」以及「至少基於」之雙方。
關於針對使用有在本揭示中所使用的「第1」、「第2」等之稱呼之要素的任何之參照,亦完全並不對於該些之要素的量或順序作任何之限定。此些之稱呼,係可作為對於2個以上的要素之間作區分之便利之方法,而在本揭示中作使用。故而,第1以及第2要素之參照,係並不代表只能夠採用2個的要素或者是必須要以某些之形態來使第1要素先行於第2要素。
在本揭示中,當使用有「包含(include)」、「包含有(including)」以及此些之變形的情況時,此些之用語,係與用語「具備(comprising)」相同的,而代表「包括性地」。進而,在本揭示中所使用之用語「或(or)」,係代表並非為排他性邏輯和。
在本揭示中,例如當起因於翻譯而追加有像是英語中之a, an以及the一般之冠詞的情況時,本揭示係亦可包含有接續於此些之冠詞之後的名詞乃為複數形的情形。
以上,雖係針對本揭示之發明作了詳細說明,但是,對於同業者而言,明顯的,本揭示之發明係並不被限定於在本揭示中所說明的實施形態。本揭示之發明,係可在並不從基於申請專利範圍之記載所制定之發明之趣旨以及範圍的前提下而作為修正以及變更態樣來實施之。故而,本揭示之記載,係僅以例示說明作為目的,而並不代表對於本揭示之發明作任何之限制。
本申請案,係基於2022年7月13日所申請之日本特願2022-112231。將其內容預先全部包含於本案中。
1:系統 10:成本算出裝置 20:播送發佈裝置 30:資訊處理裝置 31:取得部 32:抽出部 33:預測部 40:網路 110:控制部 120:記憶部 130:通訊部 140:輸入部 150:輸出部 1001:處理器 1002:記憶體 1003:儲存裝置 1004:通訊裝置 1005:輸入裝置 1006:輸出裝置 1007:匯流排
[圖1]係為對於包含有資訊處理裝置(收視率預測裝置)之系統的概略構成之其中一例作展示之圖。 [圖2]係為對於資訊處理裝置(收視率預測裝置)之內部構成之其中一例作展示之功能區塊圖。 [圖3]係為對於基於編輯距離所進行的相關節目之抽出之其中一例作展示之圖。 [圖4]係為對於基於對象節目與過去節目之播送台、播送日期、開始時刻、結束時刻、節目名稱所進行的相關節目之抽出之其中一例作展示之圖。 [圖5]係為對於基於BERT所進行的相關節目之抽出之第1例作展示之圖。 [圖6]係為對於基於BERT所進行的相關節目之抽出之第2例作展示之圖。 [圖7]係為對於成本算出裝置、播送發佈裝置、資訊處理裝置(收視率預測裝置)之功能構成之其中一例作展示之圖。 [圖8]係為對於成本算出裝置、播送發佈裝置、資訊處理裝置(收視率預測裝置)之硬體構成之其中一例作展示之圖。
30:資訊處理裝置
31:取得部
32:抽出部
33:預測部

Claims (8)

  1. 一種資訊處理裝置,係具備有: 取得部,係取得過去節目,該過去節目,係成為在對象節目之收視率預測中所使用的相關節目之候補;和 抽出部,係基於前述過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從前述過去節目之中而抽出前述相關節目。
  2. 如請求項1所記載之資訊處理裝置,其中, 係更進而具備有:預測部,係使用前述相關節目來預測前述對象節目之收視率。
  3. 如請求項1或2所記載之資訊處理裝置,其中, 前述抽出部,係基於前述對象節目與前述過去節目之播送台是否為同一台,來從前述過去節目之中而抽出前述相關節目。
  4. 如請求項1或2所記載之資訊處理裝置,其中, 前述抽出部,係基於在前述對象節目與前述過去節目之播送日中是否存在有特定之共通事項、以及前述對象節目與前述過去節目之開始時刻、結束時刻、播送分鐘數是否為同一或者是落於特定範圍中,來從前述過去節目之中而抽出前述相關節目。
  5. 如請求項1或2所記載之資訊處理裝置,其中, 前述抽出部,係基於用以將前述對象節目與前述過去節目之節目名稱編輯為同一之文字列所需要的編輯量是否有超過特定之編輯量,來從前述過去節目之中而抽出前述相關節目。
  6. 如請求項1或2所記載之資訊處理裝置,其中, 前述抽出部,係使用BERT(基於變換器的雙向編碼器表示技術,Bidirectional Encoder Representations from Transformers),來將前述對象節目與前述過去節目之節目名稱、節目概要、節目詳細內容作向量化,並基於向量化後的前述對象節目與前述過去節目之餘弦類似度,來從前述過去節目之中而抽出前述相關節目。
  7. 一種資訊處理方法,係具備有: 取得成為在對象節目之收視率預測中所使用的相關節目之候補之過去節目之步驟;和 基於前述過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從前述過去節目之中而抽出前述相關節目之步驟。
  8. 一種資訊處理程式,係使電腦實行下述步驟: 取得成為在對象節目之收視率預測中所使用的相關節目之候補之過去節目之步驟;和 基於前述過去節目之播送台、播送日期時間、節目名稱以及節目內容,來從前述過去節目之中而抽出前述相關節目之步驟。
TW112125998A 2022-07-13 2023-07-12 資訊處理裝置、資訊處理方法及資訊處理程式 TW202414228A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022-112231 2022-07-13

Publications (1)

Publication Number Publication Date
TW202414228A true TW202414228A (zh) 2024-04-01

Family

ID=

Similar Documents

Publication Publication Date Title
CN101047826B (zh) 电子设备及其信息浏览方法
CN102265276B (zh) 基于上下文的推荐系统
US9693115B2 (en) Method and system for automatically determining demographics of media assets for targeting advertisements
KR100873882B1 (ko) 전자 장치, 방송 프로그램 정보의 수집 방법, 그 수집프로그램을 기록한 컴퓨터 판독가능한 기록 매체 및 그수집 시스템
EP3570241A1 (en) Advertisement slot optimization system and advertisement slot optimization method in broadcast media such as television
US10455269B2 (en) Systems and methods for automated extraction of closed captions in real time or near real-time and tagging of streaming data for advertisements
US10116982B2 (en) Systems and methods for automated extraction of closed captions in real time or near real-time and tagging of streaming data for advertisements
JP2009088777A (ja) 広告選択最適化処理装置及びその処理方法
CN104823454A (zh) 向辅助连接设备的内容推送
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN110430476A (zh) 直播间搜索方法、系统、计算机设备和存储介质
CN103218385A (zh) 服务器装置、信息终端和程序
JP2005056361A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN110248246B (zh) 数据分析方法、装置、计算机设备及计算机可读存储介质
CN106471498A (zh) 用于使用元数据和使用数据分析的过滤技术的系统和方法
US20230283821A1 (en) Data translation for video-viewing activity
US20200053409A1 (en) Systems and Methods for Automated Extraction of Closed Captions in Real Time or Near Real-Time and Tagging of Streaming Data for Advertisements
KR101140318B1 (ko) 동영상 정보에 대응되어 저장되는 상업적 태그 등의 메타정보 기반 키워드 광고 서비스 방법 및 그 서비스를 위한시스템
JP2010171713A (ja) 広告入出力装置、広告入出力方法、広告入出力プログラム、コンピュータ読取可能な記録媒体、及び録画再生装置
JP2003163949A (ja) 視聴情報収集分析システム、視聴情報収集システム、視聴者装置、視聴管理サービス装置
TW201322740A (zh) 數位化電視廣告產品資訊顯示系統、方法及其記錄媒體
TW202414228A (zh) 資訊處理裝置、資訊處理方法及資訊處理程式
JP7399225B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2022177387A (ja) 広告コンテンツ選定装置、及び広告コンテンツ選定方法
JP7487775B2 (ja) 推定装置、推定方法、およびプログラム