WO2020170837A1 - エンゲージメント推定装置、エンゲージメント推定方法及びプログラム - Google Patents

エンゲージメント推定装置、エンゲージメント推定方法及びプログラム Download PDF

Info

Publication number
WO2020170837A1
WO2020170837A1 PCT/JP2020/004566 JP2020004566W WO2020170837A1 WO 2020170837 A1 WO2020170837 A1 WO 2020170837A1 JP 2020004566 W JP2020004566 W JP 2020004566W WO 2020170837 A1 WO2020170837 A1 WO 2020170837A1
Authority
WO
WIPO (PCT)
Prior art keywords
engagement
reproduction stop
estimation
reproduction
estimated value
Prior art date
Application number
PCT/JP2020/004566
Other languages
English (en)
French (fr)
Inventor
和久 山岸
ピエール レブレトン
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/430,393 priority Critical patent/US20220174353A1/en
Publication of WO2020170837A1 publication Critical patent/WO2020170837A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion

Definitions

  • the present invention relates to an engagement estimation device, an engagement estimation method, and a program.
  • Communication services for transferring video, audio (hereinafter, also including voice), text, etc. via the Internet between terminals or between a server and a terminal are widespread.
  • the Internet is a network whose communication quality is not always guaranteed, when communicating using audio media, video media, etc., the bit rate decreases due to the narrow line bandwidth between the viewer terminal and the network, and line congestion. As a result, packet loss, packet transfer delay, and packet retransmission occur, and the quality perceived by the viewer with respect to audio media and video media deteriorates.
  • the sound quality and image quality are deteriorated due to the decrease in throughput, and a predetermined amount is stored in the buffer of the receiving terminal.
  • a playback start wait and a playback stop occur due to the buffering process that occurs because the amount of data is not accumulated.
  • the quality and engagement of the audiovisual that viewers can experience while providing the service It is important to be able to measure and monitor the quality and engagement of the audiovisual provided to the viewer.
  • ITU-T Recommendation P One of the conventional objective quality evaluation methods is ITU-T Recommendation P.
  • This technology estimates quality from packets received by a receiving terminal (smartphone or STB (Set-Top Box)) using quality parameters such as video resolution, frame rate, bit rate, playback start wait time, and playback stop time. It is a technology to do.
  • the present invention has been made in view of the above points, and an object thereof is to make it possible to estimate engagement from parameters observable in a terminal.
  • the engagement estimation device acquires a reproduction stop position when the reproduction is stopped and a duration of the reproduction stop when the reproduction of the video distributed via the network is stopped. And an estimation unit that calculates an estimated value of an index for evaluating engagement based on a characteristic that the number of viewers leaving increases as the reproduction stop position increases and the duration increases. ..
  • Engagement can be estimated from parameters that can be observed in the terminal.
  • FIG. 1 is a diagram showing a hardware configuration example of an engagement estimation device 10 according to an embodiment of the present invention.
  • the engagement estimation device 10 in FIG. 1 includes a drive device 100, an auxiliary storage device 102, a memory device 103, a CPU 104, an interface device 105, etc., which are connected to each other by a bus B.
  • a program that realizes the process in the engagement estimation device 10 is provided by a recording medium 101 such as a CD-ROM.
  • a recording medium 101 such as a CD-ROM.
  • the program is installed from the recording medium 101 to the auxiliary storage device 102 via the drive device 100.
  • the auxiliary storage device 102 stores the installed program and also stores necessary files and data.
  • the memory device 103 reads the program from the auxiliary storage device 102 and stores it when an instruction to activate the program is given.
  • the CPU 104 executes a function related to the engagement estimation device 10 according to a program stored in the memory device 103.
  • the interface device 105 is used as an interface for connecting to a network.
  • FIG. 2 is a diagram showing a functional configuration example of the engagement estimation device 10 according to the embodiment of the present invention.
  • the engagement estimation apparatus 10 estimates the engagement (viewing/leaving) that the viewer finally feels about the adaptive bit rate video distribution performed via the network, in order to estimate the quality parameter acquisition unit 11 and the engagement estimation. It has a part 12 and the like.
  • Each of these units is realized by a process that causes the CPU 104 to execute one or more programs installed in the engagement estimation device 10. That is, each of these units is realized by the cooperation of the hardware resources of the engagement estimation device 10 and the program (software) installed in the engagement estimation device 10.
  • the quality parameter acquisition unit 11 may measure a preset measurement section (for example, 1 second, 1 minute, 5 minutes, 1 hour, or the like).
  • a playback stop time playback stop duration
  • a playback Parameters relating to the viewing state of the video such as the stop position (hereinafter, collectively referred to as “quality parameters”) are acquired from, for example, an application that is playing the video.
  • the concept of the reproduction stop time includes the reproduction start waiting time (the time from the instruction to reproduce the video until the reproduction is started). This is because the reproduction stop and the reproduction start wait are common in that the reproduction is stopped for the viewer.
  • the reproduction stop position means a time indicating the reproduction position of the video when the reproduction stop occurs. For example, the reproduction stop position is 0 (second) when the reproduction start wait occurs.
  • the engagement estimation unit 12 causes a reproduction stop (including a reproduction start wait) due to exhaustion of data accumulated in a buffer of a terminal (viewer terminal) used for viewing, and when the reproduction stop ends ( That is, when the reproduction is started or restarted), the estimated value of the index for evaluating the engagement (hereinafter referred to as “viewing departure value”) based on the quality parameter acquired by the quality parameter acquisition unit 11 by the end of the reproduction stop. That is)) is calculated.
  • view leaving people the number of people who leave viewing
  • the viewing departure rate is described as an example of the viewing departure value.
  • the value of another index such as the video viewing time at the time of leaving the viewing, may be used as the viewing leaving value.
  • the engagement estimation device 10 is, for example, a computer (viewer terminal) used for viewing adaptive bit rate video distribution. Specifically, a smartphone, a tablet terminal, a PC (Personal Computer), or the like may be used as the engagement estimation device 10.
  • FIG. 3 is a flowchart for explaining an example of a processing procedure executed by the engagement estimation device 10.
  • step S101 the quality parameter acquisition unit 11 acquires the quality parameter in the immediately preceding measurement section. Step S101 is repeated until the reproduction stop occurs and the reproduction stop ends (until the reproduction is started or restarted).
  • the engagement estimation unit 12 acquires the quality parameter acquisition unit 11 by the end of the reproduction stop. A viewing-and-leaving rate is calculated based on the obtained quality parameter. (S102). Then, it returns to step S101.
  • the viewing-and-leaving rate due to the current reproduction stop is calculated.
  • the engagement estimation unit 12 calculates the viewing departure rate based on the following formula (1).
  • User. Drop A ⁇ StallDur+B ⁇ Stall. Pos+C+MOS ⁇ User. Alr. Quit (E ⁇ F ⁇ Stall.Pos) (1)
  • the meaning of each parameter is as follows.
  • Quit When playback is stopped for a plurality of times, the rate of viewing and leaving due to the playback being stopped before the playback is stopped (that is, 0 when the playback is stopped once)
  • MOS Video quality (encoding quality) immediately before the occurrence of reproduction stop, and the higher the video quality, the larger the value.
  • A, B, C, E, F Coefficients Note that User. Alr. Quit can be calculated based on the history of the viewing-and-leaving rate calculated in step S102. Further, the MOS can be calculated based on the parameters relating to the coding quality such as the resolution, the frame rate and the bit rate acquired by the quality parameter acquiring unit 11 regarding the measurement section when the reproduction stop occurs.
  • MOS is the ITU-T Recommendation P.
  • the value output by a quality estimation technique such as 1203, or the MOS may be a value calculated using other known techniques such as the method described in WO 2017/104416.
  • the value of the MOS is 0.
  • A, B, C, E, and F may be obtained by, for example, an experiment.
  • the rate of viewing and leaving when a playback stop occurs is also affected by the rate of viewing and leaving due to the previous playback stop (which occurred in the past). That is, the higher the viewing-and-leaving rate due to the playback stop that has occurred in the past, the higher the viewing-and-leaving rate at the current playback stop. Also, in the case where the reproduction stop occurs a plurality of times, the viewing-and-leaving rate is also affected by the reproduction stop position, as in the case where the reproduction stop occurs once. Further, the viewing-and-leaving rate is also influenced by the level of the video quality when the reproduction is stopped. Specifically, when the reproduction stop occurs when the quality is high in the past, the User. Since the drop has a large effect, the higher the MOS, the larger the effect in the past. These characteristics are expressed in “MOS ⁇ User.Allr.Quit (E ⁇ F ⁇ Stall.Pos)”.
  • Example 2 Stopping playback twice
  • the present embodiment it is possible to estimate the engagement from parameters observable in the terminal such as resolution, frame rate, bit rate, reproduction stop time, reproduction stop position and the like.
  • the quality parameter acquisition unit 11 is an example of an acquisition unit.
  • the engagement estimation unit 12 is an example of an estimation unit.
  • Engagement Estimating Device 11 Quality Parameter Acquisition Unit 12 Engagement Estimating Unit 100 Drive Device 101 Recording Medium 102 Auxiliary Storage Device 103 Memory Device 104 CPU 105 Interface device B bus

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Information Transfer Between Computers (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

エンゲージメント推定装置は、ネットワークを介して配信される映像の再生停止が発生した際に、前記再生停止の発生時の再生停止位置、及び前記再生停止の継続時間を取得する取得部と、前記再生停止位置が長くなるほど、かつ、前記継続時間が増加するほど視聴離脱者が増加する特性に基づいて、エンゲージメントを評価する指標の推定値を計算する推定部と、を有することで、端末内で観測可能なパラメータからエンゲージメントを推定可能とする。

Description

エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
 本発明は、エンゲージメント推定装置、エンゲージメント推定方法及びプログラムに関する。
 インターネットを介して映像、音響(以下、音声も含む)、テキストなどを端末間あるいはサーバと端末との間で転送する通信サービス(音声通信、映像通信、Web、IoT等)が普及している。
 インターネットは、必ずしも通信品質が保証されていないネットワークであるため、音声メディアや映像メディアなどを用いて通信を行う場合、視聴者端末とネットワークの回線帯域が狭いことによるビットレートの低下、回線が輻輳することによるパケット損失、パケット転送遅延、パケットの再送が発生し、音声メディアや映像メディアなどに対して視聴者が知覚する品質が劣化してしまう。
 具体的には、ネットワークのスループットの状態に応じ、音響や映像メディアのビットレートを変更しながら配信するアダプティブビットレート映像配信では、スループット低下に伴う音質・画質低下や、受信端末のバッファに所定のデータ量が蓄積されていないために発生するバッファリング処理に伴う再生開始待ちや再生停止が発生する。
 ビットレート低下、再生開始待ちや再生停止は、ユーザが体感する品質に影響するだけでなく、エンゲージメント(視聴時間、視聴許容・中断/離脱、視聴解約)に影響を与える。
 そのため、映像配信事業者が、上記のような映像通信サービスを良好な品質やエンゲージメントで提供していることを確認するためには、サービス提供中に、視聴者が体感するオーディオビジュアルの品質やエンゲージメントを測定し、視聴者に対して提供されるオーディオビジュアルの品質やエンゲージメントが高いことを監視できることが重要となる。
 したがって、視聴者が体感するオーディオビジュアル品質やエンゲージメントを適切に表現することができる品質推定技術やエンゲージメント推定技術が必要とされている。
 従来の客観品質評価法の1つに、非特許文献1に示されるITU-T勧告P.1203や非特許文献2に示される技術がある。本技術は受信端末(スマートフォンやSTB(Set-Top Box))で受信したパケットから、映像の解像度、フレームレート、ビットレート、再生開始待ち時間、再生停止時間などの品質パラメータを用いて品質を推定する技術である。
Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport, ITU-T P.1203 2.K. Yamagishi and T. Hayashi, "Parametric Quality-Estimation Model for Adaptive-Bitrate Streaming Services," IEEE Transactions on Multimedia, 2017. DOI: 10.1109/TMM.2017.2669859.
 しかしながら、映像配信事業者が、ユーザ端末内の情報を用いエンゲージメント(視聴時間、視聴許容・中断/離脱、以降、視聴離脱について記述)を監視しようとした場合には、エンゲージメント推定技術が必要であり、現状、そのような技術は存在しない。
 本発明は、上記の点に鑑みてなされたものであって、端末内で観測可能なパラメータからエンゲージメントを推定可能とすることを目的とする。
 そこで上記課題を解決するため、エンゲージメント推定装置は、ネットワークを介して配信される映像の再生停止が発生した際に、前記再生停止の発生時の再生停止位置、及び前記再生停止の継続時間を取得する取得部と、前記再生停止位置が長くなるほど、かつ、前記継続時間が増加するほど視聴離脱者が増加する特性に基づいて、エンゲージメントを評価する指標の推定値を計算する推定部と、を有する。
 端末内で観測可能なパラメータからエンゲージメントを推定可能とすることができる。
本発明の実施の形態におけるエンゲージメント推定装置10のハードウェア構成例を示す図である。 本発明の実施の形態におけるエンゲージメント推定装置10の機能構成例を示す図である。 エンゲージメント推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
 以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態におけるエンゲージメント推定装置10のハードウェア構成例を示す図である。図1のエンゲージメント推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。
 エンゲージメント推定装置10での処理を実現するプログラムは、CD-ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
 メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従ってエンゲージメント推定装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
 図2は、本発明の実施の形態におけるエンゲージメント推定装置10の機能構成例を示す図である。図2において、エンゲージメント推定装置10は、ネットワークを介して行われるアダプティブビットレート映像配信について、視聴者が最終的に感じたエンゲージメント(視聴離脱)を推定するために、品質パラメータ取得部11及びエンゲージメント推定部12等を有する。これら各部は、エンゲージメント推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。すなわち、これら各部は、エンゲージメント推定装置10のハードウェア資源と、エンゲージメント推定装置10にインストールされたプログラム(ソフトウェア)との協働によって実現される。
 品質パラメータ取得部11は、例えば、アダプティブビットレート映像配信による映像の視聴の開始が指示されると、予め設定された測定区間(例えば、1秒、1分、5分、1時間などの単位や、映像配信に用いられるチャンク/セグメント単位)ごとに、例えば、当該測定区間における解像度、フレームレート及びビットレート等の符号化品質に関するパラメータに加えて、再生停止時間(再生停止の継続時間)及び再生停止位置等の映像の視聴状況に関するパラメータ(以下、これらをまとめて「品質パラメータ」という。)を、例えば、当該映像を再生しているアプリケーション等から取得する。なお、本実施の形態において、再生停止時間の概念には、再生開始待ち時間(映像の再生が指示されてから再生が開始されるまでの時間)も含まれる。再生停止と再生開始待ちとは、視聴者にとって再生が停止している状態であるという点で共通するからである。また、再生停止位置とは、再生停止が発生した時点での映像の再生位置を示す時間をいう。例えば、再生開始待ちが発生した場合の再生停止位置は0(秒)である。
 エンゲージメント推定部12は、視聴に利用される端末(視聴者端末)のバッファに蓄積されたデータが枯渇することによる再生停止(再生開始待ちも含む。)が発生し、当該再生停止が終了すると(すなわち、再生が開始又は再開されると)、当該再生停止の終了時までに品質パラメータ取得部11によって取得された品質パラメータに基づいて、エンゲージメントを評価する指標の推定値(以下「視聴離脱値」という。)を計算する。本実施の形態では、視聴を離脱する者(以下「視聴離脱者」という。)の多さを当該指標とする。具体的には、視聴離脱率が視聴離脱値の一例として説明される。但し、視聴を離脱した時点での映像視聴時間等、他の指標の値が視聴離脱値として利用されてもよい。
 なお、エンゲージメント推定装置10は、例えば、アダプティブビットレート映像配信の視聴に利用されるコンピュータ(視聴者端末)である。具体的には、スマートフォン、タブレット端末、又はPC(Personal Computer)等がエンゲージメント推定装置10として利用されてもよい。
 以下、エンゲージメント推定装置10が実行する処理手順について説明する。図3は、エンゲージメント推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
 ステップS101において、品質パラメータ取得部11は、直前の測定区間における品質パラメータを取得する。ステップS101は、再生停止が発生し、当該再生停止が終了するまで(再生が開始又は再開されるまで)繰り返される。
 その後、視聴者端末のバッファが枯渇して再生停止が発生し、当該再生停止が終了すると(S102でYes)、エンゲージメント推定部12は、当該再生停止の終了時までに品質パラメータ取得部11によって取得された品質パラメータに基づいて視聴離脱率を計算する。(S102)。続いて、ステップS101に戻る。
 図3の処理手順によれば、再生停止が発生するたびに、今回の再生停止の発生による視聴離脱率が計算される。具体的には、エンゲージメント推定部12は、以下の式(1)に基づいて視聴離脱率を計算する。
User.Drop=A×StallDur+B×Stall.Pos+C+MOS×User.Alr.Quit(E×F×Stall.Pos) ・・・(1)
但し、各パラメータの意味は、以下の通りである。
User.Drop:今回の再生停止による視聴離脱率
StallDur:今回の再生停止の再生停止時間
Stall.Posは:今回の再生停止の発生時の再生停止位置
User.Alr.Quit:複数回の再生停止が発生している場合、当該再生停止の前までの再生停止による視聴離脱率(つまり、再生停止が1回の場合は、0)
MOS:再生停止発生直前の映像品質(符号化品質)であり、映像品質が高いほど大きい値を示す。
A、B、C、E、F:係数
 なお、User.Alr.Quitは、ステップS102において計算される視聴離脱率の履歴に基づいて計算可能である。また、MOSは、再生停止の発生時の測定区間に関して品質パラメータ取得部11によって取得された解像度、フレームレート及びビットレート等の符号化品質に関するパラメータに基づいて計算可能である。例えば、MOSは、ITU-T勧告P.1203などの品質推定技術で出力される値、又は、MOSは、国際公開第2017/104416号等に記載された方法等、その他の公知技術を用いて計算される値でもよい。但し、再生開始待ちの場合(すなわち、再生がまだ開始されていない場合)、MOSの値は0である。A、B、C、E、Fは、例えば、実験等により求めればよい。
 式(1)の意味(根拠)について詳しく説明する。
 視聴離脱者(すなわち、視聴離脱率)は、再生停止待ち時間が増加するほど大きくなる傾向を有する。同様に、再生停止位置が長くなるほど(増加するほど)、再生停止が発生した際の視聴離脱率は大きくなる傾向がある。この特性は、「A×StallDur+B×Stall.Pos」によって表現されている。
 また、再生停止発生時の視聴離脱率は、一つ前に発生した(過去に発生した)再生停止により視聴離脱する割合にも影響を受ける。すなわち、過去に発生した再生停止による視聴離脱率が高いほど、今回の再生停止における視聴離脱率は高くなる。また、複数回の再生停止が発生した場合も1回の再生停止が発生した場合と同様に、視聴離脱率は再生停止位置にも影響を受ける。更に、再生停止が発生した際の映像品質のレベルによっても、視聴離脱率は影響される。具体的には、過去において品質が高いときに、再生停止が発生したときの方が、User.Dropに影響が大きいので、MOSが高い方が過去の影響が大きくなる。これらの特性は、「MOS×User.Alr.Quit(E×F×Stall.Pos)」において表現されている。
 以下、2つの具体例について説明する。
 [例1:再生停止が1回のケース]
 再生停止が1回の場合は、User.Alt.Quitが値を持たないので、Cまでの項でUser.Dropが計算される。例えば、30秒目に10秒の再生停止が発生した場合、
User.Drop=A×10+B×30+C
が計算される。
 [例2:再生停止が二回のケース]
 再生停止が2回の場合は、1回目の再生停止に関してUser.Alt.Quitが値を持つ。例えば、30秒目に10秒、60秒目に10秒の再生停止が発生したとし、30秒目(すなわち、1回目)の再生停止のUser.Drop(=User.Alt.Quit)が30%であり、2回目の再生停止の直前のMOSが5であるとする。この場合、
User.Drop=A×10+B×60+C+5×30×(E-F×60)
が計算される。
 なお、Cより右の項(MOS×User.Alr.Quit(E×F×Stall.Pos))は、既に前の再生停止で離脱してしまった視聴者の影響を考慮している。
つまり、「A×10+B×60+C」から明らかなように、これは2回目の再生停止が起きた際の影響のみになっている。2回目の再生停止が起きる前、つまり、1回目の再生停止が起きた影響を、そのまま足し混んでしまうと、User.Dropを過大評価してしまうため、「5×30×(E-F×60)」の項が存在するのである。また、品質が高いときに、再生停止が起きたときの方が、User.Dropに影響が大きいので、MOSが高い方が過去の影響が大きくなるようになっている。これは、高い品質で視聴している時に急に再生停止が入ると視聴者が知覚する劣化が大きくなる一方、低い品質で視聴している時に再生停止が入っても、視聴者が知覚する劣化は、元々低い品質であるため、それほど増加しないからである。このような特定は、本願発明者による実験によって検証されている。
 なお、上記数式はすべて、重回帰式に基づいているが、例えば、StallDur、Stall.Pos、User.Alr.Quitなどのパラメータが非線形回帰(パワー関数など)でモデル化され、視聴離脱率が導出されるようにしてもよい。
 上述したように、本実施の形態によれば、解像度、フレームレート、ビットレート、再生停止時間、再生停止位置等、端末内で観測可能なパラメータからエンゲージメントを推定可能とすることが可能となる。
 その結果、例えば、視聴者が実際に視聴する通信サービスのエンゲージメント値を監視することで、提供中のサービスが視聴者に対してある一定以上のエンゲージメントを保っているか否かを容易に判断することができ、提供中のサービスのエンゲージメント実態をリアルタイムで把握・管理することが可能となる。
 なお、上記各実施の形態において、品質パラメータ取得部11は、取得部の一例である。エンゲージメント推定部12は、推定部の一例である。
 以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10     エンゲージメント推定装置
11     品質パラメータ取得部
12     エンゲージメント推定部
100    ドライブ装置
101    記録媒体
102    補助記憶装置
103    メモリ装置
104    CPU
105    インタフェース装置
B      バス

Claims (7)

  1.  ネットワークを介して配信される映像の再生停止が発生した際に、前記再生停止の発生時の再生停止位置、及び前記再生停止の継続時間を取得する取得部と、
     前記再生停止位置が長くなるほど、かつ、前記継続時間が増加するほど視聴離脱者が増加する特性に基づいて、エンゲージメントを評価する指標の推定値を計算する推定部と、
    を有することを特徴とするエンゲージメント推定装置。
  2.  前記推定部は、更に、過去に発生した再生停止について計算した前記推定値に基づいて、今回の再生停止についての前記推定値を計算する、
    ことを特徴とする請求項1記載のエンゲージメント推定装置。
  3.  前記取得部は、更に、前記再生停止が発生する前の前記映像の品質を示す値を取得し、
     前記推定部は、更に、前記品質が高い方が前記過去に発生した再生停止について計算した前記推定値の影響が大きくなるように、今回の再生停止についての前記推定値を計算する、
    ことを特徴とする請求項2記載のエンゲージメント推定装置。
  4.  ネットワークを介して配信される映像の再生停止が発生した際に、前記再生停止の発生時の再生停止位置、及び前記再生停止の継続時間を取得する取得手順と、
     前記再生停止位置が長くなるほど、かつ、前記継続時間が増加するほど視聴離脱者が増加する特性に基づいて、エンゲージメントを評価する指標の推定値を計算する推定手順と、
    をコンピュータが実行することを特徴とするエンゲージメント推定方法。
  5.  前記推定手順は、更に、過去に発生した再生停止について計算した前記推定値に基づいて、今回の再生停止についての前記推定値を計算する、
    ことを特徴とする請求項4記載のエンゲージメント推定方法。
  6.  前記取得手順は、更に、前記再生停止が発生する前の前記映像の品質を示す値を取得し、
     前記推定手順は、更に、前記品質が高い方が前記過去に発生した再生停止について計算した前記推定値の影響が大きくなるように、今回の再生停止についての前記推定値を計算する、
    ことを特徴とする請求項5記載のエンゲージメント推定方法。
  7.  請求項4乃至6いずれか一項記載のエンゲージメント推定方法をコンピュータに実行させることを特徴とするプログラム。
PCT/JP2020/004566 2019-02-20 2020-02-06 エンゲージメント推定装置、エンゲージメント推定方法及びプログラム WO2020170837A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/430,393 US20220174353A1 (en) 2019-02-20 2020-02-06 Engagement estimation apparatus, engagement estimation method and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-028463 2019-02-20
JP2019028463A JP7215209B2 (ja) 2019-02-20 2019-02-20 エンゲージメント推定装置、エンゲージメント推定方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2020170837A1 true WO2020170837A1 (ja) 2020-08-27

Family

ID=72143799

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/004566 WO2020170837A1 (ja) 2019-02-20 2020-02-06 エンゲージメント推定装置、エンゲージメント推定方法及びプログラム

Country Status (3)

Country Link
US (1) US20220174353A1 (ja)
JP (1) JP7215209B2 (ja)
WO (1) WO2020170837A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015122638A (ja) * 2013-12-24 2015-07-02 日本電信電話株式会社 品質推定装置、方法及びプログラム
JP2018097394A (ja) * 2016-12-07 2018-06-21 日本電信電話株式会社 エンゲージメント指標値制御装置、エンゲージメント指標値制御方法、及びプログラム
JP2018097393A (ja) * 2016-12-07 2018-06-21 日本電信電話株式会社 エンゲージメント指標値制御装置、エンゲージメント指標値制御方法、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9191284B2 (en) * 2010-10-28 2015-11-17 Avvasi Inc. Methods and apparatus for providing a media stream quality signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015122638A (ja) * 2013-12-24 2015-07-02 日本電信電話株式会社 品質推定装置、方法及びプログラム
JP2018097394A (ja) * 2016-12-07 2018-06-21 日本電信電話株式会社 エンゲージメント指標値制御装置、エンゲージメント指標値制御方法、及びプログラム
JP2018097393A (ja) * 2016-12-07 2018-06-21 日本電信電話株式会社 エンゲージメント指標値制御装置、エンゲージメント指標値制御方法、及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KAWASHIMA, KIMIKO ET AL.: "Relationship among quality factors and viewing time for adaptive- bitrate-video-streaming services", IEICE TECHNICAL REPORT, vol. 118, no. 8, 12 April 2018 (2018-04-12), pages 41 - 45, XP033457752 *
TAKAHASHI, SHOKO ET AL.: "Analysis of User Manipulation for Adaptive Bitrate Video Streaming Services", IEICE TECHNICAL REPORT, vol. 117, no. 304, 9 November 2017 (2017-11-09), pages 39 - 44, XP009520987 *

Also Published As

Publication number Publication date
JP7215209B2 (ja) 2023-01-31
JP2020136923A (ja) 2020-08-31
US20220174353A1 (en) 2022-06-02

Similar Documents

Publication Publication Date Title
JP6662905B2 (ja) オーディオビジュアル品質推定装置、オーディオビジュアル品質推定方法、及びプログラム
JP5427238B2 (ja) ビデオストリームの品質値を判定する方法及びシステム
JP4490374B2 (ja) 映像品質評価装置および方法
WO2019216197A1 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
WO2021181724A1 (ja) 数理モデル導出装置、数理モデル導出方法及びプログラム
WO2020170869A1 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP6162596B2 (ja) 品質推定装置、方法及びプログラム
WO2020170837A1 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP6907958B2 (ja) 推定装置、推定方法及びプログラム
JP5405915B2 (ja) 映像品質推定装置、映像品質推定方法および映像品質推定装置の制御プログラム
WO2019194034A1 (ja) 視聴行動推定装置、視聴行動推定方法及びプログラム
JP5643242B2 (ja) メディアプレイヤパラメタ推定装置及び方法及びプログラム
JP6700242B2 (ja) 品質推定装置、品質推定方法及びプログラム
JP7255704B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP7405256B2 (ja) 視聴完了率推定装置、視聴完了率推定方法及びプログラム
JP6660357B2 (ja) 品質推定装置、品質推定方法及びプログラム
JP2011010238A (ja) パケット転送品質制御システムおよび方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20760266

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20760266

Country of ref document: EP

Kind code of ref document: A1