WO2022003902A1 - 視聴完了率推定装置、視聴完了率推定方法及びプログラム - Google Patents

視聴完了率推定装置、視聴完了率推定方法及びプログラム Download PDF

Info

Publication number
WO2022003902A1
WO2022003902A1 PCT/JP2020/026019 JP2020026019W WO2022003902A1 WO 2022003902 A1 WO2022003902 A1 WO 2022003902A1 JP 2020026019 W JP2020026019 W JP 2020026019W WO 2022003902 A1 WO2022003902 A1 WO 2022003902A1
Authority
WO
WIPO (PCT)
Prior art keywords
completion rate
viewing completion
viewing
video
quality
Prior art date
Application number
PCT/JP2020/026019
Other languages
English (en)
French (fr)
Inventor
和久 山岸
ピエール レブレトン
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2020/026019 priority Critical patent/WO2022003902A1/ja
Priority to JP2022532953A priority patent/JP7405256B2/ja
Priority to US18/012,572 priority patent/US20230262277A1/en
Publication of WO2022003902A1 publication Critical patent/WO2022003902A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity

Definitions

  • the present invention relates to a viewing completion rate estimation device, a viewing completion rate estimation method, and a program.
  • a video communication service for example, IPTV, adaptive streaming (for example, HLS, MPEG-DASH)) that transfers video media including video and sound (hereinafter, including voice) via the Internet between terminals or between a server and a terminal. ) Is widespread.
  • IPTV IPTV
  • adaptive streaming for example, HLS, MPEG-DASH
  • the Internet is not necessarily a network whose communication quality is guaranteed, when communicating using audio media or video media, the bit rate drops due to the narrow line band between the viewer terminal and the network, and the line is congested. As a result, packet loss, packet transfer delay, and packet retransmission occur, and the quality perceived by the viewer for audio media, video media, and the like deteriorates.
  • the original video is encoded because the video cannot be delivered at an excessive bit rate via the network, but when the original video is encoded, the video signal in the frame is divided into blocks. Deterioration occurs due to the processing of the above, or the high frequency component of the video signal is lost, so that the fineness of the entire video is lowered. Further, since the distribution bit rate cannot be secured, the resolution of the video is lowered and the sense of fineness is lowered, or the continuity of the video cannot be secured by lowering the frame rate, resulting in a discontinuous video. In addition, when the encoded video data is transmitted as a packet to the viewer terminal via the network, if packet loss or discard occurs, the packet may deteriorate in the frame or the throughput may decrease, resulting in a packet. It does not reach the playback timing, the amount of data buffer on the viewer terminal is insufficient, and video playback stops.
  • the original acoustics are coded because the acoustics cannot be delivered at excessive bit rates over the network, but when the original acoustics are coded, the high frequency components of the acoustics are lost. We lose acoustic intelligibility.
  • video when encoded acoustic data is transmitted as packets to the viewer terminal via a network, if packet loss or discard occurs, the acoustics may be distorted or the throughput may decrease. , The packet does not reach the playback timing, the amount of data buffer in the viewer terminal is insufficient, and the sound playback stops.
  • Non-Patent Documents 1-5 and the like Conventionally, as a method for evaluating audiovisual quality, for example, there is a quality estimation method disclosed in Non-Patent Documents 1-5 and the like.
  • the length of the actual content is taken into consideration by inputting the transmitted packet and the set value obtained from the service provider, etc., and considering how much the deterioration propagates due to the loss of the video frame caused by the packet loss.
  • There is a technique for deriving sound, video, and audiovisual quality evaluation values in a short time (for example, about 10 seconds) for a short time (for example, 30 minutes, 1 hour, 2 hours, etc.) see, for example, Non-Patent Document 1). ..
  • the length of the actual content (for example, codec, etc.) is input by inputting the metadata related to the transmitted video distribution (for example, resolution, frame rate, bit rate, etc.) and the setting value (for example, codec, etc.) obtained from the service provider or the like.
  • the audiovisual quality evaluation value in a short time (for example, about 10 seconds) for 30 minutes, 1 hour, 2 hours, etc. (see, for example, Non-Patent Document 2-5).
  • the conventional quality estimation method estimates the audio, video, and audiovisual quality evaluation values in a short time.
  • ITU-T P.1201 Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport
  • ITU-T P.1203 Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport-Video quality estimation module
  • ITU-T P.1203.1 P. Lebreton and K. Yamagishi, "Transferring adaptive bit rate streaming quality models from H.264 / HD to H.265 / 4K-UHD," IEICE Transactions on Communications, Vol.E102-B, No.12, pp.2226 -2242, Dec. 2019, K. Yamagishi and T. Hayashi, "Parametric Quality-Estimation Model for Adaptive-Bitrate Streaming Services," IEEE Transactions on Multimedia, Vol.19, No. 7, pp.1545-1557, 2017.
  • Non-Patent Document 1-5 directly estimates the viewing completion rate for each quality grade in order to estimate the audio, video, and audiovisual quality from parameters such as codec information and bit rate. I can't. Further, since the video content has an arbitrary time length (for example, 30 minutes, 1 hour, 2 hours, etc.), it is necessary to be able to estimate the viewing completion rate according to each video content.
  • the present invention has been made in view of the above points, and an object of the present invention is to make it possible to estimate the viewing completion rate of video.
  • the viewing probability estimation device calculates an estimated value of the viewing completion rate per unit time based on the estimated value of the video quality and the characteristic that the viewing completion rate decreases as the video quality deteriorates. It has a first estimation unit, and a second estimation unit that estimates the viewing completion rate for a certain video content length based on the estimated value of the viewing completion rate per unit time.
  • FIG. 10 It is a figure which shows the hardware configuration example of the viewing completion rate estimation apparatus 10 in embodiment of this invention. It is a figure which shows the functional structure example of the viewing completion rate estimation apparatus 10 in embodiment of this invention. It is a flowchart for demonstrating an example of the processing procedure executed by the viewing completion rate estimation apparatus 10. It is a figure which shows the relationship between the viewing completion rate and the image quality (MOS) for each unit time (video content length).
  • MOS image quality
  • FIG. 1 is a diagram showing a hardware configuration example of the viewing completion rate estimation device 10 according to the embodiment of the present invention.
  • the viewing completion rate estimation device 10 of FIG. 1 includes a drive device 100, an auxiliary storage device 102, a memory device 103, a CPU 104, an interface device 105, and the like, which are connected to each other by a bus B, respectively.
  • the program that realizes the processing in the viewing completion rate estimation device 10 is provided by a recording medium 101 such as a flexible disk or a CD-ROM.
  • a recording medium 101 such as a flexible disk or a CD-ROM.
  • the program is installed in the auxiliary storage device 102 from the recording medium 101 via the drive device 100.
  • the program does not necessarily have to be installed from the recording medium 101, and may be downloaded from another computer via the network.
  • the program may also be installed as part of another program.
  • the auxiliary storage device 102 stores the installed program and also stores necessary files, data, and the like.
  • the memory device 103 reads the program from the auxiliary storage device 102 and stores it when there is an instruction to start the program.
  • the CPU 104 executes the function related to the viewing completion rate estimation device 10 according to the program stored in the memory device 103.
  • the interface device 105 is used as an interface for connecting to a network.
  • FIG. 2 is a diagram showing a functional configuration example of the viewing completion rate estimation device 10 according to the embodiment of the present invention.
  • the viewing completion rate estimation device 10 has a coded quality estimation unit 11, a unit time viewing completion rate estimation unit 12, and a viewing completion rate estimation unit 13 in order to estimate the viewing completion rate with respect to the quality experienced by the viewer.
  • Each of these parts is realized by a process of causing the CPU 104 to execute one or more programs installed in the viewing completion rate estimation device 10. That is, each of these parts is realized by the cooperation between the hardware resource of the viewing completion rate estimation device 10 and the program (software) installed in the viewing completion rate estimation device 10.
  • the viewing completion rate is the probability that one video content will be viewed until the end.
  • the coding quality estimation unit 11 inputs codec settings (for example, profile, number of encoding paths, GoP size, motion vector search range, etc.) and coding parameters (for example, resolution, frame rate, bit rate) used in the actual service. Then, for a certain video content (hereinafter referred to as “target video”), the video quality after coding based on the codec setting and the coding parameter (for example, MOS (Mean Opinion Score)) is estimated.
  • codec settings for example, profile, number of encoding paths, GoP size, motion vector search range, etc.
  • coding parameters for example, resolution, frame rate, bit rate used in the actual service.
  • MOS MoS
  • the unit time viewing completion rate estimation unit 12 inputs the video quality estimated by the coding quality estimation unit 11, and the viewing completion rate per unit time (for example, 1 second, 10 seconds, 1 minute, etc.) (hereinafter, Estimate the "unit-time viewing completion rate").
  • the viewing completion rate per unit time means the viewing completion rate when the video content length is a unit time. For example, if the unit time is 1 minute, the viewing completion rate per unit time means the viewing completion rate when the video content length is 1 minute.
  • the viewing completion rate estimation unit 13 inputs the video content length (original playback time of the target video) of the target video and the unit time viewing completion rate estimated by the unit time viewing completion rate estimation unit 12, and inputs the unit time viewing completion rate to the video content length. Estimate the corresponding viewing completion rate.
  • FIG. 3 is a flowchart for explaining an example of a processing procedure executed by the viewing completion rate estimation device 10.
  • the coding quality estimation unit 11 uses the codec setting and a code based on the coding parameter.
  • the estimated value of the video quality after the conversion (hereinafter referred to as “quality estimated value”) is calculated, and the quality estimated value is output to the unit-time viewing completion rate estimation unit 12.
  • the arbitrary codec settings and arbitrary coding parameters are the codec settings (for example, profile, number of encoding paths, GoP size, motion vector search range, etc.) used by the video communication service provider in the actual service, and the actual. Coding parameters used in the service (eg, resolution, frame rate, bit rate).
  • the video quality can be estimated using, for example, the technique disclosed in Non-Patent Documents 3-5 and the like.
  • the coded quality estimation unit 11 calculates the quality estimation value Q using the following mathematical formula based on the video quality estimation technique of Non-Patent Document 5.
  • rs is a resolution obtained from the number of lines and the number of pixels in the vertical and horizontal directions (for example, the total number of pixels such as 1920 ⁇ 1080).
  • fr is the frame rate.
  • br is a bit rate.
  • v 1 , ..., V 7 are coefficients.
  • the unit-time viewing completion rate estimation unit 12 calculates an estimated value of the unit-time viewing completion rate based on the video quality (quality estimation value Q) estimated by the coding quality estimation unit 11, and calculates the calculation result. It is output to the viewing completion rate estimation unit 13 (S102). At this time, the unit-time viewing completion rate estimation unit 12 calculates the estimated value of the unit-time viewing completion rate in consideration of the characteristic that the viewing completion rate decreases as the video quality deteriorates.
  • FIG. 4 is a diagram showing the relationship between the viewing completion rate and the video quality (MOS) for each unit time (video content length).
  • FIG. 4 shows the relationship between the video quality (MOS) and the viewing completion rate for the unit time (video content length) of 1 minute, 2 minutes, and 3 minutes.
  • the viewing completion rate has a characteristic that the viewing completion rate decreases as the image quality deteriorates.
  • the unit-time viewing completion rate estimation unit 12 calculates an estimated value of the unit-time viewing completion rate C (Q) using the following mathematical formula.
  • This formula expresses the characteristic that the viewing completion rate decreases (viewing withdrawal rate increases) as the video quality decreases.
  • C (Q) 1-exp (-c1 x Q + c2)
  • Q is the above quality estimate
  • c1 and c2 are coefficients, which differ depending on the unit time. Therefore, the unit time viewing completion rate C (Q) is calculated based on the mathematical formula according to the unit time arbitrarily adopted or selected by the user.
  • the unit time viewing completion rate C (Q) is determined according to the mathematical formula (that is, c1 and c2) approximated to the curve on the left in FIG. Calculated.
  • the unit time viewing completion rate C (Q) is calculated according to a mathematical formula (that is, c1 and c2) approximated to the curve in the middle of FIG.
  • the unit time viewing completion rate C (Q) is calculated according to a mathematical formula (that is, c1 and c2) approximated to the curve on the right in FIG.
  • the formula for calculating the unit-time viewing completion rate C (Q) is not limited to this formula as long as it can take into account the characteristic that the viewing completion rate decreases as the video quality deteriorates.
  • the viewing completion rate estimation unit 13 calculates the viewing completion rate for the target codec setting based on the arbitrary video content length (for example, the video content length input by the user) and the unit time viewing completion rate.
  • the viewing completion rate is output (S103).
  • the viewing completion rate estimation unit 13 calculates the viewing completion rate for the target codec setting from the video content length and the unit time viewing completion rate based on this characteristic.
  • the viewing completion rate estimation unit 13 estimates the viewing completion rate C (Q, t) using the following mathematical formula.
  • This formula expresses the characteristic that the viewing completion rate decreases as the length of the video content increases, unless the video quality is high (that is, the unit time viewing completion rate is not high).
  • the characteristic that the viewing completion rate decreases unless the unit time viewing completion rate is high means the characteristic that the viewing completion rate decreases as the unit time viewing completion rate decreases.
  • C (Q, t) [C (Q)] t
  • C (Q) is the above-mentioned unit-time viewing completion rate.
  • t is the video content length (minutes).
  • any of the following mathematical formulas to which the coefficient c3 or the coefficient c4 is added may be used.
  • C (Q, t) [C (Q)] c3 ⁇ t
  • C (Q, t) [C (Q)] ( c3 ⁇ t + c4)
  • C (Q) is the above-mentioned unit-time viewing completion rate.
  • t is the video content length (minutes).
  • c3 and c4 are coefficients.
  • the formula for calculating the viewing completion rate may be any formula that can take into account the characteristic that the viewing completion rate decreases unless the viewing completion rate per unit time is high as the video content length increases. Not limited.
  • the viewing completion rate can be estimated mechanically.
  • the provider of the video communication service can grasp the viewing completion rate of the video communication service actually viewed by the viewer, so that, for example, it is possible to avoid creating a video having a significantly low viewing completion rate. Therefore, it is possible to improve the viewing completion rate of the video distribution to be provided.
  • the unit-time viewing completion rate estimation unit 12 is an example of the first estimation unit.
  • the viewing completion rate estimation unit 13 is an example of the second estimation unit.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

視聴確率推定装置は、映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定部と、前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定部と、を有することで、映像の視聴完了率を推定可能とする。

Description

視聴完了率推定装置、視聴完了率推定方法及びプログラム
 本発明は、視聴完了率推定装置、視聴完了率推定方法及びプログラムに関する。
 インターネットを介して映像や音響(以下、音声も含む)を含む映像メディアを端末間あるいはサーバと端末との間で転送する映像通信サービス(例えば、IPTV、アダプティブストリーミング(例えば、HLS、MPEG-DASH))が普及している。
 インターネットは、必ずしも通信品質が保証されているネットワークではないため、音声メディアや映像メディアなどを用いて通信を行う場合、視聴者端末とネットワークの回線帯域が狭いことによるビットレートの低下、回線が輻輳することによるパケット損失、パケット転送遅延、パケットの再送が発生し、音声メディアや映像メディアなどに対して視聴者が知覚する品質が劣化してしまう。
 具体的には、ネットワークを介して過剰なビットレートで映像を配信することができないために原映像について符号化が行われるが、原映像を符号化する際に、フレーム内の映像信号にブロック単位の処理による劣化が生じたり、映像信号の高周波成分が失われることにより、映像全体の精細感が低くなったりする。また、配信ビットレートを確保できないために、映像の解像度を低下させ、精細感が低くなったり、フレームレートを低下させることで映像の連続性が確保できず、不連続な映像になったりする。また、符号化された映像データをパケットとしてネットワークを介して視聴者端末に送信する際、パケット損失や廃棄が発生すると、フレーム内に劣化が生じたり、スループット等が低下したりして、パケットが再生のタイミングまでに届かず、視聴者端末でのデータバッファ量が不足して映像の再生が停止したりする。
 同様に、音響においても、ネットワークを介して過剰なビットレートで音響を配信することができないために原音響について符号化が行われるが、原音響を符号化する際に、音響の高周波成分が失われ、音響の明瞭度が失われる。また、映像同様に、符号化された音響データをパケットとしてネットワークを介して視聴者端末に送信する際、パケット損失や廃棄が発生すると、音響に歪が生じたり、スループット等が低下したりして、パケットが再生のタイミングまでに届かず、視聴者端末でのデータバッファ量が不足して音響の再生が停止したりする。
 結果として、視聴者は、映像劣化、音響劣化を知覚し、オーディオビジュアル品質の低下を知覚する。この知覚した品質低下により、ユーザが映像を完全に視聴し終わる前に視聴を終了してしまう問題が発生する.
 サービス提供者が、上記のような映像通信サービスを良好な品質で提供し、品質低下による視聴離脱を低減(視聴完了率を増加)するためには、品質と視聴完了率との対応関係に基づき、提供品質を決定することが重要となる。
 したがって、視聴者が体感するオーディオビジュアル品質と視聴完了率との関係を適切に表現することができる視聴完了率推定技術が必要とされている。
 従来、オーディオビジュアル品質を評価する手法として、例えば、非特許文献1-5等に開示された品質推定法がある。
 具体的には、送信されたパケットとサービス提供者などから得た設定値を入力とし、パケット損失により発生した映像フレームの損失により、劣化がどの程度伝搬するかを考慮し、実コンテンツの尺長(例えば、30分、1時間、2時間など)に対し、短時間(例えば、10秒程度)の音響、映像、オーディオビジュアル品質評価値を導出する技術がある(例えば、非特許文献1参照)。
 また、送信された映像配信に関するメタデータ(例えば、解像度、フレームレート、ビットレート等)とサービス提供者などから得た設定値(例えば、コーデック等)を入力とし、実コンテンツの尺長(例えば、30分、1時間、2時間など)に対し、短時間(例えば、10秒程度)のオーディオビジュアル品質評価値を導出する技術がある(例えば、非特許文献2-5参照)。
 従来の品質推定法は、上記のように、短時間における音響、映像、オーディオビジュアル品質評価値を推定するものであった。
Parametric non-intrusive assessment of audiovisual media streaming quality, ITU-T P.1201 Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport, ITU-T P.1203 Parametric bitstream-based quality assessment of progressive download and adaptive audiovisual streaming services over reliable transport - Video quality estimation module, ITU-T P.1203.1 P. Lebreton and K. Yamagishi, " Transferring adaptive bit rate streaming quality models from H.264/HD to H.265/4K-UHD," IEICE Transactions on Communications, Vol.E102-B, No.12, pp.2226-2242, Dec. 2019, K. Yamagishi and T. Hayashi, "Parametric Quality-Estimation Model for Adaptive-Bitrate Streaming Services," IEEE Transactions on Multimedia, Vol.19, No. 7, pp.1545-1557, 2017.
 しかしながら、非特許文献1-5の技術(パラメトリックモデル)は、コーデック情報やビットレートなどのパラメータから音響、映像、オーディオビジュアル品質を推定するため、各品質グレードに対し、視聴完了率を直接推定することができない.
 また、映像コンテンツは任意の時間長(例えば、30分、1時間、2時間等)を有するため、各映像コンテンツに合わせた視聴完了率を推定できることが必要である。
 本発明は、上記の点に鑑みてなされたものであって、映像の視聴完了率を推定可能とすることを目的とする。
 そこで上記課題を解決するため、視聴確率推定装置は、映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定部と、前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定部と、を有する。
 映像の視聴完了率を推定可能とすることができる。
本発明の実施の形態における視聴完了率推定装置10のハードウェア構成例を示す図である。 本発明の実施の形態における視聴完了率推定装置10の機能構成例を示す図である。 視聴完了率推定装置10が実行する処理手順の一例を説明するためのフローチャートである。 単位時間(映像コンテンツ長)ごとの視聴完了率と映像品質(MOS)の関係を示す図である。
 以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における視聴完了率推定装置10のハードウェア構成例を示す図である。図1の視聴完了率推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタフェース装置105等を有する。
 視聴完了率推定装置10での処理を実現するプログラムは、フレキシブルディスク又はCD-ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。また、当該プログラムは、他のプログラムの一部としてインストールされるようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
 メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って視聴完了率推定装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
 図2は、本発明の実施の形態における視聴完了率推定装置10の機能構成例を示す図である。図2において、視聴完了率推定装置10は、視聴者が体感する品質に対する視聴完了率を推定するために、符号化品質推定部11、単位時間視聴完了率推定部12及び視聴完了率推定部13を有する。これら各部は、視聴完了率推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。すなわち、これら各部は、視聴完了率推定装置10のハードウェア資源と、視聴完了率推定装置10にインストールされたプログラム(ソフトウェア)との協働によって実現される。
 なお、視聴完了率とは、1つの映像コンテンツの最後までが視聴される確率をいう。
 符号化品質推定部11は、実サービスで利用するコーデック設定(例えば、プロファイル、エンコーディングパス数、GoPサイズ、動きベクトル探索範囲等)、符号化パラメータ(例えば、解像度、フレームレート、ビットレート)を入力とし、或る映像コンテンツ(以下、「対象映像」という。)について、当該コーデック設定及び当該符号化パラメータに基づく符号化後の映像品質(例えば、MOS(Mean Opinion Score))を推定する。
 単位時間視聴完了率推定部12は、符号化品質推定部11によって推定された映像品質を入力し、単位時間(例えば、1秒、10秒、1分、等)あたりの視聴完了率(以下、「単位時間視聴完了率」という。)を推定する。なお、単位時間あたりの視聴完了率とは、仮に映像コンテンツ長が単位時間であった場合の視聴完了率をいう。例えば、単位時間が1分であれば、単位時間あたりの視聴完了率とは、映像コンテンツ長が1分である場合の視聴完了率をいう。
 視聴完了率推定部13は、対象映像の映像コンテンツ長(対象映像の本来の再生時間)及び単位時間視聴完了率推定部12によって推定された単位時間視聴完了率を入力とし、当該映像コンテンツ長に対応した視聴完了率を推定する。
 以下、視聴完了率推定装置10が実行する処理手順について説明する。図3は、視聴完了率推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
 ステップS101において、任意のコーデック設定(以下、「対象コーデック設定」という。)及び任意の符号化パラメータが入力されると、符号化品質推定部11は、当該コーデック設定及び当該符号化パラメータに基づく符号化後の映像品質の推定値(以下、「品質推定値」という。)を算出し、当該品質推定値を単位時間視聴完了率推定部12へ出力する。なお、任意のコーデック設定及び任意の符号化パラメータとは、映像通信サービスの提供者が実サービスで利用するコーデック設定(例えば、プロファイル、エンコーディングパス数、GoPサイズ、動きベクトル探索範囲等)、及び実サービスで利用する符号化パラメータ(例えば、解像度、フレームレート、ビットレート)である。映像品質は、例えば、非特許文献3-5等に開示された技術を用いて推定することができる。
 例えば、符号化品質推定部11は、非特許文献5の映像品質推定技術に基づく以下の数式を用いて品質推定値Qを算出する。
Figure JPOXMLDOC01-appb-M000001
 但し、rsは、垂直・水平方向のライン数及び画素数から求められた解像度(例えば、1920×1080などの総画素数)である。但し、垂直方向のライン数又は水平方向の画素数のみを把握可能な場合、rsは、当該ライン数又は当該画素数から公知の方法で算出された解像度である。frは、フレームレートである。brは、ビットレートである。v,…,vは、係数である。
 続いて、単位時間視聴完了率推定部12は、符号化品質推定部11によって推定された映像品質(品質推定値Q)に基づいて、単位時間視聴完了率の推定値を算出し、算出結果を視聴完了率推定部13に出力する(S102)。この際、単位時間視聴完了率推定部12は、視聴完了率が映像品質の低下とともに低下する特性も考慮して、単位時間視聴完了率の推定値を算出する。
 図4は、単位時間(映像コンテンツ長)ごとの視聴完了率と映像品質(MOS)の関係を示す図である。図4には、1分、2分、3分の単位時間(映像コンテンツ長)について、映像品質(MOS)と視聴完了率との関係が示されている。図4に示されるように、視聴完了率は、映像品質の低下とともに低下する特性を有する。
 例えば、単位時間視聴完了率推定部12は、以下の数式を用い、単位時間視聴完了率C(Q)の推定値を算出する。この数式は、映像品質の低下に伴い、視聴完了率が低下(視聴離脱率が増加)するという特性を表現している。
C(Q)=1-exp(-c1×Q+c2)
 但し、Qは、上記の品質推定値、c1、c2は係数であり、単位時間によって異なる。したがって、ユーザが任意に採用又は選択した単位時間に応じた数式に基づいて、単位時間視聴完了率C(Q)が算出される。具体的には、例えば、単位時間として1分が採用された場合には、図4の左の曲線に近似された数式(すなわち、c1及びc2)に従って、単位時間視聴完了率C(Q)が算出される。又は、単位時間として2分が採用された場合には、図4の真ん中の曲線に近似された数式(すなわち、c1及びc2)に従って、単位時間視聴完了率C(Q)が算出される。又は、単位時間として3分が採用された場合には、図4の右の曲線に近似された数式(すなわち、c1及びc2)に従って、単位時間視聴完了率C(Q)が算出される。なお、単位時間視聴完了率C(Q)を算出するための数式は、映像品質低下に伴い、視聴完了率が低下する特性を加味できる数式であればよく、本数式に限定されない。
 続いて、視聴完了率推定部13は、任意の映像コンテンツ長(例えば、ユーザによって入力された映像コンテンツ長)及び単位時間視聴完了率に基づいて、対象コーデック設定に対する視聴完了率を算出し、当該視聴完了率を出力する(S103)。
 ここで、図4によれば、映像コンテンツ長が長くなれば長くなるほど、同一の視聴完了率を達成するためには映像品質を高く維持する必要があることが分かる。例えば、図4に示されるように、視聴完了率90%を達成するために必要な映像品質(MOS)は、1分の映像コンテンツで2.1程度、2分の映像コンテンツでは2.5程度、3分の映像コンテンツでは2.7程度となる。視聴完了率推定部13は、この特性に基づいて、映像コンテンツ長及び単位時間視聴完了率から対象コーデック設定に対する視聴完了率を算出する。
 例えば、視聴完了率推定部13は、以下の数式を用いて視聴完了率C(Q,t)を推定する。この数式は、映像コンテンツ長が増加すればするほど、映像品質が高くないと(すなわち、単位時間視聴完了率が高くないと)、視聴完了率が低下してしまう特性を表現している。なお、単位時間視聴完了率が高くないと視聴完了率が低下してしまう特性とは、換言すれば、単位時間視聴完了率が低いほど視聴完了率が低下する特性をいう。
C(Q,t)=[C(Q)]
 但し、C(Q)は、上記の単位時間視聴完了率である。tは、映像コンテンツ長(分)である。
 また、映像コンテンツ長に対する視聴完了率の低下をコントロールするため、係数c3、又は更に係数c4が追加された以下のいずれかの数式が用いられてもよい。
C(Q,t)=[C(Q)]c3・t
C(Q,t)=[C(Q)](c3・t+c4)
 但し、C(Q)は、上記の単位時間視聴完了率である。tは、映像コンテンツ長(分)である。c3及びc4は係数である。視聴完了率を算出するための数式は、映像コンテンツ長の増加に伴い、単位時間あたりの視聴完了率が高くないと視聴完了率が低下する特性を加味できる数式であればよく、上記の数式に限定されない。
 上述したように、本実施の形態によれば、コーデック設定ごとに映像の視聴完了率を推定可能とすることができる。
 従来、映像品質を推定する品質推定技術は確立されているものの、品質低下による視聴離脱の増加(視聴完了の低下)が把握できない課題が有った。これに対し、本実施の形態では、視聴完了率を機械的に推定できる。
 その結果、映像通信サービスの提供者は、視聴者が実際に視聴する映像通信サービスの視聴完了率を把握できるため、例えば、視聴完了率が著しく低い映像を作成することを避けることができる。このため、提供予定の映像配信の視聴完了率を改善することが可能となる。
 なお、本実施の形態において、単位時間視聴完了率推定部12は、第1の推定部の一例である。視聴完了率推定部13は、第2の推定部の一例である。
 以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10     視聴完了率推定装置
11     符号化品質推定部
12     単位時間視聴完了率推定部
13     視聴完了率推定部
100    ドライブ装置
101    記録媒体
102    補助記憶装置
103    メモリ装置
104    CPU
105    インタフェース装置
B      バス

Claims (5)

  1.  映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定部と、
     前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定部と、
    を有することを特徴とする視聴完了率推定装置。
  2.  前記第2の推定部は、映像コンテンツ長の増加に伴い、前記単位時間あたりの視聴完了率が低いほど視聴完了率が低下する特性に基づき、前記或る映像コンテンツ長に対する視聴完了率を推定する、
    ことを特徴とする請求項1記載の視聴完了率推定装置。
  3.  映像品質の推定値と、視聴完了率が映像品質の低下とともに低下する特性とに基づいて、単位時間あたりの視聴完了率の推定値を算出する第1の推定手順と、
     前記単位時間あたりの視聴完了率の推定値に基づいて、或る映像コンテンツ長に対する視聴完了率を推定する第2の推定手順と、
    をコンピュータが実行することを特徴とする視聴完了率推定方法。
  4.  前記第2の推定手順は、映像コンテンツ長の増加に伴い、前記単位時間あたりの視聴完了率が低いほど視聴完了率が低下する特性に基づき、前記或る映像コンテンツ長に対する視聴完了率を推定する、
    ことを特徴とする請求項3記載の視聴完了率推定方法。
  5. 請求項1又は2記載の視聴完了率推定装置としてコンピュータを機能させることを特徴とするプログラム。
PCT/JP2020/026019 2020-07-02 2020-07-02 視聴完了率推定装置、視聴完了率推定方法及びプログラム WO2022003902A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2020/026019 WO2022003902A1 (ja) 2020-07-02 2020-07-02 視聴完了率推定装置、視聴完了率推定方法及びプログラム
JP2022532953A JP7405256B2 (ja) 2020-07-02 2020-07-02 視聴完了率推定装置、視聴完了率推定方法及びプログラム
US18/012,572 US20230262277A1 (en) 2020-07-02 2020-07-02 Viewing completion rate estimation apparatus, viewing completion rate estimation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/026019 WO2022003902A1 (ja) 2020-07-02 2020-07-02 視聴完了率推定装置、視聴完了率推定方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2022003902A1 true WO2022003902A1 (ja) 2022-01-06

Family

ID=79315000

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/026019 WO2022003902A1 (ja) 2020-07-02 2020-07-02 視聴完了率推定装置、視聴完了率推定方法及びプログラム

Country Status (3)

Country Link
US (1) US20230262277A1 (ja)
JP (1) JP7405256B2 (ja)
WO (1) WO2022003902A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019216197A1 (ja) * 2018-05-09 2019-11-14 日本電信電話株式会社 エンゲージメント推定装置、エンゲージメント推定方法及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9178633B2 (en) * 2010-10-28 2015-11-03 Avvasi Inc. Delivery quality of experience (QoE) in a computer network
WO2016048983A1 (en) * 2014-09-22 2016-03-31 Arris Enterprises, Inc. Video quality of experience based on video quality estimation
US10142386B2 (en) * 2014-10-29 2018-11-27 DLVR, Inc. Determining manifest file data used in adaptive streaming video delivery
JP6517342B2 (ja) * 2015-07-28 2019-05-22 日本電信電話株式会社 配信レート選択装置、配信レート選択方法、及びプログラム
KR102000590B1 (ko) * 2015-12-16 2019-07-16 니폰 덴신 덴와 가부시끼가이샤 오디오 비주얼 품질 추정 장치, 오디오 비주얼 품질 추정 방법, 및 프로그램
US10616299B2 (en) * 2016-03-30 2020-04-07 Accenture Global Solutions Limited Video analytics device
US10334328B1 (en) * 2017-01-20 2019-06-25 Render Inc. Automatic video generation using auto-adaptive video story models
US10856022B2 (en) * 2017-10-02 2020-12-01 Facebook, Inc. Dynamically providing digital content to client devices by analyzing insertion points within a digital video
US11012744B2 (en) * 2019-03-14 2021-05-18 Longtail Ad Solutions, Inc. Systems and methods for evaluating the engagement factor of videos

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019216197A1 (ja) * 2018-05-09 2019-11-14 日本電信電話株式会社 エンゲージメント推定装置、エンゲージメント推定方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ATSUSHI OKAMOTO; MASAKATSU FUJIWARA; NISHIMATSU LAB: "NTT Network Technology Laboratories Undertakes Network and Environment/Energy Technical Innovation in Pursuit of IOWN", BUSINESS COMMUNICATION, vol. 57, no. 3, 1 March 2020 (2020-03-01), JP , pages 30 - 33, XP009534085, ISSN: 0385-695X *

Also Published As

Publication number Publication date
US20230262277A1 (en) 2023-08-17
JP7405256B2 (ja) 2023-12-26
JPWO2022003902A1 (ja) 2022-01-06

Similar Documents

Publication Publication Date Title
CN108476317B (zh) 音频视频质量推测装置、音频视频质量推测方法以及程序
JP4490374B2 (ja) 映像品質評価装置および方法
EP2347599A1 (en) Method and system for determining a quality value of a video stream
JP4802209B2 (ja) 映像品質推定方法、装置およびプログラム
JP4787210B2 (ja) 映像品質推定方法、装置、およびプログラム
JP4914400B2 (ja) 品質推定方法、品質推定システム、ユーザ端末、品質管理端末およびプログラム
WO2022003902A1 (ja) 視聴完了率推定装置、視聴完了率推定方法及びプログラム
JP7073894B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP6162596B2 (ja) 品質推定装置、方法及びプログラム
WO2020170869A1 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
WO2021181681A1 (ja) 数理モデル導出装置、数理モデル導出方法及びプログラム
US12022168B2 (en) Mathematical model derivation apparatus, mathematical model derivation method and program
JP7215209B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
JP7255704B2 (ja) エンゲージメント推定装置、エンゲージメント推定方法及びプログラム
WO2022097229A1 (ja) スループット推定装置、スループット推定方法及びプログラム
US20240107027A1 (en) Coding parameter deriving apparatus, coding parameter deriving method and program
JP5707461B2 (ja) 映像品質推定装置、映像品質推定方法及びプログラム
Wang Fair billing method for VOD systems based on video quality monitoring using watermarking scheme
CN114079534B (zh) 编码、解码方法、装置、介质和电子设备
Yu et al. An adaptive streaming system for mpeg-4 scalable to lossless audio

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20942688

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022532953

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20942688

Country of ref document: EP

Kind code of ref document: A1