WO2018192455A1

WO2018192455A1 - 一种生成字幕的方法及装置

Info

Publication number: WO2018192455A1
Application number: PCT/CN2018/083244
Authority: WO
Inventors: 林耀冬; 张欣; 陈杰
Original assignee: 杭州海康威视数字技术股份有限公司
Priority date: 2017-04-18
Filing date: 2018-04-16
Publication date: 2018-10-25
Also published as: CN108737907A; CN108737907B

Abstract

本申请实施例公开了一种生成字幕的方法及装置，属于视频领域。所述方法包括：获取待生成字符包括的像素点在平面坐标系中的第一位置；根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。所述装置包括：获取模块、计算模块和渲染模块。本申请实施例能够显示全景视频的字幕。

Description

一种生成字幕的方法及装置

本申请要求于2017年4月18日提交中国国家知识产权局、申请号为201710254051.0、发明名称为“一种生成字幕的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频领域，特别涉及一种生成字幕的方法及装置。

背景技术

全景视频是把相机环360度拍摄的一组或多组照片拼接成一个全景图像，并将多个全景图像依次映射在一个球的表面上形成一帧帧图像的视频，它能在空间域上提供给用户360度无死角的新体验，提供虚拟的3D环境。

用户可以使用播放器播放全景视频，且在播放全景视频时用户可以通过选择视点，改变视频播放的视角，提高用户的交互体验。但是目前的全景视频美中不足的是没有字幕。

发明内容

为了为了能够显示全景视频的字幕，本申请提供了一种生成字幕的方法及装置。所述技术方案如下：

第一方面，本申请公开了一种生成字幕的方法，所述方法包括：

获取待生成字符包括的像素点在平面坐标系中的第一位置；

根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；

根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。

可选的，所述获取待生成字符包括的像素点在平面坐标系中的第一位置，包括：

获取待生成字符在平面坐标系中的起始位置；

根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。

可选的，所述根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置，包括：

根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

在所述起始位置处将所述点阵填写在所述平面坐标系中；

从所述平面坐标系中读取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。

从所述点阵中选择一点作为目标点，并设置所述目标点在所述平面坐标系中的第一位置为所述起始位置；

根据所述目标点的第一位置以及所述待生成字符包括的像素点与所述目标点之间间隔的点数目，计算所述像素点在所述平面坐标系中的第一位置。

可选的，所述根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置，包括：

根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

根据所述字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述字幕球面上的第二位置。

可选的，所述形成所述待生成字符之后，还包括：

确定一转轴，所述转轴经过所述字幕球面的球心，控制所述字幕球面绕所述转轴转动。

可选的，所述根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，包括：

根据视点与所述待生成字符之间的距离和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。

可选的，所述根据视点与所述待生成字符之间的距离和所述像素点的第二位置，在所述字幕球面上渲染所述像素点，包括：

根据第一连线和第二连接之间的夹角计算透明度，所述第一连线为所述字幕球面的球心与视点之间连线，所述第二连线为所述字幕球面的球心与所述待生成字符中的一点之间的连线；

所述根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，包括：

根据所述透明度和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。

根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，i＝1、2……N；

其中，N为字幕球面的总数且N为大于1的整数，N个字幕球面的球心重合，所述N个字幕球面的半径互不相等。

可选的，所述根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，包括：

根据第i个字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述第i个字幕球面上的第二位置。

在第i个时间段内，根据所述像素点在所述第i个字幕球面上的第二位置，在所述第i个字幕球面上渲染所述像素点。

第二方面，本申请公开了一种生成字幕的装置，所述装置包括：

获取模块，用于获取待生成字符包括的像素点在平面坐标系中的第一位置；

计算模块，用于根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；

渲染模块，用于根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。

可选的，所述获取模块，用于：

获取待生成字符在平面坐标系中的起始位置；

可选的，所述获取模块包括：

生成单元，用于根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

填写单元，用于在所述起始位置处将所述点阵填写在所述平面坐标系中；

读取单元，用于从所述平面坐标系中读取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。

可选的，所述获取模块，用于：

可选的，所述计算模块包括：

第一计算单元，用于根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

第二计算单元，用于根据所述字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述字幕球面上的第二位置。

可选的，所述装置还包括：

转动模块，用于确定一转轴，所述转轴经过所述字幕球面的球心，控制所述字幕球面绕所述转轴转动。

可选的，所述渲染模块，用于：

可选的，所述计算模块，还用于根据第一连线和第二连接之间的夹角计算透明度，所述第一连线为所述字幕球面的球心与视点之间连线，所述第二连线为所述字幕球面的球心与所述待生成字符中的一点之间的连线；

所述渲染模块，用于根据所述透明度和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。

可选的，所述计算模块，用于根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，i＝1、2……N；

其中，N字幕球面的总数且N为大于1的整数，N个字幕球面的球心重合，所述N个字幕球面的半径互不相等。

可选的，所述计算模块，用于：

可选的，所述渲染模块，用于在第i个时间段内，根据所述像素点在所述第i个字幕球面上的第二位置，在所述第i个字幕球面上渲染所述像素点。

第三方面，本申请公开了一种计算机可读存储介质，用于存储计算机程序，所述计算机程序通过处理器进行加载来执行第一方面或第一方面任意可能的实现方式的方法的指令。

第四方面，本申请公开了一种生成字幕的装置，所述装置包括：

一个或多个处理器；和

一个或多个存储器；

所述一个或多个存储器存储有程序代码，所述程序代码由所述一个或多个处理器执行，以实现：

获取待生成字符包括的像素点在平面坐标系中的第一位置；

本申请实施例通过获取待生成字符包括的像素点在平面坐标系中的第一位置；根据该像素点的第一位置，计算该像素点在字幕球面上的第二位置；根据该像素点的第二位置，在字幕球面上渲染该像素点，以形成待生成字符，从而可以在字幕球面上显示全景视频的字幕。

附图说明

图1是本申请实施例提供了一种生成字幕的方法流程图；

图2-1是本申请实施例提供的一种生成字幕的方法流程图；

图2-2是本申请实施例提供的点阵示意图；

图2-3是本申请实施例提供的字幕球面示意图；

图2-4是本申请实施例提供的多个字幕球面示意图；

图2-5是本申请实施例提供的在不同视点下显示字幕示意图；

图3是本申请实施例提供的一种生成字幕的装置结构示意图；

图4是本申请实施例提供的另一种生成字幕的装置结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

全景视频是将视频图像映射在图像球面的表面形成的视频，全景视频可以包括N个字幕球面，N是大于或等于1的整数，该N个字幕球面中的每个字幕球面的球心、图像球面的球心和球面坐标系的坐标原点均重合。在本申请的一个可选实施例中该N个字幕球面中的每个字幕球面的半径均不相等。

在本申请提供的如下任一实施例的执行主体可以为终端或服务器等，终端可以为手机、台式电脑、笔记本电脑、摄像机或相机等。

可选的，本申请提供的如下任一实施例的执行主体可以为终端或服务器中包括的处理器。

参见图1，本申请实施例提供了一种生成字幕的方法，所述方法包括：

步骤101：获取待生成字符在平面坐标系中的起始位置。

步骤102：根据该起始位置获取待生成字符包括的像素点在平面坐标系中的第一位置。

步骤103：根据该像素点的第一位置，计算该像素点在字幕球面上的第二位置。

步骤104：根据该像素点的第二位置，在字幕球面上渲染该像素点，以形成待生成字符。

在本申请实施例中，通过获取待生成字符在平面坐标系中的起始位置；根据该起始位置获取待生成字符包括的像素点在平面坐标系中的第一位置；根据该像素点的第一位置，计算该像素点在字幕球面上的第二位置；根据该像素点的第二位置，在字幕球面上渲染该像素点，以形成待生成字符，从而可以在字幕球面上显示全景视频的字幕。

本申请实施例提供了一种生成字幕的方法，该方法可以生成全景视频的字幕，参见图2-1，该方法包括：

步骤201：获取待生成字符在平面坐标系中的起始位置。

待生成字符可以为文字、颜文字或表情图像等。获取的待生成字符可以为为用户输入的字符或全景视频对应的字幕文件中的字符等。

假设一个全景视频对应一个字幕文件，该字幕文件包括至少一个字符。该字幕文件还可以包括该至少一个字符中的部分字符在平面坐标系中的起始位置或者可以包括该至少一个字符中的每个字符在平面坐标系中的起始位置。字幕文件中的字符在平面坐标系中的起始位置可以是事先设置的并存储在字幕文件中，或者也可以是用户临时设置后被存储在字幕文件中，在此不做限定。

待生成字符可以是该字幕文件中的任一个字符。待生成字符和其起始位置的获取过程可以为：从字幕文件中获取一个字符作为待生成字符，如果字幕文件中包括待生成字符在平面坐标系中的起始位置，则还可以从字幕文件中获取待生成字符在平面坐标系中的起始位置。如果字幕文件中不包括待生成字符在平面坐标系中的起始位置，则可以根据字幕文件中的具有起始位置的字符、待生成字符与该字符之间的间隔的字符数目、相邻两字符之间的间隔和字符大小，计算出待生成字符在平面坐标系中的起始位置。

全景视频可以由一帧帧的全景视频帧组成，该字幕文件包括的字符可以是各全景视频帧对应的字符。所谓全景视频帧对应的字符是指在显示该全景视频帧时显示的字符。

在显示不同全景视频帧对应的字符时，每个全景视频帧对应的第一字符的显示位置可以相同。所以该字幕文件可以包括目标全景视频帧对应的每个字符的起始位置，或者可以包括目标全景视频帧对应的第一个字符的起始位置。对于除目标全景视频帧以外的其他全景视频帧，该字幕文件可以不包括其他各全景视频帧对应的各字符的起始位置。

其中，目标全景视频帧可以是全景视频中的任一全景视频帧，例如可以是全景视频中的第一个全景视频帧、第二个全景视频帧或第三个全景视频帧等。这样即可以减小该字幕文件的大小，又可以减小设置起始位置所需要的工作量。

相应的，获取待生成字符的起始位置，可以为：

当待生成字符是目标全景视频帧中显示的字符时，如果该字幕文件包括目标全景视频帧对应的每个字符的起始位置或者待生成字符是目标全景视频帧对应的第一个字符，则可以从字幕文件中获取待生成字符的起始位置。如果该字幕文件只包括目标全景视频帧对应的第一个字符的起始位置且待生成字符不是该第一个字符，则可以根据该第一个字符的起始位置、待生成字符与该第一个字符之间的间隔的字符数目、相邻两字符之间的间隔和字符大小，计算出待生成字符的起始位置。

当待生成字符是除目标全景视频帧以外的其他全景视频帧对应的字符时，如果待生成字符为该其他全景视频帧对应的第一个字符，则可以将目标全景视频帧对应的第一个字符的起始位置作为待生成字符的起始位置。如果待生成字符不是该其他全景视频帧对应的第一个字符时，则根据目标全景视频帧对应的第一个字符的起始位置、待生成字符与该其他全景视频帧对应的第一个字符之间的间隔的字符数目、相邻两字符之间的间隔和字符大小，计算出待生成字符的起始位置。

待生成字符可以为用户输入的字符，用户在输入字符时还可以输入或选择该字符在平面坐标系中的起始位置。在本步骤中，可以直接获取用户输入的待生成字符和待生成字符在平面坐标系中的起始位置。

另外，用户在输入字符时，对于输入的第一个字符，可以为第一个字符输入在平面坐标系中的起始位置，对于输入的除第一个字符以外的第二个字符、第三个字符、第四个字符等字符，可以不用一一输入各字符在平面坐标系中的起始位置。因此在本步骤中，用户没有输入待生成字符输入在平面坐标系中的起始位置时，可以获取待生成字符与用户输入的第一个字符之间间隔的字符数目，根据第一个字符在平面坐标系中的起始位置、该字符数目、相邻两字符之间的间隔和字符大小计算待生成字符在平面坐标系中的起始位置。

其中，对于用户输入字符时选择该字符在平面坐标系中的起始位置的操作，在实现时用户可以直接使用输入设备(如鼠标等)在平面坐标系中选择一个位置点击。相应的，在检测到输入设备触发的点击操作时，获取该输入设备在平面坐标系的点击位置，将该点击位置确定为该字符的起始位置。或者，在使用具有触摸屏的设备显示平面坐标系时，用户可以直接使用手指在平面坐标系中选择一个位置点击。相应的，在检测到触摸屏被点击触发的点击操作时，获取该点击操作对应的点击位置，将该点击位置确定为该字符的起始位置。

步骤202：根据待生成字符的编码生成预设大小的点阵，该点阵包括待生成字符。

可以将待生成字符的编码输入到Freetype字体库中，通过该Freetype字体库生成预设大小的点阵；对于该点阵中的每个点，该点的比特值为预设第一比特值，或者为预设第二比特值。其中，如果该点是待生成字符中的像素点，则该点的比特值为预设第一比特值，如果该点不是待生成字符中的像素点，则该点的比特值为预设第二比特值。

第一比特值可以为1，第二比特值可以为0；或者，第一比特值可以为0，第二比特值为1。

例如，假设待生成字符为字符“我”，预设大小为24×24，以及假设第一比特值为1，第二比特值为0。将待生成字符“我”的编码输入到Freetype字体库中，通过Freetype字体库生成大小为24×24的点阵，该点阵如图2-2的左图所示。

图2-2左图所示意的点阵中，用黑色填充表示第一比特值，用无色填充表示第二比特值，填充黑色的点都为待生成字符“我”中的像素点，这些点的比特值均为第一比特值1，在图中用黑色表示第一比特值1；填充无色的点均不是待生成字符“我”中的像素点，这些点的比特值均为第二比特值0，在图中用无色表示第二比特值0。

步骤203：在该起始位置处将该点阵填写在平面坐标系中，从平面坐标系中读取待生成字符包括的像素点在平面坐标系中的第一位置。

例如，参见图2-2，可以将该起始位置作为该点阵的一点的位置，该点可以为左上角顶点、左下角顶点、右上角顶点、右下角顶点或点阵的中心点等，然后将图2-2左图中的点阵填写图2-2右图中的平面坐标系中。然后从平面坐标系中读取待生成字符“我”包括的每个像素点的第一位置。

可选的，在本实施例中，还可以通过如下方式获取待生成字符包括的像素点在平面坐标系中的第一位置，包括：

可以从该点阵中选择一个点作为目标点，将目标点在平面坐标系中的第一位置设置为待生成字符的起始位置；对于待生成字符包括的每个像素点，根据该像素点与目标点之间间隔的点数目和目标点的第一位置，计算出该像素点在平面坐标系中的第一位置。

例如，参数图2-2左图所示的点阵，在该点阵中每个点均为等大小的方形块，可以从图2-2左图所示的点阵中选择一个点作为目标点。可选的，可以选择位于点阵左上角位置的点、左下角位置的点、右上角位置的点、右下角位置的点或点阵的中心点等。参见图2-2的左图，假设选择位于左上角位置的点作为目标点，然后将目标点在平面坐标系中的第一位置设置为待生成字符的起始位置。对于待生成字符中的每个像素点，假设为P点，根据P点与目标点之间间隔的点数目、点的大小和目标点的第一位置，计算出P点在平面坐标系中的第一位置。其中，点的大小可以为方形块的宽度。

步骤204：根据该像素点的第一位置计算该像素点在球面坐标系中的仰角和方位角，该球面坐标系的坐标原点与字幕球面的球心重合。

平面坐标系中的像素点在字幕球面上都对应一个点。例如，参见图2-2右图所示的平面坐标系中的P点；参见图2-3，该P点在字幕球面上对应一个Q点，该字幕球面的球心与该球面坐标系xyz的坐标原点O重合。

该P点在球面坐标系中的仰角实质为Q点和坐标原点O的连线OQ与xOz平面之间的夹角α；该P点在球面坐标系中的方位角实质为Q点在xOz平面上的投影点R和坐标原点O的连线OR与x轴之间的夹角γ。

步骤204可以通过下述方式实现：对于待生成字符包括的每个像素点，假设为P点，P点在平面坐标系中的第一位置为(u，v)，u为P点在平面坐标系中的横坐标，v为P点在平面坐标系中的纵坐标；根据P点在平面坐标系中的第一位置(u，v)按如下公式(1)计算该P点在球面坐标系中的仰角和方位角；

在公式(1)中，α为P点在球面坐标系中的仰角，γ为P点在球面坐标系中的方位角。

例如，假设P点在平面坐标系中的第一位置为(0.75，0.125)，根据第一位置(0.75，0.125)按上述公式(1)计算P点在球面坐标系中的仰角α＝0.25π和方位角γ＝0.25π。

对待生成字符中的其他每个像素点，都同P点一样，按上述公式(1)计算出其他每个像素点在球面坐标系中的仰角和方位角。

步骤205：根据字幕球面的半径、该像素点的仰角和方位角，计算该像素点在字幕球面上的第二位置。

该像素点在字幕球面上的第二位置实质是该像素点在字幕球面上对应的点的位置。例如，参见图2-2和2-3，P点在字幕球面上的第二位置实质是P点在字幕球面上对应的Q点的位置。

本步骤可以为：对于待生成字符包括的每个像素点，假设为P点，根据字幕球面的半径、该P点的仰角α和方位角γ，按如下公式(2)计算P点在字幕球面上的第二位置(x,y,z)，该第二位置(x,y,z)实质为Q点的位置；

在公式(2)中，R为字幕球面的半径，x为P点在字幕球面上的横坐标，y为P点在字幕球面上的纵坐标，z为P点在字幕球面上的竖坐标。

例如，P点在球面坐标系中的仰角α＝0.25π和方位角γ＝0.25π。假设R＝2，则P点在字幕球面上的第二位置中的x＝2*cos0.25π*cos0.25π＝1，y＝2*cos0.25π*sin0.25π＝1，

即得到P点在字幕球面上的第二位置为

对待生成字符中的其他每个像素点，都同P点一样，按上述公式(2)计算出其他每个像素点在字幕球面上的第二位置。

对于包括多个字幕球面的情况，即N为大于1的整数，此时需要根据该像素点的第一位置和第i个字幕球面的半径，计算该像素点在第i个字幕球面上的第二位置，i＝1、2……N。详细过程为：

根据该像素点在平面坐标系中的第一位置计算该像素点在球面坐标系中的仰角和方位角(详细计算过程参见步骤204中的内容)，然后根据第i个字幕球面的半径、该像素点的仰角和方位角，计算该像素点在第i个字幕球面上的第二位置。

可以通过如下的公式(3)计算该像素点在第i个字幕球面上的第二位置。

在公式(3)中，R _i为第i个字幕球面的半径，x _i为P点在第i个字幕球面上的横坐标，y _i为P点在第i个字幕球面上的纵坐标，z _i为P点在第i个字幕球面上的竖坐标。

步骤206：根据该像素点的第二位置，在字幕球面上渲染该像素点，以形成待生成字符。

字幕字符中还可以包括每个字符的配置信息，字符的配置信息可以为该字符的颜色等信息。

例如，从字幕文件中获取待生成字符的配置信息，对于待生成字符包括的每个像素点，假设为P点，P点在字幕球面上的第二位置(x,y,z)实质为Q点的位置，根据该配置信息在字幕球面上的Q点位置处渲染出一个Q点。对于待生成字符包括的其他每个像素点，同P点一样，按上述方式渲染其他每个像素点在字幕球面上对应的点，从而由字幕球面上的每个像素点组成待生成字符。

这样，如果字幕文件中包括多个字符，每个字符都按上述201至206的过程渲染在字幕球面上，就可以形成了全景视频的字幕。

为了提高字幕显示的视觉效度，本实施例还可以采用如下两种方式来显示待生成字符，包括：

第一、设置N个时间段，每个时间段在一个字幕球面上渲染并显示待生成字符，可以先在半径最大的字幕球面上显示待生成字符，然后随着时间越向后，显示待生成字符的字幕球面的半径越小，这样可以实现字幕由远到近显示；或者，可以先在半径最小的字幕球面上显示待生成字符，然后随着时间越向后，显示待生成字符的字幕球面的半径越大，这样可以实现由近到远显示。详细实现过程可以为：

对于待生成字符包括的每个像素点，在第i个时间段内，根据该像素点在第i个字幕球面上的第二位置，在第i个字幕球面上渲染该像素点，以在第i 个字幕球面上显示待生成字符。其中，第i个字幕球面的半径可以小于第i-1个字幕球面的半径，或者，第i个字幕球面的半径可以大于第i-1个字幕球面的半径。

例如，参见图2-4，假设存在第一字幕球面、第二字幕球面和第三字幕球面，第一字幕球面的半径小于第二字幕球面的半径，第二字幕球面的半径小于第三字幕球面半径；设置三个时间段，在第一个时间段内根据该像素点在第一字幕球面上的第二位置，在第一字幕球面上渲染并显示待生成字符1；在第二个时间段内根据该像素点在第二字幕球面上的第二位置，在第二字幕球面上渲染并显示待生成字符2；在第三个时间段内根据该像素点在第三字幕球面上的第二位置，在第三字幕球面上渲染并显示待生成字符3，这样实现字幕由近到远显示。

又例如，在第一个时间段内根据该像素点在第三字幕球面上的第二位置，在第三字幕球面上渲染并显示待生成字符3；在第二个时间段内根据该像素点在第二字幕球面上的第二位置，在第二字幕球面上渲染并显示待生成字符2；在第三个时间段内根据该像素点在第一字幕球面上的第二位置，在第一字幕球面上渲染并显示待生成字符1，这样实现字幕由远到近显示，提高了显示效果。

第二、根据用户视点与待生成字符之间的远近来设置透明度，根据该透明度来显示待生成字符，这样可以实现当用户视点与待生成字符幕之间越远，待生成字符越模糊，反之，越清晰。详细实现过程可以为：

对于待生成字符包括的每个像素点，根据视点与待生成字符之间的距离和该像素点的第二位置，在字幕球面上渲染该像素点。

上述过程可以详细为：对于待生成字符包括的每个像素点，先确定第一连线和第二连线，第一连线为字幕球面的球心与视点之间连线，第二连线为字幕球面的球心与待生成字符中的一点之间的连线，获取第一连线和第二连线之间的夹角，视点与待生成字符之间的距离可以为该夹角，根据第一连线和第二连接之间的夹角计算透明度；然后，根据该透明度和该像素点在字幕球面上的位置，在字幕球面上分别渲染该像素点，以在字幕球面上显示待生成字符。

用户可以通过手指滑动或鼠标等设备在图像球面上选择观看视频的视点，所以可以获取到该视点并确定出字幕球面的球心与该视点之间的第一连线。例如，参见图2-5，用户先在图像球面上选择视点1，获取视点1，确定球心到视点1的连线1，根据连线1与第二连线之间的夹角计算透明度，根据该透明度显示字幕。用户可以继续选择视点2，获取视点2，确定球心到视点2的连线2，根据连线2与第二连线之间的夹角计算透明度，根据该透明度显示字幕。

用户可以通过手指点击触摸屏、或者鼠标点击视频、或者操作操纵杆等方式选择视点。

可以预设计算公式，根据第一连线和第二连接之间的夹角，通过该计算公式计算透明度。例如，可以根据第一连线和第二连线之间面向球心的夹角和设置的该计算公式实现：当该夹角越大时，计算出的透明度越小，当该夹角越小时，计算的透明度越大。该计算公式可以是线性公式或非线性公式。

第一连线和第二连接之间的夹角越大表明用户视点与待生成字符之间越远，反之，表明用户视点与待生成字符之间越近。这样可以实现当用户视点与待生成字符之间越远，待生成字符越模糊，反之，越清晰，提高了显示效果。

为了提高显示效果，在生成待生成字符后，还可以确定一转轴，该转轴经过字幕球面的球心，控制字幕球面绕该转轴转动。

这样就能够在360度观看全景视频的同时观看到全视角范围的字幕。

参见图3，本申请实施例提供了一种生成字幕的装置300，所述装置300包括：

获取模块301，用于获取待生成字符包括的像素点在平面坐标系中的第一位置；

计算模块302，用于根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；

渲染模块303，用于根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。

可选的，所述获取模块301，具体用于获取待生成字符在平面坐标系中的起始位置；根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。

可选的，所述获取模块301包括：

第一生成单元，用于根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

读取单元，用于从所述平面坐标系中读取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。或者，

可选的，所述获取模块301包括：

第二生成单元，用于根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

设置单元，用于从所述点阵中选择一点作为目标点，并设置所述目标点在所述平面坐标系中的第一位置为所述起始位置；

第一计算单元，用于根据所述目标点的第一位置以及所述待生成字符包括的像素点与所述目标点之间间隔的点数目，计算所述像素点在所述平面坐标系中的第一位置。

可选的，所述计算模块302包括：

第二计算单元，用于根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

第三计算单元，用于根据所述字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述字幕球面上的第二位置。

可选的，所述装置还包括：

可选的，所述渲染模块303用于根据视点与所述待生成字符之间的距离和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。

可选的，所述渲染模块303用于：

可选的，可以事先设置N个字幕球面，N为大于1的整数，所述N个字幕球面的球心重合，所述N个字幕球面的半径互不相等；

所述计算模块302，用于根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，i＝1、2……N。

可选的，可以设置N个用于显示所述待生成字符的时间段；

可选的，所述计算模块302，

第四计算单元，用于根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

第五计算单元，用于根据第i个字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述第i个字幕球面上的第二位置。

所述渲染模块303，用于在第i个时间段内，根据所述像素点在所述第i个字幕球面上的第二位置，在所述第i个字幕球面上渲染所述像素点。

本申请实施例提供一种生成字幕的装置，包括：

一个或多个处理器；和

一个或多个存储器；

获取待生成字符包括的像素点在平面坐标系中的第一位置；

图4示出了本申请一个示例性实施例提供的终端400的结构框图。该终端400可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端400还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端400包括有：处理器401和存储器402。

处理器401可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器401可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器401可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器401还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器402可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器402还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器401所执行以实现本申请中方法实施例提供的生成字幕的方法。

在一些实施例中，终端400还可选包括有：外围设备接口403和至少一个外围设备。处理器401、存储器402和外围设备接口403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口403相连。具体地，外围设备包括：射频电路404、触摸显示屏405、摄像头406、音频电路407、定位组件408和电源409中的至少一种。

外围设备接口403可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器401和存储器402。在一些实施例中，处理器401、存储器402和外围设备接口403被集成在同一芯片或电路板上；在一些其他实施例中，处理器401、存储器402和外围设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路404用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路404将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路404包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路404还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏405用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏405是触摸显示屏时，显示屏405还具有采集在显示屏405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器401进行处理。此时，显示屏405还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏405可以为一个，设置终端400的前面板；在另一些实施例中，显示屏405可以为至少两个，分别设置在终端400的不同表面或呈折叠设计；在再一些实施例中，显示屏405可以是柔性显示屏，设置在终端400的弯曲表面上或折叠面上。甚至，显示屏405还可以设置成非矩形的不规则图形，也即异形屏。显示屏405可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件406用于采集图像或视频。可选地，摄像头组件406包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件406还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器401进行处理，或者输入至射频电路404以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器401或射频电路404的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路407还可以包括耳机插孔。

定位组件408用于定位终端400的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件408可以是基于美国的GPS(Global Positioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源409用于为终端400中的各个组件进行供电。电源409可以是交流电、直流电、一次性电池或可充电电池。当电源409包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端400还包括有一个或多个传感器410。该一个或多个传感器410包括但不限于：加速度传感器411、陀螺仪传感器412、压力传感器413、指纹传感器414、光学传感器415以及接近传感器416。

加速度传感器411可以检测以终端400建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器411可以用于检测重力加速度在三个坐标轴上的分量。处理器401可以根据加速度传感器411采集的重力加速度信号，控制触摸显示屏405以横向视图或纵向视图进行用户界面的显示。加速度传感器411还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器412可以检测终端400的机体方向及转动角度，陀螺仪传感器412可以与加速度传感器411协同采集用户对终端400的3D动作。处理器401根据陀螺仪传感器412采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器413可以设置在终端400的侧边框和/或触摸显示屏405的下层。当压力传感器413设置在终端400的侧边框时，可以检测用户对终端400的握持信号，由处理器401根据压力传感器413采集的握持信号进行左右手识别或快捷操作。当压力传感器413设置在触摸显示屏405的下层时，由处理器401根据用户对触摸显示屏405的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器414用于采集用户的指纹，由处理器401根据指纹传感器414采集到的指纹识别用户的身份，或者，由指纹传感器414根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器401授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器414可以被设置终端400的正面、背面或侧面。当终端400上设置有物理按键或厂商Logo时，指纹传感器414可以与物理按键或厂商Logo集成在一起。

光学传感器415用于采集环境光强度。在一个实施例中，处理器401可以根据光学传感器415采集的环境光强度，控制触摸显示屏405的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏405的显示亮度；当环境光强度较低时，调低触摸显示屏405的显示亮度。在另一个实施例中，处理器401还可以根据光学传感器415采集的环境光强度，动态调整摄像头组件406的拍摄参数。

接近传感器416，也称距离传感器，通常设置在终端400的前面板。接近传感器416用于采集用户与终端400的正面之间的距离。在一个实施例中，当接近传感器416检测到用户与终端400的正面之间的距离逐渐变小时，由处理器401控制触摸显示屏405从亮屏状态切换为息屏状态；当接近传感器416检测到用户与终端400的正面之间的距离逐渐变大时，由处理器401控制触摸显示屏405从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图4中示出的结构并不构成对终端400的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种生成字幕的方法，其特征在于，所述方法包括：

获取待生成字符包括的像素点在平面坐标系中的第一位置；

根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；

根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。
如权利要求1所述的方法，其特征在于，所述获取待生成字符包括的像素点在平面坐标系中的第一位置，包括：

获取待生成字符在平面坐标系中的起始位置；

根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。
如权利要求2所述的方法，其特征在于，所述根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置，包括：

根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

在所述起始位置处将所述点阵填写在所述平面坐标系中；

从所述平面坐标系中读取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。
如权利要求2所述的方法，其特征在于，所述根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置，包括：

根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

从所述点阵中选择一点作为目标点，并设置所述目标点在所述平面坐标系中的第一位置为所述起始位置；

根据所述目标点的第一位置以及所述待生成字符包括的像素点与所述目标点之间间隔的点数目，计算所述像素点在所述平面坐标系中的第一位置。
如权利要求1所述的方法，其特征在于，所述根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置，包括：

根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

根据所述字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述字幕球面上的第二位置。
如权利要求1所述的方法，其特征在于，所述形成所述待生成字符之后，还包括：

确定一转轴，所述转轴经过所述字幕球面的球心，控制所述字幕球面绕所述转轴转动。
如权利要求1所述的方法，其特征在于，所述根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，包括：

根据视点与所述待生成字符之间的距离和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。
如权利要求7所述的方法，其特征在于，所述根据视点与所述待生成字符之间的距离和所述像素点的第二位置，在所述字幕球面上渲染所述像素点，包括：

根据第一连线和第二连接之间的夹角计算透明度，所述第一连线为所述字幕球面的球心与视点之间连线，所述第二连线为所述字幕球面的球心与所述待生成字符中的一点之间的连线；

根据所述透明度和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。
如权利要求1所述的方法，其特征在于，所述根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置，包括：

根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，i＝1、2……N；

其中，N为字幕球面的总数且N为大于1的整数，N个字幕球面的球心重合，所述N个字幕球面的半径互不相等。
如权利要求9所述的方法，其特征在于，所述根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，包括：

根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

根据第i个字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述第i个字幕球面上的第二位置。
如权利要求9所述的方法，其特征在于，所述根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，包括：

在第i个时间段内，根据所述像素点在所述第i个字幕球面上的第二位置，在所述第i个字幕球面上渲染所述像素点。
一种生成字幕的装置，其特征在于，所述装置包括：

获取模块，用于获取待生成字符包括的像素点在平面坐标系中的第一位置；

计算模块，用于根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；

渲染模块，用于根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。
如权利要求12所述的装置，其特征在于，所述获取模块，用于：

获取待生成字符在平面坐标系中的起始位置；

根据所述起始位置获取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。
如权利要求13所述的装置，其特征在于，所述获取模块包括：

第一生成单元，用于根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

填写单元，用于在所述起始位置处将所述点阵填写在所述平面坐标系中；

读取单元，用于从所述平面坐标系中读取所述待生成字符包括的像素点在所述平面坐标系中的第一位置。
如权利要求13所述的装置，其特征在于，所述获取模块，包括：

第二生成单元，用于根据所述待生成字符的编码生成预设大小的点阵，所述点阵包括所述待生成字符；

设置单元，用于从所述点阵中选择一点作为目标点，并设置所述目标点在所述平面坐标系中的第一位置为所述起始位置；

第一计算单元，用于根据所述目标点的第一位置以及所述待生成字符包括的像素点与所述目标点之间间隔的点数目，计算所述像素点在所述平面坐标系中的第一位置。
如权利要求12所述的装置，其特征在于，所述计算模块包括：

第二计算单元，用于根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

第三计算单元，用于根据所述字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述字幕球面上的第二位置。
如权利要求12所述的装置，其特征在于，所述装置还包括：

转动模块，用于确定一转轴，所述转轴经过所述字幕球面的球心，控制所述字幕球面绕所述转轴转动。
如权利要求12所述的装置，其特征在于，所述渲染模块，用于：

根据视点与所述待生成字符之间的距离和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。
如权利要求18所述的装置，其特征在于，所述渲染模块，用于：

根据第一连线和第二连接之间的夹角计算透明度，所述第一连线为所述字幕球面的球心与视点之间连线，所述第二连线为所述字幕球面的球心与所述待生成字符中的一点之间的连线；

根据所述透明度和所述像素点的第二位置，在所述字幕球面上渲染所述像素点。
如权利要求12所述的装置，其特征在于，

所述计算模块，用于根据所述像素点的第一位置和第i个字幕球面的半径，计算所述像素点在所述第i个字幕球面上的第二位置，i＝1、2……N；

其中，N为字幕球面的总数且N为大于1的整数，N个字幕球面的球心重合，所述N个字幕球面的半径互不相等。
如权利要求20所述的装置，其特征在于，所述计算模块，用于：

第四计算单元，用于根据所述像素点的第一位置计算所述像素点在球面坐标系中的仰角和方位角，所述球面坐标系的坐标原点与所述字幕球面的球心重合；

第五计算单元，用于根据第i个字幕球面的半径、所述像素点的仰角和方位角，计算所述像素点在所述第i个字幕球面上的第二位置。
如权利要求20所述的装置，其特征在于，

所述渲染模块，用于在第i个时间段内，根据所述像素点在所述第i个字幕球面上的第二位置，在所述第i个字幕球面上渲染所述像素点。
一种生成字幕的装置，其特征在于，所述装置包括：

一个或多个处理器；和

一个或多个存储器；

所述一个或多个存储器存储有程序代码，所述程序代码由所述一个或多个处理器执行，以实现：

获取待生成字符包括的像素点在平面坐标系中的第一位置；

根据所述像素点的第一位置，计算所述像素点在字幕球面上的第二位置；

根据所述像素点的第二位置，在所述字幕球面上渲染所述像素点，以形成所述待生成字符。