CN101309383B - 运动图像拍摄设备和运动图像拍摄方法 - Google Patents
运动图像拍摄设备和运动图像拍摄方法 Download PDFInfo
- Publication number
- CN101309383B CN101309383B CN2008100818787A CN200810081878A CN101309383B CN 101309383 B CN101309383 B CN 101309383B CN 2008100818787 A CN2008100818787 A CN 2008100818787A CN 200810081878 A CN200810081878 A CN 200810081878A CN 101309383 B CN101309383 B CN 101309383B
- Authority
- CN
- China
- Prior art keywords
- character information
- parameter value
- character string
- file
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种运动图像拍摄设备和运动图像拍摄方法。运动图像拍摄设备生成数据文件以在记录介质上记录从摄像单元输出的图像信号、从要被记录在记录介质上的图像信号提取字符信息、根据字符信息的出现的特性来设置用于选择作为文件名的参数值、根据所设置的参数值来计算评价值、并将基于计算出的评价值的字符信息设置为图像信号的文件名。此外,运动图像拍摄设备基于提取了计算出的评价值相对大的字符信息的图像信号来生成文件的缩略图。
Description
技术领域
本发明涉及一种运动图像拍摄设备和运动图像拍摄方法。更具体地,本发明涉及一种用于将文件名添加至多个文件的每个,以使用户能够容易地识别其内容的方法。此外,本发明涉及一种用于将用户有选择地拍摄的图像适当地设置为缩略图图像的方法。
背景技术
如摄像机等传统的运动图像拍摄设备包括电子装置,如电荷耦合装置(CCD)或者互补金属-氧化物半导体(complementarymetal oxide semiconductor,CMOS)。这种传统的运动图像拍摄设备将通过由上述电子装置构成的图像传感器所捕捉的视觉信息输出作为图像信号。此外,传统的运动图像拍摄设备基于输出图像文件来生成预定的数据文件,然后将所生成的数据文件记录在如硬盘驱动器(HDD)、数字多功能盘(DVD)、或半导体存储器等记录单元上。
这种图像传感器捕捉的视觉信息一般为静止图像。在这方面,传统的运动图像拍摄设备使用普通图像传感器的用于以每秒数十帧的速率生成静止图像的功能来连续地记录静止图像信号。因此,传统的运动图像拍摄设备可以使用上述图像传感器来记录运动图像。
同时,近年来,由于迅速增长的存储器容量,记录单元具有更大的记录容量。这里,传统的运动图像拍摄设备在其图像显示单元上显示运动图像文件标识名称(在下文简称为“文件名”)的列表,从而允许用户确认以文件形式记录在记录单元中的数据。因此,用户可以操作运动图像拍摄设备的操作单元以发现和选择期望的文件名。
通常,传统的运动图像拍摄设备使用基于拍摄日期和时间或者连续的编号机械地生成的字符串作为文件名。例如, 日本特开2003-037770讨论了这样一种运动图像拍摄设备:该运动图像拍摄设备从图像信号提取字符信息以识别字符串、并将这样识别出的字符串设置为文件名,从而方便管理图像文件。
另一传统方法自动地从由图像传感器捕捉的视觉信息所获取的彩色图像信号中提取字符区域。例如,日本特开2001-283153讨论了使用用于判断背景颜色是否均匀的判断单元并提取具有高级别精度的字符串的图案(pattern)提取设备。
此外,日本特开平09-134406(对应于美国专利6035061)讨论了用于从包括多个字符串的文档中选择和提取一个文件名的方法。日本特开平09-134406(对应于美国专利6035061)中讨论的方法使用包括如下条件的至少之一:字符串的位置、字符串大小、是否对字符串加下划线、是否对字符串添加框、以及字符串和其它字符串的位置关系。此外,日本特开平09-134406(对应于美国专利6035061)中讨论的方法包括这样一种文件名提取单元:该文件名提取单元为每个字符串存在的字符区域指派点、对具有高点(high point)的字符区域进行字符识别、并将识别出的字符串设置为文件名。
同时,如上所述,由于存储器容量的增加,记录单元的记录容量已经增加。在这方面,已经出现并引入了用于允许用户在记录介质上记录有许多运动图像文件的情况下容易地搜索图像文件的传统方法。例如,传统的运动图像拍摄设备在其图像显示单元上显示可以通过对表示运动图像文件的内容的一个图像进行压缩而获得的摘要(digest)图像(在下文称为“缩略图”)的列表。
关于要基于运动图像文件中的哪个图像来生成缩略图,日本特开平11-313316讨论了使用存在于在第一图像之后预定的时间长度的位置处的帧内编码的(intraframe-coded)图像来生成缩略图的方法。然而,日本特开平11-313316中讨论的运动图像拍摄设备不能确保所生成的缩略图是表示运动图像文件的内容的一个代表图像。
也就是说,利用在日本特开平11-313316中讨论的运动图像拍摄设备,位于在第一图像之后预定时间长度处的图像可以是根本不表示运动图像文件的内容的图像(例如,无显示(solid)(纯黑(black-out))图像)。此外,在传统的运动图像拍摄设备的情况下,其显示单元的画面的区域被限定,并在其上显示多个缩略图图像。因此,将每个缩略图的大小限制为一定程度的小的尺寸。因此,利用这种传统的方法,对用户来说,不容易识别由缩略图图像表示的运动图像文件的内容。因此,对用户来说,不容易正确地选择期望的缩略图图像。
在这方面,日本特开2005-020351讨论了一种从字幕信息和音频信息以及从缩略图图像获取字符数据的视频再现设备。日本特开2005-020351中讨论的视频再现设备从所获取的字幕信息和音频信息选择并获取字符数据。此外,日本特开2005-020351中讨论的视频再现设备同时显示所获取的字符数据和所选择的缩略图图像以允许用户容易地识别由缩略图图像所表示的运动图像文件的内容。
此外,日本特开2002-027363讨论了这样的缩略图生成设备:该缩略图生成设备包括用于分析图像数据并选择具有字符信息的图像的字符识别单元、以及用于基于由字符识别单元所选择的图像来生成缩略图图像的缩略图选择单元。日本特开2002-027363中讨论的缩略图生成设备基于具有比预定大小大的大小的字符串的图像来生成缩略图,从而允许用户容易地识别由缩略图图像表示的运动图像文件的内容。
然而,上述传统的运动图像拍摄设备,如在日本特开2003-037770中讨论的设备等,不能从多个字符串中选择要设置为文件名的一个字符串。
日本特开2001-283153中讨论的图案提取设备提取静止图像的文件名。因此,日本特开2001-283153中讨论的图案提取设备不考虑时间轴问题,因此不能将在拍摄运动图像时用户已经有意捕捉的字符串适当地设置为文件名。
日本特开平09-134406(对应于美国专利6035061)中讨论的数字照相机拍摄从拍摄开始至拍摄结束的一系列场景作为一个文件、在拍摄操作已经结束后对该文件进行分割、并进行用于适当地排列分割后的文件的编辑操作。在这种情况下,在将单个文件分割为多个文件时,传统的方法使用按照通过将连续编号添加至单个文件的名称的机械的方式所生成的文件名。因此,利用这种传统方法,在分割后的文件的顺序已经被排列之后,用户基于该文件名不能识别文件的内容。因此,需要用户麻烦地验证每个图像文件的内容。
利用在日本特开2005-020351中讨论的视频再现设备,需要用户进行这种处理:该处理用于从分别来自选择缩略图图像的处理的字幕信息和音频信息获取的大量字符数据中适当地选择字符串。为了进行这种处理,用户需要验证大量的图像数据。因此,利用这种传统方法,需要用户进行用于生成缩略图图像的复杂操作。
在日本特开2002-027363中讨论的缩略图生成设备的情况下,当在多个场景中包括大小比预定大小大的字符串时,生成多个图像以用作为基于其来生成缩略图图像的图像。因此,日本特开2002-027363中讨论的缩略图生成设备不能将如下图像适当地设置为缩略图图像,该图像由用户有选择地拍摄作为表示运动图像文件的内容的视频图像。
发明内容
本发明的实施例涉及这样一种设备:在拍摄具有多个场景的运动图像中,该设备用于指派用户能够利用其容易地识别运动图像的内容的文件名、并将用户有选择地拍摄的图像适当地设置为缩略图图像。
根据本发明的一个方面,一种运动图像拍摄设备,包括:摄像单元,用于捕捉视觉信息以输出图像信号;文件生成单元,用于生成数据文件以将从所述摄像单元输出的所述图像信号记录在记录介质上;字符识别单元,用于从要被记录在记录介质上的所述图像信号提取字符信息;参数值设置单元,用于根据所述数据文件内由所述字符识别单元提取的字符信息的出现的特性,来设置用于选择作为文件名的、与时间轴有关的参数值;评价值计算单元,用于根据由所述参数值设置单元设置的所述参数值来计算评价值;以及文件名设置单元,用于将基于由所述评价值计算单元计算出的所述评价值的字符信息设置为所述图像信号的文件名。
根据本发明的另一个方面,一种运动图像拍摄方法,包括:捕捉视觉信息以输出图像信号;生成数据文件以将输出的所述图像信号记录在记录介质上;从要被记录在所述记录介质上的所述图像信号提取字符信息;根据所述数据文件内的所提取的字符信息的出现的特性来设置用于选择作为文件名的、与时间轴有关的参数值;根据设置的所述参数值来计算评价值;以及将基于计算出的所述评价值的字符信息设置为所述图像信号的文件名。
根据本发明的又一个方面,一种运动图像拍摄设备,包括:摄像单元,用于捕捉视觉信息以输出图像信号;文件生成单元,用于生成数据文件以将从所述摄像单元输出的所述图像信号记录在记录介质上;字符识别单元,用于从所述图像信号提取字符信息;参数值设置单元,用于根据所述数据文件内由所述字符识别单元提取的字符信息的出现的特性来设置与时间轴有关的参数值;评价值计算单元,用于根据由所述参数值设置单元设置的所述参数值来计算评价值;缩略图生成单元,用于基于提取了计算出的所述评价值最大的字符信息的图像信号来生成所述数据文件的缩略图。
根据本发明的再一个方面,一种运动图像拍摄方法,包括:捕捉视觉信息以输出图像信号;生成数据文件以将输出的所述图像信号记录在记录介质上;从所述图像信号提取字符信息;根据所述数据文件内的所提取的字符信息的出现的特性来设置与时间轴有关的参数值;根据设置的所述参数值来计算评价值;以及基于提取了计算出的所述评价值最大的字符信息的图像信号来生成所述数据文件的缩略图。
根据本发明的示例性实施例,根据所提取的字符信息的出现的特性来设置用于选择作为文件名的参数值,并且将该字符信息和参数值记录为记录介质上的组(pair)。因此,用户可以容易地从在拍摄运动图像期间相继出现的多个字符串中选择一个字符串、并将所选择的字符串设置为文件名。
根据本发明的示例性实施例,用户可以改变表示作为文件名的适当性的定义。因此,用户可以更正确地选择并将有选择地捕捉的字符串设置为文件名。
根据本发明的示例性实施例,在用户从拍摄开始到拍摄结束已经拍摄了一系列场景作为一个文件、并在拍摄操作已经结束后将该文件分割为多个文件的情况下,可以将作为字符识别的结果所获取的新文件名添加至作为分割的结果所获得的文件。因此,即使在作为分割的结果已经获得的文件的顺序被重新排列的情况下,用户也可以容易地识别文件的内容而无需麻烦地仔细验证文件的内容。
根据本发明的示例性实施例,将字符信息和参数值记录为记录介质上的组,并设置表示字符信息的出现的特性的参数值。此时,使用包括检测时刻、检测时间长度、检测频率、字符串大小、画面上字符串的位置和字符串识别精度中的至少之一参数来设置参数值。因此,用户可以将已经被有选择地拍摄到的图像适当地设置为缩略图图像。
根据下面参考附图对示例性实施例的详细说明,本发明的其它特征和方面将显而易见。
附图说明
包含在说明书中并构成说明书的一部分的附图示出本发明的示例性实施例、特征和方面,并和说明书一起用来解释本发明的原理。
图1示出根据本发明第一示例性实施例的摄像机的结构的例子。
图2A~2C每个示出根据本发明第一示例性实施例的显示在显示单元上的捕捉的图像数据的一个场景的例子。
图3示出根据本发明第一示例性实施例的表示画面上字符串的位置的参数值的例子。
图4示出根据本发明第一示例性实施例的表示预定字符串大小的参数值的例子。
图5是示出根据本发明第一示例性实施例的从捕捉图像数据到选择文件名的处理的例子的流程图。
图6示出根据本发明第一示例性实施例的一个运动图像文件的例子。
图7示出根据本发明第一示例性实施例的在场景6-1~6-4的每个中显示具有字符串的图像的显示单元的画面的例子。
图8示出根据本发明第一示例性实施例的、当用户在一个文件中搜索拍摄的图像时显示的、显示所提取的字符串的列表的显示单元的画面的例子。
图9是示出根据本发明第一示例性实施例的、用于在将文件分割为多个文件时进行的选择文件名的处理的例子的流程图。
图10示出根据本发明第一示例性实施例的分割后的运动图像文件的例子。
图11是示出根据本发明第二示例性实施例的从捕捉图像数据到选择缩略图的处理的例子的流程图。
图12示出根据本发明第二示例性实施例的一个运动图像文件的例子。
图13示出根据本发明第二示例性实施例的在场景6-1~6-5的每个中显示具有字符串的图像的显示单元的画面的例子。
图14示出根据本发明第二示例性实施例的、当用户在一个文件中搜索拍摄的图像时显示的、显示三个缩略图的列表的显示单元的画面的例子。
图15示出根据本发明第二示例性实施例的、当用户在一个文件中搜索拍摄的图像时显示的、显示所提取的字符串的列表的显示单元的画面的例子。
图16示出根据本发明第二示例性实施例的显示单元的画面的另一例子。
具体实施方式
这里参考附图将详细说明本发明的各种示例性实施例、特征和方面。应当注意,除非另外具体指出,在这些实施例中说明的组件的相关配置、数字表达、和数值并不是意在限制本发明的范围。
第一示例性实施例
现在,下面将说明本发明的第一示例性实施例。图1示出根据本发明第一示例性实施例的摄像机的结构的例子。
根据本示例性实施例的摄像机包括摄像单元11、图像处理单元12、控制单元13、存储器单元14、字符串转换处理单元15、显示单元16、操作单元17、缓冲器单元18以及记录和再现单元19。摄像机将利用摄像单元11捕捉的图像数据和利用音频电路(未示出)生成的音频数据记录在光盘20上。
摄像单元11包括具有拍摄透镜单元和机械(mechnical)快门单元的的镜筒(lens barrel)、以及布置在该镜筒的背面处的图像传感器。在图像传感器的光接收表面上形成被摄体图像作为视觉信息。摄像单元11基于来自控制单元13的控制信号可变地设置快门速度和曝光值、并向图像处理单元12输出由图像传感器生成的图像信号。
图像处理单元12将从图像传感器输入的图像信号分离成亮度组分和颜色组分、并接收来自控制单元13的控制信号。在对该亮度组分和颜色组分进行校正之后,图像处理单元12向存储器单元14输出由此校正的图像信号。
控制单元13包括中央处理单元(CPU)(未示出)、程序存储器(未示出)和工作存储器(未示出)。CPU加载来自程序存储器的特定控制程序并执行加载至工作存储器上的程序。因此,控制单元13读取从图像处理单元12输出的图像信号、控制摄像单元11、并将该图像信号输出至显示单元16。
此外,控制单元13将数据写在存储器单元14上并控制字符串转换处理单元15以控制摄像机的操作。此外,控制单元13具有作为数据文件生成单元、参数值设置单元、评价值计算单元、文件名设置单元或图像信号搜索单元的功能。
显示单元16包括被设置作为取景器的约3英寸的液晶显示器(LCD)。在LCD上显示被转换成与用于显示单元16进行显示用的格式相适应的格式的、并从控制单元13输出的图像信号。
存储器单元14包括这样的记录介质:该记录介质能够非易失性地存储所生成的作为预定数据文件的、并从图像处理单元12输出的图像文件以及各种设置数据。作为记录介质,可以使用磁带、HDD、DVD或者半导体存储器。
从摄像机可以拆卸存储器单元14。此外,在摄像机中可以设置多个存储器单元14以将各种设置数据和图像文件记录在不同的记录介质上。
操作单元17包括触发键(trigger key)、变焦按钮、菜单操作按钮和记录/再现开关。用户可以操作触发键以发出开始或停止运动图像的拍摄的指令。用户可以操作变焦按钮以发出操作透镜单元的指令。用户可以操作记录/再现开关以发出用于在记录模式和再现模式之间切换摄像机的操作模式的指令。此外,操作单元17包括缩略图按钮,用户可以操作该缩略图按钮以发出优先基于由摄像单元11捕捉的字符串来生成缩略图的指令。将来自操作单元17的操作信号输出至控制单元13。
控制单元13对字符串转换处理单元15进行控制以使用预定阈值、基于来自摄像单元11的图像信号的亮度组分来生成二值数据。该二值数据包括对应于字符部分的值和对应于背景部分的值。字符串转换处理单元15将该二值数据与先前记录在控制单元13的程序存储器上的字符识别图案进行比较(collate)以提取字符串。然后,字符串转换处理单元15将所提取的字符串数据输出至控制单元13。
缓冲器单元18存储已经被图像处理单元12多路复用(multiplex)的流数据。图像处理单元12将压缩并编码后的视频数据和音频数据多路复用以生成流数据。此外,图像处理单元12将流数据解多路复用(demultiplex)以生成视频数据和音频数据。光盘20是可记录介质,如可记录DVD(DVD-R)或者可写DVD(DVD-RW)。将视频图像或者静止图像记录在光盘20上,并从光盘20再现该视频图像和静止图像。
通过图像处理单元12将在记录时由摄像单元11获得的电信号转换成数字数据。此外,通过音频信号处理单元(未示出)将由麦克风(未示出)捕捉的音频信号转换成数字数据。然后,将数字化的视频数据和音频数据发送至数据压缩单元(未示出)以被压缩,并且然后,将压缩后的数据由图像处理单元12进行多路复用处理。然后,将压缩并多路复用后的视频数据和音频数据存储在缓冲器单元18上。
缓冲器单元18具有大到足够存储一个记录单位的流数据的容量。当将一个记录单位的流数据存储在缓冲器单元18上时,通过记录和再现单元19将该流数据写在光盘20上。然后,将关于写在光盘20上的流数据的信息写在控制单元13的存储器上。
在再现时,记录和再现单元19读取记录在光盘20上的图像数据。通过缓冲器单元18将该图像数据输出至图像处理单元12。
根据本示例性实施例的记录和再现单元19包括用于通过在光盘20上照射光束来读写数据的拾取器(pickup)。此外,记录和再现单元19包括接收来自光盘20的反射光束的传感器。此外,记录和再现单元19包括如沿光盘20的半径方向移动拾取器的寻道(seek)电动机和旋转光盘20的轴电动机(spindle motor)等机构。
现在,下面将说明根据本示例性实施例的由摄像机在拍摄期间进行的操作。当摄像机处于记录(拍摄)模式时,用户操作操作单元17以启动该摄像机并在显示单元16上实时显示图像数据,并且将摄像机的模式切换至预览模式。在该预览模式中,用户验证内容(composition)。然后,用户操作操作单元17的触发键以开始拍摄。在停止拍摄操作时,用户再次操作操作单元17的触发键。因此,拍摄操作结束。
通过摄像机的图像处理单元12将由摄像机拍摄的图像转换成图像数据。在拍摄操作期间或者在已经结束拍摄操作之后,通过字符串转换处理单元15将图像数据中的字符串识别为字符串。然后,输出所识别的字符串作为文本数据。然后输出的字符串的文本数据被记录在存储器单元14上,与基于字符信息的出现的特性所确定的参数值一起作为组。
根据本示例性实施例的运动图像拍摄设备为从图像数据提取的每个字符串设置参数值并从所提取的字符串中选择文件名。在这方面,现在下面将说明用于设置参数值的操作和用于选择文件名的操作。
首先,将说明参数值设置操作。本示例性实施例使用如下的至少之一作为参数:检测时刻、文件名按钮用户操作时刻、检测时长、提取频率、字符串大小、画面上的字符串位置和字符串识别精度。
在本示例性实施例中,“检测时刻”指文件内所识别的字符串在时间轴上的位置。“文件名按钮用户操作时刻”指在拍摄运动图像期间用户期望设置为文件名的字符串出现时的时刻。在该时刻,用户通过操作显示在操作单元17上的文件名按钮可以对字符串进行期望的加权。这里,用户按压的文件名按钮可以是具有用于拍摄照片的照片按钮的双重功能。
“检测时长”是表示已经连续检测到字符串的参数。“提取频率”是表示文件中字符串的检测的频率的参数。
“字符串大小”是表示字符串的第一字符的大小的参数。在拍摄运动图像期间检测到的字符串的大小是在图像传感器的光接收表面上形成图像的字符串的大小。因此,由于根据用户操作变焦按钮而进行的透镜单元的移动或者被摄体的移动,因而字符串大小在时间轴上实时变化。在这方面,将根据本示例性实施例的表示字符串大小的参数定义为通过在检测时间内平均字符串大小来计算出的字符串大小。
“画面上的字符串位置”是表示画面上字符串的位置的参数。在运动图像拍摄期间检测到的字符串位置是在图像传感器的光接收表面上形成图像的字符串的位置。因此,正如在字符串大小的情况下,由于根据用户操作变焦按钮而进行的透镜单元的移动或者被摄体的移动,因而字符串位置在时间轴上实时变化。
在这方面,以如下方式来定义根据本示例性实施例的表示字符串位置的参数:将显示画面上的区域分割为多个区域、并然后通过判断在哪个区域中字符串区域的重心已经被检测了最长时间段来定义每个分割后的区域。
“字符串识别精度”是表示识别字符串的精度的参数。根据背景颜色是否均匀以及背景区域的亮度级和字符串区域的亮度级之间的差有多大来确定该识别精度。因此,由于根据用户操作变焦按钮而进行的透镜单元的移动或者被摄体的移动,识别精度在时间轴上实时变化。定义根据本示例性实施例的字符串识别精度具有检测时长内的最高精度。
现在,将说明上述参数值。将表示检测时刻的参数值表示为从为文件开始的时间设置的值“0”开始的经过时间。表示检测时长的参数值是由连续拍摄的秒数来表示。
表示文件名按钮用户操作时刻的参数值是由表示用户是否已经按压文件名按钮的值来表示。表示提取频率的参数值是由在文件内检测到相同文本数据的次数来表示。
表示字符串大小的参数值是由每个预定像素大小的矩形所覆盖的大小,在该矩形中,可以适当地框出(frame)平均大小字符串的第一字符。表示字符串大小的参数值用先前指派给预定矩形的值来表示。
例如,如果字符串的大小小于矩形“a”的大小(图4),那么将字符串大小的参数值设置为“0”。如果字符串的大小大于矩形“a”的大小但小于矩形“b”的大小(图4),那么将字符串大小的参数值设置为“1”。如果字符串的大小大于矩形“b”的大小但小于矩形“c”的大小(图4),那么将字符串大小的参数值设置为“2”。如果字符串的大小大于矩形“c”的大小,那么将字符串大小的参数值设置为“5”。
根据字符串已经被检测了最长时间段的字符串位置存在于哪个区域(显示画面的区域A、B、C和D中的每个(图3))中,将画面上字符串的位置的参数值设置为“0”、“1”、“2”或“5”。表示识别精度的参数用检测时间内的最高识别精度来表示。
图2A示出根据本示例性实施例的显示在显示单元16上的捕捉的图像数据的一个场景的例子。图2A中示出的场景是在开始拍摄后五秒时拍摄的场景。包括具有图2A中的场景的图像数据的文件包括已经连续拍摄了60分钟的图像数据。
这里,为了便于理解,假定在检测时间内已经平均了字符串的大小。此外,字符串位置表示字符串已经被检测了最长时间段的位置。此外,识别精度表示检测时间内的最高精度。在图2A中的场景中, 已经识别了两个字符串, 即,“ABC”和“DEFGH”。如下为用于所识别的字符串的参数值。
也就是说,对于字符串“ABC”的参数值,将检测时刻设置为“00:00:05”,检测时长设置为“5”,并且将字符串检测频率设置为“1”。此外,将字符串大小设置为“1”,将画面上字符串的位置设置为“5”,将缩略图按钮上的压力级设置为“0”,并且将识别精度设置为80%。
对于字符串“DEFGH”的参数值,将检测时刻设置为“00:00:01”,将检测时长设置为“20”,并且将字符串检测频率设置为“1”。此外,将字符串大小设置为“2”,将画面上字符串的位置设置为“2”,将缩略图按钮上的压力级设置为“0”,并且将识别精度设置为90%。
现在,参考图5的流程图下面将说明根据本示例性实施例的、使用所检测到字符串的文本数据和被记录为与字符串成组的参数值来从多个字符串中选择文件名的方法。
图5是示出根据本示例性实施例的从捕捉图像数据到选择文件名的处理的例子的流程图。
参考图5,在已经开始处理之后,在步骤S101,控制单元13从文件的第一图像按顺序读取图像。
在步骤S102,控制单元13判断在拍摄的场景中是否包括字符串。
如果在步骤S102中判断为所拍摄的场景没有包括字符串(步骤S102中为“否”),那么该控制单元13进入步骤S112。在步骤S112,控制单元13判断当前场景是否为文件的末尾。
如果在步骤S112中判断为当前场景不是文件的末尾(步骤S112中为“否”),那么该控制单元13返回步骤S101并顺次读取图像直到找到具有字符串的图像为止。另一方面,如果在步骤S112中判断为当前场景是文件的末尾(步骤S112中为“是”),那么该控制单元13进入步骤S113。在步骤S113,控制单元13将拍摄日期和时间设置为文件名,然后结束该处理。
另一方面,如果在步骤S102中判断为所拍摄的场景包括字符串(步骤S102中为“是”),那么该控制单元13进入步骤S103。在步骤S103,在控制单元13的控制下,字符串转换处理单元15进行字符识别。
在步骤S104,控制单元13判断是否成功地进行了步骤S103中的字符识别。
如果在步骤S104中判断为已经成功地进行了步骤S103中的字符识别(步骤S104中为“是”),那么控制单元13进入步骤S105。另一方面,如果在步骤S104中判断为没有成功地进行步骤S103中的字符识别(步骤S104中为“否”),那么控制单元13返回步骤S101以重复上述处理。
在步骤S105,控制单元13设置表示字符信息出现的特性的参数值。在步骤S106,控制单元13将字符串的文本数据和用于字符信息出现的参数值作为组存储在存储器单元14上。
在步骤S107,控制单元13以下面的方式转换参数值并使用转换后的参数值来计算评价值。首先,对于作为用于检测时刻的参数值的、从开始拍摄起的经过的时间,控制单元13将从开始拍摄起的10秒或者更早的经过时间转换成5点、并将从开始拍摄起的30秒或更早的且在10秒之后的经过时间转换为2点,作为表示与文件的开头的接近度的加权。此外,控制单元13将从开始拍摄起的1分钟或更早且在30秒之后的经过时间转换成1点、并将从开始拍摄起的在1分钟之后的经过时间设置为0点。
另一方面,控制单元13将到结束拍摄的10秒或更少的经过时间转换成5点,将到结束拍摄的30秒或更少且多于10秒的经过时间转换成2点,将到结束拍摄的1分钟或更少且多于30秒的经过时间转换成1点,且将到结束拍摄时多于1分钟的经过时间转换成0点,作为表示到文件的末尾的接近度的加权。转换用于检测时长的参数值作为通过将秒数(参数值)乘以1/10计算出的数值。
对于用于文件名按钮操作时刻的参数值,控制单元13将存在用户文件名按钮操作的检测结果转换成1点、并将不存在用户文件名按钮操作的检测结果转换成0点。对于用于提取频率的参数值,控制单元13将提取数转换成点。
对于用于字符串大小的参数值,控制单元13将与各种矩形的大小相对应的数值转换成点。对于用于画面上字符串位置的参数值,控制单元13将数值转换成点。对于用于字符串识别精度的参数值,控制单元13照原样使用字符识别精度的比率。
通过下面的表达式可以计算评价值H:
H=用于检测次数的值×{(文件名按钮用户操作值+1)×字符串识别精度值×(用于从文件的开头起的检测时刻的值+检测时长值+用于到文件的末尾的检测时刻的值+字符串大小值+用于画面上的字符串位置的值)}。
在步骤S108,控制单元13在存储器单元14上存储由此计算出的评价值。
在步骤S109,控制单元13将所存储的评价值相互比较以选择作为文件中最大值的评价值X。这里,将初始评价值X定义为“0”。如果在步骤S109中判断为不满足表达式“Xi+1>Xi”(步骤S109中为“否”),那么控制单元13使“i”增加1并返回步骤S101。
在已经选择了最大评价值X之后,控制单元13进入步骤S110。在步骤S110,控制单元13判断是否已经对文件中的所有字符串进行了比较(当前图像是否为文件的末尾)。
如果在步骤S110中判断为当前图像不是文件的末尾(步骤S110中为“否”),那么该控制单元13返回步骤S101以重复上述处理。另一方面,如果在步骤S110中判断为当前图像是文件的末尾(步骤S110中为“是”),那么控制单元13进入步骤S111。
在步骤S111,控制单元13将具有最大评价值Xi的字符串设置为用于运动图像文件的文件名。例如,在仅有两个字符串、即已经在图2A的条件下提取的“ABC”和“DEFGH”存在于文件中的情况下,字符串“ABC”的评价值是9.2点且字符串“DEFGH”的评价值是11.7点。因此,字符串“DEFGH”被判断为具有这两个中的较大评价值。因此,控制单元13确定文件的文件名(数据文件名)为“DEFGH”。
在显示单元16上显示所设置的文件名。这里,如果自动设置的文件名与用户期望的文件名不同,那么用户可以选择并指定其它图像中的字符串作为文件名,其中,该其它图像是从具有作为按评价值的降序的列表显示在显示单元16上的字符串的图像中选择的。
通过添加和使用与时间轴有关的参数作为由字符信息出现的特性定义的参数,控制单元13可以从在拍摄运动图像期间相继出现的多个字符串中选择一个字符串,并设置所选择的字符串作为文件名。
在本示例性实施例中,下面的表达式用于计算评价值H。也就是说,如果使用用于计算评价值H的下面的表达式,那么用户可以选择具有用户期望用作为文件名的字符串的图像,并因此用户可以更正确地设置文件名。
H=h×用于检测次数的值×{(n ×用于文件名按钮用户操作的值+1)×1×字符识别精度值×(x ×用于从文件的开头起的时刻的值+y×用于到文件的末尾的时刻的值+q×检测时长值+p×字符串大小值+z×用于画面上字符串位置的值)},其中,“h”和“n”表示用于提取频率的优先度的系数,“1”表示用于字符识别精度的优先度的系数,“x”表示从文件的开头起的时刻的优先度的系数,“y”表示到文件的末尾的时刻的优先度的系数,“q”表示用于检测时长的优先度的系数,“p”表示用于字符串大小的优先度的系数,“z”表示用于画面上字符串的位置的优先度的系数,并且上述系数“1”、“x”、“y”、“q”、“p”、和“z”每个表示作为文件名的适当性的字符串的权重的值。
也就是说,用户可以操作操作单元17的菜单操作按钮以有选择地改变上述参数的优先度并改变表示表示作为文件名的适当性的字符串的权重的值。
如上所述,通过改变作为文件名的字符串的适当性的值,用户可更精确地选择用户期望用作为文件名的字符串。
这里,将表示作为文件名的适当性的字符串的权重用的值记录在与存储包括捕捉的图像信号的数据文件的相同的记录介质上(在本实施例,光盘20)是有用的,从而维持一个记录介质上的文件名的一致性。此外,可以将表示作为文件名的适当性的字符串的权重用的值记录在与存储包括捕捉的图像信号的数据文件的不同的记录单元(例如,摄像机中的非易失性存储器单元(在本实施例中,存储器单元14))上。利用这种结构,在使用相同的摄像机来拍摄运动图像的情况下,可以维持文件名的一致性。
在搜索没有被用作为文件名的字符串的情况下,制作字符串的列表并按照提取频率的顺序或者字符串大小的顺序在显示单元16上显示该字符串列表是有用的。利用这种结构,用户可以从包括字符串的大量场景中更容易地搜索期望场景。例如,按照评价值的顺序在显示单元16上显示该字符串列表是有用的。利用这种结构,用户可以从在大容量的文件中所包括的许多字符串中更容易地搜索包括具有期望字符串的图像的场景。
图6示出根据本示例性实施例的作为运动图像文件的文件1的例子。参考图6,文件1的部分“场景6-1”、“场景6-2”、“场景6-3”和“场景6-4”每个包括相应的拍摄的场景(场景6-1、6-2、6-3或6-4(图7))。在运动图像文件1中具有最大评价值的字符串是场景6-1中的字符串“1.AAAAA”。因此,文件1的文件名被确定为“1.AAAAA”。
用户具有包括字符串的拍摄场景(场景6-1、6-2、6-3或6-4(图7))。因此,在搜索运动图像文件时,列出字符串并将其显示单元16上(图8)。通过在搜索运动图像文件时显示没有被用作为文件名的字符串的列表,用户可以容易地搜索包括用户期望用作为文件名的字符串的场景。
同时,在拍摄运动图像时,在某些情况下,用户可以拍摄从拍摄开始到拍摄结束的一系列场景作为一个文件,在拍摄已经结束后分割该文件,并进行如重新排列分割后的文件的顺序等编辑操作。
在这方面,现在将说明在将一个文件分割成多个文件时进行的用于选择文件名的方法。
图9是示出根据本示例性实施例的用于选择文件名的处理的例子的流程图。图9的流程图示出在将一个文件1(图10)分割成文件2(图10)和文件3(图10)时进行的用于选择文件名的处理。
当处理开始时,在步骤S801,控制单元13判断该文件1是否已经被分割并等待直到判断为该文件1已经被分割为止。如果在步骤S801中判断为文件1已经被分割为文件2和文件3(步骤S801中为“是”),那么该控制单元13进入步骤S802。在步骤S802,控制单元13读取在作为分割的结果已经获得的文件3中包括的字符串和参数值。这里,设置文件2的文件名与文件1的文件名相同。
在步骤S803,控制单元13判断在作为分割的结果已经获得的文件3中是否存在字符串。如果在步骤S803中判断为在文件3中不存在字符串(步骤S803中为“否”),那么控制单元13进入步骤S804。在步骤S804,控制单元13进行用于在文件被分割前将连续编号添加至文件的文件名的处理,然后结束该处理。
另一方面,如果在步骤S803中判断为在作为分割的结果已经获得的文件3中存在字符串(步骤S803中为“是”),那么控制单元13进入步骤S805。在步骤S805,控制单元13对于文件3使用上述方法将评价值相互比较。在步骤S806,控制单元13将文件3内的具有最大评价值的字符串设置为文件3的文件名。
在显示单元16上显示如上所述自动设置的文件3的文件名。如果自动设置的文件名不同于用户期望的文件名,那么用户可以从按照评价值的顺序、列出并显示在显示单元16上的字符串中选择不同的期望字符串、并将该期望的字符串设置为文件3的文件名。
例如,在运动图像文件1(图6)被分割成文件2(图10)和文件3(图10)的情况下,控制单元13对于作为分割的结果已经获得的文件3的评价值进行计算。这里,如果文件3内具有最大评价值的字符串是已经从图7的场景中提取的字符串“4.BBBBB”,那么控制单元13将字符串“4.BBBBB”设置为文件3的文件名。这里,通过同样对于文件2的评价值进行计算来新设置文件2的文件名。
如上所述,根据本示例性实施例,在用户从拍摄开始到拍摄结束已经拍摄了一系列的场景作为一个文件、并在拍摄操作已经结束后将文件分割成多个文件的情况下,可以将作为字符识别的结果获取的新文件名添加至作为分割的结果获得的文件。因此,即使在作为分割的结果已经获得的文件的顺序被重新排列的情况下,用户也可以容易地识别文件的内容而不需要费力地仔细验证文件的内容。
第二示例性实施例
现在,将说明本发明的第二示例性实施例。在本示例性实施例中,摄像机具有与在第一示例性实施例的图1中示出的结构类似的结构。因此,将不重复根据本示例性实施例的摄像机的结构。
根据本示例性实施例的摄像机将参数值设置为已经从在拍摄期间生成的图像数据提取的字符串、并基于所提取的字符串的出现的特性进行加权以选择适当的缩略图。在本示例性实施例中,用作参数值设置单元的控制单元13使用包括如下的参数的至少之一来设置参数值:检测时刻、检测时长、检测频率、字符串大小、画面上字符串的位置以及字符串识别精度。
现在,将说明用于设置参数值的操作以及用于选择用于生成缩略图的图像的处理。首先,将说明根据本示例性实施例的由运动图像拍摄设备进行的用于设置参数值的操作。本示例性实施例使用检测时刻、缩略图按钮用户操作时刻、检测时长、提取频率、字符串大小、画面上的字符串位置以及字符串识别精度作为参数。
在本示例性实施例中,“检测时刻”指文件内所识别的字符串在时间轴上的位置。“缩略图按钮用户操作时刻”指在拍摄运动图像期间用户期望设置为缩略图的字符串出现时的时刻。在此时刻,用户通过操作显示在操作单元17上的缩略图按钮可以对字符串进行期望加权。因此,用户可以改变根据参数值来计算评价值的定义。
这里,操作单元17用作允许用户改变计算评价值用的定义的操作单元。因此,用户的期望可以适当地反映在利用用作评价值计算单元的控制单元13来根据参数值而计算评价值中。
这里用户按压的缩略图按钮可以具有用于拍摄照片的照片按钮的双重功能。“检测时长”是表示已经连续检测到字符串的参数。“提取频率”是表示检测到文件中字符串的频率的参数。
“字符串大小”是表示字符串的第一字符的大小的参数。在拍摄运动图像期间检测到的字符串的大小是在图像传感器的光接收表面上形成图像的字符串的大小。因此,由于根据用户操作变焦按钮而进行的透镜单元的移动或者被摄体的移动,因而字符串大小在时间轴上时刻变化。
“画面上的字符串位置”是表示画面上字符串的位置的参数。在拍摄运动图像期间检测到的字符串位置是在图像传感器的光接收表面上形成图像的字符串的位置。因此,正如在字符串大小的情况下,由于根据用户操作变焦按钮而进行的透镜单元的移动或者被摄体的移动,因而字符串位置在时间轴上时刻变化。
“字符串识别精度”是表示识别字符串的精度的参数。根据背景颜色是否均匀以及背景区域的亮度级和字符串区域的亮度级之间的差有多大来判断识别精度。因此,由于根据用户操作变焦按钮而进行的透镜单元的移动或者被摄体的移动,因而识别精度在时间轴上实时变化。根据本示例性实施例,将字符串识别精度定义为检测时间内的最高精度。
现在,将说明上述参数值。将表示检测时刻的参数值表示为从为开始文件的时间设置的值“0”开始的经过时间。表示检测时刻的参数值表示与作为缩略图的基础的图像的关系度。
表示检测时长的参数值是由连续拍摄的秒数来表示。表示缩略图按钮用户操作时刻的参数值是由表示用户是否按压了缩略图按钮的值来表示。表示提取频率的参数值是由在文件中检测到相同文本数据的次数来表示。
表示字符串大小的参数值是由每个预定像素大小的矩形所覆盖的大小,在该矩形中,可以适当地框出平均大小的字符串的第一字符。表示字符串大小的参数值用先前指派给预定矩形的值来表示。例如,如果矩形的大小小于矩形“a”的大小(图4),那么将用于字符串大小的参数值设置为“0”。如果矩形的大小大于矩形“a”的大小但小于矩形“b”的大小(图4),那么将用于字符串大小的参数值设置为“1”。如果矩形的大小大于矩形“b”的大小但小于矩形“c”的大小(图4),那么将用于字符串大小的参数值设置为“2”。如果矩形的大小小于矩形“c”的大小,那么将用于字符串大小的参数值设置为“5”。
根据已经检测了字符串最长时间段的字符串的位置存在于哪个区域(显示画面的区域A、B、C和D的每个(图3))中,将用于画面上字符串的位置的参数值设置为“0”、“1”、“2”或“5”。表示识别精度的参数值是由识别精度的比率(%)来表示。
图2B和2C每个示出根据本示例性实施例的具有字符串、且显示在显示单元16上的数据文件的一个场景的例子。在该数据文件内,图2B和2C中示出的场景的仅两个场景包括字符串。图2B中示出的场景是在开始拍摄之后5秒时拍摄的场景。图2C中示出的场景是在开始拍摄之后50分钟时拍摄的场景。包括具有图2B或图2C中的场景的图像数据的文件包括已经连续拍摄了60分钟的图像数据。
根据图2B中的场景来识别出字符串“ABC”。根据图2C的场景来识别出字符串“DEFGH”。根据图2B和图2C的场景识别出的每个字符串的参数值为如下所示。
也就是说,对于字符串“ABC”(图2B)的参数值,将检测时刻设置为“00:00:05”,检测时长设置为“5”,并且将字符串检测频率设置为“1”。此外,将字符串大小设置为“1”,画面上字符串的位置设置为“5”,缩略图按钮上的压力级设置为“0”,并且将识别精度设置为80%。
对于字符串“DEFGH”(图2C)的参数值,将检测时刻设置为“00:00:55”,检测时长设置为“20”,并且将字符串检测频率设置为“1”。此外,将字符串大小设置为“2”,画面上字符串的位置设置为“2”,缩略图按钮上的压力级设置为“0”,并且将识别精度设置为90%。
现在,参考图11的流程图下面将说明根据本示例性实施例的使用检测到的字符串的、文本数据和存储器单元14上被记录成组的参数值来选择要用于生成缩略图的图像(缩略图源图像)的方法。
图11是示出根据本示例性实施例的从捕捉图像数据到选择缩略图的处理的例子的流程图。
参考图11,在开始该处理之后,在步骤S1101,控制单元13从文件的第一图像按顺序读取图像。在步骤S1102,控制单元13判断字符串是否被包括在所拍摄的场景中。
如果在步骤S1102中判断为所拍摄的场景没有包括字符串(步骤S1102中为“否”),那么控制单元13进入步骤S1112。在步骤S1112,控制单元13判断当前场景是否为文件的末尾。如果在步骤S1112中判断为当前场景不是文件的末尾(步骤S1112中为“否”),那么该控制单元13返回步骤S1101并顺次读取图像直到找到具有字符串的图像为止。另一方面,如果在步骤S1112中判断为当前场景是文件的末尾(步骤S1112中为“是”),那么控制单元13进入步骤S1113。在步骤S1113,控制单元13将位于第一图像之后预定时长的位置处的帧内编码的图像设置为缩略图源图像,然后结束该处理。
另一方面,如果在步骤S1102中判断为拍摄的场景包括字符串(步骤S1102中为“是”),那么控制单元13进入步骤S1103。在步骤S1103,在控制单元13的控制下,字符串转换处理单元15进行字符识别。在步骤S1104,控制单元13判断是否成功地进行了步骤S1103中的字符识别、并评价字符识别精度。
如果在步骤S1104中判断为没有成功地进行步骤S1103中的字符识别(步骤S1104中为“否”),那么控制单元13返回步骤S1101以重复上述处理。另一方面,如果在步骤S1104中判断为已经成功地进行了步骤S1103中的字符识别(步骤S1104中为“是”),那么控制单元13进入步骤S1105。在步骤S1105,用作参数值设置单元的控制单元13设置表示所提取的字符串的出现的特性的参数值。在步骤S1106,控制单元13将字符串的文本数据和用于字符信息出现的参数值作为组存储在存储器单元14上。
在步骤S1107,控制单元13以下面的方式转换参数值并使用转换后的参数值来计算评价值。首先,对于作为用于检测时刻的参数值的从开始拍摄起的经过时间,控制单元13将从开始拍摄起的10秒或更早的经过时间转换成5点,并将从开始拍摄起的30秒或更早并在10秒之后的经过时间转换成2点,作为表示与文件的开头的接近度(closeness)的加权。此外,控制单元13将从开始拍摄起的1分钟或更早并在30秒之后的经过时间转换成1点,并将从开始拍摄起的1分钟之后的经过时间转换成0点。
另一方面,控制单元13将到结束拍摄的10秒或更少的经过时间转换成5点,将到结束拍摄的30秒或更少并多于10秒的经过时间转换成2点,将到结束拍摄的1分钟或更少并多于30秒的经过时间转换成1点,并且将到结束拍摄的多于1分钟的经过时间设置为0点,作为表示到文件的末尾的接近度的加权。将检测时长的参数值转换为通过将秒数(参数值)乘以1/10所计算出的数值。
对于用于缩略图按钮操作时刻的参数值,控制单元13将存在用户缩略图按钮操作的检测结果转换成1点、并将不存在用户缩略图按钮操作的检测结果转换成0点。对于用于提取频率的参数值,控制单元13将提取数转换成预定点。对于用于字符串大小的参数值,控制单元13将对应于各种矩形的大小的数值转换成点。对于用于画面上字符串位置的参数值,控制单元13将该数值转换成点。对于用于字符串识别精度的参数值,控制单元13照原样使用字符识别精度的比率。
通过下面的表达式可以计算评价值H:
H=用于检测次数的值×{(缩略图按钮用户操作值+1)×字符识别精度值×(从文件的开头起的检测时刻的值+检测时长值+到文件的末尾的检测时刻的值+字符串大小值+画面上字符串位置的值)}。
在步骤S1108,控制单元13在存储单元14上存储由此计算出的评价值。在步骤S1109中,控制单元13将所存储的评价值相互比较以选择作为文件中最大值的评价值X。这里,将初始评价值X定义为“0”。如果在步骤S1109中判断为没有选择最大评价值X(步骤S1109中为“否”),那么控制单元13对“i”增加1并返回步骤S1101以重复上述处理。
在已经选择了最大评价值X之后,控制单元13进入步骤S1110。在步骤S1110,控制单元13判断是否已经对文件中的所有字符串进行比较。
如果在步骤S1110中判断为已经选择了最大评价值X(步骤S1110中为“是”),那么该控制单元13进入步骤S1111。在步骤S1111,控制单元13将包括具有最大评价值Xi的字符串的图像设置为运动图像文件的缩略图源图像。
例如,在仅两个字符串,即仅“ABC”(图2B)和“DEFGH”(图2C)存在于文件中的情况下,字符串“ABC”的评价值是9.2点并且字符串“DEFGH”的评价值是5.4点。因此,字符串“ABC”被判断为具有这两个中较大的评价值。因此,控制单元13确定具有字符串“ABC”的图2B中的场景为文件的缩略图源图像。
基于已经如此设置的缩略图源图像,用作缩略图生成单元的控制单元13生成缩略图。在显示单元16上显示所生成的缩略图。这里,如果自动设置的缩略图不同于用户期望的缩略图,那么用户可以选择并指定具有字符串的其他图像作为缩略图,其中,该其它图像是从具有作为按评价值的降序的列表显示在显示单元上的字符串的图像中选择。
通过使用由字符信息出现特性定义的参数来进行上述处理,本示例性实施例允许用户从包括多个字符串的多条图像数据中适当地选择缩略图源图像,而无需费力地进行复杂的操作。
在本示例性实施例中,使用用于计算评价值H的下面的表达式是更有用的。也就是说,如果使用用于计算评价值H的下面的表达式,那么用户可以选择具有用户期望用作为缩略图的字符串的图像,因此,用户可以更准确地设置缩略图。
H=h×用于检测的次数的值×{(n×缩略图按钮用户操作的值+1)×1×字符识别精度值×(x×从文件的开头起的时刻的值+y×到文件的末尾的时刻的值+q×检测时长值+p×字符串大小值+z×画面上字符串位置的值)},其中“h”和“n”表示提取频率的优先度的系数,“1”表示字符识别精度的优先度的系数,“x”表示从文件的开头起的时刻的优先度的系数,“y”表示到文件的末尾的时刻的优先度的系数,“q”表示检测时长的优先度的系数,“p”表示字符串大小的优先度的系数,“z”表示画面上字符串的位置的优先度的系数,并且上述系数“1”、“x”、“y”、“q”、“p”、和“z”每个表示用于表示作为缩略图的适当性的字符串的权重的值。
也就是说,用户可以操作操作单元17的菜单操作按钮以改变以何种优先度要优先上述参数中的哪个,以改变表示作为缩略图的适当性的字符串的加权的值。
如上所述,通过改变表示作为缩略图的字符串的适当性的值,用户可以更正确地选择用户期望用作为缩略图的字符串。
这里,将表示作为缩略图的适当性的字符串的加权的值记录在与存储包括捕捉的图像信号的数据文件的相同的记录介质(在本实施例中,光盘20)上是有用的,从而维持一个记录介质上缩略图的一致性。此外,可以将表示作为缩略图的适当性的字符串的加权的值记录在与存储包括捕捉的图像信号的数据文件的不同的记录单元(例如,摄像机中的非失性存储器单元(在本实施例中,存储器单元14))上。利用这种结构,可以在通过利用相同的摄像机拍摄运动图像所捕捉的数据文件中保持缩略图的一致性。
在搜索具有未被用作为缩略图的字符串的图像的情况下,制作字符数据的列表并按照提取频率、字符串大小或者评价值的顺序在显示单元16上显示字符数据列表是有用的。利用这种结构,用户可以从包括字符串的大量场景中更容易地搜索期望场景。利用这种结构,用户可以在大容量的文件中所包括的许多字符串中更容易地搜索包括具有期望字符串的图像的场景。
图12示出根据本示例性实施例的作为一个运动图像文件的文件B的例子。
参考图12,文件B的部分“场景6-1”、“场景6-2”、“场景6-3”、“场景6-4”和“场景6-5”每个包括相应的拍摄的场景(场景6-1、6-2、6-3、6-4或者6-5(图13))。场景6-1~6-5的每个包括具有字符串的图像。
按照场景6-1、场景6-2、场景6-5、场景6-4、和场景6-3的顺序,字符串评价值变小。也就是说,运动图像文件B中具有最大评价值的字符串是场景6-1中的字符串“1.AAAAA”。因此,将文件B的缩略图确定为场景“1.AAAAA”。
图14示出根据本示例性实施例的在利用用作图像信号搜索单元的控制单元13搜索图像信号时显示在摄像机的显示单元16上的图像的例子。如在图14中所示,在用户搜索数据文件时,将以上述方式已经先前确定的、例如文件A的缩略图71、文件B的缩略图72、和文件C的缩略图73的每个显示在摄像机的显示单元16上作为列表。这里,与摄像机的显示单元16的画面的大小相比,每个缩略图的大小是非常小的。因此,对用户来讲,在仅观看缩略图画面时,可能难以适当地验证数据文件的内容。
在这方面,根据本示例性实施例的摄像机,与缩略图图像一起显示在每个文件的字符串中具有最大评价值的字符串,作为大尺寸的文本数据(文本数据74、75、或76(图14))。利用这种结构,即使在用户观看摄像机的显示单元16的小尺寸的画面时,本示例性实施例也可以允许用户容易地识别数据文件的内容。
与缩略图图像一起显示的字符串不限于基于评价值。也就是说,字符串可以是基于包括检测时刻、缩略图按钮用户操作时刻、检测时长、提取频率、字符串大小、画面上的字符串位置、以及字符串识别精度的参数。可以将要与缩略图图像一起显示的字符串改变为与包括在缩略图图像中的字符串不同的其它字符串。
此外,在搜索一个文件B中的拍摄的图像的情况下,可以如图15的列表栏81中那样,列出所提取的字符串。
此外,通过如在列表栏91中那样,在显示单元16上一起显示字符串和所拍摄的图像列表,本示例性实施例可以允许用户在观看显示单元16的画面时更容易地识别数据文件的内容。如上所述,利用在用户搜索时使用的所提取的字符串,本示例性实施例可以允许用户更容易地搜索期望场景。
其它示例性实施例
通过存储在计算机的随机存取存储器(RAM)或只读存储器(ROM)上的计算机程序可以实现根据本示例性实施例的构成运动图像拍摄设备的每个单元和运动图像拍摄方法的每个步骤。程序和存储该程序的计算机可读记录介质包括在本发明中。
例如,可以在系统、设备、方法、程序或者存储该程序的存储介质中实现本发明。更具体地,可以将本发明应用于包括多个装置的系统以及包括单个装置的设备。
通过直接或间接地向系统或设备提供实现上述示例性实施例的功能的软件的程序(在本实施例中,对应于根据图5、9、和11中的流程图进行的处理的程序)、并利用系统或设备的计算机读取并执行所提供的程序代码可以实现本发明。
因此,安装至计算机以利用计算机来实现本发明的功能处理的程序代码自身实现了本发明。也就是说,本发明还包括实现本发明的功能处理的计算机程序。
因此,可以以任何形式配置该程序,如对象代码、由解释器执行的程序、以及提供给操作系统(OS)的脚本数据等。
可以使用如下作为用于提供这种程序代码的记录介质:例如,软盘、硬盘、光盘、磁光盘(MO)、致密盘只读存储器(CD-ROM)、可记录CD(CD-R)、可写CD(CD-RW)、磁带、非易失性存储卡、ROM、数字多功能盘(DVD)(DVD只读存储器(DVD-ROM))和可记录DVD(DVD-R))。
还可以通过使用客户计算机的浏览器连接至因特网上的网站并从该网站下载程序至如硬盘等记录介质来提供上述程序。另外,还可以通过从网站下载包括自动安装功能的压缩文件至如硬盘等记录介质来提供上述程序。
还可以通过将程序代码分割成多个文件、并从不同的网站下载每个分割后的文件来实现上述实施例的功能。也就是说,用于允许多个用户下载用于实现功能处理的程序文件的万维网(WWW)服务器构成本发明。
另外,通过在加密之后分发存储根据本发明的程序的如CD-ROM等存储介质、通过允许满足预定条件的用户通过因特网从网站下载用于解码该加密的密钥信息、并通过使用该密钥信息来执行并将该加密的程序代码安装在计算机上来提供上述程序。
另外,不仅通过执行由计算机读取的程序代码可以实现根据上述实施例的功能、而且通过基于由程序代码给出的指令通过OS等执行实际处理的部分或全部的处理来实现根据上述实施例的功能。
此外,根据本发明实施例的另一方面,在将从记录介质读取的程序代码写入设置在插入至计算机中的功能扩展板或者连接至计算机的功能扩展单元中的存储器中之后,功能扩展板或者功能扩展单元中设置的CPU等执行部分或全部处理以实现上述实施例的功能。
尽管已经参考典型实施例说明了本发明,但是应该理解,本发明不限于所公开的典型实施例。所附权利要求书的范围符合最宽的解释,以包含所有这类修改、等同结构和功能。
Claims (18)
1.一种运动图像拍摄设备,包括:
摄像单元,用于捕捉视觉信息以输出图像信号;
文件生成单元,用于生成数据文件以将从所述摄像单元输出的所述图像信号记录在记录介质上;
字符识别单元,用于从要被记录在记录介质上的所述图像信号提取字符信息;
参数值设置单元,用于根据所述数据文件内由所述字符识别单元提取的字符信息的出现的特性,来设置用于选择作为文件名的、与时间轴有关的参数值;
评价值计算单元,用于根据由所述参数值设置单元设置的所述参数值来计算评价值;以及
文件名设置单元,用于将基于由所述评价值计算单元计算出的所述评价值的字符信息设置为所述图像信号的文件名。
2.根据权利要求1所述的运动图像拍摄设备,其特征在于,使用如下的至少之一来设置所述参数值:字符信息检测时刻、字符信息检测时长、字符信息检测频率、字符信息大小、显示画面上的字符信息位置以及字符信息识别精度。
3.根据权利要求1所述的运动图像拍摄设备,其特征在于,用于根据所述参数值来计算所述评价值的定义能够被用户改变。
4.根据权利要求1所述的运动图像拍摄设备,其特征在于,还包括图像信号搜索单元,所述图像信号搜索单元用于使用所提取的字符信息和所述参数值来搜索所述图像信号。
5.根据权利要求1所述的运动图像拍摄设备,其特征在于,当添加有所述文件名的数据文件被分割为多个文件时,所述文件名设置单元使用根据所述参数值计算出的所述评价值来向每个分割后的文件添加新文件名。
6.一种运动图像拍摄方法,包括:
捕捉视觉信息以输出图像信号;
生成数据文件以将输出的所述图像信号记录在记录介质上;
从要被记录在所述记录介质上的所述图像信号提取字符信息;
根据所述数据文件内的所提取的字符信息的出现的特性来设置用于选择作为文件名的、与时间轴有关的参数值;
根据设置的所述参数值来计算评价值;以及
将基于计算出的所述评价值的字符信息设置为所述图像信号的文件名。
7.根据权利要求6所述的运动图像拍摄方法,其特征在于,使用如下的至少之一来设置所述参数值:字符信息检测时刻、字符信息检测时长、字符信息检测频率、字符信息大小、显示画面上的字符信息位置以及字符信息识别精度。
8.根据权利要求6所述的运动图像拍摄方法,其特征在于,用于根据所述参数值来计算所述评价值的定义能够被用户改变。
9.根据权利要求6所述的运动图像拍摄方法,其特征在于,还包括使用所提取的字符信息和所述参数值来搜索所述图像信号。
10.根据权利要求6所述的运动图像拍摄方法,其特征在于,还包括在将添加有所述文件名称的数据文件分割为多个文件时,使用根据所述参数值计算出的所述评价值来向每个分割后的文件添加新文件名。
11.一种运动图像拍摄设备,包括:
摄像单元,用于捕捉视觉信息以输出图像信号;
文件生成单元,用于生成数据文件以将从所述摄像单元输出的所述图像信号记录在记录介质上;
字符识别单元,用于从所述图像信号提取字符信息;
参数值设置单元,用于根据所述数据文件内由所述字符识别单元提取的字符信息的出现的特性来设置与时间轴有关的参数值;
评价值计算单元,用于根据由所述参数值设置单元设置的所述参数值来计算评价值;以及
缩略图生成单元,用于基于提取了计算出的所述评价值最大的字符信息的图像信号来生成所述数据文件的缩略图。
12.根据权利要求11所述的运动图像拍摄设备,其特征在于,使用如下的至少之一来设置所述参数值:字符信息检测时刻、字符信息检测时长、字符信息检测频率、字符信息大小、显示画面上的字符信息位置以及字符信息识别精度。
13.根据权利要求11所述的运动图像拍摄设备,其特征在于,用于根据所述参数值来计算所述评价值的定义能够被用户改变。
14.根据权利要求11所述的运动图像拍摄设备,其特征在于,还包括图像信号搜索单元,所述图像信号搜索单元用于使用所提取的字符信息和所述参数值来搜索所述图像信号。
15.一种运动图像拍摄方法,包括:
捕捉视觉信息以输出图像信号;
生成数据文件以将输出的所述图像信号记录在记录介质上;
从所述图像信号提取字符信息;
根据所述数据文件内的所提取的字符信息的出现的特性来设置与时间轴有关的参数值;
根据设置的所述参数值来计算评价值;以及
基于提取了计算出的所述评价值最大的字符信息的图像信号来生成所述数据文件的缩略图。
16.根据权利要求15所述的运动图像拍摄方法,其特征在于,使用如下的至少之一来设置所述参数值:字符信息检测时刻、字符信息检测时长、字符信息检测频率、字符信息大小、显示画面上的字符信息位置以及字符信息识别精度。
17.根据权利要求15所述的运动图像拍摄方法,其特征在于,用于根据所述参数值来计算所述评价值的定义可以被用户改变。
18.根据权利要求15所述的运动图像拍摄方法,其特征在于,还包括使用所提取的字符信息和所述参数值来搜索所述图像信号。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007-132088 | 2007-05-17 | ||
JP2007132088A JP5020705B2 (ja) | 2007-05-17 | 2007-05-17 | 動画撮像装置及び動画撮像方法 |
JP2007-132087 | 2007-05-17 | ||
JP2007132087A JP4804417B2 (ja) | 2007-05-17 | 2007-05-17 | 動画撮像装置及び動画撮像方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101309383A CN101309383A (zh) | 2008-11-19 |
CN101309383B true CN101309383B (zh) | 2010-07-21 |
Family
ID=40125567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100818787A Expired - Fee Related CN101309383B (zh) | 2007-05-17 | 2008-05-16 | 运动图像拍摄设备和运动图像拍摄方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4804417B2 (zh) |
CN (1) | CN101309383B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8825670B2 (en) | 2010-02-26 | 2014-09-02 | Rakuten, Inc. | Information processing device, information processing method, and recording medium that has recorded information processing program |
JP7333761B2 (ja) * | 2020-01-30 | 2023-08-25 | シャープ株式会社 | システム及び画像形成システム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3425834B2 (ja) * | 1995-09-06 | 2003-07-14 | 富士通株式会社 | 文書画像からのタイトル抽出装置および方法 |
JP4275866B2 (ja) * | 2000-01-27 | 2009-06-10 | 富士通株式会社 | カラー画像から文字列パターンを抽出する装置および方法 |
JP2002374481A (ja) * | 2001-06-18 | 2002-12-26 | Matsushita Electric Ind Co Ltd | ファイル名設定システム |
JP4239442B2 (ja) * | 2001-07-24 | 2009-03-18 | カシオ計算機株式会社 | 電子カメラ、及びそのプログラム |
JP2004005314A (ja) * | 2002-06-03 | 2004-01-08 | Matsushita Electric Ind Co Ltd | データ検索システム及び、それに関する、装置または方法または記録媒体またはプログラム |
JP2005057360A (ja) * | 2003-08-07 | 2005-03-03 | Hitachi Ltd | 画像撮影装置およびプログラム |
JP2005056315A (ja) * | 2003-08-07 | 2005-03-03 | Ricoh Co Ltd | 情報処理装置、プログラム及び記憶媒体 |
JP4276042B2 (ja) * | 2003-10-07 | 2009-06-10 | パイオニア株式会社 | 索引データ生成装置、索引データ生成方法、索引データ生成プログラムおよびそれを記録した情報記録媒体、並びに、コンテンツデータ再生装置、コンテンツデータ再生方法、コンテンツデータ再生プログラムおよびそれを記録した情報記録媒体 |
JP3912423B2 (ja) * | 2006-01-06 | 2007-05-09 | 三菱電機株式会社 | 推奨番組抽出装置、推奨番組抽出方法 |
-
2007
- 2007-05-17 JP JP2007132087A patent/JP4804417B2/ja not_active Expired - Fee Related
-
2008
- 2008-05-16 CN CN2008100818787A patent/CN101309383B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4804417B2 (ja) | 2011-11-02 |
CN101309383A (zh) | 2008-11-19 |
JP2008288898A (ja) | 2008-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2710594B1 (en) | Video summary including a feature of interest | |
JP4656454B2 (ja) | 記録装置および方法、再生装置および方法、並びにプログラム | |
US9013604B2 (en) | Video summary including a particular person | |
CN101051515B (zh) | 图像处理设备及图像显示方法 | |
CN101267523B (zh) | 处理运动图像的设备、成像设备、图像显示控制方法 | |
US8599316B2 (en) | Method for determining key video frames | |
US8605221B2 (en) | Determining key video snippets using selection criteria to form a video summary | |
EP2577664B1 (en) | Storing a video summary as metadata | |
KR101532294B1 (ko) | 자동 태깅 장치 및 방법 | |
EP1971134B1 (en) | Information processing apparatus, imaging apparatus, image display control method and computer program | |
US8619150B2 (en) | Ranking key video frames using camera fixation | |
CN101383935A (zh) | 数据处理装置、数据处理方法及数据处理程序 | |
EP2053540B1 (en) | Imaging apparatus for detecting a scene where a person appears and a detecting method thereof | |
US8842189B2 (en) | Moving image capture apparatus and moving image capture method | |
CN101753943B (zh) | 图像处理设备和图像处理方法 | |
CN101309383B (zh) | 运动图像拍摄设备和运动图像拍摄方法 | |
JP3780252B2 (ja) | 記録再生装置および記録再生方法 | |
JP2008311847A (ja) | 表示制御装置、表示制御方法、プログラム | |
JP5020705B2 (ja) | 動画撮像装置及び動画撮像方法 | |
JP2008154099A (ja) | カメラ装置およびカメラ装置における静止画生成方法 | |
JP2010004433A (ja) | 動画検索システムおよび動画検索方法、動画検索プログラム並びにそのプログラムを記憶するコンピュータ読み取り可能な記憶媒体 | |
JP2010212821A (ja) | 記録再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100721 Termination date: 20190516 |
|
CF01 | Termination of patent right due to non-payment of annual fee |