CN102385894A - 音视频处理装置、音视频处理方法及其可读取记录介质 - Google Patents
音视频处理装置、音视频处理方法及其可读取记录介质 Download PDFInfo
- Publication number
- CN102385894A CN102385894A CN2010102700683A CN201010270068A CN102385894A CN 102385894 A CN102385894 A CN 102385894A CN 2010102700683 A CN2010102700683 A CN 2010102700683A CN 201010270068 A CN201010270068 A CN 201010270068A CN 102385894 A CN102385894 A CN 102385894A
- Authority
- CN
- China
- Prior art keywords
- index
- operand
- image transitions
- image
- operation result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
音视频处理装置、音视频处理方法及其可读取记录介质。该音视频处理方法,使用在一音视频处理装置上,包含:(a)将至少一2D图像数据转换成至少一3D图像数据;(b)计算该步骤(a)中所产生的多个图像转换运算量指数;(c)累加多个图像转换运算量指数以产生一累加图像转换运算量指数;(d)对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及(e)根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
Description
技术领域
本发明有关于音视频处理方法、存储可执行此方法的程序的可读取记录介质以及使用此方法的音视频处理装置,特别涉及将2D图像转换成3D图像的音视频处理方法、存储可执行此方法的程序的可读取记录介质以及使用此方法的音视频处理装置。
背景技术
在已知技术中,2D(2dimensional,2维)的图像和声音在制作或播放时皆为2D的形态,如果要让声音呈现3D的环绕效果,则须通过OSD(OnScreen Display,屏幕调整功能)来固定开或关。这样的机制让声音无法随着影片内容做调整,因此无法达成较佳的3D音效效果。
发明内容
因此,本发明的一目的在于提供一种可以随着图像3D转换程度改变声音处理方式的音视频处理方法以及相关的音视频处理装置。
本发明的一实施例公开了一种音视频处理方法,使用在一音视频处理装置上,包含:(a)将至少一2D图像数据转换成至少一3D图像数据;(b)计算该步骤(a)中所产生的多个图像转换运算量指数;(c)累加多个图像转换运算量指数;(d)对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及(e)根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
本发明的另一实施例一种内储程序的可读取记录介质,当载入该程序并执行后,可执行下列的步骤:(a)将至少一2D图像数据转换成至少一3D图像数据;(b)计算该步骤(a)中所产生的多个图像转换运算量指数;(c)累加多个图像转换运算量指数;(d)对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及(e)根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
本发明的另一实施例一种音视频处理装置,包含:一图像转换单元,用以将至少一2D图像数据转换成至少一3D图像数据;一处理器,用以计算该图像转换单元在将2D图像转换成3D图像时所产生的多个图像转换运算量指数,该处理器更累加多个图像转换运算量指数,并对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及一声音转换单元,根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
根据前述实施例,可随着2D图像转成3D的程度来处理声音,以得到更好的3D声音效果。
附图说明
图1绘示了根据本发明的一实施例的音视频处理装置。
图2绘示了根据本发明的一实施例的音视频处理方法。
【主要元件符号说明】
100音视频处理装置
101处理器
103图像转换单元
105声音转换单元
具体实施方式
在说明书及所附的权利要求书当中使用了某些词汇来指称特定的元件。本领域技术人员应可理解,硬件制造商可能会用不同的名词来称呼同一个元件。本说明书及所附的权利要求书并不以名称的差异来作为区分元件的方式,而是以元件在功能上的差异来作为区分的准则。在通篇说明书及所附的权利要求书当中所提及的「包含」为一开放式的用语,故应解释成「包含但不限定于」。
图1绘示了根据本发明的一实施例的音视频处理装置100。如图1所示,音视频处理装置100包含一处理器101、一图像转换单元103、以及一声音转换单元105。在本发明中,处理器101的功能也可由一运算单元实现。图像转换单元103用以将至少一2D图像数据转换成至少一3D图像数据。处理器101用以计算图像转换单元103在将2D图像转换成3D图像时所产生的多个图像转换运算量指数。处理器101更累加多个图像转换运算量指数,并对累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果index。然后声音转换单元105根据逻辑运算结果index来将一2D声音数据转换成一3D声音数据。其中,图像转换单元103或声音转换单元105可整合于处理器101中,亦即图像转换单元103和声音转换单元105可以轫体方式让处理器101来执行。
图2绘示了根据本发明的一实施例的音视频处理方法,其可使用但不限制于图1所示的音视频处理装置100。请共同参着图1和图2,以更为了解本发明。如图2所示,此方法包含:
步骤201
使用图像转换单元103将至少一2D图像数据转换成至少一3D图像数据。
步骤203
使用处理器101计算步骤201中所产生的多个图像转换运算量指数。
步骤205
使用处理器101累加多个图像转换运算量指数。
步骤207
使用处理器101对累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果。
步骤209
使用声音转换单元105根据逻辑运算结果来将一2D声音数据转换成一3D声音数据。
步骤203中所称的图像转换运算量指数可随着不同的2D/3D图像转换动作而有所不同。举例来说这些图像转换运算量指数可从一视差指数(stereo)、一亮度指数、一纹理指数(texture)、一尺寸指数、一移动指数(motion parallax)以及一场景切换指数中的至少其中一个。视差指数系代表两眼视差的程度,如果2D图像转3D图像程度愈强,则视差也有对等相关变化。亮度指数用以表示亮度,如果图像愈靠近使用者则亮度指数有相关变化。纹理指数代表图像的模糊程度,如果图像愈靠近使用者则愈清楚,愈远离使用者则愈模糊。尺寸指数代表图像中物体的大小程度,愈靠近前景愈大;愈远离前景,也就是愈靠近背景或后景,则尺寸越小。移动指数代表图像中物体的速度,愈靠近前景移动越快;愈远离前景,也就是愈靠近背景或后景,则移动越慢。场景切换指数代表场景切换的频率,例如从3D图像的前景切到后景又切回到前景。根据这些指数,可以得知2D图像转3D图像的转换程度,可作为2D声音转3D声音的参考。须注意的是,上述指数仅用以举例,并非用以限定本发明,其他2D图像转3D图像时可得知的运算量指数亦应在本发明的范围之内。
在本发明的一实施例中,步骤207中所包含的逻辑运算是将N个图像转换运算量指数累加后再除以N(亦即求出图像转换运算量指数的平均),以得到逻辑运算结果。在一特定实施例中,可使N个图像转换运算量指数的前N/6个由前一组N个图像转换运算量指数的后N/6个所组成,然而本发明不限于此特定实施例,凡是本组N个图像转换运算量指数会参考到前一组指数,以及本组N个图像转换运算量指数会提供某几个指数给下一组指数参考运算,均属本发明范围。或者,也可将N个图像转换运算量指数累加后,除以不同于N的正整数(举例来说,除以2N或N2),此类变化亦应在本发明的范围之内。
在一实施例中,步骤209可包含根据逻辑运算结果来对声音数据的相位和振幅做调整,以将一2D声音数据转换成一3D声音数据。
前述步骤可通过一内储程序的可读取记录介质来实行。当此可读取记录介质中的程序被读取时,便可执行上述的方法。
根据前述实施例,可随着图像转成3D的程度来处理声音,以得到更好的3D声音效果。
以上所述仅为本发明的优选实施例,凡依本发明权利要求书所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (12)
1.一种音视频处理方法,其使用在一音视频处理装置上,该方法包含:
(a)将至少一2D图像数据转换成至少一3D图像数据;
(b)计算该步骤(a)中所产生的多个图像转换运算量指数;
(c)累加多个图像转换运算量指数以产生一累加图像转换运算量指数;
(d)对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及
(e)根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
2.如权利要求1所述的音视频处理方法,其中该逻辑运算包含:将该累加的图像转换运算量指数除以一正整数以得到该逻辑运算结果。
3.如权利要求2所述的音视频处理方法,其中该逻辑运算包含:将N个图像转换运算量指数累加后再除以N,以得到逻辑运算结果。
4.如权利要求1所述的音视频处理方法,其中该图像转换运算量指数系从一视差指数、一亮度指数、一纹理指数、一尺寸指数、一移动指数以及一场景切换指数中的至少其中一个。
5.一种内储程序的可读取记录介质,当载入该程序并执行后,该可读取记录介质可执行下列的步骤:
(a)将至少一2D图像数据转换成至少一3D图像数据;
(b)计算步骤(a)中所产生的多个图像转换运算量指数;
(c)累加多个图像转换运算量指数以产生一累加图像转换运算量指数;
(d)对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及
(e)根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
6.如权利要求5所述的可读取记录介质,其中该逻辑运算包含:将该累加的图像转换运算量指数除以一正整数以得到该逻辑运算结果。
7.如权利要求6所述的可读取记录介质,其中该逻辑运算包含:将累加N个图像转换运算量指数而形成的该累加的图像转换运算量指数除以N以得到该逻辑运算结果。
8.如权利要求5所述的可读取记录介质,其中该图像转换运算量指数系从一视差指数、一亮度指数、一纹理指数、一尺寸指数、一移动指数以及一场景切换指数中的至少其中一个。
9.一种音视频处理装置,包含:
一图像转换单元,用以将至少一2D图像数据转换成至少一3D图像数据;
一处理器,用以计算该图像转换单元在将2D图像转换成3D图像时所产生的多个图像转换运算量指数,该处理器更累加多个图像转换运算量指数以产生一累加图像转换运算量指数,并对该累加的图像转换运算量指数进行一逻辑运算来获得一逻辑运算结果;以及
一声音转换单元,根据该逻辑运算结果来将一2D声音数据转换成一3D声音数据。
10.如权利要求9所述的音视频处理装置,其中该处理器可用来将该累加的图像转换运算量指数除以一正整数以得到该逻辑运算结果。
11.如权利要求10所述的音视频处理装置,其中该处理器可用来将N个图像转换运算量指数累加后再除以N,以得到逻辑运算结果。
12.如权利要求9所述的音视频处理装置,其中该图像转换运算量指数可包括一视差指数、一亮度指数、一纹理指数、一尺寸指数、一移动指数以及一场景切换指数中的至少其中一个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102700683A CN102385894A (zh) | 2010-08-30 | 2010-08-30 | 音视频处理装置、音视频处理方法及其可读取记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102700683A CN102385894A (zh) | 2010-08-30 | 2010-08-30 | 音视频处理装置、音视频处理方法及其可读取记录介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102385894A true CN102385894A (zh) | 2012-03-21 |
Family
ID=45825243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102700683A Pending CN102385894A (zh) | 2010-08-30 | 2010-08-30 | 音视频处理装置、音视频处理方法及其可读取记录介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102385894A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006081198A2 (en) * | 2005-01-25 | 2006-08-03 | The Board Of Trustees Of The University Of Illinois | Compact haptic and augmented virtual reality system |
CN1954606A (zh) * | 2004-05-21 | 2007-04-25 | 韩国电子通信研究院 | 通过使用三维立体视频附加数据来发送/接收三维立体数字广播信号的装置和方法 |
US7563168B2 (en) * | 2004-02-13 | 2009-07-21 | Texas Instruments Incorporated | Audio effect rendering based on graphic polygons |
CN101563935A (zh) * | 2006-12-19 | 2009-10-21 | 皇家飞利浦电子股份有限公司 | 将二维视频转换为三维视频的方法和系统 |
-
2010
- 2010-08-30 CN CN2010102700683A patent/CN102385894A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7563168B2 (en) * | 2004-02-13 | 2009-07-21 | Texas Instruments Incorporated | Audio effect rendering based on graphic polygons |
CN1954606A (zh) * | 2004-05-21 | 2007-04-25 | 韩国电子通信研究院 | 通过使用三维立体视频附加数据来发送/接收三维立体数字广播信号的装置和方法 |
WO2006081198A2 (en) * | 2005-01-25 | 2006-08-03 | The Board Of Trustees Of The University Of Illinois | Compact haptic and augmented virtual reality system |
CN101563935A (zh) * | 2006-12-19 | 2009-10-21 | 皇家飞利浦电子股份有限公司 | 将二维视频转换为三维视频的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10529197B2 (en) | Offline haptic conversion system | |
US20230402067A1 (en) | Integration of audio into a multi-view interactive digital media representation | |
CN105794230B (zh) | 生成多通道音频信号的方法和用于执行该方法的装置 | |
Sulema | Mulsemedia vs. Multimedia: State of the art and future trends | |
EP3646609B1 (en) | Viewport selection based on foreground audio objects | |
EP2974286A1 (en) | Generating videos with multiple viewpoints | |
KR101507242B1 (ko) | 영상 분석을 통하여 모션 햅틱 효과를 제공하는 장치 및 방법 | |
KR20150085801A (ko) | 사용자에 의해 생성되는 콘텐츠 저작을 위한 시스템 및 방법 | |
US9489774B2 (en) | Three dimensional user interface in augmented reality | |
US20140035905A1 (en) | Method for converting 2-dimensional images into 3-dimensional images and display apparatus thereof | |
CN104091607A (zh) | 一种基于ios设备的视频编辑方法及装置 | |
JP2012253768A (ja) | 3d映像変換装置、その深さ情報の調整方法及びその保存媒体 | |
KR20160146775A (ko) | 깊이 또는 시차를 갖는 이미지로부터의 뷰 보간을 위한 적응형 리-메싱 | |
KR20140010120A (ko) | 스테레오스코픽 그래픽 오브젝트를 정의하기 위한 장면 그래프 | |
KR101511315B1 (ko) | 스테레오스코픽 컨텐츠를 위한 다이나믹 플로팅 윈도우 생성 방법 및 시스템 | |
CN104375755A (zh) | 信息处理方法和信息处理设备 | |
CN102474650B (zh) | 立体观察影像的再现装置、集成电路、再现方法 | |
Hänel et al. | Interactive volume rendering for immersive virtual environments | |
CN104301772B (zh) | 一种在视频中叠加图片的方法及装置 | |
CN102385894A (zh) | 音视频处理装置、音视频处理方法及其可读取记录介质 | |
WO2014200539A1 (en) | Remultiplexing bitstreams of encoded video for video playback | |
EP4085397B1 (en) | Reference of neural network model by immersive media for adaptation of media for streaming to heterogenous client end-points | |
JP2011041249A5 (ja) | 記録媒体、再生装置、再生方法、プログラム、およびプログラム格納媒体、並びに、記録装置および記録方法 | |
JP2012253767A (ja) | 3d映像変換装置、その具現方法及びその保存媒体 | |
JP2012253644A (ja) | 画像処理装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120321 |