JP5222939B2 - テレビ電話におけるプライバシーを最大にするための浅い被写界深度のシュミレート - Google Patents

テレビ電話におけるプライバシーを最大にするための浅い被写界深度のシュミレート Download PDF

Info

Publication number
JP5222939B2
JP5222939B2 JP2010504146A JP2010504146A JP5222939B2 JP 5222939 B2 JP5222939 B2 JP 5222939B2 JP 2010504146 A JP2010504146 A JP 2010504146A JP 2010504146 A JP2010504146 A JP 2010504146A JP 5222939 B2 JP5222939 B2 JP 5222939B2
Authority
JP
Japan
Prior art keywords
image
video image
video
videophone
remaining portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010504146A
Other languages
English (en)
Other versions
JP2010525667A (ja
Inventor
ジェイ. ギャリソン、ウィリアム
フィッツジェラルド エルコック、アルバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arris Technology Inc
Original Assignee
General Instrument Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Instrument Corp filed Critical General Instrument Corp
Publication of JP2010525667A publication Critical patent/JP2010525667A/ja
Application granted granted Critical
Publication of JP5222939B2 publication Critical patent/JP5222939B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08CTREATMENT OR CHEMICAL MODIFICATION OF RUBBERS
    • C08C19/00Chemical modification of rubber
    • C08C19/30Addition of a reagent which reacts with a hetero atom or a group containing hetero atoms of the macromolecule
    • C08C19/42Addition of a reagent which reacts with a hetero atom or a group containing hetero atoms of the macromolecule reacting with metals or metal-containing groups
    • C08C19/44Addition of a reagent which reacts with a hetero atom or a group containing hetero atoms of the macromolecule reacting with metals or metal-containing groups of polymers containing metal atoms exclusively at one or both ends of the skeleton
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08FMACROMOLECULAR COMPOUNDS OBTAINED BY REACTIONS ONLY INVOLVING CARBON-TO-CARBON UNSATURATED BONDS
    • C08F279/00Macromolecular compounds obtained by polymerising monomers on to polymers of monomers having two or more carbon-to-carbon double bonds as defined in group C08F36/00
    • C08F279/02Macromolecular compounds obtained by polymerising monomers on to polymers of monomers having two or more carbon-to-carbon double bonds as defined in group C08F36/00 on to polymers of conjugated dienes
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L19/00Compositions of rubbers not provided for in groups C08L7/00 - C08L17/00
    • C08L19/006Rubber characterised by functional groups, e.g. telechelic diene polymers
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L25/00Compositions of, homopolymers or copolymers of compounds having one or more unsaturated aliphatic radicals, each having only one carbon-to-carbon double bond, and at least one being terminated by an aromatic carbocyclic ring; Compositions of derivatives of such polymers
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L51/00Compositions of graft polymers in which the grafted component is obtained by reactions only involving carbon-to-carbon unsaturated bonds; Compositions of derivatives of such polymers
    • C08L51/04Compositions of graft polymers in which the grafted component is obtained by reactions only involving carbon-to-carbon unsaturated bonds; Compositions of derivatives of such polymers grafted on to rubbers
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L55/00Compositions of homopolymers or copolymers, obtained by polymerisation reactions only involving carbon-to-carbon unsaturated bonds, not provided for in groups C08L23/00 - C08L53/00
    • C08L55/02ABS [Acrylonitrile-Butadiene-Styrene] polymers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Description

テレビ電話におけるプライバシーを最大にするための浅い被写界深度の模擬実験に関する。
現在のテレビ電話では、被写界深度の深いカメラを用いており、その結果、カメラによって取り込まれる場面における主体は前景から背景まで焦点が合っている。このことを、被写界深度がより浅いカメラによって取り込まれるビデオ画像と比較すると、この場合には、前景における主体は焦点が合って見える一方で、場面の背景における対象は焦点が外れて見える。
テレビ電話において被写界深度が深いことは一般的に、レンズ口径に対してデジタル画像センサのサイズが小さいことと相まって、焦点距離およびシャッタ速度が固定されていることに起因する。これらの特定のデザイン・パラメータは、部品コストを低く保ちながら良好なテレビ電話画質を実現するために選択されている。このことは、非常に競争の激しい民生用エレクトロニクス市場でテレビ電話を販売していくためには重要なことである。
消費者市場でのテレビ電話は全体的に性能が優れており、被写界深度が深いことは多くの設定において許容されるのが普通である。その結果、テレビ電話の画像が全体的にシャープかつ鮮明であるということが知覚されるだけでなく、取り込まれた場面の一部分について焦点が外れるという心配をユーザがすることなく、テレビ電話を種々の設定で用いることができる。たとえば、テレビ電話通話の一方の側にいる人々のグループでは、カメラの近くに位置する参加者もいるし、離れている者もいる。別のユーザが、テレビ電話を用いて、カメラから少し離れたところに保持する必要がある何かを示したいと希望する場合もある。
しかしテレビ電話の被写界深度が深いことは、状況によっては問題点を示す可能性がある。ユーザの中には、受信したビデオ画像の背景において詳細が乱れていることを見つける場合もある。また他のユーザの中には、自分達のテレビ電話が取り込む自分達自身、自分達の家、または周囲の画像が鮮明すぎることに対して、また自分達のプライバシに対してテレビ電話が多少なりとも侵害を示すことに対して、不愉快な思いをする場合もある。また、テレビ電話の能力を全面的に受け入れるユーザの場合でさえ、ユーザの生活の詳細がテレビ電話通話の間に意図せずに明らかにされ得る可能性もある。たとえば、人が、テレビ電話通話が行なわれていることに気付かずに、家の外にいる人々が見るには不適切な衣装の状態で背景を通って歩く場合がある。
プライバシーに対する懸念に対処する現時点での1つの解決方法には、テレビ電話に対する制御として、ユーザが、通話の音響部分が損なわれないようにしながらテレビ電話カメラを停止できるようにする制御を設定することが含まれる。多くの状況において効果的ではあるものの、これが示す解決方法は、すべてのユーザが受け入れるわけではない全か無かの解決方法である。なぜならば、ビデオ機能が失われることによって、テレビ電話がもたらす主な特徴が取り除かれるからである。加えて、このようなユーザ制御では、望ましくない内容または不適切な内容がテレビ電話によって偶然に取り込まれることは防止されない。
取り込まれたテレビ電話画像において浅い被写界深度を模擬実験するための配置であって、画像の背景部分をデジタル的に分離および不鮮明にして不明瞭にする配置が提供される。その結果、前景におけるテレビ電話ユーザの表示ビデオ画像は焦点が合った状態に保持され、一方で、背景は焦点が外れているように見える。
種々の説明例において、画像検出および追跡技術用いて、対象部分(たとえば焦点が合った状態に保持される人の顔、または顔および肩の領域)を、残りのビデオ画像から動的に分離する。画像処理技術を、残りの部分における画素群に適用して、その部分を不鮮明にして不明瞭にする。このような技術としては、空間ドメインにおける畳み込みフィルタ(たとえば、平均、中央値、またはガウシアン・フィルタ)または周波数ドメインにおける周波数フィルタ(たとえば、ロー・パスまたはガウシアン・フィルタ)から選択される1または複数のフィルタを適用することが挙げられる。固定テンプレートも、取り込まれたビデオのそれぞれ焦点を合わされて不鮮明にされた部分を分離するために、代替的に利用可能である。テンプレートには種々の形状があり、実質的に矩形状、長円形状、またはアーチ形状のものが含まれる。たとえば、長円形状のテンプレートを適用することによって、取り込まれたビデオ画像のうち固定された長円形の内部に収まる部分を焦点が合った状態に保ち、そして画像のうち長円形の外側に収まる残りの部分をデジタル的に不鮮明にする。
利用する前景/背景分離技術のタイプ(すなわち、動的な物体検出/追跡または固定テンプレート形状)の制御、背景に適用される不鮮明化の度合いの制御、および背景不鮮明化のオン/オフ制御を可能にするために、ユーザ−選択可能な制御が任意的に提供される。
本配置によってもたらされる模擬実験された浅い被写界深度によって、優位に、高い度合いのプライバシーを実現することが可能になる一方で、テレビ電話通話のビデオ・コンポーネントが損なわれないようにすることによってテレビ電話通信の固有の価値が保持される。プライバシーの特徴は、カメラ・ハードウェアに対して、望ましくないコストを加えるであろう変更も追加も必要としない経済的に実行されるデジタル画像処理技術を用いてもたらされる。加えて、ビデオ画像の不鮮明にされた背景部分は、見る者に自然に見える。なぜならば、浅い被写界深度画像は、テレビ、映画、および他のメディア・プレゼンテーションにおいて一般的に用いられているからである。こうして、テレビ電話通話と干渉することもなく、プライバシーが利用されているという事実に注意が向けられることもない押しつけがましくない仕方で、プライバシーが有効にされる。
カメラと、カメラの視野内に配置された2つの黒色および白色のパターン化ターゲットとを示す図である。 例示的な視野深さに対するカメラによって取り込まれる画像を示す図である。 例示的な視野深さに対するカメラによって取り込まれる画像を示す図である。 2人のテレビ電話ユーザを示す例示的な配置の図形図である。 図4に示すテレビ電話の一方の図形図である。 テレビ電話によって表示された深い被写界深度を有するビデオ画像の例示的なスクリーン・ショットを示す図である。 本配置の原理によりテレビ電話によって表示される模擬実験された浅い被写界深度を伴うビデオ画像の例示的なスクリーン・ショットを示す図である。 取り込まれたビデオ画像を、焦点が合った状態に保持される対象部分と、種々の代替的な画像処理技術を用いて不鮮明にされた残りの部分とにする例示的な分離を示す説明図である。 それぞれビデオ画像内の焦点が合った状態に保持される対象部分を分離する一方で残りの部分が不鮮明にされる種々の例示的な固定テンプレートを示す図である。 それぞれビデオ画像内の焦点が合った状態に保持される対象部分を分離する一方で残りの部分が不鮮明にされる種々の例示的な固定テンプレートを示す図である。 それぞれビデオ画像内の焦点が合った状態に保持される対象部分を分離する一方で残りの部分が不鮮明にされる種々の例示的な固定テンプレートを示す図である。 焦点が合った状態に保持される対象部分と不鮮明化部分との間の遷移領域を有する例示的なテンプレートのダイアグラムである。 デジタル・フィルタリングの応用例に付随する畳み込みを行なうために用いられる例示的な画像およびカーネル配列を示す図である。 平均(すなわち、平均化する)デジタル・フィルタとともに用いられる例示的なカーネルを示す図である。 例示的なテレビ電話アーキテクチャの単純化されたダイアグラムである。 ビデオ画像における被写界深度効果を模擬実験する例示的な方法のフローチャートである。 本配置の原理によりプライバシーが有効にされる正のフィードバックをユーザに与えるためにテレビ電話によって表示される模擬実験された浅い被写界深度を伴うビデオ画像の例示的なスクリーン・ショットを示す図である。
図面の全体に渡って同じ参照番号は同じ要素を示す。
従来の写真撮影では、ある場面における主体を強調するために種々の合成技術が用いられている。このような技術の1つは「ボケ」として知られている。これは、「曖昧な」または「目まい」に翻訳される日本語の用語である。ボケは、表示された画像内で焦点が外れたハイライトまたは領域を用いることを指す。主体の焦点が合った状態に保持される一方で、表示された画像の残りの部分について焦点が外れているという希望する効果を与えるために「被写界深度」として知られる属性の種々の機能的、芸術的、または美的理由で、ボケ技術を用いる場合がある。
被写界深度は、スチールおよびビデオ写真撮影の両方において、レンズ口径、フィルム・ネガ/画像センサのサイズ(従来/デジタル・イメージングのそれぞれにおいて)、および焦点距離によって決定される。従来の35mmフィルムは、ネガのサイズがレンズ口径と比較して大きいために、被写界深度が浅い。比較して、コストを最小限にするために、消費者市場向けのほとんどのテレビ電話では、非常に小さいデジタル画像センサを用いるとともに、光学部品パッケージが備える焦点距離およびシャッタ速度は固定されている。したがって、開口数(すなわち、f/絞り)をレンズの最大口径未満に調製すること、および露出を補償するためにシャッタ速度を小さくすることによって被写界深度を浅くするように用いられる従来技術は一般的に、テレビ電話カメラに対しては適用することはできない。
被写界深度とは、満足できる程にシャープである焦点面の周りの距離範囲のことである。被写界深度は、カメラ・タイプ、口径、および焦点距離に応じて変化するが、表示される画像サイズおよび視距離によって、被写界深度を知覚することに影響が出る可能性がある。被写界深度は、シャープな状態からシャープでない状態委に突然に変わることはないが、その代わりに漸次的な遷移として起こる。実際には、見る者またはカメラの解像力によって知覚されない場合であっても、焦点距離のすぐ前または後ろにあるすべてのものは鮮明さを失い始める。
遷移の臨界点というものは存在しないため、「錯乱円」と呼ばれる用語を用いて、特定の点をシャープでないとして知覚されるためにはどのくらい不鮮明にする必要があるかを規定している。錯乱円とは、レンズから出る光の円錐によって生じる光スポットであり、点光源を結像するときに完全な焦点に達しない。「錯乱円」が小さい物体は、鮮明できれいなドットを示し、焦点が合っている。「錯乱円」が大きい物体は、エッジがぼやけたドットを示し、焦点が外れている。
したがって本配置では、表示されたテレビ電話画像の前景における対象とする人の顔または他の領域に、小さい錯乱円を与える。画像の残りの部分には大きな錯乱円を伴って表示される。ボケ技術、錯乱円、およびサンプル画像についてのさらなる説明が、H.マークリンガ(H.Merklinger)、ボケの技術的見解(A Technical View of Bokeh)、写真技術(Photo Techniques)、5月/6月(1997)に掲載されている。
図1〜3は、本配置に被写界深度の原理を適用することを例示するために与えられている。図1は、カメラ105と、その視野内にある2つの黒色および白色パターン化ターゲット112および115とを示す図形説明図である。図示するように、ターゲット112はカメラの視野の前景にあり、ターゲット115は背景にある。図2に示すのは、深い焦点深度をカメラ105が選択したときの画像の見かけの例である。図示するように、ターゲット112および115は両方とも焦点が合っている。比較して、図3に示すのは、焦点深度がより浅い場合の画像の例である。この場合、前景にあるターゲット112は焦点が合っているが、背景にあるターゲット115はもはや焦点が合っておらず、ぼやけて見える。
図4を参照して、2人のテレビ電話ユーザがビデオ電話通信セッションに参加している例示的な配置400を示す。ユーザ405は、家413でテレビ電話408を用いている。テレビ電話408は、ネットワーク418を介して、家435でユーザ430が用いるテレビ電話426に結合されている。テレビ電話によって一般的に、通話が広帯域ネットワークを介して伝えられるときに、フレーム・レートおよび解像力が両方ともより高いより良好な画質が実現されるが、テレビ電話の中には、通常の公衆交換電話網(「PSTN」)を介して動作するように構成されているものもある。広帯域ネットワーク・サービスは一般的に、ケーブル、DSL(デジタル加入者線)、および人工衛星サービス・プロバイダから提供される。テレビ電話は普通、2人1組になって用いられ、通話上の各当事者はテレビ電話を用いている。
図5は、図4に示すテレビ電話408の図形図である。テレビ電話408は、消費者市場に市販されているテレビ電話を表わす。テレビ電話408は、基部505に取り付けアーム512によって取り付けられるディスプレイ・コンポーネントを備えている。基部505は、テレビ電話408をたとえばデスクまたはテーブル上に配置できるように構成されている。カメラ514がディスプレイ・コンポーネント内に配置されている。カメラ514のレンズは、図示するように、テレビ電話ユーザの方に向けられている。またマイクロフォン(図示せず)がカメラ514の付近に配置され、音声および他の、テレビ電話通話に付随する音を取り込むようになっている。
カメラ514は一般的に、CCD(電荷結合素子)画像センサを用いて実現されている。CCD画像センサは、多数の画素(すなわち、分離した画素)から、テレビ電話ユーザおよび周囲領域から形成される画像を取り込む。カメラ514から得られる画像は、テレビ電話408内でデジタル信号処理を受けて、デジタル・ビデオ画像出力ストリームを作成する。このストリームは、テレビ電話通話の他方の側にあるテレビ電話426に送信される。この説明例では、デジタル・ビデオ画像出力ストリームは、国際標準化機構(「ISO」)とともに動画像専門家グループによって規定されたMPEG−4ビデオ標準に準拠する圧縮されたビデオ・ストリームである。代替的な実施形態においては、以下のものから選択される1つを含む他のフォーマットおよび/またはビデオ圧縮方式が利用可能である。MPEG−1、MPEG−2、MPEG−7、MPEG−21、VC−1(映画テレビ技術者協会SMPTE421Mとしても知られている)、DV(デジタル・ビデオ)、DivX、作製元はディブックス社(DivX,Inc.)(以前は、ディブックスネットワーク社(DivXNetworks Inc.)として知られていた)、国際電気通信連合ITUH.261、ITUH.263、ITUH.264、WMV(ウィンドウズ・メディア・ビデオ)、リアルメディア、リアルビディオ、アップル・クィックタイム、ASF(拡張ストリーミング形式、拡張システム形式としても知られている)、AVI(オーディオ・ビデオ・インターフェース)、3GPP(第3世代パートナーシップ・プロジェクト)、3GPP2(第3世代パートナーシップ・プロジェクト2)、JPEG(写真専門家合同委員会)、またはモーションJPEG。
表示コンポーネントはスクリーン516を備え、スクリーン516は受像領域520および送像領域525を備えている。スクリーン516の受像領域520は、図4に示すテレビ電話426内のカメラによって取り込まれたユーザ430のビデオ画像を表示するように配置されている。送像領域525は、カメラ514によって取り込まれたユーザ405の比較的より小さい画像を表示する。こうして送像領域525によって、ユーザ405は、送信されて他方のユーザ430によって見られている自分自身の像を見ることができる。このようなフィードバックは、ユーザ405が自分自身をカメラ514の視野内に、取り込まれたビデオ画像内で所望の位置決めおよびフレーミングがなされた状態で配置できるようにするためには重要である。
取り付けアーム512が、ディスプレイ・コンポーネントおよびカメラ514を、基部505から上方にある距離を置いて位置決めするように配置されている。この距離は、表示ビデオ画像を快適に見ることが実現され、テレビ電話ユーザの良好な視野を用いてカメラ514を位置決めするようにするためのものである。取り付けアーム512内には、テレビ電話動作制御532が配置されている。テレビ電話動作制御532は、ユーザが、テレビ電話通話を設定し、ユーザ選好を設定し、テレビ電話設定を調整するなどのために、設けられている。
図4を再び参照して、テレビ電話ユーザ430は、テレビ電話426内に配置されたカメラによって取り込まれる場面440の前景に位置している。前景を参照数字442によって示す。同様に、図示するように、室内用鉢植え植物450が場面の中景452にあり、家族メンバ460が背景462にいる。
図6に、図4における取り込まれた場面440のビデオ画像の、テレビ電話408によってスクリーン516上に表示されたときの例示的なスクリーン・ショット600を示す。図示するように、表示された画像は被写界深度が深い状態で現れており、ユーザ430、室内用鉢植え植物450、および家族メンバ460はすべて焦点が合っている。前述したように、このような深い被写界深度は普通、従来のテレビ電話によって表示されるビデオ画像に対して与えられている。また、取り込んだ場面内のすべての対象をこのように鮮明に結像することは、プライバシーに対する懸念を示す場合がある。
図6に示す従来の被写界深度が深いビデオ画像と比べて、図7に、本配置によって実現される模擬実験された浅い被写界深度を有するビデオ画像の例示的なスクリーン・ショット700を示す。スクリーン・ショット700に示すビデオ画像は、テレビ電話408によってスクリーン516上に表示されたものと同じ取り込まれた場面440である。ここでは、前景442におけるユーザ430の画像のみが焦点が合った状態に保持され、一方で、室内用鉢植え植物450および家族メンバ460は、図7におけるドット・パターンによって示されるように、不鮮明にされて不明瞭にされている。
図8は、取り込まれたビデオ画像を、焦点が合った状態に保持されている対象領域805と、複数の代替的な画像処理技術(後に、図13および14に付随するテキストで述べる)の1つを用いて不鮮明にされている残りの部分810とにする例示的な分離を示す説明図である。この説明例では、物体検出技術として、特定の特徴(この場合はユーザの顔、頭、および肩)を、テレビ電話通話の間にユーザが動いたときおよび/または位置を変えたときに、取り込まれたビデオ画像内で動的に検出して追跡する技術が用いられている。図8に示す対象領域には、ユーザの顔、頭、および肩の領域が含まれているが、他の対象領域を検出および追跡用に規定しても良い。たとえば、動的な検出および追跡技術を用いて焦点が合った状態に保持される画像領域を、ユーザの顔領域のみに限定しても良い。
物体検出、特に顔検出は、種々のコンピュータ・ビジョン領域(たとえば画像検索、ショット検出、ビデオ監視など)の重要な要素である。目標は、ビデオ画像内の予め規定されたクラスの物体を見つけることである。ビデオ画像中の物体検出を行なう従来の種々の技術が、具体的な用途の要求に応じて利用可能である。このような技術として、特徴ベースのアプローチが挙げられる。このアプローチは、顔形状特徴の位置特定を、たとえば特定の画像特徴(たとえばエッジ、色彩領域、テクスチャ、輪郭、ビデオ・モーション・キューなど)を抽出することによって行ない、そして、いくつかのヒューリスティックスを用いて、対象とする物体に固有の特徴の構成および/または組み合わせを見出すものである。
他の物体検出技術では、画像ベースのアプローチを用いている。このアプローチは、物体(たとえば顔)の場所を、本質的にパターン認識問題として処理するものである。顔パターンを認識する際の基本的なアプローチは、例を顔およびそれ以外のプロトタイプ・クラスに分類するトレーニング手順を介している。これらのクラスと、入力画像から抽出された2D強度配列(したがって名前画像ベース)とを比較することによって、顔の存在を判定することができる。画像ベースのアプローチとしては、線形部分空間法、ニューラル・ネットワーク、および統計的アプローチが挙げられる。
これらの技術の概略および他の技術の説明は、E.ジェルマス(Hjelmas)およびB.K.ロウ(Low)、顔検出:調査、コンピュータ・ビジョン、および画像理解(Face Detection:A Survey,ComputerVision and Image Understanding)83、236〜274(2001)に見出せる場合がある。加えて、種々のオープン・ソース・コード供給源が、適切な顔検出アルゴリズムを実行するのに利用可能である。たとえば、オープン(Open)CVコンピュータ・ビジョン・ファシリティ(インテル社製)である。これは、統計モデルを用いた顔検出に対する低レベルおよび高レベルの両方のAPI(アプリケーション・プログラミング・インターフェース)を提供するものである。この統計モデル、または分類子では、対象とする物体クラスの複数のインスタンス、または「正の」サンプルと、複数の「負の」サンプル、すなわち対象とする物体を含まない画像とを取り扱う。正および負のサンプルは一緒になって、トレーニング・セットを作成する。トレーニングの間、異なる特徴がトレーニング・サンプルから抽出されて、物体を分類するために用いることができる特有の特徴が選択される。この情報は、統計モデル・パラメータ内に「圧縮される」。トレーニングを受けた分類子が、物体を検出しない(物体を見逃す)かまたは不在の物体を誤って検出する(すなわち、誤報を出す)場合には、対応する正または負のサンプルをトレーニング・セットに加えることによって、容易に調整することができる。インテル・オープンCV顔検出についてのより多くの情報を、以下の文献で見出せる場合がある。G.ブラッドスキー(Bradski)、A.ケーラー(Kaehler)、およびV.ピザレブスキー(Pisarevsky)、インテルのオープン・ソース・コンピュータ・ビジョン・ライブラリによる学習ベースのコンピュータ・ビジョン(Learning-Based Computer Vision with Intel's Open Source Computer Vision Library)、インテル技術ジャーナル(Intel Technical Journal)、9巻、2号、(2005)。
図9〜11に、対象部分を残りの部分から分離するために、取り込まれたビデオ画像に適用される固定テンプレートの説明例を示す。対象が動くとターゲット部分の形状が動的に変化する場合の物体検出技術と比較して、図9〜11におけるテンプレートでは、ターゲットと残りの部分との間の固定された境界を用いる。固定テンプレートを用いることによって、プライバシーを実現するために本配置の分離態様をそれほど複雑ではなく実行する一方で、いくつかのシナリオにおいて有益な場合があるその機能性の大部分が保持され得る。任意的な配置では、テレビ電話ユーザが、種々のテンプレートから選択して特定の用途および状況に最良にマッチするテンプレートを見出すように、制御が行なわれる。他の配置では、ターゲット部分および残りの部分の相対的サイズの調整を、固定増分でかまたは固定範囲において無限に行なっても良い。
図示するように、図9におけるテンプレート900は、スクリーンのほぼ中央の3分の2を占める領域に配置された実質的に矩形のターゲット部分905を有している。ターゲット部分905は、残りの部分910がスクリーンの最上部および側辺を占めることができるように配置されている。このテンプレートは、ほとんどのテレビ電話ユーザがテレビ電話カメラの視野の中央部分を占めるように位置するという観察結果を利用している。したがって、潜在的なプライバシーに対する懸念の領域は、取り込まれた画像の最上部および側辺になる傾向がある。前述したように、任意的な配置では、ターゲット部分905と残りの部分910との間の相対的サイズを、図9における波線の矩形925が示すようにユーザ調整可能となるように構成しても良い。
図10に示すのは、ターゲット部分1005の最上部部分が曲線状であるということ以外は、図9に示すのと同様(スクリーンのほぼ中央の3分の2を占有することによって)であるテンプレート1000である。したがって、ターゲット部分1005は実質的にアーチ形状である。この形状を用いることによって、残りの部分1010の領域が増加するとともに、特定のユーザの用途に対して、焦点が合っている部分と不鮮明部分との間のフィットがより良好になる場合がある。
図11に、ターゲット部分が実質的に長円形状であるテンプレート1100を示す。この場合、残りの部分1110は、プライバシー不鮮明化が、スクリーンの最上部および側辺領域とともに、表示された画像の下部中央で行なわれるように(これは、テンプレート900および1000とは異なる)、ターゲット部分1105を囲んでいる。
図12に、焦点が損なわれない状態に保持されたターゲット部分1205と、本明細書に記載した技術を用いて不鮮明にされた残りの部分1210との間の遷移領域1202を有する例示的なテンプレート1200を示す。遷移領域1202は、ターゲット部分1205と残りの部分1210との間に中程度の錯乱円を伴って構成されている。これにより、焦点領域と不鮮明化領域との間の遷移をより柔らかくすることが実現でき、その結果、表示された画像が状況によってはより自然に見えるようにすることに役立つ場合がある。遷移領域1202のサイズは、普通は特定の用途の要求に従って選択されるデザイン上の選択である。遷移領域は、長円形のターゲット部分を有するテンプレートとともに用いられていると示されているが、このような遷移領域は、固定テンプレートおよび動的な物体検出の両方の実施形態において、任意のターゲット部分形状とともにを用いても良いことを強調しておく。
取り込まれたビデオ画像が、対象部分と残りの部分とにいったん分離されると、デジタル画像処理が行なわれて、残りの部分における画素群の錯乱円を増加させ、その結果、残りの部分を不鮮明にして不明瞭にする。この説明例では、デジタル画像処理には、空間ドメインまたは周波数ドメインのいずれかにおいてフィルタリングすることが含まれる。
空間ドメインは、空間内のある特定の点における強度によって画像が表わされる通常の像空間である。空間ドメインは、画像データに対する共通表現である。畳み込み演算子が、残りの部分における画素を不鮮明にするために適用される。畳み込みは、多くの共通の画像処理動作に対して基本的である単純な数学演算である。畳み込みによって、2つの数配列(一般的にサイズは異なるが次元は同じ)を互いに乗じて、同じ次元の第3の数配列を作成する方法が与えられる。これを画像処理において用いて、出力画素値が特定の入力画素値の単純な一次結合である演算子を実行することができる。
画像処理の文脈では、入力配列の1つは通常、たとえばRGB(赤緑青)色モデルを用いて、ビデオ画像内の色成分の1つに対する強度値の組(すなわち、グレー・レベル)である。第2の配列は通常、はるかに小さく、さらに2次元であり(単に単一の画素厚みの場合もあるが)、またカーネルとして知られている。図13に、畳み込みを例示するために用いられる例画像1305およびカーネル1310を示す。
畳み込みは、画像上でカーネルをスライドさせて行ない(一般的に左上のコーナーで開始する)、カーネルが画像の境界内で完全にフィットするすべての位置を通してカーネルを動かす(なお具体化は、画像のエッジにおいて何をするかで異なる。これについては後述する)。各カーネル位置は、単一の出力画素に対応し、その値の計算は、カーネル内の各セルに対してカーネル値とその下の画素値とを互いに乗じることと、次にこれらの数を互いに加えて出力Oを作成することとによって行なう。したがって、図13に示す例では、出力画像における右下の画素の値は、以下の式によって与えられる。
Figure 0005222939
画像IがM行およびN列を有し、カーネルがm行およびn列を有する場合、出力画像のサイズは、M−m+1行およびN−n+1列を有する。数学的に、畳み込みは以下のように書かれる。
Figure 0005222939
ここで、iは1からM−m+1に及び、jは1からN−n+1に及ぶ。
1つの説明例では、適用される畳み込みフィルタは平均フィルタと呼ばれる。平均フィルタでは、画像内の各画素の代わりに、その隣接(それ自体を含む)の平均値を用いる。平均フィルタは一般的に、「ボックス」、「平滑化」、または「平均化」フィルタとも言われる。平均フィルタに対して用いるカーネルは、平均を計算するときにサンプリングすべき近隣のサイズおよび形状を表わす。多くの場合に、図14の参照数字1410によって示される3x3の四角形カーネルであるが、より大きい5x5、7x7などのカーネル用いて、より不鮮明化を作成しても良い。カーネル1405を2回以上適用しても良い。
代替的に中央値フィルタを用いる。中央値フィルタでは、平均フィルタで用いた平均値の代わりに、隣接する画素の中央値を用いる。
別の説明例では、ガウシアン・フィルタを適用して、画像内の焦点が合った状態で表示すべき対象部分以外の残りの部分を不鮮明にする。このフィルタでは、カーネルとして、ガウシアン(すなわち、ベル形状曲線)を表わす形状を有するものを用いる。ガウシアンは以下の式で表される。
Figure 0005222939
ここで、σは分布の標準偏差である(平均はゼロである、すなわち行の中心x=0に置かれていると仮定する)。
ガウシアン平滑化の効果は、前記した平均フィルタと同様の方法で画像を不鮮明にすることである。平滑化の度合いはガウシアンの標準偏差によって決定される。標準偏差がより大きいガウシアンの場合は、正確に表わすために、より大きい畳み込みカーネルを必要とする。
ガウシアンは、各画素の近隣の「加重平均」を出力する。平均値を、中央の画素の値に向けてより多く重み付けする。これは、平均フィルタの均一な加重平均とは対照的である。このため、ガウシアン・フィルタでは一般的に、平滑化がより優しく行なわれ、同様のサイズの平均フィルタよりもエッジが良好に保持される。
周波数ドメインは、種々の周波数を有する周期的な信号の和によってビデオ画像が表わされるドメインである。適用するフィルタ関数を、一部の周波数を減衰させて他を高めるような形にする。一般的に、フーリエ空間における乗算は、空間ドメインにおける畳み込みと同一であるため、すべての周波数フィルタを空間ドメイン内で実行することもできる。加えて、所望のフィルタ効果に対して単純なカーネルが存在する場合には、空間ドメイン内でフィルタリングを行なうことは計算的に安価である。空間ドメイン内で簡単なカーネルを見つけることができない場合には、周波数フィルタリングの方が適切であり、より効率的でもあり得る。
周波数ドメイン内でフィルタを適用するためには、画像内の対象領域以外の残りの部分における画素群を、空間ドメインから周波数ドメインへとフーリエ変換する。
Figure 0005222939
ここで、F(k、i)はフーリエ・ドメインにおける入力画像であり、H(k、i)はフィルタ関数であり、G(k、i)はフィルタリングされた画像である。空間ドメイン内で結果として生じる画像を得るために、G(k、l)を逆フーリエ変換から再変換する必要がある。
フィルタ関数の形状によって、演算子の効果が決定される。本配置では、ロー・パス・フィルタを用いて、高周波を減衰させ、低周波を不変に保つ。空間ドメインにおける結果は、平均フィルタを空間ドメイン内で適用することによって得られるものと同等である。なぜならば、ブロックされた高周波は、鋭い強度変化すなわち空間ドメイン画像における微細な詳細に、対応するからである。
最も単純なローパス・フィルタが理想的なローパスである。このようなフィルタでは、カットオフ周波数Dよりも高いすべての周波数が抑えられ、それよりも小さい周波数は変わらずに残る。
Figure 0005222939
ほとんどの用途では、Dは、フーリエ・ドメイン画像によって表わされる最も高い周波数の何分の1かで与えられる。
本配置の応用例では、周波数ドメイン内でガウシアン・フィルタを適用することによって、理想的なローパス・フィルタよりも望ましい結果が生じる。広く用いられているガウシアンに対する別個の近似は、バターワース・フィルタとして知られている。周波数ドメイン内でこのフィルタを適用すると、空間ドメイン内でのガウシアン平滑化と同様の結果が示される。
図15は、テレビ電話408および/または426(図4)に対する例示的なアーキテクチャ1500である。カメラ514を形成するCCDイメージ・センサは、深い被写界深度(すなわち実質的に無限なもの)を有するビデオ画像を取り込むものであるが、アーキテクチャ1500における抽象化ハードウェア層1502内に含まれている。またハードウェア層1502は、フレーム・バッファ1504および出力インターフェース1512も備えている。取り込まれたビデオ画像は、画像処理モジュール1516によって処理される。画像処理モジュール1516は、多くのコンポーネントを有しており、たとえば、画像分離論理回路1520、不鮮明化論理回路1526、ブレンディング論理回路1532、およびユーザ・インターフェース1535がある。画像処理モジュール1516およびその内部のコンポーネントを、用途によっては、たとえばハードウェア(たとえば1または複数の特定用途向け集積回路)および/またはファームウェアを用いて、別個に実現しても良い。あるいは、画像処理モジュール1516を、テレビ電話408に常駐するソフトウェア、またはハードウェア、ファームウェア、もしくはソフトウェアの組み合わせを用いて実現される論理装置として、構成しても良い。
分離論理回路1520は、カメラ514からビデオ画像を分離して、ターゲット部分(焦点が維持される)と残りの部分(不鮮明化が課される結果、その部分が不明瞭になる)とにするように配置されている。分離は、図8に付随するテキストで説明した物体検出を用いて、あるいは図9〜12に付随するテキストで説明したテンプレートの1つを用いて行なう。
不鮮明化論理回路1526は、取り込まれたビデオ画像の残りの部分を不鮮明にして、その内部の画素の錯乱円を増加させ、その結果、主体を不明瞭にするように配置されている。このような不鮮明化は、図13および14に付随するテキストで説明したデジタル・フィルタリング技術のうちの1または複数を用いて行なう。不鮮明化論理回路は任意的に、ユーザからの入力に応答可能なように不鮮明化の度合いを調整するように構成される。不鮮明化論理回路1526は代替的に、取り込まれたビデオ画像の残りの部分を、前記したように、あらかじめ定義された画像(たとえば壁紙)と入れ替えるように配置されている。
ブレンディング論理回路1532は、不鮮明にされないターゲット部分を不鮮明にされる残りの部分と組み合わせた合成ビデオ画像を作成するように配置されている。用途によっては、ブレンディング論理回路1532および不鮮明化論理回路1526は、図12に示し付随するテキストで説明した複数の不鮮明化レベルを可能にするように構成される。
ユーザ・インターフェース1535は、テレビ電話408のユーザに、現在のプライバシー特徴に対するユーザ−選択可能な制御を与えるように配置されている。たとえば、ユーザは、取り込まれた画像の背景部分が不明瞭にされるかまたは焦点が合った状態に保持されるように、プライバシー特徴を選択的に有効および/または無効にしても良い。不鮮明化を実行する度合い(物体検出/追跡を用いようと固定テンプレートを用いようと)およびテンプレート形状も、本配置の用途によってはユーザ−選択可能であっても良い。
フレーム・バッファ1504を、処理の間にビデオ画像を一時的に記憶するために、テレビ電話アーキテクチャ1500内で用いる。出力インターフェース1512は、フレーム・バッファ1504からビデオ画像を読み出して、ネットワーク418(図4)上でビデオ出力ストリームとしてリアル・タイム送信を行なうことに備える。ほとんどの用途では、出力ストリームは、MPEG−4に従ってフォーマットされる。あるいは、MPEG−2である。
図16は、ビデオ画像内の被写界深度効果を模擬実験するための例示的な方法1600のフローチャートである。方法1600は、図4のテレビ電話408または426のいずれかによって用いても良い。本方法はブロック1605で開始する。ブロック1611において、カメラ(たとえば、カメラ514)によって、被写界深度が深いかまたは実質的に無限であるビデオ画像(消費者市場内で販売されるほとんどのテレビ電話に対して典型的である)を取り込む。
ブロック1616において、取り込まれたビデオ画像を、焦点が維持されるターゲット部分と、図8に関する記載で説明した技術の1つを用いて不鮮明化が適用される残りの部分とに、空間的に分離する。通常、ビデオ画像は、分離、不鮮明化、および合成の画像処理ステップの間にバッファリングされる(たとえば、図15におけるフレーム・バッファ1504において)。
ブロック1620において、取り込まれたビデオ画像の残りの部分を不鮮明にして、その内部の画素の錯乱円を増加させ、その結果、主体を不明瞭にすることを、図13および14に付随するテキストで説明したデジタル・フィルタリング技術の1または複数を用いて行なう。不鮮明にされた残りの部分を、不鮮明にされないターゲット部分と組み合わせて、ブロック1622において示すように合成ビデオ画像を作成する。合成ビデオ画像を次に、ブロック1625においてフレーム・バッファにおいてリフレッシュする。
ブロック1631は、任意的なステップを示す(図16において波線の矩形で示す)。このステップでは、合成ビデオ画像をテレビ電話の表示スクリーン上に局所的に表示する。この任意的なステップを、図17のスクリーン・ショットにおいて示す。このステップは、テレビ電話ユーザ(すなわち、図4においてテレビ電話426を用いるテレビ電話ユーザ430)が、プライバシー特徴が有効にされる正のフィードバックを受け取ることができるように行なわれる。すなわち、ユーザは、自分自身を、表示スクリーン1710の最下部にある小さい画像1705内に見ることができる。画像1705には、表示される合成画像が含まれる。プライバシーが、ユーザ選択的に有効および無効にされるように配置される応用例では、画像1705には、プライバシー特徴が無効にされたときに典型的な深い被写界深度を含むであろう通常のビデオ画像(すなわち、プライバシーを実現するようには処理されない)が含まれるであろう。
図16に再び戻って、ブロック1635は、合成ビデオ画像が通話の遠い側にあるテレビ電話に送信されることを示す。通常、合成ビデオ画像は、MPEG−4に準拠するビデオ・ストリームの一部として送られる。例示的な方法1600はブロック1640で終了する。
前述の説明では、別個かつ専用のテレビ電話配置が設けられているが、説明した特徴および機能は代替的に、汎用的なパーソナル・コンピュータ(「PC」)を用いて実施可能であることに注意されたい。このシナリオでは、ウェブカメラおよびマイクロフォン・ハードウェアを用いて、PCによって提供される処理能力およびネットワーク・アクセスを補う。加えて、図15に示すテレビ電話アーキテクチャ1500は通常、ソフトウェアで実現されて、PC上のアプリケーションとして実行される「ソフト」テレビ電話が提供される。
別の代替的な例示的実施形態では、任意または所定の画像、効果、またはパターンを用いて、取り込まれたビデオ画像の残りの部分(すなわち、取り込まれたビデオ画像の、焦点が合った状態に保持されるターゲット部分以外の部分)と入れ替えても良い。前述したように、残りの部分における画素をそれらの錯乱円を増加させることによって不鮮明にして、その結果、残りの部分を不明瞭にする代わりに、残りの部分の全部または一部を、たとえば特徴のない画像と取り替えても良い。特徴のない画像を、たとえばテレビ電話ユーザが平坦な壁の前方に座っているように見えるようにするであろう任意のまたはユーザ選択可能な色彩を用いて配置しても良い。他の例では、任意のまたはユーザ選択可能な画像として、たとえば写真またはイラストを選択する。たとえば、庭園写真を選択して、テレビ電話ユーザに対する背景景色を提供しても良い。
主題を構造的特徴および/または方法行為に固有の言葉で説明してきたが、添付の請求項において規定される主題は必ずしも、前述した特定の特徴または行為に限定されないことを理解されたい。むしろ、前述した特定の特徴および行為は、請求の範囲を実施する形態例として開示されている。

Claims (19)

  1. テレビ電話であって、
    複数の画素を含むビデオ画像を取り込むために配置されたカメラと、
    プライバシー・フィルタリングを前記ビデオ画像に適用して被写界深度効果をシュミレートするために配置された画像処理モジュールであって、前記プライバシー・フィルタリングは、(a)前記ビデオ画像のターゲット部分前記ビデオ画像の残りの部分から分離すること、(b)空間ドメイン内の前記ビデオ画像の前記残りの部分内の画素に適用される平均フィルタ、中央値フィルタ、またはガウシアン・フィルタのうちの1つを用いて前記残りの部分に付随する錯乱円を大きくして前記ビデオ画像の前記残りの部分を不鮮明にすることを含む、画像処理モジュールと
    を備え
    前記画像処理モジュールは、前記ターゲット部分と前記残りの部分との間に中程度の錯乱円を有する遷移領域を形成する、テレビ電話。
  2. 前記画像処理モジュールは、前記ビデオ画像の前記残りの部分を不鮮明にすることを、周波数ドメインの前記ビデオ画像の前記残りの部分内の画素に適用されるローパス・フィルタまたはガウシアン・フィルタの一方を用いて行なう、請求項1に記載のテレビ電話。
  3. 前記ビデオ画像の前記不鮮明にされる部分を、前記ビデオ画像の不鮮明にされない部分の少なくとも一部と組み合わせて合成ビデオ画像を作成する、請求項1又は2項に記載のテレビ電話。
  4. 前記画像処理モジュールは、ソフトウェア・アプリケーション、ファームウェア、ハードウェアのうちの1つ、またはそれらの組み合わせにより実現される、請求項1又は2に記載のテレビ電話。
  5. 前記ビデオ画像の前記不鮮明にされる残りの部分のサイズまたは形状は、1または複数のテンプレートから選択される、請求項1又は2に記載のテレビ電話。
  6. 前記プライバシー・フィルタリングに対する選択可能な制御を行なうように配置されたユーザ・インターフェースをさらに含む、請求項1又は2に記載のテレビ電話。
  7. 前記ユーザ・インターフェースは、前記プライバシー・フィルタリングを有効および無効にするように配置される、請求項に記載のテレビ電話。
  8. 前記ユーザ・インターフェースは、前記ビデオ画像の前記残りの部分を不鮮明にする度合いを選択するように配置される、請求項に記載のテレビ電話。
  9. 前記ユーザ・インターフェースは、前記ビデオ画像の不鮮明にされる前記残りの部分のサイズまたは形状を選択するように配置される、請求項に記載のテレビ電話。
  10. コンピューター読取可能な媒体であって、電子装置内に配置された1つまたは複数のプロセッサにおいて実行されるとテレビ電話通話にプライバシーを与えるための方法を行なう命令を含み、前記方法は、
    テレビ電話カメラを用いてビデオ画像を取り込むステップと、
    物体検出アルゴリズムを適用して、前記ビデオ画像のターゲット部分を前記ビデオ画像の残りの部分から分離するステップと、
    空間ドメイン内の前記ビデオ画像の前記残りの部分内の画素に適用される平均フィルタ、中央値フィルタ、またはガウシアン・フィルタのうちの1つを用いて前記残りの部分に付随する錯乱円を大きくすることにより前記ビデオ画像の残りの部分をデジタル・フィルタリングして、前記ビデオ画像に含まれる主体にプライバシーを与えるステップと、
    前記ターゲット部分と前記残りの部分との間に中程度の錯乱円を有する遷移領域を形成するステップと、
    前記ターゲット部分を前記フィルタリングされた残りの部分と合成して、合成ビデオ画像を作成するステップと
    を含む、コンピューター読取可能な媒体。
  11. 前記合成ビデオ画像を、前記テレビ電話通話の遠隔側にあるテレビ電話に送信するステップをさらに含む、請求項10に記載のコンピューター読取可能な媒体。
  12. 前記送信を、ビデオ圧縮を用いるフォーマットで行ない、前記フォーマットは、MPEG、MPEG−1、MPEG−2、MPEG−4、MPEG−7、MPEG−21、VC−1、DV、DivX、ITUH.261、ITUH.263、ITUH.264、WMV1、リアルメディア、リアルビディオ、クイックタイム、ASF、AVI、3GPP、3GPP2、JPEG、またはモーションJPEGのうちの1つから選択される、請求項11に記載のコンピューター読取可能な媒体。
  13. 前記デジタル・フィルタリングは、空間ドメインまたは周波数ドメインの一方における畳み込み演算子を適用することを含む、請求項10〜12のいずれか1項に記載のコンピューター読取可能な媒体。
  14. 前記デジタル・フィルタリングは、前記ビデオ画像の前記残りの部分の代わりに画像を適用することを含み、前記画像は、イラスト、パターン、特徴のない画像、カラー画像、写真または説明図の1つから選択される、請求項10〜13のいずれか1項に記載のコンピューター読取可能な媒体。
  15. ビデオ画像における被写界深度効果をシュミレートするための方法であって、
    画像センサを用いて、実質的に無限の被写界深度を有する前記ビデオ画像を取り込むステップと、
    前記ビデオ画像のターゲット部分を画像バッファに空間的に前記ビデオ画像の残りの部分から分離するステップと、
    前記ビデオ画像の外見上の被写界深度が浅くなるように、前記残りの部分に画像処理を適用して、平均フィルタ、中央値フィルタ、またはガウシアン・フィルタのうちの1つを用いて前記残りの部分に付随する錯乱円を大きくするステップと、
    前記ターゲット部分と前記残りの部分との間に中程度の錯乱円を有する遷移領域を形成するステップと、
    前記画像処理されたビデオ部分を用いて前記画像バッファをリフレッシュするステップと
    を含む、方法。
  16. 物体検出技術を用いて前記空間分離を行ない、前記ビデオ画像における対象部分について動的に位置を特定して追跡する、請求項15に記載の方法。
  17. 前記物体検出技術を、特徴ベースのアプローチまたは画像ベースのアプローチの一方から選択する、請求項16に記載の方法。
  18. 前記画像センサは、付随する画像センサのレンズ口径と比べて小さいCCDアレイである、請求項1517のいずれか1項に記載の方法。
  19. 前記レンズは、固定焦点距離を与えるように配置される、請求項18に記載の方法。
JP2010504146A 2007-04-20 2008-03-27 テレビ電話におけるプライバシーを最大にするための浅い被写界深度のシュミレート Active JP5222939B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/737,813 US7911513B2 (en) 2007-04-20 2007-04-20 Simulating short depth of field to maximize privacy in videotelephony
US11/737,813 2007-04-20
PCT/US2008/058338 WO2008130783A1 (en) 2007-04-20 2008-03-27 Simulating short depth of field to maximize privacy in videotelephony

Publications (2)

Publication Number Publication Date
JP2010525667A JP2010525667A (ja) 2010-07-22
JP5222939B2 true JP5222939B2 (ja) 2013-06-26

Family

ID=39871775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010504146A Active JP5222939B2 (ja) 2007-04-20 2008-03-27 テレビ電話におけるプライバシーを最大にするための浅い被写界深度のシュミレート

Country Status (4)

Country Link
US (1) US7911513B2 (ja)
JP (1) JP5222939B2 (ja)
GB (1) GB2460586B8 (ja)
WO (1) WO2008130783A1 (ja)

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8593542B2 (en) 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US8174555B2 (en) 2007-05-30 2012-05-08 Eastman Kodak Company Portable video communication system
US20090060343A1 (en) * 2007-08-30 2009-03-05 Andrew Rosca Method for partially obscuring content of documents and images
KR101344017B1 (ko) 2007-10-10 2013-12-24 삼성전자주식회사 영상 통화 단말 및 그를 이용한 영상 전송 방법
US8558942B2 (en) * 2007-10-17 2013-10-15 Nikon Corporation Focusing measurement device, focusing measurement method, and program
KR101412752B1 (ko) * 2007-11-26 2014-07-01 삼성전기주식회사 디지털 자동 초점 영상 생성 장치 및 방법
KR101348596B1 (ko) * 2008-01-22 2014-01-08 삼성전자주식회사 임장감 생성 장치 및 방법
US8688841B2 (en) * 2008-06-05 2014-04-01 Modena Enterprises, Llc System and method for content rights based on existence of a voice session
US8311275B1 (en) * 2008-06-10 2012-11-13 Mindmancer AB Selective viewing of a scene
US20100015976A1 (en) * 2008-07-17 2010-01-21 Domingo Enterprises, Llc System and method for sharing rights-enabled mobile profiles
US20100015975A1 (en) * 2008-07-17 2010-01-21 Kota Enterprises, Llc Profile service for sharing rights-enabled mobile profiles
JP5202211B2 (ja) * 2008-09-25 2013-06-05 三洋電機株式会社 画像処理装置及び電子機器
JP2012503817A (ja) * 2008-09-25 2012-02-09 テレ アトラス ベスローテン フエンノートシャップ 画像をぼかす方法及び構成
US8265167B2 (en) * 2008-10-31 2012-09-11 Sprint Communications Company L.P. Application specific video format
US8094163B2 (en) * 2008-12-09 2012-01-10 Himax Technologies Limited Method of directing a viewer's attention subliminally in image display
US8306283B2 (en) * 2009-04-21 2012-11-06 Arcsoft (Hangzhou) Multimedia Technology Co., Ltd. Focus enhancing method for portrait in digital image
US9350940B1 (en) * 2009-10-29 2016-05-24 Hewlett-Packard Development Company, L.P. Privacy control for a visual-collaborative system
CN102170552A (zh) * 2010-02-25 2011-08-31 株式会社理光 一种视频会议系统及其中使用的处理方法
US8363085B2 (en) * 2010-07-06 2013-01-29 DigitalOptics Corporation Europe Limited Scene background blurring including determining a depth map
US20120019688A1 (en) * 2010-07-20 2012-01-26 Research In Motion Limited Method for decreasing depth of field of a camera having fixed aperture
US9208239B2 (en) 2010-09-29 2015-12-08 Eloy Technology, Llc Method and system for aggregating music in the cloud
KR20120060549A (ko) * 2010-12-02 2012-06-12 전자부품연구원 사용자 단말 및 이를 이용한 영상 통화 방법
DE102011010315A1 (de) * 2011-02-03 2012-08-09 Hönigsberg & Düvel Datentechnik GmbH Erkennung von Objekten
TWI543112B (zh) * 2011-05-16 2016-07-21 聯詠科技股份有限公司 淺景深模擬方法及數位相機
JP2013005091A (ja) * 2011-06-14 2013-01-07 Pentax Ricoh Imaging Co Ltd 撮像装置および距離情報取得方法
US20130088562A1 (en) * 2011-10-07 2013-04-11 Hanwha Solution & Consulting Co., Ltd Communication terminal for providing silhouette function on video screen for video call and method thereof
US20130094753A1 (en) * 2011-10-18 2013-04-18 Shane D. Voss Filtering image data
US9100574B2 (en) 2011-10-18 2015-08-04 Hewlett-Packard Development Company, L.P. Depth mask assisted video stabilization
CN103493093B (zh) * 2011-11-17 2017-07-18 松下知识产权经营株式会社 图像处理装置、摄像装置及图像处理方法
CN103999096B (zh) * 2011-12-16 2017-12-08 英特尔公司 用于视频数据背景区域的降低的图像质量
US9286658B2 (en) 2012-03-22 2016-03-15 Qualcomm Incorporated Image enhancement
JP5968073B2 (ja) * 2012-05-18 2016-08-10 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、および画像処理プログラム
WO2014001095A1 (en) * 2012-06-26 2014-01-03 Thomson Licensing Method for audiovisual content dubbing
JP2014021570A (ja) * 2012-07-12 2014-02-03 Sony Computer Entertainment Inc 動画像生成装置
CN103634557A (zh) * 2012-08-22 2014-03-12 韩华S&C有限公司 视频通话时用于个人保护的影像处理方法及装置
CN104782119B (zh) * 2012-09-17 2018-05-18 谷歌有限责任公司 带宽降低系统和方法
US8914894B2 (en) * 2012-09-21 2014-12-16 Intel Corporation Enhanced privacy for provision of computer vision
US9124762B2 (en) * 2012-12-20 2015-09-01 Microsoft Technology Licensing, Llc Privacy camera
US8891942B2 (en) 2013-01-11 2014-11-18 Adobe Systems Incorporated Method and apparatus for automatically generating a tilt-shift effect in a video
KR101978219B1 (ko) * 2013-03-15 2019-05-14 엘지전자 주식회사 이동 단말기 및 이의 제어 방법
US9282285B2 (en) * 2013-06-10 2016-03-08 Citrix Systems, Inc. Providing user video having a virtual curtain to an online conference
JP6470530B2 (ja) * 2013-12-06 2019-02-13 キヤノン株式会社 画像処理装置、画像処理方法、プログラム及び記録媒体
US9367939B2 (en) * 2013-10-22 2016-06-14 Nokia Technologies Oy Relevance based visual media item modification
US9367948B2 (en) * 2013-11-14 2016-06-14 Intel Corporation Flexible filter logic for multi-mode filtering of graphical texture data
CN104836977B (zh) 2014-02-10 2018-04-24 阿里巴巴集团控股有限公司 即时通讯过程中的视频通讯方法及系统
CN105303514B (zh) 2014-06-17 2019-11-05 腾讯科技(深圳)有限公司 图像处理方法和装置
CN105635634A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 一种实现视频图像处理的方法及装置
JP6700672B2 (ja) * 2015-05-08 2020-05-27 キヤノン株式会社 遠隔コミュニケーションシステム、その制御方法、及びプログラム
US9674327B2 (en) * 2015-08-25 2017-06-06 Ca, Inc. Controlling display devices to interfere with imaging by mobile terminals
US9681097B1 (en) 2016-01-20 2017-06-13 Global Tel*Link Corporation Secure video visitation system
US10296994B2 (en) 2016-02-11 2019-05-21 Global Tel*Link Corporation System and method for visitation management in a controlled environment
US20170272435A1 (en) 2016-03-15 2017-09-21 Global Tel*Link Corp. Controlled environment secure media streaming system
US9558523B1 (en) 2016-03-23 2017-01-31 Global Tel* Link Corp. Secure nonscheduled video visitation system
US20170324927A1 (en) 2016-05-06 2017-11-09 Global Tel*Link Corp. Controlled Environment Media and Communication System
US10009536B2 (en) * 2016-06-12 2018-06-26 Apple Inc. Applying a simulated optical effect based on data received from multiple camera sensors
US11553157B2 (en) 2016-10-10 2023-01-10 Hyperconnect Inc. Device and method of displaying images
CN106530241B (zh) * 2016-10-31 2020-08-11 努比亚技术有限公司 一种图像虚化处理方法和装置
CN106550243A (zh) * 2016-12-09 2017-03-29 武汉斗鱼网络科技有限公司 直播视频处理方法、装置及电子设备
CN106971165B (zh) * 2017-03-29 2018-08-10 武汉斗鱼网络科技有限公司 一种滤镜的实现方法及装置
KR101932844B1 (ko) 2017-04-17 2018-12-27 주식회사 하이퍼커넥트 영상 통화 장치, 영상 통화 방법 및 영상 통화 중개 방법
US10896622B2 (en) 2017-06-20 2021-01-19 Global Tel*Link Corporation Educational content delivery system for controlled environments
CN107609463B (zh) * 2017-07-20 2021-11-23 百度在线网络技术(北京)有限公司 活体检测方法、装置、设备及存储介质
US11164151B2 (en) 2017-07-20 2021-11-02 Global Tel*Link Corporation System and method for providing job-specific training and employment to residents of a controlled environment facility
US10122825B1 (en) 2017-07-27 2018-11-06 Global Tel*Link Corporation Systems and methods for providing a visual content gallery within a controlled environment
US10405007B2 (en) 2017-07-27 2019-09-03 Global Tel*Link Corporation Systems and methods for a video sharing service within controlled environments
US10015546B1 (en) 2017-07-27 2018-07-03 Global Tel*Link Corp. System and method for audio visual content creation and publishing within a controlled environment
US10565247B2 (en) 2017-07-28 2020-02-18 Global Tel*Link Corporation Controlled environment secure media streaming system with digital video recording
US11213754B2 (en) 2017-08-10 2022-01-04 Global Tel*Link Corporation Video game center for a controlled environment facility
WO2019070299A1 (en) * 2017-10-04 2019-04-11 Google Llc DEPTH ESTIMATION USING A SINGLE CAMERA
KR102132341B1 (ko) * 2017-12-27 2020-07-09 주식회사 하이퍼커넥트 영상 통화 서비스를 제공하는 단말 및 서버
CN110009556A (zh) * 2018-01-05 2019-07-12 广东欧珀移动通信有限公司 图像背景虚化方法、装置、存储介质及电子设备
CN109190453A (zh) * 2018-07-09 2019-01-11 奇酷互联网络科技(深圳)有限公司 防止虹膜信息泄露的方法和装置
WO2020087486A1 (zh) 2018-11-02 2020-05-07 Oppo广东移动通信有限公司 深度图像处理方法、深度图像处理装置和电子装置
US11425335B2 (en) 2018-11-19 2022-08-23 Hewlett-Packard Development Company, L.P. Protecting privacy in video content
DE102018220880B4 (de) 2018-12-04 2023-06-29 Audi Ag Verfahren und Vorrichtung zum Modifizieren einer Bildanzeige eines Fahrzeuginnenraums bei einem Videotelefonat in einem Fahrzeug sowie ein Kraftfahrzeug
KR102266888B1 (ko) * 2018-12-31 2021-06-21 주식회사 하이퍼커넥트 영상 통화 서비스를 제공하는 단말기 및 서버
DE102019204602B4 (de) 2019-04-01 2020-10-15 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zur Maskierung von in einem Bild enthaltenen Objekten
KR102282963B1 (ko) 2019-05-10 2021-07-29 주식회사 하이퍼커넥트 단말기, 서버 및 그것의 동작 방법
KR102311603B1 (ko) 2019-10-01 2021-10-13 주식회사 하이퍼커넥트 단말기 및 그것의 동작 방법
US11182879B1 (en) * 2019-11-27 2021-11-23 United Services Automobile Association (Usaa) Synthetic bokeh for video conferencing
WO2021153596A1 (en) * 2020-01-27 2021-08-05 Nec Corporation Information processing system, information processing method, and storage medium for anonymized person detection
KR102293422B1 (ko) 2020-01-31 2021-08-26 주식회사 하이퍼커넥트 단말기 및 그것의 동작 방법
WO2021155549A1 (en) * 2020-02-06 2021-08-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method, system, and computer-readable medium for generating stabilized image compositing effects for image sequence
CN112115811A (zh) * 2020-08-31 2020-12-22 支付宝(杭州)信息技术有限公司 基于隐私保护的图像处理方法、装置和电子设备
TWI757940B (zh) * 2020-10-29 2022-03-11 宏碁股份有限公司 視訊會議系統及其排除打擾的方法
US11659137B1 (en) * 2020-11-30 2023-05-23 Securus Technologies, Inc. Video display blurring on demand
US11838684B2 (en) * 2021-01-26 2023-12-05 Dell Products, Lp System and method for operating an intelligent videoframe privacy monitoring management system for videoconferencing applications
US11893668B2 (en) 2021-03-31 2024-02-06 Leica Camera Ag Imaging system and method for generating a final digital image via applying a profile to image information
US20240089403A1 (en) * 2022-09-14 2024-03-14 Google Llc Chat View Modification Based on User Identification or User Movement

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US538615A (en) * 1895-04-30 Thomas j
US4071577A (en) * 1976-04-23 1978-01-31 Dow Corning Corporation Toughened mercaptosiloxane modified emulsion polymerized vinylic polymers
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5448053A (en) 1993-03-01 1995-09-05 Rhoads; Geoffrey B. Method and apparatus for wide field distortion-compensated imaging
US5384615A (en) 1993-06-08 1995-01-24 Industrial Technology Research Institute Ambient depth-of-field simulation exposuring method
US6148113A (en) 1998-02-03 2000-11-14 Micrografx, Inc. System for stimulating the depth of field of an image in two dimensional space and method of operation
EP1141093B1 (en) * 1998-12-07 2008-04-02 General Electric Company Emulsion polymerized silicone rubber-based impact modifiers, method for making, and blends thereof
US6950130B1 (en) * 1999-01-05 2005-09-27 Sharp Laboratories Of America, Inc. Method of image background replacement
JP2000261646A (ja) * 1999-03-04 2000-09-22 Matsushita Electric Ind Co Ltd 背景画像編集装置及び方法
ATE373296T1 (de) 2000-04-25 2007-09-15 Koninkl Philips Electronics Nv Verfahren zur fehlerverringerung in anzeigegeäten mit mehrreihiger steuerung in teilfeldern
KR20010067992A (ko) * 2001-04-13 2001-07-13 장민근 배경화상 추출 및 삽입이 가능한 동화상 제공 이동통신단말기 및 이를 이용한 배경화상 분리 방법
JP2003274375A (ja) * 2002-03-13 2003-09-26 Mitsubishi Electric Corp テレビ電話装置
JP2004133551A (ja) * 2002-10-08 2004-04-30 Noritsu Koki Co Ltd 画像処理方法、画像処理装置、画像処理プログラム、および画像処理プログラムを記録した記録媒体
WO2006011384A1 (ja) * 2004-07-28 2006-02-02 Kaneka Corporation 熱可塑性樹脂組成物
US7227567B1 (en) * 2004-09-14 2007-06-05 Avaya Technology Corp. Customizable background for video communications
JP2006197096A (ja) * 2005-01-12 2006-07-27 Mitsubishi Electric Corp テレビ電話装置
US7512262B2 (en) * 2005-02-25 2009-03-31 Microsoft Corporation Stereo-based image processing
JP2006270380A (ja) * 2005-03-23 2006-10-05 Victor Co Of Japan Ltd 画像情報送信装置
WO2007047943A2 (en) * 2005-10-19 2007-04-26 Dow Global Technologies Inc. Silane-sulfide chain end modified elastomeric polymers
US7885463B2 (en) * 2006-03-30 2011-02-08 Microsoft Corp. Image segmentation using spatial-color Gaussian mixture models

Also Published As

Publication number Publication date
JP2010525667A (ja) 2010-07-22
GB0917390D0 (en) 2009-11-18
US20080259154A1 (en) 2008-10-23
GB2460586B8 (en) 2011-12-21
GB2460586A8 (en) 2011-07-27
WO2008130783A1 (en) 2008-10-30
GB2460586B (en) 2011-11-30
GB2460586A (en) 2009-12-09
US7911513B2 (en) 2011-03-22

Similar Documents

Publication Publication Date Title
JP5222939B2 (ja) テレビ電話におけるプライバシーを最大にするための浅い被写界深度のシュミレート
CN111641778B (zh) 一种拍摄方法、装置与设备
US9639956B2 (en) Image adjustment using texture mask
TWI602152B (zh) 影像擷取裝置及其影像處理方法
US9142010B2 (en) Image enhancement based on combining images from multiple cameras
US20130169760A1 (en) Image Enhancement Methods And Systems
US10264230B2 (en) Kinetic object removal from camera preview image
US11800056B2 (en) Smart webcam system
Dong et al. Human visual system-based saliency detection for high dynamic range content
CN108154465B (zh) 图像处理方法及装置
WO2014170886A1 (en) System and method for online processing of video images in real time
CN104169842B (zh) 用于控制视频界面的方法、用于操作视频界面的方法、面部朝向检测器以及视频会议服务器
US11917158B2 (en) Static video recognition
JP2023544627A (ja) ビデオ・ストリームの操作
US20220342365A1 (en) System and method for holographic communication
WO2018166170A1 (zh) 一种图像处理的方法、装置及智能会议终端
CN112153240B (zh) 一种调整图像画质方法、装置及可读存储介质
WO2013112295A1 (en) Image enhancement based on combining images from multiple cameras
KR102338877B1 (ko) 딥러닝을 이용한 자가 촬영 영상의 화질 개선 방법
Cheng et al. A novel saliency model for stereoscopic images
CN107025638B (zh) 图像处理的方法及装置
US20230306698A1 (en) System and method to enhance distant people representation
CN113805824B (zh) 电子装置以及在显示设备上显示图像的方法
US11936881B2 (en) Region of interest based image data enhancement in a teleconference
CN114882089A (zh) 一种图像处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120404

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130311

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5222939

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250