JP2016504657A - 画像の方向を修正するための画像内容に基づく画像の回転 - Google Patents
画像の方向を修正するための画像内容に基づく画像の回転 Download PDFInfo
- Publication number
- JP2016504657A JP2016504657A JP2015542773A JP2015542773A JP2016504657A JP 2016504657 A JP2016504657 A JP 2016504657A JP 2015542773 A JP2015542773 A JP 2015542773A JP 2015542773 A JP2015542773 A JP 2015542773A JP 2016504657 A JP2016504657 A JP 2016504657A
- Authority
- JP
- Japan
- Prior art keywords
- image
- content
- determining
- current direction
- axis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 252
- 238000003708 edge detection Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 20
- 210000000887 face Anatomy 0.000 claims description 16
- 230000001815 facial effect Effects 0.000 claims description 16
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000006073 displacement reaction Methods 0.000 claims 1
- 239000013598 vector Substances 0.000 description 18
- 230000006855 networking Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 244000025254 Cannabis sativa Species 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
- G06T3/608—Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- User Interface Of Digital Computer (AREA)
- Controls And Circuits For Display Device (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
例えば、電子メール、掲示板、フォーラム、ソーシャルネットワーキングサービスなどのインターネットプラットフォーム及びサービスのユーザーは、自分自身と他人が見るために画像を投稿する。しかし、多くの撮影された画像は、撮影時に想定した方向から、カメラまたは他の撮像装置が意図することなく回転しているため、回転によるねじれ(skew)を有する。いくつかのケースでは、ユーザーは、様々なソフトウェアプログラムを使用して、その後手動でこの回転を修正することができる。
いくつかの実施態様では、ある方法は、画像に示されるコンテンツの1以上の識別要素を取得し、画像に示されたコンテンツの現在の方向を決定することを含む。現在の方向は、コンテンツの1以上の識別要素に基づいて決定される。
画像の回転量は、識別されたコンテンツを現在の方向よりもある所定の基準方向により近く方向付けるように決定される。画像は決定された量だけ回転される。
いくつかの実施態様では、エッジ検出技術は、画像内の少なくとも一つの有力なエッジを見つけるために用いることができ、この方法は、所定の基準方向からの有力なエッジのずれの量を決定することができる。エッジ検出プロセスは、画像が、風景または屋外環境の描写のような、エッジ検出プロセスを使用することに関連付けられているある種類のコンテンツを描いていると判断したことに応答して、使用することができる。
この方法は、画像に描かれたコンテンツの現在の方向を決定するために、1以上の技術を選択しそして適用し、この1以上の技術は複数の利用可能な技術から選択される。この技術の選択は、画像に描かれ識別されたコンテンツに基づく。
この方法は、描かれたコンテンツを現在の方向よりも所定の基準方向に近い方向に向けるように画像の回転量を決定し、そして決定された回転量だけ画像を回転させる。
様々な実施態様において、画像に描かれた複数の現象および/または複数の種類のコンテンツを考慮した結果に基づいて、得られる方向を見出だすことができる。あるシステムでは、描かれたコンテンツを水平方向のようなある基準方向により近い方向に向ける画像の回転量を決定し、そして画像の方向を修正するために決定された量だけ画像を回転させることができる。
サーバブロック102, 104、及び106は、複数のシステム、サーバ装置、およびネットワークデータベースを表しても良く、そして各ブロックは、示されているものと異なる構成で提供することができる。例えば、サーバシステム102は、ネットワーク130を介して他のサーバシステムと通信可能な複数のサーバ・システムを表すことができる。他の例では、ソーシャルネットワークデータベース106および/または他の記憶装置は、サーバ装置104から分離され、ネットワーク130を介して、サーバ装置104及び他のサーバシステムと通信可能な1または複数のサーバシステムブロックとして提供することができる。
また、任意の数のクライアント・デバイスが存在してもよい。各クライアント デバイスは、コンピュータシステム、携帯機器、携帯電話、スマートフォン、タブレットコンピュータ、テレビ、テレビセットトップボックス、または娯楽デバイス、パーソナルデジタルアシスタント(PDA)、メディアプレーヤ、ゲーム装置などの任意の種類の電子機器とすることができる。他の実施態様では、ネットワーク環境100は、示されたコンポーネントのすべてを持っていないこともあり、および/または、または本明細書に記載したものに代えて、又はそれに加えて他の種類の要素を含む他の要素を含んでもよい。
ユーザーが特定のまたは複数の他のユーザーにメッセージを送信し、ソーシャルネットワークシステム内の他のユーザーとの間で関連の形でリンクを形成し、ユーザーリスト、友人リスト、またはその他のグループの内の他のユーザーをグループ化する、テキスト、画像(例えば、写真などの)、ビデオシーケンス、オーディオシーケンス又は録音、またはソーシャルネットワークサービスの指定された組のユーザーによりアクセスされる他の種類のコンテンツを送信する。
ソーシャルネットワークサービスの他のユーザーにマルチメディア情報及び他の情報を送信する、サービスの他のユーザーとのライブビデオ、オーディオ、および/またはテキストチャットに参加すること等である。
ユーザーは、画像や他の種類のコンテンツを含む投稿されたコンテンツの1以上のアルバムを編成することができる。
ユーザーは、指定されたユーザーグループ内のユーザーが、ソーシャルネットワーキングサービス上のユーザーに関連付けられたコンテンツおよび他の情報にアクセスまたはそれらを受領できるようにするために、1以上のユーザーグループを指定することができる。本明細書で使用される「ソーシャルネットワーキングサービス」の用語は、ユーザー間の相互交流を容易にするソフトウェアおよび/またはハードウェアシステムを含むことができ、ネットワークシステム上で実施されるサービスを含むことができる。いくつかの実施態様では、「ユーザー」は、1以上のプログラムまたは仮想エンティティ(virtual entities)、ならびにシステムまたはネットワークとインターフェイス接続する人々を含むことができる。
インターフェイス200上で画像を見ることができる。他の実施態様では、アプリケーションプログラム、オペレーティングシステム、またはスタンドアロンのコンピュータシステム、携帯装置、又は他の電子機器のような他のサービスやシステムを用いて画像を表示することができる。
この図2Cの例では、フェイスライン208は2つの中央値の一つであり、ライン208は基準軸に近いラインなので、得られる軸220として選択される。得られる軸220は、画像204に描かれた画像コンテンツの現在の方向を示すために用いられる。
所望の方向付けを達成するために、画像204は、図2Dに示す、量Xだけ回転される必要があり、それは、得られる軸220と、像204の水平エッジ222に平行な水平基準軸224との間の角度である。
例えば、もし描かれた画像コンテンツが風景、屋外環境、および/または関連する特徴として識別された場合、特定の技術を用いることができる。この例では、システムは、1以上の有力なライン又はエッジを決定するために、画像304の画素を調査するための技術を用いた。以下に記述するように、画像中にその様な有力なライン又はエッジを見つけるために、1以上の周知の技術を用いるとができる。図3Bの例では、システムは、画像304内に複数の有力ライン308を見だした。これらは、長さおよび/または視認性などの、最も顕著である画像304中の、ラインまたはエッジである。他の実施態様では、1つの最も有力なラインを決定することができる。
所望の方向に向けるために、画像304は、図3Dに示すように量Xだけ回転される必要がある。 この量は、得られる軸312と、画像304の水平(最上部および底部)エッジ310に平行な水平基準軸314の間の角度である。
種々の技術が、そのようなコンテンツを特定するために使用することができ、例えば、人の顔が描かれていることを識別するため、および/またはある特定の個人であること識別するための顔認識などである。例えば、ソーシャルネットワーキングサービスでは、認識された顔はサービスを利用するユーザーの顔と比較され、画像に描かれた何れの人が、またサービスの利用者であるかを特定することができる。物体と顔認識技術は、顔、風景、または他の種類のコンテンツのような、コンテンツの種類を識別するために使用することができる。例えば、認識技術は、描かれた物体の分類、タイプおよび/またはモデルを提供することができる。いくつかの画像は、画像に描かれたコンテンツを記述するタグのような識別要素または識別標識に関連付けることができ、そしてこれらのタグは、描かれたコンテンツの識別要素として得ることができる。種々の実施態様において、識別要素は、方法400によって決定され得るか、または異なるプロセスまたはシステムによって決定される1以上のコンテンツ識別要素を受領することによって得ることができる。
例えば、異なる技術は、識別されたコンテンツのある特別の識別要素に基づいて使用することができ、および/または異なる技術により得られる結果は、識別されたコンテンツに基づいて加重値を与えることができる。種々の実施態様において、画像に描かれたコンテンツの、複数回の発生および/またはコンテンツの種類を考慮した、画像について得られる方向軸を求めることができる。ブロック404の別の実施態様については、図5を参照して以下に説明する。
いくつかの記述子は、画像で認識される特定のブランド、または製品またはサービスのモデルに関する特異的なものであってもよい。物体を認識する場合のいくつかの実施態様では、複数の記述子を、各特徴または物体について提供することができ、その様な各記述子は、認識と信頼性と相関する異なる特異性を有する。例えば、認識された特徴の一つの記述子は、高い信頼性を有する「構築物」であり得るが、一方、同じ特徴を示す、別のより特異的な記述子は「エンパイア・ステート・ビルディング」であり得るが、これは信頼性が低い。
いくつかの実施態様では、描かれたコンテンツの識別標識を、認識を実行する1以上の他のプロセスから、方法500に提供することができ、および/または方法500は、ブロック506において、全体的にまたは部分的に特徴認識を行うことができる。
ある例では、基準軸は、図2および3の例において上述したように、インターフェイス200または300のようなユーザーインターフェイスで定義された水平軸とすることができる。
他の実施態様または例では、ユーザーは、画像を編集しないこともある。例えば、このシステムは、記憶装置に記憶された画像の集合から画像を選択していてもよいし、画像を表示せずに、及びユーザーが画像を編集したいと望むことなく、方法500を使用して画像の方向を補正することができる。
いくつかの実施態様では、画像のエッジが回転した方向においてほぼ水平と垂直となるように回転した画像をトリミングすることもできる。トリミングされた画像の例について、図を2Fと3Fを参照して上に記述している。画像が表示されている実施態様では、画像表示は新たな回転位置が決定された後に回転した方向に変更することができる。他の実施態様または例では、画像データは回転されて、保存され、そして表示は更新されない。
これらの所望の回転位置の各々は、ユーザーのために画像の有望な回転位置として決定することができる。他の例において、ブロック508は、1以上の異なる技術および/またはこれらの技術で使用される1以上の異なるパラメータまたは条件に基づいて、画像内の異なる、得られる軸を見つけるために繰り返すことができる。この第2の得られる軸は、他の可能性のある回転位置を決定するために使用することができる。いくつかの実施態様では、ブロック512の多くの可能性のある回転位置が、機械学習の実施で用いられる識別器(classifier)から決定することができ、その例は、図7に関してより詳細に説明する。
いくつかの実施態様では、現在位置から選択された位置への画像の表示は、選択した位置への「スナップ」(snap)として表示することができ、例えば、画像の手動回転が、所定の位置の所定の範囲内に入ると、画像は所定の位置に素早く動く(snap)。いくつかの実施態様では、画像の周囲にブロック516で決定された可能性が高いすべての位置の指標を表示することができ、そしてユーザー入力に応じて回転位置へ画像の表示をスナップすることができる。
ベクトルは、関連する顔の方向を示している。ある一つの顔における両目は、顔認識技術を用いて容易に検出可能であり、ベクトルは、それぞれの目の中心を通って引くことができる。画像内の複数の顔は同様に検出することができ、各顔の両目の間の顔方向ベクトルは、それぞれの顔の方向を決定する(例えば、水平軸の様な所定の軸に関して)。
それぞれ適用される技術は、決定される得られる方向軸を提供することができる。例えば、いくつかの実施態様では、目の結合ベクトルを含む、上記の顔の方向判定技術を用いる場合、ブロック604の選択された技術により、画像内の一つの顔のみが使用される(例えば、画像中に使用に適した1つの顔がある)場合、得られる軸は、その顔の目の結合ベクトルに対応する。もし画像中の複数の顔にこの技術が用いられる場合、得られる軸は、複数の顔について決定される複数のベクトルに基づいて決定することができる。いくつかの実施態様では、描かれた顔から得られる目の結合ベクトルは、得られる軸を決定するための1以上の方法で組み合わせることができる。ある例では、目の結合ベクトルは、得られる軸を決定するために平均化することができる。いくつかの例では、目の結合ベクトルの中央値またはモードは、得られる軸として使用することができ、その中央値はそのベクトル分布の中央のベクトルであり、モードはベクトルの分布において最も一般的に生ずるベクトルである。他の例において、線形回帰は、すべての顔の方向ベクトルを用いて実行され、得られたベクトルは、得られる方向軸である。他の技術はまた、ブロック604で決定される顔の方向ベクトルを考慮に入れた、得られる軸を見つけるために用いることができる。画像について得られる軸が決定された後に、この方法は以下に詳述するブロック608に進む。
他の物体もまた、顔の特徴でないものとして含まれ得る。描かれたコンテンツが、その様な1以上の顔の特徴でないタイプの特徴を含む場合、この方法はブロック610に進む。
例えば、もしコンテンツが、山や湖などの自然や自然環境のものである場合、あるいくつかの技術は、有力なエッジの検出に優れていることが知られていることもあり、一方、他の技術は、建物、道路、壁、フェンス、または他の人工構造物や物体(ソーダ缶、家具等)のようなより真っ直ぐなまたは人工的なエッジを含むコンテンツの有力なエッジを検出するに優れていることが知られていることもある。いくつかの実施態様では、あるエッジ検出技術は、画像内のエッジを検出するために使用されるハフ変換法であることもあり、他のエッジ検出技術は、フーリエ解析及び変換技術であることもある。ここでハフ変換法は、例えば、自然の特徴よりも建物を描いたコンテンツのエッジをより良く検出することができる。ある例では、建物のタイプのコンテンツが画像に描かれている場合、フーリエ解析技術が選択され、ハフ変換法は選択されないであろう。いくつかの実施態様では、複数またはすべての利用可能なエッジ検出技術を選択することができ、そして以下に説明するように、それらの結果は、描かれたコンテンツに基づいて得られる方向の決定において、異なる加重値が与えられる。他のエッジ検出技術も使用することもできる。
いくつかの実施態様では、例えば、特定の技術は、複数の有力なエッジを見つけることができる。複数の有力なエッジから唯一の得られる軸を決定することができる。画像の得られる軸を見つけるために、例えば、複数の有力なエッジを平均化し、または中央値、モード、または線形数列(linear progresssion)を決定することができる。得られる軸は、ブロック612で適用された各エッジ検出技術に求められる。
例えば、いくつかの技術は、特定のタイプのコンテンツための所望のエッジを見つけるのに優れていることが知られていることがある。描かれたコンテンツがそれらのタイプと一致する場合、そのような技術から得られる結果は加重値を増すことができ、一方、描写されたタイプのコンテンツに対して同様程度には良く作動しないと知られている技術から得られる結果については加重値を低減させることができる。上記のようないくつかの例では、複数のエッジ検出技術を画像に適用することができ、それぞれの技術は得られる方向軸を提供し、いくつかの技術は自然の特徴よりも人工的特徴を分析するのにより適していることがある。他の実施態様の例では、顔の方向判定結果はエッジ検出技術の結果よりも大きい加重値を与えても良いし、またその逆もある。ある例では、ある画像は、顔や風景の特徴、ならびに他の特徴を含み、複数のタイプのコンテンツを描写することができ、そして、エッジ検出と顔の方向判定技術の両方の技術が適用されてもよい。これらの技術による結果は、上記のように、画像に描かれた識別されたコンテンツに基づいて加重値を与えることができる。
ブロック702は、方法400又は500を実行するシステムとは異なるシステム上でまたは同じシステム上で実行することができる。ブロック702において、異なる識別器は、各々画像の異なる関連する回転位置について学習している。いくつかの実施態様では、各識別器は、画像の特定の回転位置について学習されているプロセスであるので、その識別器は、識別器に入力される新しい画像が、その様に学習された回転位置を有するコンテンツを持つ場合を認識することができる。識別器は、例えば、既知の正しい方向から特定の量の回転角度の様に、特定の回転位置まで回転されていることが知られている画像で、学習することができる。各受領された、学習された画像について、識別器は学習された画像中のコンテンツの得られる軸及び方向を決定するために、図6に関して上述したと同様のコンテンツの識別および分析技術を使用することができる。例えば、1以上のエッジ検出と顔検出技術を適用することができる。いくつかのこのような学習された画像は、もし、ある画像がその識別器の関連する回転位置にコンテンツを持っている場合、識別器が予想する結果の一般的なプロファイルを提供するために、識別器に供給することができる。例えば、いくつかの実施態様では、識別器を学習させるために数百または数千の学習画像を使用することができる。
ある例では、水平基準位置から5度の時計回りの回転を有する画像が、一組の識別器に入力される。時計回りにそれぞれ3および4度の回転を検出した識別器は、画像コンテンツが3または4度回転されていないことを示す負の出力を示す。5度の回転を検出した識別器は、コンテンツ中の特徴及び画像の回転と一致する得られる軸は、学習させたものであることを見い出し、画像コンテンツは5度回転している可能性が高いことを明確に示すことができる。いくつかの実施態様では、各識別器は、画像が関連する回転位置まで回転されている可能性を示すために、連続した範囲内で信頼水準または信頼値を提供することができる。
いくつかの実施態様では、複数の識別器は確実な結果を提供し、または1以上の識別器は、その画像が、確実であると考えられる程度の回転位置、例えば、所定の閾値を超えている可能性がある、にある可能性が十分に高いことを示すこともあったと思われる。いくつかの実施態様では、この方法は、複数の確実な結果から、現在の方向を決定するために更なる処理を行うことができる。ある例では、例えば、関連する識別器が互いに閾値の回転位置の範囲内である場合、複数の確かな結果を平均化することができる。他の例では、この方法は、画像を独自の分析を行うことによって、識別器の結果の1つ(またはサブセット)を選択することが、画像の現在の方向を決定することを導きだすものとすることができる。次に、決定された現在の方向は、図5に示すように回転修正方法の残りのブロックにおいて使用される。
いくつかの実施態様では、これらの方法のうちの1以上が、図1に示すように、例えば、サーバシステム102の様なサーバ上で実施することができる。いくつかの実施態様では1以上のクライアントデバイスは、それらのブロックを実行するサーバシステムに代わり、又はそれに加えて、1以上のブロックを実行することができる。
メモリ804は、オペレーティングシステム808と、いくつかの実施態様では、ソーシャルネットワーキングエンジン810(および/または他のアプリケーション)を含む、プロセッサ802によって、サーバデバイス800上で動作するソフトウェアを格納することができる。いくつかの実施態様では、ソーシャルネットワーキングエンジン810または他のアプリケーションエンジンは、本明細書に記載の機能、例えば、図4-7のいくつか又はすべての方法をプロセッサ802に実行させるための命令を含むことができる。メモリ804内の任意のソフトウェアは、代替的に、任意の他の好適な記憶場所またはコンピュータ読取可能な媒体に記憶することができる。加えて、メモリ804(および/または他の接続された1以上の記憶装置)は、画像、コンテンツ、および本明細書に記載された特徴で使用される他のデータを格納することができる。メモリ804及び他の任意のタイプの記憶媒体(磁気ディスク、光ディスク、磁気テープ、または他の有形の媒体)は、「記憶装置」と考えることができる。
他の実施態様では、サーバ装置800は、示されたコンポーネントのすべてを持っているものとは限らず、および/または本明細書に示されたものに代わりに、またはそれに加えて、他のタイプの要素を含む他の要素を持ってもよい。
システムは、本明細書のいくつかの実施態様で説明したブロックを実行するものとして記載されているが、任意の好適なコンポーネント、またはシステムのコンポーネントの組み合わせ、またはそのようなシステムに関連する任意の好適な1以上のプロセッサは記載されたブロックを実施することができる。
Claims (20)
- 方法であって、
画像コンテンツを含む画像を取得し、
画像に示されるコンテンツを識別し、識別されたコンテンツは、画像の画像コンテンツの少なくとも一部であり、
画像に示された識別されたコンテンツの現在の方向を決定するために、1以上の技術を選択しそして適用し、前記1以上の技術は複数の利用可能な技術から選択され、そしてこの1以上の技術の選択は、画像に描かれ識別されたコンテンツに基づき、
識別されたコンテンツを現在の方向よりも所定の基準方向に近い方向に向ける画像の回転量を決定し、そして
前記決定された回転量だけ画像を回転させる、
ことを含む前記方法。 - 方法であって、
画像に示されるコンテンツの1以上の識別要素を取得し、
前記画像に示されるコンテンツの現在の方向を決定し、
前記現在の方向は、コンテンツの1以上の識別要素に基づいて決定され、
前記コンテンツを現在の方向よりも所定の基準方向に近い方向に向ける、画像の回転量を決定し、そして
前記決定された回転量だけ画像を回転させる、
ことを含む前記方法。 - 請求項2の方法であって、前記所定の基準方向は、その現在の方向での画像の1以上の境界線またはエッジに基づいて、ほぼ水平軸に合わせされる、前記方法。
- 請求項2の方法であって、
現在の方向を決定することには、画像の現在の方向を決定するために、1以上の分析技術を選択し、そして適用することを含み、前記1以上の分析技術は、1以上の識別要素に基づいて複数の技術から選択される、前記方法。 - 請求項2の方法であって、現在の方向を決定することには、画像の1以上の特徴について決定される1以上の線形軸に基づいて、前記画像の方向軸を決定することを含む、前記方法。
- 請求項2の方法であって、現在の方向を決定することには、画像内の少なくとも一つの有力なエッジを見つけるためにエッジ検出技術を用いることを含み、及び回転量を決定することには、所定の基準方向からの、少なくとも一つの有力なエッジのずれの量を決定することを含む、前記方法。
- 請求項6の方法であって、前記エッジ検出プロセスは、前記画像が、エッジ検出プロセスを使用することに関連付けられるある種のコンテンツを示していると決定されたことに応答して使用される、前記方法。
- 請求項7の方法であって、エッジ検出プロセスに関連付けられているある種のコンテンツには、風景または屋外環境の描写を含む、前記方法。
- 請求項2の方法であって、
現在の方向を決定することには、
画像に描かれていると識別された各顔の両目の間の軸を決定することを含む顔の方向判定技術を用いることを含む、前記方法。 - 請求項9の方法であって、
前記顔の方向判定技術は、画像が1以上の顔を示していると判断されたことに応答して使用される、前記方法。 - 請求項2の方法であって、
現在の方向を決定することには、画像に示されている一以上の各顔の両目の間の軸を決定することを含む顔の方向判定技術を用いること及び1以上の顔の決定された軸に合致するえられる軸を決定することを含み、及び回転量を決定することには、前記所定の基準方向からの、得られる軸のずれの量を決定することを含む、前記方法。 - 請求項11の方法であって、得られる軸を決定することには、1以上の顔の軸の
平均の軸(average axis)、1以上の顔の軸のモード軸(mode axis)の一つを決定し、及び1以上の顔の軸の平均軸(mean axis)を見つけることを含む、前記方法。 - 請求項2の方法であって、
ユーザーからの画像の回転の指示を受領し、そして
回転された画像を表示し、前記表示は、現在の方向の画像の表示から、回転された方向に画像を素早く動かす(snapping)ことを含み、前記表示された回転方向は決定された回転量に対応する、前記方法。 - 請求項2の方法であって、現在の画像の方向を決定することには、
画像の現在の方向を決定するために、機械学習を用いる複数の識別器に画像を入力することを含む、前記方法。 - システムであって、
記憶装置と、
前記記憶装置にアクセスして、操作を実行可能にする少なくとも一つのプロセッサを含み、
前記操作は、
画像に示されたコンテンツの1以上の識別要素を取得し、
画像のコンテンツの現在の方向を決定するし、前記現在の方向は、コンテンツの1以上の識別要素に基づいて決定され、
前記コンテンツを現在の方向よりもある所定の基準方向により近い方向に、向けるように前記画像の回転量が決定され、
及び画像を決定された量だけ回転する
ことを含む前記システム。 - 請求項15のシステムであって、
前記所定の基準方向は、現在の方向における画像の、1以上の境界線又はエッジに基づいてほぼ水平の軸に位置合わせされる、前記システム。 - 請求項15のシステムであって、
現在の方向を決定する操作には、画像の現在の方向を決定するためには、1以上の分析技術を選択し、そして適用することを含み、前記1以上の分析技術は、1以上の識別要素に基づいて決定され、複数の技術から選択されることを含む、前記システム。 - 請求項15のシステムであって、現在の方向を決定する操作は、画像の1以上の特徴について決定される1以上の線形軸に基づいて、前記画像の方向軸を決定することを含む、前記システム。
- 請求項15のシステムであって、現在の方向を決定する操作は、
画像の少なくとも一つの有力な軸を見つけ出すためのエッジ検出技術、及び
画像に示されていると識別された各顔の両目の間の軸を決定することを含む顔の方向判定技術、
の少なくとも一つを使用することを含む、
前記システム - 請求項15のシステムであって、さらに、以下の操作、すなわち、
ユーザーからの画像の回転の指示を受領し、そして
回転された画像を表示し、前記表示は、現在の方向の画像の表示から、回転された方向に画像を急変化(snapping)させることを含み、前記表示された回転方向は決定された回転量に対応する、
前記システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/678,850 US9280804B2 (en) | 2012-11-16 | 2012-11-16 | Rotation of an image based on image content to correct image orientation |
US13/678,850 | 2012-11-16 | ||
PCT/US2013/070081 WO2014078526A2 (en) | 2012-11-16 | 2013-11-14 | Rotation of an image based on image content to correct image orientation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016504657A true JP2016504657A (ja) | 2016-02-12 |
JP6012060B2 JP6012060B2 (ja) | 2016-10-25 |
Family
ID=49674396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015542773A Active JP6012060B2 (ja) | 2012-11-16 | 2013-11-14 | 画像の方向を修正するための画像内容に基づく画像の回転 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9280804B2 (ja) |
EP (1) | EP2920758B1 (ja) |
JP (1) | JP6012060B2 (ja) |
KR (1) | KR101685861B1 (ja) |
CN (1) | CN104838420B (ja) |
WO (1) | WO2014078526A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018054880A (ja) * | 2016-09-29 | 2018-04-05 | セイコーエプソン株式会社 | 表示装置、情報処理装置および情報処理方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9652887B2 (en) * | 2014-01-22 | 2017-05-16 | Hankookin, Inc. | Object oriented image processing and rendering in a multi-dimensional space |
WO2016136610A1 (ja) * | 2015-02-27 | 2016-09-01 | シャープ株式会社 | 表示装置、及び表示装置の画像表示方法 |
WO2017131838A2 (en) * | 2015-11-13 | 2017-08-03 | Flir Systems, Inc. | Sonar sensor fusion and model based virtual and augmented reality systems and methods |
US11328155B2 (en) * | 2015-11-13 | 2022-05-10 | FLIR Belgium BVBA | Augmented reality labels systems and methods |
US9864925B2 (en) * | 2016-02-15 | 2018-01-09 | Ebay Inc. | Digital image presentation |
US12008034B2 (en) | 2016-02-15 | 2024-06-11 | Ebay Inc. | Digital image presentation |
CN106371730A (zh) * | 2016-09-08 | 2017-02-01 | 珠海市魅族科技有限公司 | 一种移动终端及图像旋转方法 |
US11263777B2 (en) * | 2017-05-09 | 2022-03-01 | Sony Corporation | Information processing apparatus and information processing method |
US11823359B2 (en) * | 2017-10-06 | 2023-11-21 | Google Llc | Systems and methods for leveling images |
US10095925B1 (en) * | 2017-12-18 | 2018-10-09 | Capital One Services, Llc | Recognizing text in image data |
JP2019168999A (ja) * | 2018-03-23 | 2019-10-03 | カシオ計算機株式会社 | 撮像装置、撮像方法及びプログラム |
KR102242407B1 (ko) * | 2019-03-11 | 2021-04-20 | 삼성전자주식회사 | 디스플레이 장치 및 그 제어 방법 |
CN111679731A (zh) * | 2019-03-11 | 2020-09-18 | 三星电子株式会社 | 显示装置及其控制方法 |
CN111986069A (zh) | 2019-05-22 | 2020-11-24 | 三星电子株式会社 | 图像处理装置及其图像处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002344723A (ja) * | 2001-05-17 | 2002-11-29 | Fuji Photo Film Co Ltd | 撮像装置、画像処理装置、画像処理方法、及びプログラム |
US20030152289A1 (en) * | 2002-02-13 | 2003-08-14 | Eastman Kodak Company | Method and system for determining image orientation |
JP2004534334A (ja) * | 2001-06-30 | 2004-11-11 | ヒューレット・パッカード・カンパニー | 電子画像の傾きを修正する方法及び画像処理システム、画像取り込みシステム、並びに、カメラ |
JP2008305275A (ja) * | 2007-06-08 | 2008-12-18 | Fujifilm Corp | アルバム作成装置および方法ならびにプログラム |
JP2009010452A (ja) * | 2007-06-26 | 2009-01-15 | Fuji Xerox Co Ltd | 画像処理システム及び画像処理プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7893963B2 (en) | 2000-03-27 | 2011-02-22 | Eastman Kodak Company | Digital camera which estimates and corrects small camera rotations |
US7079707B2 (en) | 2001-07-20 | 2006-07-18 | Hewlett-Packard Development Company, L.P. | System and method for horizon correction within images |
JP2004320277A (ja) * | 2003-04-15 | 2004-11-11 | Sony Corp | プリント用端末、プリントシステム、記憶媒体及びプログラム |
WO2007142621A1 (en) * | 2006-06-02 | 2007-12-13 | Fotonation Vision Limited | Modification of post-viewing parameters for digital images using image region or feature information |
KR100580174B1 (ko) * | 2003-08-21 | 2006-05-16 | 삼성전자주식회사 | 회전 가능한 디스플레이 장치 및 화면 조정 방법 |
US20050146620A1 (en) | 2004-01-02 | 2005-07-07 | Monroe Darrin D. | Electronic device with image capturing and method therefor |
US7724296B2 (en) | 2006-06-21 | 2010-05-25 | Sony Ericsson Mobile Communications Ab | Device and method for adjusting image orientation |
CN100440248C (zh) * | 2006-12-06 | 2008-12-03 | 北京中星微电子有限公司 | 一种图像方向校正装置及方法 |
US7706579B2 (en) * | 2006-12-21 | 2010-04-27 | Sony Ericsson Communications Ab | Image orientation for display |
JP4946730B2 (ja) * | 2007-08-27 | 2012-06-06 | ソニー株式会社 | 顔画像処理装置及び顔画像処理方法、並びにコンピュータ・プログラム |
US8232988B2 (en) * | 2007-10-31 | 2012-07-31 | Autodesk, Inc. | Pre-computing image manipulations |
WO2010103868A1 (ja) | 2009-03-11 | 2010-09-16 | オリンパスメディカルシステムズ株式会社 | 画像処理システム、その外部装置およびその画像処理方法 |
-
2012
- 2012-11-16 US US13/678,850 patent/US9280804B2/en active Active
-
2013
- 2013-11-14 WO PCT/US2013/070081 patent/WO2014078526A2/en active Application Filing
- 2013-11-14 KR KR1020157012941A patent/KR101685861B1/ko active IP Right Grant
- 2013-11-14 JP JP2015542773A patent/JP6012060B2/ja active Active
- 2013-11-14 CN CN201380059226.2A patent/CN104838420B/zh active Active
- 2013-11-14 EP EP13796207.2A patent/EP2920758B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002344723A (ja) * | 2001-05-17 | 2002-11-29 | Fuji Photo Film Co Ltd | 撮像装置、画像処理装置、画像処理方法、及びプログラム |
JP2004534334A (ja) * | 2001-06-30 | 2004-11-11 | ヒューレット・パッカード・カンパニー | 電子画像の傾きを修正する方法及び画像処理システム、画像取り込みシステム、並びに、カメラ |
US20030152289A1 (en) * | 2002-02-13 | 2003-08-14 | Eastman Kodak Company | Method and system for determining image orientation |
JP2008305275A (ja) * | 2007-06-08 | 2008-12-18 | Fujifilm Corp | アルバム作成装置および方法ならびにプログラム |
JP2009010452A (ja) * | 2007-06-26 | 2009-01-15 | Fuji Xerox Co Ltd | 画像処理システム及び画像処理プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018054880A (ja) * | 2016-09-29 | 2018-04-05 | セイコーエプソン株式会社 | 表示装置、情報処理装置および情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
KR101685861B1 (ko) | 2016-12-12 |
CN104838420B (zh) | 2018-04-20 |
EP2920758A2 (en) | 2015-09-23 |
EP2920758B1 (en) | 2022-04-13 |
WO2014078526A3 (en) | 2014-08-28 |
KR20150070363A (ko) | 2015-06-24 |
JP6012060B2 (ja) | 2016-10-25 |
US9280804B2 (en) | 2016-03-08 |
CN104838420A (zh) | 2015-08-12 |
US20140140609A1 (en) | 2014-05-22 |
WO2014078526A2 (en) | 2014-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6012060B2 (ja) | 画像の方向を修正するための画像内容に基づく画像の回転 | |
US11483268B2 (en) | Content navigation with automated curation | |
US10591281B2 (en) | Apparatus and methods for facial recognition and video analytics to identify individuals in contextual video streams | |
CN105981368B (zh) | 在成像装置中的照片构图和位置引导 | |
US9665986B2 (en) | Systems and methods for an augmented reality platform | |
US11429338B2 (en) | Shared visualizations in augmented reality | |
US20180046855A1 (en) | Face detection and recognition | |
CN112954450B (zh) | 视频处理方法、装置、电子设备和存储介质 | |
US9582731B1 (en) | Detecting spherical images | |
US9324014B1 (en) | Automated user content processing for augmented reality | |
TW202026948A (zh) | 活體檢測方法、裝置以及儲存介質 | |
EP3069301A1 (en) | Face detection and recognition | |
CN113366489A (zh) | 检测增强现实目标 | |
US20180189602A1 (en) | Method of and system for determining and selecting media representing event diversity | |
CN110866168A (zh) | 信息推荐方法、装置、终端及服务器 | |
US9058674B1 (en) | Enhancing resolution of single images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160822 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6012060 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |