JPWO2017203777A1 - 電子装置、電子装置の制御方法、および、プログラム - Google Patents

電子装置、電子装置の制御方法、および、プログラム Download PDF

Info

Publication number
JPWO2017203777A1
JPWO2017203777A1 JP2017560634A JP2017560634A JPWO2017203777A1 JP WO2017203777 A1 JPWO2017203777 A1 JP WO2017203777A1 JP 2017560634 A JP2017560634 A JP 2017560634A JP 2017560634 A JP2017560634 A JP 2017560634A JP WO2017203777 A1 JPWO2017203777 A1 JP WO2017203777A1
Authority
JP
Japan
Prior art keywords
unit
electronic device
shape
distance
light
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017560634A
Other languages
English (en)
Other versions
JP6904261B2 (ja
Inventor
大木 光晴
光晴 大木
伸樹 古江
伸樹 古江
嘉人 大木
嘉人 大木
東山 恵祐
恵祐 東山
正浩 渡邉
正浩 渡邉
堅誠 城
堅誠 城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2017203777A1 publication Critical patent/JPWO2017203777A1/ja
Application granted granted Critical
Publication of JP6904261B2 publication Critical patent/JP6904261B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/02Systems using the reflection of electromagnetic waves other than radio waves
    • G01S17/06Systems determining position data of a target
    • G01S17/08Systems determining position data of a target for measuring distance only
    • G01S17/32Systems determining position data of a target for measuring distance only using transmission of continuous waves, whether amplitude-, frequency-, or phase-modulated, or unmodulated
    • G01S17/36Systems determining position data of a target for measuring distance only using transmission of continuous waves, whether amplitude-, frequency-, or phase-modulated, or unmodulated with phase comparison between the received signal and the contemporaneously transmitted signal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/48Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
    • G01S7/481Constructional features, e.g. arrangements of optical elements
    • G01S7/4814Constructional features, e.g. arrangements of optical elements of transmitters alone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/521Depth or shape recovery from laser ranging, e.g. using interferometry; from the projection of structured light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/145Illumination specially adapted for pattern recognition, e.g. using gratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/56Cameras or camera modules comprising electronic image sensors; Control thereof provided with illuminating means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/254Image signal generators using stereoscopic image cameras in combination with electromagnetic radiation sources for illuminating objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/271Image signal generators wherein the generated image signals comprise depth maps or disparity maps

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Electromagnetism (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Optics & Photonics (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

画像を撮像する電子装置において、画像内の文字を正確に認識する。電子装置は、撮像部、測距部、形状推定部、および、座標変換部を具備する。撮像部は、物体を撮像して画像データを撮像する。測距部は、撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する。形状推定部は、測定された距離から物体の形状を推定する。座標変換部は、推定された形状に基づいて物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う。

Description

本技術は、電子装置、その制御方法、および、当該方法をコンピュータに実行させるためのプログラムに関する。詳しくは、文字認識を行う電子装置、その制御方法、および、当該方法をコンピュータに実行させるためのプログラムに関する。
従来より、印刷物に記載された文字を情報処理装置によって取り込んで処理するために、光学文字認識(OCR:Optical Character Recognition)と呼ばれる技術が用いられている。例えば、車載カメラによって道路の標識を撮像して、その標識に記載された文字をOCRを用いて読み取り、翻訳するシステムが提案されている(例えば、特許文献1参照。)。
特開2003−323693号公報
上述の従来技術では、標識に記載された文字の意味を、光学文字認識によって認識している。しかしながら、上述の従来技術では、湾曲した面や車載カメラから見て傾いた面に文字が記載されていた場合に、文字の形が歪んで光学文字認識を正確に行うことができないという問題がある。
本技術はこのような状況に鑑みて生み出されたものであり、画像を撮像する電子装置において、画像内の文字を正確に認識することを目的とする。
本技術は、上述の問題点を解消するためになされたものであり、その第1の側面は、物体を撮像して画像データを撮像する撮像部と、上記撮像部から上記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距部と、上記測定された距離から上記物体の形状を推定する形状推定部と、上記推定された形状に基づいて上記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を上記画像データに対して行う座標変換部とを具備する電子装置、その制御方法、および、その方法をコンピュータに実行させるためのプログラムである。これにより、物体の表面上の立体座標が、基準平面上の平面座標に変換されるという作用をもたらす。
また、この第1の側面において、上記座標変換が行われた画像データにおいて上記物体の表面上の文字を認識する文字認識部をさらに具備してもよい。これにより、文字が認識されるという作用をもたらす。
また、この第1の側面において、照射光を照射する照射部をさらに具備し、上記測距部は、上記照射光に対する反射光と上記照射光との位相差から上記距離を測定してもよい。これにより、反射光と上記照射光との位相差から距離が測定されるという作用をもたらす。
また、この第1の側面において、上記撮像部は、上記画像データを撮像する処理と上記照射光を受光する処理とを行ってもよい。これにより、同一の撮像部で画像データの撮像と照射光の受光とが行われるという作用をもたらす。
また、この第1の側面において、上記照射部は、所定の周期信号に同期したパルス光を上記照射光として照射してもよい。これにより、パルス光が照射されるという作用をもたらす。
また、この第1の側面において、上記照射部は、スポット光および拡散光のいずれかを所定の操作に従って選択して上記照射光として照射し、上記測距部は、上記拡散光が照射されたときに上記距離を測定してもよい。これにより、スポット光および拡散光のいずれかが照射されるという作用をもたらす。
また、この第1の側面において、上記照射部は、所定のボタンが半押しされた場合には上記照射光の照射を開始し、上記撮像部は、上記所定のボタンが全押しされた場合には上記画像データを撮像してもよい。これにより、ボタンの操作に従って、照射光の照射と撮像とが行われるという作用をもたらす。
また、この第1の側面において、上記電子装置は、ウェアラブル端末に取付けられるカメラユニットであってもよい。これにより、カメラユニットにおいて物体の表面上の立体座標が、基準平面上の平面座標に変換されるという作用をもたらす。
また、この第1の側面において、上記形状推定部は、上記距離に基づいて複数の候補形状のいずれかを上記物体の形状として推定してもよい。これにより、複数の候補形状のいずれかが物体の形状として推定されるという作用をもたらす。
また、この第1の側面において、上記形状推定部は、上記距離から上記複数の測定点のそれぞれの座標を測定座標として検出する座標検出部と、上記複数の候補形状のそれぞれについて当該候補形状の座標と所定の基準座標系における座標との間の関係を示す関数を上記測定座標を用いて取得する関数取得部と、上記取得された関数と上記測定座標とから上記複数の候補形状のそれぞれについて上記物体の形状を想定した際の誤差を演算する誤差演算部と、上記複数の候補形状のうち上記誤差の最も少ない形状を上記物体の形状として推定する推定処理部とを備えてもよい。これにより、複数の候補形状のうち誤差の最も少ない形状が物体の形状として推定されるという作用をもたらす。
また、この第1の側面において、上記画像データは、複数の画素データを含み、上記撮像部は、瞳分割された2つの像の位相差を検出する位相差検出画素と、光を光電変換して上記複数の画素データのいずれかを生成する通常画素とを備え、上記測距部は、上記位相差検出画素により検出された位相差から上記距離を測定してもよい。これにより、位相差検出画素により検出された位相差から距離が測定されるという作用をもたらす。
本技術によれば、画像を撮像する電子装置において、画像内の文字を正確に認識することができるという優れた効果を奏し得る。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術の第1の実施の形態における電子装置の一構成例を示すブロック図である。 本技術の第1の実施の形態における立体形状推定部の一構成例を示すブロック図である。 本技術の第1の実施の形態における距離情報の一例を示す図である。 本技術の第1の実施の形態における測定座標の一例を示す図である。 本技術の第1の実施の形態におけるパラメータの一例を示す図である。 本技術の第1の実施の形態における撮像素子の一構成例を示すブロック図である。 本技術の第1の実施の形態における画素回路の一構成例を示すブロック図である。 本技術の第1の実施の形態における座標変換部の一構成例を示すブロック図である。 本技術の第1の実施の形態におけるレーザ光の形状の一例を示す図である。 本技術の第1の実施の形態におけるQ1Q2検出期間内の画素回路の露光制御の一例を示すタイミングチャートである。 本技術の第1の実施の形態におけるQ3Q4検出期間内の画素回路の露光制御の一例を示すタイミングチャートである。 本技術の第1の実施の形態における撮像期間内の画素回路の露光制御の一例を示すタイミングチャートである。 本技術の第1の実施の形態における基準座標系と平面座標系との関係の一例を示す図である。 本技術の第1の実施の形態における基準座標系と円柱座標系との関係の一例を示す図である。 本技術の第1の実施の形態における傾いた平面を撮像する際の電子装置の利用シーンの一例を示す図である。 本技術の第1の実施の形態における平面形状と変換前後の画像と翻訳結果の一例を示す図である。 本技術の第1の実施の形態における円柱を撮像する際の電子装置の利用シーンの一例を示す図である。 本技術の第1の実施の形態における円柱形状と変換前後の画像と翻訳結果の一例を示す図である。 本技術の第1の実施の形態における電子装置の動作の一例を示すフローチャートである。 本技術の第1の実施の形態の変形例における撮像システムの一構成例を示すブロック図である。 本技術の第1の実施の形態の変形例における撮像システムの外観図の一例である。 本技術の第2の実施の形態における電子装置の一構成例を示すブロック図である。 本技術の第2の実施の形態における撮像素子の一構成例を示すブロック図である。 本技術の第2の実施の形態における電子装置の動作の一例を示すフローチャートである。
以下、本技術を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(形状を推定して座標変換を行う例)
2.第2の実施の形態(位相差検出画素で測距した結果から形状を推定して座標変換を行う例)
<1.第1の実施の形態>
[電子装置の構成例]
図1は、第1の実施の形態における電子装置100の一構成例を示すブロック図である。この電子装置100は、操作部111、制御部112、レーザ光照射部113、挿抜部114、拡散板115、立体形状推定部200、測距部116、スイッチ117および撮像素子300を備える。また、電子装置100は、撮像レンズ118、座標変換部400、光学文字認識部119、翻訳処理部120および音声出力部121を備える。
操作部111は、ボタンやスイッチに対するユーザの操作に従って操作信号を生成するものである。電子装置100には、例えば、2段階に押し下げることのできるボタンが設けられる。操作部111は、そのボタンが押下されていない状態、半押しの状態、および、全押しの状態のいずれであるかを示す操作信号を生成して制御部112に供給する。
レーザ光照射部113は、制御部112の制御に従って、指向性を持たせた可視光(赤色光など)をレーザ光として所定の方向に照射するものである。レーザ光は、例えば、撮像レンズ118の光軸方向に略平行な方向に照射される。なお、レーザ光照射部113は、特許請求の範囲に記載の照射部の一例である。
挿抜部114は、制御部112の制御に従って、レーザ光の光路に拡散板115を挿入する処理、または、その光路から拡散板115を抜去する処理を行うものである。この挿抜部114は、モータなどのアクチュエータにより実現される。
拡散板115は、レーザ光を拡散するものである。拡散板115の挿入前においてレーザ光の形状はスポット状である。一方、拡散板115を挿入するとレーザ光は拡散して、例えば、円状となる。なお、拡散後のレーザ光の形状は、円に限定されず、線や三角形であってもよい。
また、レーザ光の形状の切替えは、例えば、サンワサプライ株式会社製のレーザポインタLP−RD312BKNや、コクヨ株式会社製のレーザポインタELP−G20と同様のものをレーザ光照射部113として用いることにより実現することができる。
撮像レンズ118は、光を集光して撮像素子300に導くものである。撮像素子300は、制御部112の制御に従って、物体を撮像して画像データを生成するものである。この撮像素子300には、二次元格子状に配列された複数の画素が配置される。画素のそれぞれは、受光量に応じたレベルの画素データを生成する。撮像素子300は、それらの画素データを含む画像データをスイッチ117に供給する。なお、撮像レンズ118および撮像素子300は、特許請求の範囲に記載の撮像部の一例である。
スイッチ117は、制御部112の制御に従って、撮像素子300からの画像データの出力先を切り替えるものである。このスイッチ117は、測距部116および座標変換部400のいずれかに画像データを出力する。
測距部116は、制御部112の制御に従って、物体上の複数の測定点のそれぞれについて、撮像素子300から測定点のそれぞれまでの距離を測定するものである。ここで、測定点は、拡散されたレーザ光が照射された点である。この測距部116は、照射したレーザ光と、そのレーザ光に対する反射光との位相差から距離を測定する。この測距方式は、ToF(Time of Flight)方式と呼ばれる。測距部116は、測定点毎の距離を示す距離情報を立体形状推定部200に供給する。
立体形状推定部200は、距離情報に基づいて、物体の形状を推定するものである。この立体形状推定部200は、推定した物体の形状に関連するパラメータを座標変換部400に供給する。このパラメータについての詳細は後述する。なお、立体形状推定部200は、特許請求の範囲に記載の形状推定部の一例である。
座標変換部400は、立体形状推定部200からのパラメータを用いて、画像データに対して所定の座標変換を行うものである。この座標変換は、レーザ光が照射された物体の表面上の座標を、所定の基準平面上の座標に変換する処理である。例えば、撮像素子300の像面に平行な(言い換えれば、正対した)平面が、基準平面として用いられる。座標変換部400は、座標変換後の画像データを光学文字認識部119に供給する。
制御部112は、電子装置100全体を制御するものである。所定のボタンが半押しされると制御部112は、レーザ光照射部113を制御して連続的なレーザ光の照射を開始させる。また、制御部112は、挿抜部114に拡散板115を抜去させる。
そして、ボタンが全押しされると制御部112は、レーザ光照射部113を制御して間欠的なレーザ光の照射を開始させる。例えば、制御部112は、矩形波やサイン波の発光制御信号CLKpをレーザ光照射部113に供給し、レーザ光照射部113は、その信号に同期して発光する。この制御により、例えば、周波数が20メガヘルツ(MHz)のパルス光が照射される。
また、ボタンの全押し時に制御部112は、挿抜部114に拡散板115を挿入させる。さらに、制御部112は、撮像素子300を制御して画像データを撮像させる。そして、スイッチ117を制御して画像データを測距部116に供給させ、一定の測距期間に亘って測距部116に測距を行わせる。
測距期間が経過すると、制御部112は、撮像素子300を制御して、再度、画像データを撮像させる。また、制御部112は、スイッチ117を制御して画像データを座標変換部400に供給させる。
光学文字認識部119は、画像データに対してOCRを行うものである。光学文字認識部119は、OCRの結果を翻訳処理部120に供給する。
翻訳処理部120は、OCRで認識された文字からなる文章の言語(日本語など)を、他の所定の言語(英語など)に置き換える翻訳処理を行うものである。翻訳処理部120は、翻訳処理の結果を音声出力部121に供給する。音声出力部121は、翻訳処理部120の翻訳結果を音声で出力するものである。
なお、レーザ光照射部113や撮像素子300などの各部を1つの装置(電子装置100)内に設けているが、これらを複数の装置に分散して設けてもよい。例えば、レーザ光照射部113、挿抜部114および拡散板115を、電子装置100に外付けする外部のレーザポインタユニット内に設けてもよい。また、光学文字認識部119や翻訳処理部120を、電子装置100の外部の情報処理装置に設けてもよい。この場合には、電子装置100は、画像データや文字情報を、その情報処理装置に送信し、OCRや翻訳の結果を受信すればよい。
また、電子装置100は、OCRを行っているが、OCR以外の処理を画像データに対して行ってもよい。例えば、電子装置100は、特定の物体(顔など)や二次元バーコードの認識処理をOCRの代わりに行ってもよい。また、電子装置100は、翻訳結果を音声出力しているが、その翻訳結果を液晶モニタなどの表示部に表示してもよい。
[立体形状推定部の構成例]
図2は、第1の実施の形態における立体形状推定部200の一構成例を示すブロック図である。この立体形状推定部200は、測定座標保持部210、測定座標検出部220、距離情報保持部230、最小二乗法演算部240、パラメータ保持部250、誤差演算部260およびパラメータ供給部270を備える。
距離情報保持部230は、測距部116により測定された測定点毎の距離を示す距離情報を保持するものである。
測定座標検出部220は、距離情報に基づいて、所定の基準座標系における立体座標を測定点ごとに測定座標として検出するものである。この基準座標系として、例えば、撮像素子300の像面に平行なX軸およびY軸と、像面に垂直なZ軸とからなる座標系が用いられる。測定座標検出部220は、拡散されたレーザ光の方向と所定の基準軸(X、YおよびZ軸など)とのなす角度を予め取得しておき、その角度と測定された距離とから三角関数を用いて、測定点毎に測定座標を演算する。測定座標検出部220は、測定点毎の測定座標を測定座標保持部210に保持させる。以下、測定点の個数をN(Nは2以上の整数)個とし、i(iは、0乃至N−1の整数)番目の測定点の測定座標を(x0i、y0i、z0i)とする。
最小二乗法演算部240は、最小二乗法を用いて、候補形状ごとに測定座標群に最もフィットする関数を演算するものである。複数の候補形状は、例えば、基準平面に対して傾いた平面形状と、円柱形状とを含む。また、ここで、演算により求められる関数は、候補形状の座標系における座標と、基準座標系における座標との間の関係を示す関数である。
ここで、互いに直交するXp軸、Yp軸およびZp軸からなる座標系を、傾いた平面の平面座標系とすると、この平面座標系上の座標と、基準座標系上の座標との間の関係は、例えば、次の式により表される。
Figure 2017203777
上式において、(xpi、ypi、zpi)は、平面座標系における座標を示す。また、Rpは、回転行列であり、次の式により表される。
Rp=Rxp・Ryp・Rzp
上式において、Rxpはx軸周りに角度trxpだけ回転させる際の回転行列である。また、Rypはy軸周りに角度trypだけ回転させる際の回転行列であり、Rzpはz軸周りに角度trzpだけ回転させる際の回転行列である。
また、Tpは、x成分、y成分、およびz成分からなる平行移動ベクトルである。これらのx成分、y成分、およびz成分の値をA、BおよびCとする。
XpYp平面上に測定点が位置する際には、その測定点の座標のZp成分は零となるはずである。このため、Zp成分が零とならないときには、この成分は誤差として扱われる。次の式により、この誤差の二乗和Epが最小となるときのRpおよびTpが求められる。
Figure 2017203777
上式を解くために、例えば、上式の両辺をtrxp、tryp、trzp、A、BおよびCのそれぞれで偏微分する偏微分法が用いられる。
次に、互いに直交するXc軸、Yc軸およびZc軸からなる座標系を円柱の円柱座標系とすると、この円柱座標系上の座標と、基準座標系上の座標との間の関係は、例えば、次の式により表される。
Figure 2017203777
上式において、(xci、yci、zci)は、円柱座標系における座標を示す。また、Rcは、回転行列であり、次の式により表される。
Rc=Rxc・Ryc・Rzc
上式において、Rxcはx軸周りに角度trxcだけ回転させる際の回転行列である。また、Rycはy軸周りに角度trycだけ回転させる際の回転行列であり、Rzcはz軸周りに角度trzcだけ回転させる際の回転行列である。rは円柱の半径である。
また、Tcは、x成分、y成分、およびz成分からなる平行移動ベクトルである。これらのx成分、y成分、およびz成分の値をD、EおよびFとする。
rを円柱の半径とすると、円柱の表面上に測定点が位置する際は、その測定点のXcおよびZc座標の二乗和は、rの二乗に等しくなるはずである。このため、これらの差分が零にならないときは、この差分は誤差として扱われる。次の式により、この誤差の二乗和Ecが最小となるときのRc、Tcおよびrが求められる。
Figure 2017203777
上式を解くために、例えば、上式の両辺をtrxc、tryc、trzc、D、EおよびFのそれぞれで偏微分する偏微分法が用いられる。
最小二乗法演算部240は、求めたRpおよびTpのパラメータ群とRc、Tcおよびrのパラメータ群とをパラメータ保持部250に保持させる。
誤差演算部260は、候補形状ごとに、その候補形状に対応するパラメータを用いて、その形状を想定した際の誤差を演算するものである。この誤差演算部260は、例えば、式2および式4を用いて傾き平面形状に対応する誤差の二乗和Epと、円柱形状に対応する誤差の二乗和Ecとを演算し、パラメータ供給部270に供給する。
パラメータ供給部270は、誤差に基づいて、複数の候補形状のいずれかを実際の物体の形状として推定するものである。このパラメータ供給部270は、誤差の二乗和EpおよびEcを比較して、値の小さな方に対応する候補形状を物体の形状として推定する。そして、パラメータ供給部270は、その形状に対応するパラメータ群をパラメータ保持部250から読み出して、推定した形状の識別情報とともに座標変換部400に供給する。なお、パラメータ供給部270は、特許請求の範囲に記載の推定処理部の一例である。
なお、立体形状推定部200は、平面形状および円柱形状の2つの候補形状を想定して形状を推定しているが、候補形状の種類はこれらに限定されない。候補形状は、例えば、球や立方体であってもよい。また、候補形状の個数は2つに限定されず、3つ以上であってもよい。候補形状が3つ以上の場合にパラメータ供給部270は、誤差が最も少ない候補形状を物体の形状として推定する。
図3は、第1の実施の形態における距離情報の一例を示す図である。この距離情報は、測定点ごとに、撮像レンズ118から測定点までの距離を含む。例えば、測定点P1までの距離が100メートルであり、測定点P2までの距離が102メートルであった場合には、立体形状推定部200は、P1に対応する「100」と、P2に対応する「102」とを距離情報保持部230内に保持する。
図4は、第1の実施の形態における測定座標の一例を示す図である。測定点までの距離と、レーザ光の照射角度とから、測定点ごとにX、YおよびZ軸上の測定座標が算出される。測定点P1のX座標、Y座標およびZ座標として50、50および51が算出され、測定点P2のX座標、Y座標およびZ座標として50、51および51が算出されたものとする。この場合に、立体形状推定部200は、測定点P1に対応する測定座標(50、50、51)と測定点P2に対応する測定座標(50、51、51)とを測定座標保持部210内に保持する。
図5は、第1の実施の形態におけるパラメータの一例を示す図である。平面形状に対応する式1の関数は、回転行列Rpおよび平行移動ベクトルTpのパラメータを含み、円柱形状に対応する式2の関数は、回転行列Rcおよび平行移動ベクトルTcおよび半径rのパラメータを含む。立体形状推定部200は、最小二乗法により、これらのパラメータを算出してパラメータ保持部250内に保持する。
[撮像素子の構成例]
図6は、第1の実施の形態における撮像素子300の一構成例を示すブロック図である。この撮像素子300は、行走査回路310と、画素アレイ部320と、タイミング制御部340と、複数のAD(Analog to Digital)変換部350と、列走査回路360と、信号処理部370とを備える。画素アレイ部320には、二次元格子状に複数の画素回路330が配置される。以下、所定の方向に配列された画素回路330の集合を「行」と称し、行に垂直な方向に配列された画素回路330の集合を「列」と称する。前述のAD変換部350は、列ごとに設けられる。
タイミング制御部340は、垂直同期信号に同期して行走査回路310、AD変換部350および列走査回路360を制御するものである。
行走査回路310は、全行を同時に露光させ、露光終了後に行を順に選択して画素信号を出力させるものである。画素回路330は、行走査回路310の制御に従って、受光量に応じたレベルの画素信号を出力するものである。
AD変換部350は、対応する列からの画素信号をAD変換するものである。このAD変換部350は、列走査回路360の制御に従って、AD変換した画素信号を画素データとして信号処理部370に出力する。列走査回路360は、AD変換部350を順に選択して画素データを出力させるものである。
信号処理部370は、画素データからなる画像データに対して、CDS(Correlated Double Sampling)処理などの信号処理を行うものである。この信号処理部370は、信号処理後の画像データをスイッチ117に供給する。
[画素回路の構成例]
図7は、第1の実施の形態における画素回路330の一構成例を示すブロック図である。この画素回路330は、受光素子331と、転送スイッチ332と、電荷蓄積部333および334と、選択スイッチ335および336とを備える。
受光素子331は、光を光電変換して電荷を生成するものである。この受光素子331として、例えば、フォトダイオードが用いられる。
転送スイッチ332は、行走査回路310の制御に従って受光素子331を電荷蓄積部333、電荷蓄積部334およびリセット電源Vrstのいずれかに接続するものである。この転送スイッチ332は、例えば、複数のMOS(Metal-Oxide-Semiconductor)トランジスタなどにより実現される。リセット電源Vrstに接続された際において、MOSトランジスタのドレインから出力された電荷は破棄され、受光素子331の電荷が初期化される。
電荷蓄積部333および334は、電荷を蓄積して、その蓄積量に応じた電圧を生成するものである。これらの電荷蓄積部333および334として、例えば、浮遊拡散層が用いられる。
選択スイッチ335は、行走査回路310の制御に従って、電荷蓄積部333とAD変換部350との間の線路を開閉するものである。選択スイッチ336は、行走査回路310の制御に従って、電荷蓄積部334とAD変換部350との間の線路を開閉するものである。例えば、行走査回路310によりFD読出し信号RD_FD1が供給された際に選択スイッチ335が閉状態に遷移し、行走査回路310によりFD読出し信号RD_FD2が供給された際に選択スイッチ336が閉状態に遷移する。これらの選択スイッチ335および336のそれぞれは、例えば、MOSトランジスタなどにより実現される。
[座標変換部の構成例]
図8は、第1の実施の形態における座標変換部400の一構成例を示すブロック図である。この座標変換部400は、切り出し処理部420、フレームメモリ410およびアドレス変換部430を備える。
切り出し処理部420は、画像データにおいて、円状のレーザ光で囲まれた部分を含む所定形状(例えば、長方形)の領域を切り出すものである。この切り出し処理部420は、切り出した領域を切り出し領域としてフレームメモリ410に保持させる。フレームメモリ410は、切り出し領域を保持するものである。
アドレス変換部430は、切り出し領域内の画素のそれぞれについて、その座標を基準平面上の座標に変換するものである。この座標変換部400は、立体形状推定部200により推定された形状の識別情報と、その形状のパラメータ群とを受け取る。平面形状であると推定された場合には式1の回転行列Rpおよび平行移動ベクトルTpがパラメータとして座標変換部400に供給される。一方、立体形状であると推定された場合には式2の回転行列Rc、平行移動ベクトルTcおよび半径rがパラメータとして座標変換部400に供給される。
平面形状であると推定された場合に、撮像素子300上の座標(u、v)と、傾いた平面上の座標(xei、yei)との間の位置関係はパラメータRpおよびTpを用いて次の式により表される。
Figure 2017203777
上式においてfは、焦点距離である。アドレス変換部430は、上式を用いてフレームメモリ410に保持された画像(切り出し領域)において座標(u、v)の画素値を基準平面上の座標(xei、yei)の画素値として出力する。これにより、アドレス変換部430は、像面に正対した画像を生成することができる。
一方、円柱形状であると推定された場合に、撮像素子300上の座標(u、v)と円柱上の座標(xei、yei)との間の位置関係はパラメータRp、Tpおよびrを用いて次の式により表される。
Figure 2017203777
アドレス変換部430は、上式を用いてフレームメモリ410に保持された画像において座標(u、v)の画素値を基準平面上の座標(xei、yei)の画素値として出力する。これにより、アドレス変換部430は、像面に正対した画像を生成することができる。
なお、座標変換部400は、レーザ光で囲まれた部分の周辺のみを切り出して座標変換を行っているが、切り出しを行わずに画像全体に対して座標変換を行ってもよい。
図9は、第1の実施の形態におけるレーザ光の形状の一例を示す図である。同図におけるaは、ボタンを半押しした際のレーザ光の形状の一例を示す図である。同図におけるaに例示するように、ボタンを半押しすると、拡散板115が抜去された状態でスポット状のレーザ光500が照射される。
また、図9におけるbは、ボタンを全押しした際のレーザ光の形状の一例を示す図である。同図におけるbに例示するように、ボタンを全押しすると、拡散板115が挿入され、円状のレーザ光501が照射される。ユーザは、OCR対象の文字(値札の文字など)がレーザ光の円内に入るように、レーザ光の照射位置を調整する。
なお、ToF方式では、測距対象の面全体にレーザ光を照射する面照射が一般的である。しかしながら、OCR対象の部分のみを測距するのであれば、電子装置100は、面全体を照射する必要はなく、その部分のみにレーザ光を照射すれば十分である。レーザ光の照射範囲を絞ることにより、面全体に照射する場合よりも電子装置100の消費電力を抑制することができる。
また、ToF方式では、赤外光など、可視光でない光を照射するのが一般的である。しかしながら、想定される電子装置100の利用シーンでは、レーザ光の照射位置をユーザが視認する必要があるため、電子装置100は、赤色光などの可視光を照射している。可視光を用いる場合も、ToFによる測距原理は、赤外光と同様である。
図10は、第1の実施の形態におけるQ1Q2検出期間内の画素回路の露光制御の一例を示すタイミングチャートである。ボタンが全押しされると、画素回路330は、受光量Q1およびQ2の検出と、受光量Q3およびQ4の検出とを交互に繰り返し行う。以下、受光量Q1およびQ2の検出期間を「Q1Q2検出期間」と称し、受光量Q3およびQ4の検出期間を「Q3Q4検出期間」と称する。Q1Q2検出期間およびQ3Q4検出期間のそれぞれの長さは、垂直同期信号VSYNCの周期(例えば、1/60秒)である。
ここで、受光量Q1は、レーザ光の発光制御信号CLKpの特定の位相(例えば、立上り)を0度として、0度から180度までの受光量q1をQ1Q2検出期間に亘って累積したものである。発光制御信号CLKpの周波数は20メガヘルツ(MHz)と高いため、その1周期(1/20マイクロ秒)当たりの受光量q1は非常に少なく、検出が困難である。このため、画素回路330は、発光制御信号CLKpの周期(1/20マイクロ秒)より長い1/60秒などのQ1Q2検出期間に亘って、q1のそれぞれを累積し、その総量を受光量Q1として検出する。また、受光量Q2は、180度から360度までの反射光の受光量q2をQ1Q2検出期間に亘って累積したものである。
また、受光量Q3は、90度から270度までの反射光の受光量q3をQ3Q4検出期間に亘って累積したものである。また、受光量Q4は、270度から90度までの反射光の受光量q4をQ3Q4検出期間に亘って累積したものである。
これらの受光量Q1、Q2、Q3およびQ4を次の式に代入することにより、測距部116は、測定点までの距離dを算出することができる。この式の導出方法は、例えば、「Larry Li、"Time-of-Flight Camera - An Introduction"、テキサスインスツルメンツ、Technical White Paper SLOA190B January 2014 Revised May 2014」に記載されている。
d=(c/4πf)×tan−1{(Q3−Q4)/(Q1−Q2)}
上式においてdは距離であり、単位は、例えば、メートル(m)である。cは光速であり、単位は、例えば、メートル毎秒(m/s)である。tan−1()は、正接関数の逆関数を示す。
例えば、タイミングT1からタイミングT2までのQ1Q2検出期間において、その期間の受光量Q1およびQ2が検出される。まず、行走査回路310は、タイミングT1から所定のパルス期間に亘ってリセット信号RSTを全行に供給する。このリセット信号RSTにより、全行の電荷蓄積部333および334の電荷蓄積量が初期化される。また、行走査回路310は、FD選択信号SEL_FDにより、全行の受光素子331の電荷を初期化する。
そして、行走査回路310は、Q1Q2検出期間において、発光制御信号CLKpの周期内の0度から180度までに亘って全行についてFD選択信号SEL_FDにより受光素子331が生成した電荷を電荷蓄積部333に転送させる。この制御により、電荷蓄積部333に受光量q1が蓄積される。
また、行走査回路310は、Q1Q2検出期間において、発光制御信号CLKpの周期内の180度から360度までに亘って全行についてFD選択信号SEL_FDにより受光素子331が生成した電荷を電荷蓄積部334に転送させる。この制御により、電荷蓄積部334に受光量q2が蓄積される。
そして、タイミングT2の直前のタイミングT11において行走査回路310は、1行目にFD読出し信号RD_FD1およびRD_FD2を順に供給する。この制御により、1行目の受光量Q1およびQ2に応じた画素信号が読み出される。次に、行走査回路310は、2行目にFD読出し信号RD_FD1およびRD_FD2を順に供給して画素信号を読み出す。以下、同様に行走査回路310は、行を順に選択して画素信号を読み出す。
このように、Q1Q2検出期間において画素回路330のそれぞれは、0度から180度までの受光量Q1と、180度から360度までの受光量Q2とを検出する。
図11は、第1の実施の形態におけるQ3Q4検出期間内の画素回路330の露光制御の一例を示すタイミングチャートである。例えば、タイミングT2からタイミングT3までのQ3Q4検出期間において、その期間の受光量Q3およびQ4が検出される。まず、行走査回路310は、タイミングT2から所定のパルス期間に亘ってリセット信号RSTを全行に供給し、全行の電荷蓄積部333および334の電荷蓄積量を初期化する。また、行走査回路310は、FD選択信号SEL_FDにより、全行の受光素子331の電荷を初期化する。
そして、行走査回路310は、最初の0度から90度において、全行についてFD選択信号SEL_FDにより受光素子331が生成した電荷を電荷蓄積部334に転送させる。この制御により、電荷蓄積部334に受光量q4が蓄積される。以降において行走査回路310は、発光制御信号CLKpの周期内の90度から270度までに亘って全行についてFD選択信号SEL_FDにより受光素子331が生成した電荷を電荷蓄積部333に転送させる。この制御により、電荷蓄積部333に受光量q3が蓄積される。
また、行走査回路310は、Q3Q4検出期間において、発光制御信号CLKpの周期内の270度から90度までに亘って全行についてFD選択信号SEL_FDにより受光素子331が生成した電荷を電荷蓄積部334に転送させる。この制御により、電荷蓄積部334に受光量q4が蓄積される。
そして、タイミングT3の直前のタイミングT21において行走査回路310は、1行目にFD読出し信号RD_FD1およびRD_FD2を順に供給する。この制御により、1行目の受光量Q3およびQ4に応じた画素信号が読み出される。以下、同様に行走査回路310は、行を順に選択して画素信号を読み出す。
このように、Q3Q4検出期間において画素回路330のそれぞれは、90度から270度までの受光量Q3と、270度か90度までの受光量Q4とを検出する。
図12は、第1の実施の形態における撮像期間内の画素回路330の露光制御の一例を示すタイミングチャートである。まず、行走査回路310は、タイミングT3から所定のパルス期間に亘ってリセット信号RSTを全行に供給し、全行の電荷蓄積量を初期化する。また、行走査回路310は、FD選択信号SEL_FDにより、全行の受光素子331の電荷を初期化する。
そして、行走査回路310は、全行についてFD選択信号SEL_FDにより受光素子331が生成した電荷を電荷蓄積部333に転送させる。続いてタイミングT4の直前のタイミングT31において行走査回路310は、1行目にFD読出し信号RD_FD1を供給して画素信号を読み出す。次に、行走査回路310は、2行目にFD読出し信号RD_FD1を供給して画素信号を読み出す。以下、同様に行走査回路310は、行を順に選択して画素信号を読み出す。これにより、画像データが撮像される。
図13は、第1の実施の形態における基準座標系と平面座標系との関係の一例を示す図である。前述したように、X軸、Y軸およびZ軸からなる基準座標系をRpおよびTpにより回転および平行移動させた、Xp軸、Yp軸およびZp軸からなる平面座標系を想定する。この想定に基づいて電子装置100は、測定点502および503などのN個の測定点が、XpYp平面510に位置すると仮定して誤差の二乗和Epを算出する。
図14は、第1の実施の形態における基準座標系と円柱座標系との関係の一例を示す図である。前述したように、X軸、Y軸およびZ軸からなる基準座標系をRcおよびTcにより回転および平行移動させた、Xc軸、Yc軸およびZc軸からなる円柱座標系を想定する。この想定に基づいて電子装置100は、測定点502および503などのN個の測定点が、円柱511の表面上に位置すると仮定して誤差Ecを算出する。
図15は、第1の実施の形態における傾いた平面を撮像する際の電子装置100の利用シーンの一例を示す図である。同図におけるaは、ボタンを半押しした際のレーザ光の形状の一例を示す図である。同図におけるaに例示するように、ボタンを半押しするとスポット状のレーザ光500が照射される。ここで、電子装置100は、例えば、スティック状の装置であり、ユーザは、その電子装置100を手に把持して、レーザ光の向きを変えることができる。ユーザは、レーザ光500の照射点を移動させ、OCR対象の文字の位置でボタンを全押しする。例えば、魚の切り身に平面状の値札がついており、その値札の文字をOCRで読み取る際に、ユーザは、その値札にレーザ光500の照射点を移動させる。この値札の平面が、図13の平面510に対応する。
図15におけるbは、ボタンを全押しした際のレーザ光の形状の一例を示す図である。同図におけるbに例示するように、ボタンを全押しすると円状のレーザ光501が値札(平面510)に照射される。
図16は、第1の実施の形態における平面形状と変換前後の画像と翻訳結果の一例を示す図である。同図におけるaは、候補となる平面形状の一例を示す図である。色の濃淡は、奥行きを表す。例えば、撮像素子300の像面に対して傾いた平面が想定される。
図16におけるbは、撮像した画像データのうち、レーザ光が照射された部分の一例を示す。「サーモン」および「100円」の文字列が値札に記載されているが、値札の平面が像面に正対していないため、文字が歪んでいる。このため、このままでは、OCRで正確に文字を読み取ることができないおそれがある。
そこで、電子装置100は、傾いた平面上の座標を基準平面上の座標に変換する。図16におけるcは、座標変換後の画像の一例である。同図におけるcに例示するように、像面に正対していない平面が、正対する基準平面に変換され、文字の歪みが無くなっている。電子装置100は、OCRにより、変換後の画像内の文字を読み取り、翻訳を行う。
図16におけるdは、翻訳結果の一例を示す図である。日本語の「サーモン」および「100円」は、英語の「Salmon」および「One hundred yen」に翻訳され、音声出力される。
図17は、第1の実施の形態における、円柱形状の物体を撮像する際の電子装置100の利用シーンの一例を示す図である。同図におけるaは、ボタンを半押しした際のレーザ光の形状の一例を示す図である。例えば、ワインボトルの円柱の部分にラベルが貼り付けられており、そのラベルの文字をOCRで読み取らせたい場合にユーザは、そのラベルにレーザ光500の照射点を移動させる。このワインボトルの円柱部分が、図14の円柱511に対応する。
図17におけるbは、ボタンを全押しした際のレーザ光の形状の一例を示す図である。同図におけるbに例示するように、ボタンを全押しすると円状のレーザ光501がラベル(円柱511)に照射される。
図18は、第1の実施の形態における円柱形状と変換前後の画像と翻訳結果の一例を示す図である。同図におけるabは、候補となる円柱形状の一例を示す図である。
図18におけるbは、撮像した画像データのうち、レーザ光が照射された部分の一例を示す。「酸化防止剤無添加のおいしいワイン」の文字列がラベルに記載されているが、ラベルの面が湾曲しているため、文字が歪んでいる。このため、このままでは、OCRで正確に文字を読み取ることができないおそれがある。
そこで、電子装置100は、円柱上の座標を基準平面上の座標に変換する。図18におけるcは、座標変換後の画像の一例である。同図におけるcに例示するように、円柱上の湾曲した面が基準平面に変換され、文字の歪みが無くなっている。電子装置100は、OCRにより、変換後の画像内の文字を読み取り、翻訳を行う。
図18におけるdは、翻訳結果の一例を示す図である。日本語の「酸化防止剤無添加のおいしいワイン」は、英語の「Antioxidant free nice wine」に翻訳され、音声出力される。
[電子装置の動作例]
図19は、第1の実施の形態における電子装置100の動作の一例を示すフローチャートである。この動作は、例えば、電子装置100に電源が投入されたときに開始する。電子装置100は、ユーザによりボタンが半押しされたか否かを判断する(ステップS901)。ボタンが半押しされた場合に(ステップS901:Yes)、電子装置100は、拡散板を抜去し(ステップS902)、スポット状のレーザ光を照射する(ステップS903)。そして、電子装置100は、ユーザによりボタンが全押しされたか否かを判断する(ステップS904)。
ボタンが半押しされていない場合(ステップS901:No)、または、ボタンが全押しされていない場合(ステップS904:No)、電子装置100は、ステップS901以降を繰り返し実行する。
ボタンが全押しされた場合に(ステップS904:Yes)、電子装置100は、拡散板を挿入し(ステップS905)、円状のレーザ光の照射と、その反射光の受光とを行う(ステップS906)。電子装置100は、測定点毎にToF方式で測距を行い(ステップS907)、測定された距離に基づいて物体の立体形状を推定する(ステップS908)。
そして、電子装置100は、物体を撮像し(ステップS909)、画像データに対して座標変換を行う(ステップS910)。電子装置100は、座標変換した画像において光学文字認識を行い(ステップS911)、翻訳および音声出力を行う(ステップS912)。ステップS912の後に、電子装置100は、OCRのための動作を終了する。
このように、本技術の第1の実施の形態によれば、電子装置100は、測定点までの距離から物体の形状を推定し、その形状に基づいて座標変換を行うため、文字の歪みを無くしてOCRの精度を向上させることができる。
[変形例]
上述の第1の実施の形態では、スティック状の電子装置100内に、操作部111や撮像素子300などを設けていたが、ウェアラブル端末に装着されるカメラユニットに、操作部111等を設けてもよい。この第1の実施の形態の変形例における撮像システムは、ウェアラブル端末に装着されるカメラユニットに、操作部111等を設けた点において第1の実施の形態と異なる。
図20は、撮像システムの一構成例を示すブロック図である。この撮像システムは、ウェアラブル端末150とカメラユニット101とを備える。また、ウェアラブル端末150は、操作部151および端末制御部152を備える。また、カメラユニット101の構成は、制御部112およびスイッチ117の代わりにカメラユニット制御部122およびスイッチ123を備える点以外は、第1の実施の形態の電子装置100と同様である。なお、カメラユニット101は、特許請求の範囲に記載の電子装置の一例である。
操作部151は、スイッチやボタンに対するユーザの操作に従って操作信号を生成するものである。例えば、画像データを撮像させるための操作(シャッターボタンの押下など)が行われる。操作部151は、生成した操作信号を端末制御部152に供給する。
端末制御部152は、ウェアラブル端末150全体を制御するものである。この端末制御部152は、操作信号をカメラユニット制御部122に供給し、カメラユニット制御部122から画像データなどを受け取る。
カメラユニット制御部122は、カメラユニット101全体を制御するものである。このカメラユニット制御部122は、ウェアラブル端末150にカメラユニット101が装着されていない場合に、第1の実施の形態と同様の制御を行う。一方、ウェアラブル端末150にカメラユニット101が装着されている場合に、カメラユニット制御部122は、画像データを撮像させるための操作(シャッターボタンの押下など)が行われたか否かを判断する。シャッターボタンが押下されると、カメラユニット制御部122はスイッチ123を制御して画像データをウェアラブル端末150に出力させる。
スイッチ123は、カメラユニット制御部122の制御に従って、画像データの出力先を切り替えるものである。
図21は、第1の実施の形態の変形例における撮像システムの外観図の一例である。ウェアラブル端末150は、眼鏡型の端末であり、カメラユニット101を連結具155により側面に取付けることができる。この端末のレンズ部分は、同図において省略されている。連結具155として、例えば、特表2015−515638号公報の図1や図2に記載のものを用いることができる。
カメラユニット101は、ウェアラブル端末150から取り外した状態でも動作する。単体のカメラユニット101の機能は、第1の実施の形態の電子装置100と同様である。
また、ウェアラブル端末150には、遮蔽部材156が設けられる。この遮蔽部材156は、カメラユニット101が取り付けられた際に、カメラユニット101からのレーザ光を遮蔽するものである。ただし、撮像素子300への入射光は遮蔽されない。
例えば、カメラユニット101の下部にレーザ光照射部113が配置され、上部に撮像素子300が配置されるものとする。この場合に遮蔽部材156は、カメラユニットの101の下部のみを遮蔽する。これにより、レーザ光のみがマスクされる。測距が不要な状況でレーザ光を遮蔽することにより、撮像した画像データにレーザ光が写ることを防止することができる。これにより、撮像システムの利便性を向上させることができる。
カメラユニット101は、ウェアラブル端末150に装着された状態では、測距を行わず、画像データの撮像などを行う。ウェアラブル端末150は、その画像データを解析して、端末のヘッドアップディスプレイに所定の情報を表示する。例えば、現在の位置情報や、認識した物体に合成する画像などが表示される。
このように、本技術の第1の実施の形態の変形例によれば、ウェアラブル端末150に装着時に遮蔽部材156がレーザ光を遮蔽するため、撮像した画像データにレーザ光が写ることを防止することができる。
<2.第2の実施の形態>
上述の第1の実施の形態では、ToF方式で測距を行っていたが、このToF方式では
レーザ光を照射する部品が必要となるため、その分、コストの低減や小型化が困難となる。この第2の実施の形態の電子装置100は、小型化およびコストの低減を実現した点において第1の実施の形態と異なる。
図22は、第2の実施の形態における電子装置100の一構成例を示すブロック図である。この第2の実施の形態の電子装置100としては、デジタル一眼レフレックスカメラなどのデジタルカメラが想定される。また、第2の実施の形態の電子装置100は、レーザ光照射部113の代わりに表示部123をさらに備える点において第1の実施の形態と異なる。
また、第2の実施の形態の撮像素子300は、瞳分割された一対の像の位相差を検出する位相差検出画素と、通常画素とが配置される。
制御部112は、シャッターボタンなどのボタンが半押しされると、撮像素子300を制御して解像度が比較的低い画像をライブビュー画像として垂直同期信号に同期して撮像させる。そして、制御部112は、スイッチ117を制御して、ライブビュー画像を表示部123に供給させる。
また、ボタンが全押しされると制御部112は、ライブビュー画像より解像度の高い画像データを撮像素子300に撮像させる。そして、制御部112は、スイッチ117を制御して、画像データを測距部116に供給させる。
表示部123は、画像データを表示するものである。この表示部123は、例えば、液晶モニタなどにより実現される。
測距部116は、位相差画素の画素信号から距離を測定し、画像データと距離情報とを立体形状推定部200に供給する。この画像データにおいて、位相差画素の位置の画素値は、周囲の画素から補間される。座標変換部400以降の処理は、第1の実施の形態と同様である。
なお、電子装置100は、測距情報を立体形状の推定に用いているが、この測距情報はAF(Auto Focus)にも用いられる。図22において、測距情報に基づいてフォーカスレンズの位置を制御するAF制御部は省略されている。
図23は、第2の実施の形態における撮像素子300の一構成例を示すブロック図である。この第2の実施の形態の撮像素子300は、画素回路330の代わりに、通常画素回路380および位相差検出画素回路390が設けられる点において第1の実施の形態と異なる。
通常画素回路380は、R(Red)、G(Green)およびB(Blue)などの可視光を光電変換して画素信号を生成する画素である。位相差検出画素回路390は、瞳分割された一対の像の位相差を検出するための画素である。このように、位相差検出のための画素が像面に配置され、その画素の信号から距離を測定する方式は、像面位相差方式と呼ばれる。このような像面位相差方式の撮像素子300の構造は、例えば、特開2012−124791号公報に搭載されている。
図24は、第2の実施の形態における電子装置100の動作の一例を示すフローチャートである。電子装置100は、ユーザによりボタンが半押しされたか否かを判断する(ステップS901)。ボタンが半押しされた場合に(ステップS901:Yes)、電子装置100は、ライブビュー画像を撮像して表示する(ステップS921)。ユーザは、ライブビュー画像を視認しながら、OCR対象の文字が、モニタ(表示部123)内に収まるように電子装置100の向きを調整する。調整後にユーザは、ボタンを全押しする。
そして、電子装置100は、ユーザによりボタンが全押しされたか否かを判断する(ステップS904)。ボタンが全押しされると、電子装置100は、画像データを撮像するとともに、位相差検出画素回路390で検出された位相差から測定点ごとに距離を求める(ステップS922)。また、電子装置100は、立体形状を推定し(ステップS908)、画像データにおいて位相差画素を補間する(ステップS923)。そして電子装置100は、ステップS910以降を実行する。
このように、本技術の第2の実施の形態によれば、位相差検出画素で検出された位相差から距離を測定するため、レーザ光照射部113や拡散板115を設ける必要が無くなり、部品点数を削減することができる。これにより、小型化やコストの低減が容易となる。
なお、上述の実施の形態は本技術を具現化するための一例を示したものであり、実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本技術の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本技術は実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
また、上述の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disc)、メモリカード、ブルーレイディスク(Blu-ray(登録商標)Disc)等を用いることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
なお、本技術は以下のような構成もとることができる。
(1)物体を撮像して画像データを撮像する撮像部と、
前記撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距部と、
前記測定された距離から前記物体の形状を推定する形状推定部と、
前記推定された形状に基づいて前記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う座標変換部と
を具備する電子装置。
(2)前記座標変換が行われた画像データにおいて前記物体の表面上の文字を認識する文字認識部をさらに具備する
前記(1)記載の電子装置。
(3)照射光を照射する照射部をさらに具備し、
前記測距部は、前記照射光に対する反射光と前記照射光との位相差から前記距離を測定する前記(1)または記載の電子装置。
(4)前記撮像部は、前記画像データを撮像する処理と前記照射光を受光する処理とを行う
前記(3)記載の電子装置。
(5)前記照射部は、所定の周期信号に同期したパルス光を前記照射光として照射する
前記(3)または(4)に記載の電子装置。
(6)前記照射部は、スポット光および拡散光のいずれかを所定の操作に従って選択して前記照射光として照射し、
前記測距部は、前記拡散光が照射されたときに前記距離を測定する
前記(3)から(5)のいずれかに記載の電子装置。
(7)前記照射部は、所定のボタンが半押しされた場合には前記照射光の照射を開始し、
前記撮像部は、前記所定のボタンが全押しされた場合には前記画像データを撮像する
前記(3)から(6)のいずれかに記載の電子装置。
(8)前記電子装置は、ウェアラブル端末に取付けられるカメラユニットである
前記(1)から(7)のいずれかに記載の電子装置。
(9)前記形状推定部は、前記距離に基づいて複数の候補形状のいずれかを前記物体の形状として推定する
前記(1)から(8)のいずれかに記載の電子装置。
(10)前記形状推定部は、
前記距離から前記複数の測定点のそれぞれの座標を測定座標として検出する座標検出部と、
前記複数の候補形状のそれぞれについて当該候補形状の座標と所定の基準座標系における座標との間の関係を示す関数を前記測定座標を用いて取得する関数取得部と、
前記取得された関数と前記測定座標とから前記複数の候補形状のそれぞれについて前記物体の形状を想定した際の誤差を演算する誤差演算部と、
前記複数の候補形状のうち前記誤差の最も少ない形状を前記物体の形状として推定する推定処理部と
を備える前記(9)記載の電子装置。
(11)前記画像データは、複数の画素データを含み、
前記撮像部は、
瞳分割された2つの像の位相差を検出する位相差検出画素と、
光を光電変換して前記複数の画素データのいずれかを生成する通常画素と
を備え、
前記測距部は、前記位相差検出画素により検出された位相差から前記距離を測定する
前記(1)または(2)に記載の電子装置。
(12)撮像部が、物体を撮像して画像データを撮像する撮像手順と、
前記撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距手順と、
前記測定された距離から前記物体の形状を推定する形状推定手順と、
前記推定された形状に基づいて前記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う座標変換手順と
を具備する電子装置の制御方法。
(13)撮像部が、物体を撮像して画像データを撮像する撮像手順と、
前記撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距手順と、
前記測定された距離から前記物体の形状を推定する形状推定手順と、
前記推定された形状に基づいて前記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う座標変換手順と
をコンピュータに実行させるためのプログラム。
100 電子装置
101 カメラユニット
111、151 操作部
112 制御部
113 レーザ光照射部
114 挿抜部
115 拡散板
116 測距部
117、123 スイッチ
118 撮像レンズ
119 光学文字認識部
120 翻訳処理部
121 音声出力部
122 カメラユニット制御部
123 表示部
150 ウェアラブル端末
152 端末制御部
155 連結具
156 遮蔽部材
200 立体形状推定部
210 測定座標保持部
220 測定座標検出部
230 距離情報保持部
240 最小二乗法演算部
250 パラメータ保持部
260 誤差演算部
270 パラメータ供給部
300 撮像素子
310 行走査回路
320 画素アレイ部
330 画素回路
331 受光素子
332 転送スイッチ
333、334 電荷蓄積部
335、336 選択スイッチ
340 タイミング制御部
350 AD変換部
360 列走査回路
370 信号処理部
380 通常画素回路
390 位相差検出画素回路
400 座標変換部
410 フレームメモリ
420 切り出し処理部
430 アドレス変換部

Claims (13)

  1. 物体を撮像して画像データを撮像する撮像部と、
    前記撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距部と、
    前記測定された距離から前記物体の形状を推定する形状推定部と、
    前記推定された形状に基づいて前記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う座標変換部と
    を具備する電子装置。
  2. 前記座標変換が行われた画像データにおいて前記物体の表面上の文字を認識する文字認識部をさらに具備する
    請求項1記載の電子装置。
  3. 照射光を照射する照射部をさらに具備し、
    前記測距部は、前記照射光に対する反射光と前記照射光との位相差から前記距離を測定する請求項1記載の電子装置。
  4. 前記撮像部は、前記画像データを撮像する処理と前記照射光を受光する処理とを行う
    請求項3記載の電子装置。
  5. 前記照射部は、所定の周期信号に同期したパルス光を前記照射光として照射する
    請求項3記載の電子装置。
  6. 前記照射部は、スポット光および拡散光のいずれかを所定の操作に従って選択して前記照射光として照射し、
    前記測距部は、前記拡散光が照射されたときに前記距離を測定する
    請求項3記載の電子装置。
  7. 前記照射部は、所定のボタンが半押しされた場合には前記照射光の照射を開始し、
    前記撮像部は、前記所定のボタンが全押しされた場合には前記画像データを撮像する
    請求項3記載の電子装置。
  8. 前記電子装置は、ウェアラブル端末に取付けられるカメラユニットである
    請求項1記載の電子装置。
  9. 前記形状推定部は、前記距離に基づいて複数の候補形状のいずれかを前記物体の形状として推定する
    請求項1記載の電子装置。
  10. 前記形状推定部は、
    前記距離から前記複数の測定点のそれぞれの座標を測定座標として検出する座標検出部と、
    前記複数の候補形状のそれぞれについて当該候補形状の座標と所定の基準座標系における座標との間の関係を示す関数を前記測定座標を用いて取得する関数取得部と、
    前記取得された関数と前記測定座標とから前記複数の候補形状のそれぞれについて前記物体の形状を想定した際の誤差を演算する誤差演算部と、
    前記複数の候補形状のうち前記誤差の最も少ない形状を前記物体の形状として推定する推定処理部と
    を備える請求項9記載の電子装置。
  11. 前記画像データは、複数の画素データを含み、
    前記撮像部は、
    瞳分割された2つの像の位相差を検出する位相差検出画素と、
    光を光電変換して前記複数の画素データのいずれかを生成する通常画素と
    を備え、
    前記測距部は、前記位相差検出画素により検出された位相差から前記距離を測定する
    請求項1記載の電子装置。
  12. 撮像部が、物体を撮像して画像データを撮像する撮像手順と、
    前記撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距手順と、
    前記測定された距離から前記物体の形状を推定する形状推定手順と、
    前記推定された形状に基づいて前記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う座標変換手順と
    を具備する電子装置の制御方法。
  13. 撮像部が、物体を撮像して画像データを撮像する撮像手順と、
    前記撮像部から前記物体の表面上の複数の測定点のそれぞれまでの距離を測定する測距手順と、
    前記測定された距離から前記物体の形状を推定する形状推定手順と、
    前記推定された形状に基づいて前記物体の表面上の立体座標を所定の基準平面上の平面座標に変換する座標変換を前記画像データに対して行う座標変換手順と
    をコンピュータに実行させるためのプログラム。
JP2017560634A 2016-05-23 2017-02-28 電子装置、電子装置の制御方法、および、プログラム Active JP6904261B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016102584 2016-05-23
JP2016102584 2016-05-23
PCT/JP2017/007827 WO2017203777A1 (ja) 2016-05-23 2017-02-28 電子装置、電子装置の制御方法、および、プログラム

Publications (2)

Publication Number Publication Date
JPWO2017203777A1 true JPWO2017203777A1 (ja) 2019-03-22
JP6904261B2 JP6904261B2 (ja) 2021-07-14

Family

ID=60412243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017560634A Active JP6904261B2 (ja) 2016-05-23 2017-02-28 電子装置、電子装置の制御方法、および、プログラム

Country Status (5)

Country Link
US (1) US10565462B2 (ja)
EP (1) EP3467765A4 (ja)
JP (1) JP6904261B2 (ja)
CN (1) CN107710275A (ja)
WO (1) WO2017203777A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017150893A (ja) 2016-02-23 2017-08-31 ソニー株式会社 測距モジュール、測距システム、および、測距モジュールの制御方法
JP2018036102A (ja) 2016-08-30 2018-03-08 ソニーセミコンダクタソリューションズ株式会社 測距装置、および、測距装置の制御方法
JP2020076619A (ja) * 2018-11-07 2020-05-21 ソニーセミコンダクタソリューションズ株式会社 投光制御装置、投光制御方法
JP7463671B2 (ja) * 2019-08-01 2024-04-09 Toppanホールディングス株式会社 距離画像撮像装置、及び距離画像撮像方法
CN111882596B (zh) * 2020-03-27 2024-03-22 东莞埃科思科技有限公司 结构光模组三维成像方法、装置、电子设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0338789A (ja) * 1989-07-06 1991-02-19 Fuji Electric Co Ltd パターンマッチング方式
JP2000293627A (ja) * 1999-04-02 2000-10-20 Sanyo Electric Co Ltd 画像入力装置、画像入力方法、及び記憶媒体
JP2000307947A (ja) * 1999-04-16 2000-11-02 Ricoh Co Ltd 画像処理装置およびその方法
JP2008026243A (ja) * 2006-07-25 2008-02-07 Konica Minolta Sensing Inc 三次元形状測定システム、三次元形状測定方法
JP2015191450A (ja) * 2014-03-28 2015-11-02 日本電気株式会社 Pos端末装置、情報処理装置、情報処理システム、画像認識方法、及び画像認識プログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615003A (en) * 1994-11-29 1997-03-25 Hermary; Alexander T. Electromagnetic profile scanner
JP3309743B2 (ja) * 1996-11-27 2002-07-29 富士ゼロックス株式会社 形状測定方法及び装置
JP4635392B2 (ja) * 2001-08-09 2011-02-23 コニカミノルタホールディングス株式会社 3次元物体の表面形状モデリング装置、および、プログラム
US20030202683A1 (en) 2002-04-30 2003-10-30 Yue Ma Vehicle navigation system that automatically translates roadside signs and objects
JP2004040395A (ja) * 2002-07-02 2004-02-05 Fujitsu Ltd 画像歪み補正装置、方法及びプログラム
JP4052929B2 (ja) * 2002-07-17 2008-02-27 株式会社リコー 三次元形状表示装置、三次元形状表示方法、プログラムおよび記録媒体
JP2006267031A (ja) * 2005-03-25 2006-10-05 Brother Ind Ltd 3次元入力装置および3次元入力方法
US7589844B2 (en) * 2005-07-15 2009-09-15 Asahi Glass Company, Limited Shape inspection method and apparatus
CN101566465B (zh) * 2009-05-18 2011-04-06 西安交通大学 一种物体变形的实时测量方法
US20150253428A1 (en) * 2013-03-15 2015-09-10 Leap Motion, Inc. Determining positional information for an object in space
WO2013121897A1 (ja) 2012-02-17 2013-08-22 ソニー株式会社 情報処理装置および方法、画像処理装置および方法、並びにプログラム
US11721414B2 (en) * 2015-03-12 2023-08-08 Walmart Apollo, Llc Importing structured prescription records from a prescription label on a medication package
JP2017150893A (ja) 2016-02-23 2017-08-31 ソニー株式会社 測距モジュール、測距システム、および、測距モジュールの制御方法
JP2018036102A (ja) 2016-08-30 2018-03-08 ソニーセミコンダクタソリューションズ株式会社 測距装置、および、測距装置の制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0338789A (ja) * 1989-07-06 1991-02-19 Fuji Electric Co Ltd パターンマッチング方式
JP2000293627A (ja) * 1999-04-02 2000-10-20 Sanyo Electric Co Ltd 画像入力装置、画像入力方法、及び記憶媒体
JP2000307947A (ja) * 1999-04-16 2000-11-02 Ricoh Co Ltd 画像処理装置およびその方法
JP2008026243A (ja) * 2006-07-25 2008-02-07 Konica Minolta Sensing Inc 三次元形状測定システム、三次元形状測定方法
JP2015191450A (ja) * 2014-03-28 2015-11-02 日本電気株式会社 Pos端末装置、情報処理装置、情報処理システム、画像認識方法、及び画像認識プログラム

Also Published As

Publication number Publication date
US20180189591A1 (en) 2018-07-05
EP3467765A4 (en) 2020-02-26
EP3467765A1 (en) 2019-04-10
CN107710275A (zh) 2018-02-16
JP6904261B2 (ja) 2021-07-14
US10565462B2 (en) 2020-02-18
WO2017203777A1 (ja) 2017-11-30

Similar Documents

Publication Publication Date Title
JP6904261B2 (ja) 電子装置、電子装置の制御方法、および、プログラム
US20220070436A1 (en) Time-of-flight camera system
EP3248374B1 (en) Method and apparatus for multiple technology depth map acquisition and fusion
JP5868183B2 (ja) 撮像装置及び撮像方法
JP2010071976A (ja) 距離推定装置、距離推定方法、プログラム、集積回路およびカメラ
US20140347553A1 (en) Imaging devices with light sources for reduced shadow, controllers and methods
KR930007296A (ko) 물체의 3차원 입체정보취득장치
JP2008167295A (ja) 撮像装置及び撮像方法
CN107463659B (zh) 物体搜索方法及其装置
US8823863B2 (en) Image capturing apparatus and control method therefor
CN102265627A (zh) 图像数据获得方法和图像数据获得设备
JP2012015642A (ja) 撮像装置
JPH0942940A (ja) 3次元物体の形状計測方法及び装置
JP2008008687A (ja) 距離測定システム及び距離測定方法
CN113115027A (zh) 校准摄像头的方法和系统
JP5857712B2 (ja) ステレオ画像生成装置、ステレオ画像生成方法及びステレオ画像生成用コンピュータプログラム
US11283970B2 (en) Image processing method, image processing apparatus, electronic device, and computer readable storage medium
KR102061087B1 (ko) 비디오 프로젝터용 포커싱방법, 장치 및 저장매체에 저장된 프로그램
JP2012181757A (ja) 光学情報読み取り装置
JPWO2017134881A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2015060531A (ja) 情報コード読取装置
JP6566800B2 (ja) 撮像装置及び撮像方法
JP2004257934A (ja) 3次元形状計測方法及び3次元形状計測装置並びにその処理プログラムと記録媒体
JP2001145128A (ja) 3次元画像検出装置
JP2010258839A (ja) 表示制御装置およびその動作制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210607

R151 Written notification of patent or utility model registration

Ref document number: 6904261

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151