JP2009517138A - 動き検出と「実体像」イメージの構築 - Google Patents

動き検出と「実体像」イメージの構築 Download PDF

Info

Publication number
JP2009517138A
JP2009517138A JP2008542532A JP2008542532A JP2009517138A JP 2009517138 A JP2009517138 A JP 2009517138A JP 2008542532 A JP2008542532 A JP 2008542532A JP 2008542532 A JP2008542532 A JP 2008542532A JP 2009517138 A JP2009517138 A JP 2009517138A
Authority
JP
Japan
Prior art keywords
block
image
frame
blocks
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008542532A
Other languages
English (en)
Inventor
ワン、カンフアイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capso Vision Inc
Original Assignee
Capso Vision Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capso Vision Inc filed Critical Capso Vision Inc
Publication of JP2009517138A publication Critical patent/JP2009517138A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/041Capsule endoscopes for imaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • H04N19/433Hardware specially adapted for motion estimation or compensation characterised by techniques for memory access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Abstract

【課題】嚥下可能な医療用のカプセルカメラ等で得られる大量のイメージを効率的に処理して、胃腸内等の実体像イメージを得ることを可能にする、フレーム内イメージ圧縮方法を提供する。
【解決手段】フレーム内イメージ(画像)圧縮方法において、イメージを複数のブロックに分割し、所定の順番でブロックを選択し、各選択されたブロックについて、(1)イメージ内の複数の処理済みブロックから画素値の差に基づいて基準ブロックを特定し、(2)基準ブロックの活動度が、選択されたブロックの活動度より大きい場合のみ、基準ブロックと選択されたブロックとの差を圧縮する処理を行う。このフレーム内イメージ圧縮方法は、フレーム内イメージ圧縮を行う際に必要となるメモリ領域を小さくする方法と結びつけることができる。
【選択図】図8C

Description

本発明は、胃腸(GI)管のイメージングのための嚥下可能なカプセルカメラに関するものである。特に、本発明は、カプセルカメラの用途に適したデータ圧縮方法に関するものである。
本出願の関連出願として(1)「オンボード・データストレージを備えた生体内自律センサ」なる名称の2005年11月23日に出願の米国特許仮出願第60/739,162号、(2)「パノラマカメラ付きの生体内自律センサ」なる名称の2006年1月18日出願の米国特許仮出願第60/760,079号、(3)「オンボード・データストレージを備えた生体内自律センサ」なる名称の2006年1月19日に出願の米国特許仮出願第60/760,794号、及び(4)「動き検出と『現実』イメージの構築」なる名称の2006年11月22日に出願の米国特許出願第11/562,926号が挙げられ、本出願はこれらの特許出願についての優先権を主張するものである。これらの米国特許出願(1)−(4)(まとめて「特許出願」と称する。)は、ここで引用したことにより、これらの内容の全体を本明細書の一部とする。このほか、本出願の関連出願として(1)「オンボードデータストレージを備えた生体内自律カメラまたは規制認可帯域でのデジタル無線送信」なる名称の2006年9月19日に出願の米国特許出願第11/533,304号、及び(2)「オンボードデータストレージ及び方法」なる名称の2006年10月25日出願の米国特許出願第11/552,880号も挙げられ、これらの米国特許出願もここで引用したことにより本明細書の一部とする。また、本出願は、上述の、2006年11月22日に出願の米国特許出願第11/562,926号の継続出願である。
体腔または生体内の通路をイメージングする装置は当分野で公知であり、内視鏡と自立的なカプセル化されたカメラを含む。内視鏡は、開口部または切開部を通して体内に入れられる、典型的には口を通して食道に入れられたり、または直腸を通して結腸に入れられる柔軟なまたは硬質な管である。レンズを用いてその遠位端で撮影されたイメージは、レンズリレーシステムまたはコヒーレント光ファイバー束の何れかによって、近位側に体外へと送られる。類似したコンセプトの器具は、例えばCCDまたはCMOSアレイを用いて遠位端において電子的にイメージを記録し、イメージデータを電気信号としてケーブルを通して近位側へ送る。内視鏡は、その視野全体にわたる医師のコントロールが可能な、広く用いられている診断器具である。しかし、内視鏡にはいくつもの限界があり、患者を危険にさらし、また患者の体内に入れて用いられるので患者にとっては不快である。これらの手順にコストがかかるため、その用途は定期的な精密検査に限定されがちである。
屈曲した通路を通すことが困難なので、内視鏡は小腸の大部分には達することができない。腸の大部分に達するためには、コストを増す特殊な技術と予防措置が必要となる。内視鏡のリスクとしては、それを通す体内の器官に孔をあけてしまうことや、麻酔を原因とする合併症等が挙げられる。さらに、処置の間の患者の苦痛と、麻酔に関連する健康上のリスク並びに術後ダウンタイムとの間にトレードオフの関係がある。内視鏡検査は必然的に長時間の入院患者向けサービスを臨床医から受けなければならないので、コストが高くつく。
これらの問題の多くに対処できる別形態の生体内イメージセンサはカプセル型内視鏡である。嚥下可能なカプセルのなかには、カメラとともにデータを送信するための無線送信機が包入されている。送信されるデータは、主としてデジタルカメラで記録されたイメージであり、送信先は体外のベースステーション受信器または送受信器・データレコーダである。カプセルには、ペースステーション送受信器からの命令や他のデータを受信するための受信器が設けられていてもよい。高周波で送信するかわりに、低周波の電磁信号を用いてもよい。電力は外部のインダクタからカプセル内の内部インダクターへ誘導的に供給するか、またはカプセル内の電池から供給してもよい。
嚥下可能なカプセル内のカメラの初期の例としては、イスラエルの国防省に付与された米国特許第5,604,531号(特許文献1)に記載されている。ギブン・イメージング社の多くの特許に、外部の受信器にカメラで撮影したイメージを送信する送信機を用いたシステムの詳細が記載されている。米国特許の例としては、第6,709,387号(特許文献2)及び第6,428,469号(特許文献3)が挙げられる。類似の技術について記載したものとして多くのオリンパス株式会社の特許がある。たとえば、米国特許第4,278,077号(特許文献4)にカメラ内のフィルムが備えられた胃カメラを有するカプセルが記載されている。米国特許第6,939,292号(特許文献5)には、メモリと送信器を備えたカプセルが記載されている。
内部電池を備えた自律式カプセルカメラの利点は、患者を病院外で歩行させた状態で、かつ活動にわずかな制限を加えるだけで測定を行える点である。ベースステーションは、目的の体内領域を取り囲むアンテナアレイを備えており、このアレイは一時的に皮膚に貼り付けるか着用可能なベルトに組み込むことができる。データレコーダはベルトに取付けられ、バッテリ電源とデータ格納媒体とを備えており、データ格納媒体には記録イメージや他のデータが格納され、これらは後に診断用コンピュータシステムにアップロードされる。
典型的手順では、朝患者が病院に入り、臨床医がベースステーション装置を患者に取り付け、患者がカプセルを飲み込む。システムは嚥下された直後からイメージの記録を開始し、バッテリが完全になくなるまで消化管のイメージを記録し続ける。蠕動によりカプセルは消化管を進む。通過速度は、運動性の程度によって左右される。通常は、4〜8時間で小腸を横断する。所定時間の経過後に患者はデータレコーダを臨床医に返し、臨床医はそのデータをみて分析するためにコンピュータにアップロードする。カプセルはやがて直腸を通過して出てゆくが、回収する必要はない。
このカプセルカメラによって、食道から小腸の終わりまでの消化管を完全にイメージ化することが可能となるが、このカプセルカメラは胃で異常を発見することには最適化されていない。異常が、形状ではなく僅かな視覚的に認識できる特徴でありさえすれば検出できるように、カラー写真イメージがとられる。この手順は無痛で麻酔を必要としない。体内を通過するカプセルに関連するリスクは最小限で済む。即ち、穿孔の危険が従来型の内視鏡検査と比較して著しく低減していることは間違いない。この手順にかかるコストも、臨床医の時間や病院の設備が少なくてすみ、また麻酔が不要であることから、従来型の内視鏡検査と比較して少なくて済む。
カプセルカメラが消化管を調べる技術が現実のものとなって、イメージデータを格納するための種々の方法がでてきた。例えば、米国特許第4,278,077号(特許文献4)には、化学膜内にイメージデータを格納するカプセルカメラが開示されている。米国特許第5,604,531号(特許文献1)には、体に付けるか、患者が着るベスト内に配置されたアンテナアレイに無線でイメージデータを送信するカプセルカメラが開示されている。米国特許第6,800,060号(特許文献6)には、高価な原子分解能記憶(ARS)デバイスにイメージデータを格納するカプセルカメラが開示されている。格納されたイメージデータはワークステーションにダウンロードされる。ワークステーションは通常は分析と処理を行うパーソナルコンピュータである。こうして、使いやすいユーザインタフェースを用いて医者が検査結果を検討することができる。しかし、これらの方法はすべて、データ転送プロセス中に物理的な媒体の変換が必要である。例えば、化学膜上のイメージデータの場合は、パーソナルコンピュータで読み出し可能な物理的媒体に変換する必要がある。電磁信号を無線で送信する場合は、コンピュータに格納できるイメージを作り出すためにアンテナと高周波電子回路による広範囲の処理が必要となる。さらにARSデバイスの場合は、読み書きのいずれにおいても荷電粒子ビームを用いる必要がある。
揮発性、不揮発性何れかの半導体メモリデバイスを用いたカプセルカメラは、イメージを捕捉するCMOSまたはCCDイメージセンサと、イメージを解析し得るパーソナルコンピュータの両方に対する直接のインタフェースとなり得るという利点を有する。近年成し遂げられた高密度化と低製造コスト化によって、半導体メモリはカプセルカメラのイメージ記憶装置として最も有望なものとなった。依然として有効であると考えられているムーアの法則によれば、集積回路の密度は24ヶ月で二倍になる。CMOSまたはCCDセンサの解像度は2、3年ごとに2倍になるとしても、半導体メモリデバイスで達成され得るデータ密度は、少なくともセンサ解像度の増加には対応できることになる。或いは、同じ解像度が維持される場合には、より大きいメモリによってより多くのイメージを格納させ、従ってより高速のフレームレートに対応できることになる。
イメージが無線リンクによって送られる場合には、カプセルが体内を通過する間に何時間にもわたって捕捉し送られる膨大な量のデータが、電池に大きな負担をかける。また、従来技術では、必要なデータレートでイメージデータを送信するのに必要な帯域幅は、規制当局(例えば連邦通信委員会)によって医療用に割り当てられた限られた帯域幅を容易に上回ってしまう。或いは、オンボード記憶装置をカプセルカメラに設けると、非圧縮イメージファイルでは複数のギガバイトの記憶装置がすぐに必要となり、このような装置はカプセルカメラ内には収めることは困難である。従って、イメージをオンボードで記憶するか、捕捉したイメージを無線で受信機に送るかには関わりなく、適切なデータ圧縮を用いて記憶装置の容量、送信の帯域幅、電力の消費量を減らしている。
同時に、カプセルカメラで捕捉される大量のイメージ(例えば大人の小腸の場合には5万枚のイメージ、大人の大腸では15万枚のイメージ)を調べるには非常に時間がかかる。検査できる患者数は増やすことができず、またコストも高くなる。検討を早めるための技術を用いたとしても、医師が大量のイメージを調べるのに通常45分〜2時間がはかかる。多くのイメージにおいてその多くの部分が重複し合っているため、医師がこれらの重なった領域を繰り返しみているうちに、領域の重複がなければしっかりと調べられたはずの重要な領域を見落としてしまう危険もある。調べるべきデータの量が大量なので、遠隔医療に使用することはできず、またファイル保管やデータ検索ですら困難となる。
米国特許第5,604,531号明細書 米国特許第6,709,387号明細書 米国特許第6,428,469号明細書 米国特許第4,278,077号明細書 米国特許第6,939,292号明細書 米国特許第6,800,060号明細書
本発明の一実施例によれば、イメージのフレーム内データ圧縮方法が、(a)イメージを複数のブロックに分割する過程と、(b)予め定めされたシーケンスに従ってブロックを選択する過程と、(c)各選択されたブロックを処理する過程とを含み、(c)前記ブロックを処理する過程が、(1)前記イメージ内の複数の処理済みブロックから基準ブロックを特定する過程と、(2)前記基準ブロックを用いて、前記選択されたブロックを圧縮する過程とを含む。或る実施形態では、処理済みブロックが、前記選択されたブロックから予め定められた距離の範囲内にある。
或る実施形態では、前記選択されたブロックを圧縮する過程が、前記選択されたブロックと前記基準ブロックとの差を圧縮する過程を含む。ここで、前記差は、予め定められた値だけオフセットされ得る。加えて、或る実施形態では、前記基準ブロックの活動度の測定基準が、前記選択されたブロックの対応する活動度の測定基準を超えた場合にのみ、前記差が圧縮される。前記活動度の測定基準は、1つのブロックについて、前記ブロックの各画素値と前記ブロック内の画素値の平均値との差を合計することによって求められる。或る実施形態では、前記圧縮において、JPEG圧縮標準で使用されるもののようなフレーム内圧縮技術を用いる。
或る実施形態では、基準ブロックが、(a)複数の前記処理済みのブロックのそれぞれについて、そのブロックと前記選択されたブロックとの差の絶対値の和を計算し、(b)計算された前記和の最小値に対応する処理済ブロックを、前記基準ブロックとして選択することによって特定される。
本発明の別の態様では、フレーム内イメージ圧縮を行う際に必要となるメモリ領域を小さくする方法が、(a)第1フレームのフレーム内データ圧縮を行う過程と、(b)フレーム内圧縮済み第1フレームをフレームバッファに保存する過程と、(c)第2フレームを受信する過程と、(d)前記第2フレームにおけるブロックと前記第1フレームの選択された部分における圧縮解除されたブロックとを比較することによって、前記第1フレーム及び前記第2フレームのブロック同士の一致を検出する過程と、(e)検出された一致ブロックに従って前記第2フレームを圧縮する過程とを含む。前記第2フレームの圧縮は、前記第1フレーム及び前記第2フレームから導出された残余フレームとして圧縮によって達成され得る。
本発明の或る実施形態によれば、本発明のフレーム内圧縮方法を、上述のフレーム内イメージ圧縮を行う際に必要となるメモリ領域を小さくする方法における第1フレームのフレーム内圧縮において使用することができる。
本発明の更に別の態様の方法は、第1及び第2フレーム間の重複領域を検出し、保存されたイメージデータからその重複領域を除去する。重複したイメージの組以外の連続したイメージは互いに結合されて、非重複イメージ群から消化管の長さ方向に沿ったイメージが形成される。このイメージは、「実体像」イメージとして知られており、これによって医師による読映検査が非常に簡単になる。或る実施形態では、第1イメージと第2イメージとの間で多数の動きベクトルが計算される。その動きベクトルからヒストグラムを集計して、重複領域を示す動きベクトルを特定する。或る実施形態では、動きベクトルの平均が、重複部分を示す動きベクトルとして選択される。
本発明の方法によって、各イメージの圧縮比が向上するとともに、MPEG様の圧縮が、2枚以上のイメージ分のフレームバッファを用いることなく行えるようになる。動き方についての特徴を利用することによって達成される圧縮により、遠隔医療での利用が可能となり、アーカイブ保存や検索が容易になる。また正確で見やすいイメージが得られることから、医師が速やかかつ正確な読映を行うことが可能となる。
本発明の方法は、JPEGのような標準的な圧縮技術とともに用いることができる。例えば、同じイメージ内のマッチングブロックの検出は、標準的な圧縮の前処理過程とみなすことができる。画素データを再現するためには、標準的な圧縮解除アルゴリズムが用いられ、その後、前記前処理過程とは逆の後処理が行われる。標準的な圧縮技術を用いることで、特定用途向け集積回路(ASIC)や市販のソフトウェアの形で提供される既存のモジュールを用いて開発時間を最短にすることが可能となるという利点が得られる。
本発明は、下記の詳細な説明を添付の図面とともに参照することによっては一層よく理解されよう。尚、図面間の相互参照を容易にするため、図面中の類似の要素には類似の参照符号が付されている。
同時係属中の特許出願には、従来技術の多くの問題を克服するカプセルカメラが開示されている。今日、半導体メモリは低コストで低消費電力で、複数の発売元から入手容易であり、特定用途向け集積回路(ASIC)、センサ機器(即ちデータ発信元)、及びパーソナルコンピュータ(即ちデータの送り先)と互換性を有しており、形式変換デバイスなしで用いることができる。本発明の一実施形態では、イメージを半導体メモリを用いた「オンボードストレージ」に格納でき、この半導体メモリは業界標準のメモリプロセスまたは容易に利用可能なメモリプロセスを用いて製造されたものである。半導体メモリデバイスの診断用イメージ記憶装置のための使用を最適化するために、本発明の方法では、連続したイメージ間の重複領域を取り除いて必要な記憶容量を小さくすることができる。
本発明の一実施形態によれば、専用のフレームバッファが設けられる。解像度が640×480のVGAタイプのデータ(例えば8ビット)は30万の画素数を有し、各画素が等しく1バイトのデータ(例えば8ビット)によって表されるとするならば、そのイメージには2.4Mビットのフレームバッファ(「通常フレームバッファ」)が必要となる。その物理的な制約及び消費電力の制約のために、実際上は、カプセルカメラは通常フレームバッファの一部しか提供できない。必要な記憶容量を小さくするために非常に効率的なイメージ圧縮(デジタルイメージは適当な情報の損失を伴う圧縮技術を用いて圧縮されてもよい)アルゴリズムが用いられてもよい。この場合も、カプセルで利用できる消費電力とメモリサイズの制約を考慮に入れる必要がある。同時係属中の出願に記載のように、それぞれが通常フレームバッファよりずっと小さい「部分的フレームバッファ」を設けてもよい。
図1は、本発明の一実施形態による、体内管腔00内の嚥下可能なカプセルシステム01を示す。管腔00は、例えば、結腸、小腸、食道、または胃であり得る。カプセルシステム01は体内にあるときは完全に自律動作しており、全ての要素は内部部品を体液から保護する水分バリアとなるカプセルハウジング10内に包入された状態にある。カプセルハウジング10は透明なので、照明システム12の発光ダイオード(LED)からの光を、カプセルハウジング10の壁を通して体内管腔00内壁に当てることができ、また体内管腔00内壁からの散乱光をカプセル内に収集してイメージ化することができる。カプセルハウジング10は、その内部の異物が体内管腔00に直接接触することも防止する。カプセルハウジング10は、嚥下が容易で、その後消化管を通過してゆけるような形状にされる。通常、カプセルハウジング10は滅菌された、非毒性の材料からなり、体内管腔内に留まることが最小となるように十分に滑らかなものである。
図1に示すように、カプセルシステム01は、照明システム12と、光学系14及びイメージセンサ16を備えるカメラとを備えている。イメージセンサ16でとらえられたイメージはイメージベースの運き検出器18で処理され、カプセルがカメラの視野内に入った消化管の部分に対して動いているか否かが決定され得る。イメージベースの動き検出器18は、デジタル信号プロセッサ(DSP)や中央演算処理装置(CPU)上で動作するソフトウェアとして、ハードウェアとして、或いはその両方の形態で実装することができる。イメージベースの動き検出器18は1以上の部分的フレームバッファを有し得、半導体不揮発性アーカイブメモリ20は、カプセルが回収された後に体外のドッキングステーションでイメージを検索できるようにするために設けられ得る。システム01は、バッテリー電源24と出力ポート28を備える。カプセルシステム01は、蠕動によって消化管内を前進し得る。
照明システム12はLEDによって実現できる。図1では、LEDがカメラの開口に隣接した位置にあるが、他の形態も可能である。光源は例えば開口の後側に設けることができる。他の光源(例えばレーザダイオード)も利用可能である。或いは、白色光源または2以上の狭帯域光源の組み合わせを用いてもよい。LED光によって励起されてより長い波長の光を発する燐光材料とともに、青または紫のLEDを備える白色LEDも利用できる。カプセルハウジング10の光を透過させ得る部分は、生体適合性のガラスまたはポリマー製であり得る。
光学系14は、複数の屈折、回折、または反射用のレンズ要素を備えたものであり得、体腔壁のイメージをイメージセンサ16上に供給する。イメージセンサ16は、受け取った光の強度を対応する電気信号に変換する、CCD型またはCMOS型のデバイスによって提供され得る。イメージセンサはモノクロで応答するものでもよいが、カラーイメージ(例えばRGBやCYM表現を用いたもの)を捕らえられるようにカラーフィルタアレイを備えていてもよい。イメージセンサ16からのアナログ信号は、デジタル形式での処理ができるようにデジタルに変化されるのが好ましい。そのような変換はA/Dコンバータを用いて行うことができ、またそのA/Dコンバータは(この実施形態のように)センサの内部に配置したり、或いはカプセルハウジング10内の他の部分に配置される。A/D変換ユニットは、イメージセンサ16とシステムの他の部分との間に設けられてもよい。照明システム12のLEDは、イメージセンサ16の動作と同期して発光する。制御モジュール22の機能の1つは、イメージ捕捉動作の間にLEDを制御する。
動き検出モジュール18は、限られた利用可能な記憶空間を節約するためにイメージが1つ前のイメージからの十分な動きを示すとのイメージを捕捉すべきイメージとして選択する。そのイメージはオンボードアーカイブメモリシステム20に保存される。図1に示す出力ポート26は生体内では使用されず、カプセルが体内を通過して回収された後ワークステーションにデータをアップロードする。
図2は、カプセルカメラの動作中の情報の流れを示す機能ブロック図である。光学系114を除いて、これらの機能の全ては、一個の集積回路で実現することができる。図2に示すように、照明システム12と光学系14の両方を表す光学系114は、イメージセンサ16に体腔壁のイメージを与える。動き検出回路18は、現イメージが前イメージから十分に異なったものであるか否かを決定する動き検出回路18の決定に基づき、撮られてもアーカイブメモリ20に保存されないイメージもある。イメージが前イメージと十分に異なっていないと考えられるならばそのイメージは破棄されることもある。第2のセンサ(例えばpH、熱、圧力センサなど)も設けられ得る。第2センサからのデータは、第2センサ回路121で処理されて、アーカイブメモリシステム20に供給される。行われた測定にはタイムスタンプが付され得る。制御モジュール22は、マイクロプロセッサ、ステートマシン、またはランダムロジック回路、またはこれらの組み合わせからなるものであり得、モジュールの動作を制御する。例えば、制御モジュール22はイメージセンサ16または動き検出回路18からのデータを用いて、イメージセンサ16の露出を調節し得る。
アーカイブメモリシステム20は、1以上の不揮発半導体メモリデバイスによって実装され得る。アーカイブメモリシステム20は、制御モジュール22が存在する集積回路とは別の集積回路として設けられてもよい。画像データは、画像データ処理技術(例えば、動き検出)のためにデジタル化されるので、デジタルデータに適合するメモリ技術が選択される。もちろん、プレーナ技術(現在の実質的にすべての集積回路の製造に用いられる)を用いて大量生産される半導体メモリは最も便利である。半導体メモリは、カプセルシステム01のセンサや他の回路と電源を共有しており、出力ポート26でアップロードデバイスにインタフェースする際にデータ変換はほとんどの場合不要であることから、最も適合性が高い。アーカイブメモリシステム20は、カプセルが体内で動作し、カプセルが体外に排出された後にデータをアップロードするまで、動作中に収集したデータを保存する。この保存すべき期間は通常2、3日程度である。不揮発性メモリは、カプセルのバッテリが消耗した後ですらデータは電力消費なしに保たれ得ることから好適である。適当な不揮発性メモリとしては、フラッシュメモリ、一回書き込み型メモリ、または一回書き込み・一回読み出し型(program-once-read-once memories)メモリ等が挙げられる。或いは、アーカイブメモリシステム20は揮発性のスタティックメモリ(例えばSRAMや、その一種であるVSRAM、PSRAM等)であってもよい。或いは、メモリはダイナミックランダムアクセスメモリ(DRAM)であり得る。
アーカイブメモリ20は、カプセルシステム01の動作を開始するための初期化情報(例えばブートアップコード及び初期レジスタ値)を保持するために用いられ得る。従って、この場合第2の不揮発メモリまたはフラッシュメモリのコストが節約できる。不揮発性メモリのその部分には、選択された捕捉イメージを保存するべく動作中に書き込みが行われてもよい。
カプセルは体を通過した後に回収される。カプセルハウジング10を開いて、入力ポート16をアップロードデバイスに接続し、データの保存・解析のためコンピュータワークステーションにデータを転送する。データ転送プロセスは、図3の機能ブロック図に図示されている。図3に示すように、カプセル・システム01の出力ポート26は、アップロードデバイスの入力ポートでコネクタ37と結合する電気コネクタ35を含む。図3には1つのコネクタが示されているが、データをシリアルに、またはパラレルバスを通して転送可能とし、かつ電源をアップロードデバイスからカプセルに供給して、データアップロード時にカプセルのバッテリが電源を供給しなくて済むようにするように、これらのコネクタを複数の導電素子として実現してもよい。
出力ポート26への電気的接続をなすために、カプセルハウジング10は、破砕、切断、溶融、または他の技術によってその一部が破られる。カプセルハウジングは、シールを形成するべくガスケット等を用いて互いに圧入されるが、コネクタ35を露出するために分離することもできる2以上の部品を備え得る。コネクタどうしの機械的結合は、カプセル開放プロセスの後に行うか、同プロセスの一部とし得る。これらのプロセスはカスタムツーリングを用いるか又は用いないで手で実施してもよいし、機械によって自動または半自動で実施してもよい。
図4はデータ転送プロセスを示す図であり、カプセルシステム01からワークステーション51への情報の流れ、及びワークステーションで情報がコンピュータハードドライブ等の記憶媒体に書き込まれることが示されている。図4に示すように、データは、カプセルシステム01の出力ポート26とアップロードデバイス50の入力ポート36との間の転送媒体43を介してアーカイブメモリ20から取り出される。転送リンクは、既存の又はカスタムメイドの通信プロトコルを用い得る。転送媒体は、図3に示すコネクタ35及び36を含み、また図3には示されていないケーブルも含み得る。アップロードデバイス50はインタフェース53を介してデータをコンピュータワークステーション51に転送するが、インタフェース53は、USBインタフェース等の標準的なインタフェースとして実装され得る。転送は、LANまたはWANを介して行われてもよい。アップロードデバイス50は、データをバッファリングするためのメモリも有し得る。
オンボードでイメージを格納するための望ましい代替手段は、イメージを無線リンクで伝送する。本発明の一実施例では、データは無線デジタル伝送を介してレコーダを備えたベースステーションに送られる。このような実施形態では利用できる記憶空間に関する不安が少なくなるので、イメージの解像度を高めてより高品質なイメージを得ることができる。さらに、例えばプロトコルの符号化技術を用いて、データをよりローバストで耐雑音性を向上させた方式でベースステーションに転送することもできる。より高い解像度を用いることの不利な点は、消費電力と帯域幅が大きくなることである。本発明の一実施例は、保存すべきイメージを選択するための上述の選択基準を実質的に用いることによって選択されたイメージのみを送信する。かくして、低いデータレートが達成され、このようにして行われるデジタル無線送信は、当局に認可された体内植込型医療用データ伝送用(MISC)帯域の狭帯域幅内におさまることになる。その上、この低いデータレートによってビット当りの伝送出力が高めることができ、誤りに対する抵抗力の高い伝送が可能となる。従って、体外に向けてより長い距離(例えば6フィート)伝送させることが可能となり、伝送データを受信するためのアンテナを邪魔になるほど広げて設けたり、人体に取り付ける必要がなくなる。その信号が前記MISCの条件を満たすならば、そのような伝送はFCCや他の規制に違反することなく開放して行うことができる。
図5は、本発明の一実施形態による嚥下可能なカプセルシステム02を示す。カプセルシステム02は、図1のカプセルシステム01とほとんど同じ構造を有するが、アーカイブメモリシステム20と出力ポート26が必要とされない点が異なる。カプセルシステム02も、無線通信で用いられる送信機1326及び通信プロトコル符号化器1320を備える。従って、カプセル01及びカプセル02の実質的に同一の要素には、同じ参照符号を付してある。それらの要素の構造と機能についてはここでは繰り返して説明しない。通信プロトコル符号化器1320は、DSPやCPU上で動くソフトウェアとして、ハードウェアとして、或いはそれらの両方の組み合わせた形態で実装され得る。送信機1326は、捕捉したデジタルイメージを送信するためのアンテナシステムを備える。
図6は、動作中のカプセルカメラの実施形態1400の情報の流れの機能ブロック図である。ブロック1401及び1402で示される機能はそれぞれ、カプセル及び受信機を備えた外部ベースステーションで実施される機能である。光学系114とアンテナ1328を除いて、ブロック1401の機能は一個の集積回路上に実装され得る。図6に示すように、照明システム12と光学系14の両方を表す光学系114は、イメージセンサ16に体腔壁のイメージを与える。動き検出回路18は、現イメージが前イメージから十分に異なったものであるか否かを決定する動き検出回路18の決定に基づき、撮られてもカプセルシステム02から送信されないイメージもある。イメージが前イメージと十分に異なっていないと考えられるならばそのイメージは破棄されることもある。送信のために選択されたイメージは、データ伝送のためのプロトコル符号化器1320によって処理される。第2のセンサ(例えばpH、熱、圧力センサなど)も設けられ得る。第2センサからのデータは、第2センサ回路121で処理されて、プロトコル符号化器1320に供給される。行われた測定にはタイムスタンプが付され得る。プロトコル符号化器1320で処理されたイメージと測定値はアンテナ1328を通して送信される。制御モジュール22は、マイクロプロセッサ、ステートマシン、またはランダムロジック回路、またはこれらの組み合わせからなるものであり得、カプセルシステム02のモジュールの動作を制御する。上述のように、カプセルが意味のある距離だけ動いたり方向を変えたか否かに基づいて細くされるイメージを選択することの利点も、無線送信のための捕捉イメージを選択sるうために適用できる。このようにして、前に送信されたものに対する追加の情報を提供しないイメージは送信されないことになる。従って、そのような方式でなければイメージを送信するのに必要となっていた貴重なバッテリーの電力が節約されることになる。
図6に示すように、体外のブロック1402で表されるベースステーションは、受信機1332のアンテナ1331を用いて無線データ伝送を受け取る。プロトコル復号化器1333は、送信されたデータをデコードし、捕捉されたイメージを復元する。復元後の捕捉されたイメージはアーカイブストレージ1334に保存された後にワークステーションに供給されて、作業者(例えば医師や訓練された技術者)がそのイメージを解析することができる。制御モジュール22と同じ形で実装され得る制御モジュール1336は、ベースステーションの機能を制御する。カプセルシステム02は、圧縮を利用して伝送に必要な電力を節約し得る。動き検出器18に送信されたイメージに圧縮を施す場合には、ベースステーションに圧縮解除エンジンを設けるか、イメージを見たり処理する際にワークステーションでイメージの圧縮解除を行えばよい。ベースステーションに色空間コンバータを設けて、動き検出器では、送信されたイメージがイメージデータストレージで用いられる色空間とは異なる空間で表されるようにしてもよい。
本明細書では、「画像圧縮」及び「イメージ圧縮」という語を、文脈から異なるものを指すことが明らかな場合を除いて、交換可能な同じ意味で用いている。この点に関連して、ビデオは、時間軸上の各点に対応するイメージからなるイメージ列とみなすことができる。
よく使用される画像圧縮アルゴリズムは2つのカテゴリに分類される。第1のカテゴリは、フレーム単位圧縮に基づくもの(例えばJPEG)で、フレーム内冗長性を除去するものである。第2のカテゴリーは、フレーム間の違いに少なくとも部分的に基づいているもの(例えばMPEG)で、フレーム内冗長性とフレーム間冗長性の両方を除去するものである。第2のカテゴリの(MPEG様の)圧縮アルゴリズムは、複雑で複数のフレームバッファが必要となるが、より高い圧縮比を達成できる。30万画素のイメージではフレームバッファとして2.4メガビット以上のRAMが必要となる。従って、カプセルカメラの空間と電力消費の限界を考えれば、複数のフレームバッファを必要とする重要なMPEG様アルゴリズムは実用的ではない。動き圧縮アルゴリズムは広く利用されている。従って、本発明は従来技術で必要とされていたフルフレームバッファサポートを必要とせず、イメージ間の重複を除去する動きベースの圧縮を適用する。
本発明の一実施例は典型的な成人の小腸の長さが5.6メートルであることを利用する。この長さ分の距離を進む間、カプセルカメラは5万枚以上のイメージ(即ち、平均して、0.1mmの前イメージには含まれていなかった新しい領域を各イメージが含む)を撮影し得る。実際のイメージの視野はこの長さの数十倍(例えば5mm)をカバーする。従って、動きベクトルにガイドされて、連続するイメージどうしの非重複領域のみを保存することによって、圧縮比を大いに向上させることができる。この方法は、例えば、同様に時間的な冗長性の除去を利用しているMPEG様の圧縮アルゴリズムと結合することができる。本発明の一実施例では、圧縮プロセスで検出される動きベクトルを、連続するイメージ間の重複部分の除去のために用いることができる。さらに、重複領域を除去することによって、イメージどうしを合わせて、医師による読映用の、消化管の連続したリアルなイメージ(「実体像」)として提示することができる。重要な領域を見落とす危険を冒すことなく、そのようなイメージを検討するために必要な時間はおよそ2、3分となろう。また、医師は遠隔地でそのようなイメージを検討できるので、この分野における遠隔治療の利用も可能となる。さらに、重要なデータのみが提示されるので、迅速かつ低コストで保存や検索を行うことが可能となる。
本発明では、望ましいフレームレートを決定し、前イメージの視野との重複部分を決定するため、動き検出のためにイメージを一時的に保存するバッファメモリのみが必要となる。特殊な技術によって、2以上のフレームデータを保存する従来型のフレームバッファが不要となる。その代わりに、部分的フレームバッファのみが必要となる。イメージ内の冗長性は破棄され、必要で非冗長のイメージ及び情報のみがオンボードアーカイブメモリに保存されるか無線通信で送信される。
本発明の一実施例は、静止画像圧縮技術(「JPEG様の圧縮アルゴリズム」)を改善するものであり、図7及び図8A−図8Cに示されている。この実施例では、JPEG圧縮の場合のように、イメージが8×8画素ブロックに分割される(図7参照)。ブロックに分割することによって、例えば周波数領域への離散コサイン変換(DCT)によってイメージデータを処理することが容易になる。図7において、各8×8ブロックPijは、ブロック内の選択された画素(例えばブロックの左上位置の画素)の行と列の位置(i,j)によってラベル付けされ得る。JPEG圧縮の場合のように、符号化と復号化はイメージの左上から右下へとブロック単位で進められ得る。図7に示すように、ブロックPijは前に処理された隣接するブロック(例えばブロックP(i−8)j,P(i−8)(j−8),及びPi(j−8))である所定の数のブロック(例えば3つ)と比較される。図8Aは、前に処理された隣接ブロックを特定する、各ブロックの処理について図示している。図8Aで示すように、ブロックが第1行、第1列にある(ステップ804、810、及び811で判定される)場合には、そのブロックは、参照ブロックを用いることなくJPEG様アルゴリズムで圧縮即ち符号化される。そのブロックが第1列にあって、その左側に前に処理された近接ブロックがある(ステップ804、810、及び812で判定される)場合には、その前に処理された近接ブロックは、さらなる処理の準備段階におけるステップ813で圧縮解除即ち復号化される。更なる処理は、図8BのステップBから始まる。ブロックが第1の行にないが、第1の列にある(ステップ804、805、及び808で判定される)場合には、その上側隣接ブロックが基準ブロックとしての役目を果たす。このような場合、ステップBにおいて上側隣接ブロックが更なる処理のために復号化即ち圧縮解除される。
ステップB(図8B)では、基準ブロックとして適格な処理済みの隣接ブロックのそれぞれに対して、本発明の方法では、同じイメージにおける現ブロックの画素と処理済みの隣接ブロックの画素とを比較して、処理済の隣接ブロックが基準ブロックとして利用できるか否かを決定する。従って、基準ブロックとして適格な処理済みの隣接ブロックごとに、ステップ814−822のそれぞれにおいて、そのブロックと隣接ブロックP’(例えばブロックP(i−8)j)の対応する画素どうしの差の絶対値の合計(SAD)を計算する。図8Bのステップ824は、ブロックPijと隣接ブロックP’の対応する画素Pmn及びP’mnのSADの合計=Σ[m=0,7]Σ[n=0,7]|Pmn−P’mn|を示す。ブロックP7’は、例えば、ブロックPijの左側の隣接ブロックであり得る。(尚、本明細書全体において、例えば”Σ[i=1,n]f(i)”という表記は、”f(1)+f(2)・・・+f(n)”を表すものとする。
その他、図8Bのステップ824において、ブロックPDBijは、現ブロックの各画素値pmnと基準ブロックの対応する画素値p’mnを用いて計算された8×8個の差値pdbmn=pmn−p’mn+128から形成される。255を超えるpdbmn値が存在するならば、その基準ブロックは、基準ブロックとして選択するには不適格と考えられるほど現画素ブロックとは異なってるいことになる。
全隣接ブロックが処理されたとき、本発明の方法は図8Cに示すステップCに進む。隣接ブロックの何れもが基準ブロックとして適格でない(ステップ825で判定)場合には、現ブロックは基準ブロックを用いずに圧縮即ちJPEGに符号化される(ステップ830)。適格なものが存在する場合には、合計SAD値が最小となる隣接ブロックが選択される(ステップ825及び826で判定)。ステップ827で、平均画素値と活動度の統計値が、現ブロックPij及び異なるブロックPDBijの両方について計算される。即ち、現ブロックPijの平均画素値pave=1/64・Σ[m=0,7]Σ[n=0,7]pmn、異なるブロックPDBijの平均画素値dave=1/64・Σ[m=0,7]Σ[n=0,7]pdbmn、現ブロックPijの活動度A=Σ[m=0,7]Σ[n=0,7](pmn−pave)、及び異なるブロックPDBijの活動度Apdb=Σ[m=0,7]Σ[n=0,7](pdbmn−dave)が計算される。ステップ828において、現ブロックPijの活動度Aが異なるブロックPDBijの活動度Apdb以上である場合には、現ブロックPijでなく異なるブロックPDBijが圧縮即ち符号化され、現ブロックPijの活動度Aが異なるブロックPDBijの活動度Apdb未満である場合には、現ブロックPijが基準ブロックを用いることなくJPEGで圧縮即ち符号化される。
基準ブロックとしての役目を選択された隣接ブロックは、現ブロックに対する保存された相対位置参照によって示される。符号化されるブロックそれぞれに対して、処理済みの隣接ブロックが3つ考えられる場合には、選択された基準ブロックの位置を2ビットで符号化する。最大7個の処理済みブロックを考える場合(即ちブロックのなかには直接接していないものもある)、選択された基準ブロックの位置を3ビットで符号化する。例えば、これらの位置参照ビットは、圧縮データストリーム内または補助データ部分に配置され得る。
図8A−図8Cに示す方法によれば、あるイメージのうち僅かな部分(即ち基準ブロックとして適格な隣接ブロック)のみが圧縮解除される必要があるだけなので、図8A−図8Cの動作のための圧縮解除候補の基準フレームを保持するのに必要なフレームバッファのサイズは、全イメージを圧縮解除サイズとする場合と比較して小さくなる。
復号化の間、基準ブロックの画素値が対応する異なる画素値(即ちPDBij)に加えられて、現ブロックPijの画素値が復元される。基準ブロックの復号化された画素値は、符号化プロセスで用いられた画素値とは僅かに異なった値であり得るので、基準ブロックを選択するために計算される差の絶対値の合計は、符号化前に計算された値より符号化された値を用いて計算するのが好ましい。JPEG圧縮も、符号化された画素値に基づいて施される。このように僅かなオーバーヘッドで、JPEG圧縮比を向上させることができる。従ってこの方法は、省スペース・低消費電力を維持しつつフレームバッファまたは部分的フレームバッファを不要とし、カプセルカメラのスペースと消費電力の制約の両方を満たすことができる。
図9に示す本発明の別の実施形態によれば、大きいフレームバッファを用いることなくMPEG様データ圧縮を達成し得る。この実施形態によれば、JPEG様技術とMPEG様技術の両方を用いるカスケード圧縮が、初めに中程度の量子化レベルを用いるJPEG様圧縮技術で現イメージを圧縮することによって達成される。図9は、DCT(ステップ901)、量子化(ステップ902)、及びエントロピー符号化(ステップ903)を行うこのJPEG様圧縮技術を示す。ステップ901−903は上述の図8A−図8Cの技術とともに用いられる圧縮手順の一部である。このJPEG様圧縮されたイメージは、MPEG用語の”I”フレームとみなされる。得られるJPEG様圧縮イメージは、有害な画質劣化なく小さいサイズのフレームバッファだけを占める(ステップ904)ものとなる。フレーム間圧縮アルゴリズムの一部として、この”I”フレームは、後続のフレームが残余フレーム(例えば”P”フレーム)として符号化される際に参照される、基準フレームとしての役目を果たし得る。”P”フレームとして以降のフレームを符号化するために、”I”フレームとして選択された部分は、ステップ905−907において逆変換(即ちエントロピー復号化、逆量子化、及び逆DCT)を用いて”P”フレームを符号化する時点で圧縮解除される。任意の時点での動き検出のために必要なのは、イメージの小さい部分のみ(即ち探索領域を表すイメージの細片部(ストリップ))の圧縮解除なので、”I”フレームの圧縮解除された探索領域を保持するために設けられたストリップバッファも小さいサイズとなる(ステップ908)。動き検出がうまくいった場合(ステップ909)、現フレームは、現フレームと基準フレームの対応するブロックの画素ごとの差をとることによって、残余フレーム(即ち”P”フレーム)として圧縮できる。”P”フレームは、DCT、量子化、及びエントロピー符号化(ステップ911−913)を用いて圧縮される。この実施形態では、”B”フレーム(”P”及び”I”フレームから導出される)は用いられない。
現フレームの符号化の間、基準Iフレームの探索領域の復号化が、現フレームの受信と重複してリアルタイムで同時に行われる。図13Aは、基準Iフレームにおける探索領域と現フレームの画素ブロック1301を示す。図13Bは、それぞれ現フレームの画素ブロック1301及びブロック1302に対応する、基準Iフレームの探索領域1303及び1307を示す。ブロック1302は、画素ブロック1301の右側に隣接した位置にある。図13の斜線部分1304は、探索領域1303及び1307の両方に共通の領域を示す。つまり、探索領域1303は領域1305と共通探索領域1304を含み、探索領域1307は共通探索領域1304と領域1306を含む。ブロック1301が符号化された後にブロック1302を符号化するためには、ブロック1306さえ符号化すればよい。なぜなら、ブロック1301の符号化の段階で共通探索領域1304は既に符号化されているからである。実際、領域1305の符号化データを保持するためのバッファメモリ空間は、領域1306の符号化データで上書きしてもよい。領域1305と1306はそれぞれ、高さが探索領域と同じで幅が画素ブロックの幅と同じストリップである。或る実施形態では、符号化が第1の方向に行単位で行われ、各行内では第1の方向に直交する方向にブロック単位で行われる。従って、一行の画素ブロックを完全に符号化した後、符号化は次の行にうつり、基準フレームの探索領域も同様に1ブロック下に移動する。このプロセスは、図14A及び図14Bに例示されている。図14Aは、現フレームの画素ブロック1402−1乃至1402−nの行の対する基準フレームの探索領域1401を示す。符号化が次の行(即ち画素ブロック1403−1乃至1403−n)に進んだとき、基準フレーム内の新たな探索領域1404も1行分下に動く。このように、符号化探索領域1405を保持するために用いられるバッファメモリは、探索領域1406からの符号化データによって上書きされ得る。画素ブロック1402−1乃至1402−nの処理の際に共通探索領域(即ち探索領域1401と1402の重複部分)は既に符号化済みなので、符号化する必要があるのは探索領域1406からのデータのみである。
このように、Pフレームとして符号化される現フレームのそれぞれについて、基準Iフレームが符号化される。基準フレームをただ一度だけ符号化し、アクセスできるようにDRAMに保存しておく方式と比較して、基準フレームの符号化は消費電力が多くなると考える者もいるかもしれない。しかし、DRAM回路をリフレッシュし、そこにアクセスしたり、アクセスのためのチップ内での相互接続をなすために必要な電力を考えると、上述の方式でのフレームの符号化の方が、スタティックな回路を使用しASIC内でチップ内相互接続をなさしめることでより効率的に電力を使用する。
連続したフレーム間でカプセルに捕捉されたイメージは、進行方向(+x方向と呼ぶものとする。)に入れ代わることが、進行方向に垂直な方向(y方向)に入れ代わることより多いので、或る実施例では、y方向よりx方向が長い探索領域を選択し得る。さらに、進行方向(+x方向)の動きが生じやすいことから、探索領域を非対称に(即ち+x方向が−x方向より長くなるように)選択してもよい。側面の360度のパノラマビューが得られる設計では、y方向成分は探索する必要はない。
動き(「動きベクトル」で表現される)は、さまざまな技術を用いて検出することができる。そのよな技術の例として、代表点マッチング(RPM)法とグローバル動きベクトル(GMV)法が挙げられる。何れの技術も、利用する前にイメージをフィルタリングしてフリッカや他のノイズを低減させ得る。
図10に示すRPM法の下では、いくつかの代表的な画素(例えば32個)を各イメージから選択し、関連するイメージ同士でそれらを比較する。中央領域のようないくつかの領域が、他の領域(例えば周辺領域)より多くの画素を有するようにしてもよい。図10に示すように、選択された代表画素を外囲する画素群が、「マッチング近傍」(例えば代表画素1002のマッチング近傍1001)を形成する。例えば、マッチング近傍を形成するためにx方向かy方向の何れかの方向に±4の範囲内の画素を選択してもよい。現フレームの選択された代表画素のマッチング近傍のそれぞれは、基準フレーム(即ち他の時点のイメージ)の探索領域内のマッチング近傍と比較される。その探索領域(例えば探索領域1005)は、代表画素に対応する画素(例えばマッチング近傍1003内の画素)を含む基準フレームのにおける領域である。一般的に、その探索領域はマッチング近傍より大きい領域が選択される。動きベクトルは、現フレームの代表画素のマッチング近傍と、前記代表画素のマッチング近傍の画素群との一致度が最も高い画素群から構成される基準フレームのマッチング近傍との変位である。最も高い一致度を求めるための基準はさまざまな方式で決定される。例えば、一致度の基準を、現イメージのマッチング近傍の画素群と基準イメージのマッチング近傍の対応する画素群との差の絶対値の和が最小となるものとすることができる。この一致度の最も高いベクトルを、その代表画素の動きベクトルと称し、現イメージの代表画素のそれぞれについて求められる。
図11に示すGMV法では、動きベクトルが、MPEG様の動き推定で求められる動きベクトルと同一または類似したものとなる。例えば、図11に示すように、ブロック1103は前フレームの探索領域1105で探索される。動きベクトルは、前フレームのブロック1104の画素が現フレームのブロック1103aの画素と一致したとき、ブロック1103b(即ち、現フレームのブロック1103aに位置が対応する前フレームのブロック)に対するブロック1104の位置として前フレーム内で求められる。
何れかの方法(RPMまたはGMV)を用いている場合で、一致度の最も高いものが複数存在するときには、平均をとっても、直前に見出された動きベクトルと大きさと向きが最も近い動きベクトルを選択してもよく、或いは最も一致度の高いもののうち任意のものを選択したり、または何れの動きベクトルも選択しなくてもよい。GMV法では、動きベクトルはMPEG様のイメージ圧縮の副産物として得られることがある。或いは、図11に示すように、動きベクトルを導出する領域はフレーム全体でなくてもよい。バッファメモリや、計算用リソースや、消費電力に制約がある場合には、現フレーム全体から動きベクトルを求めるのでなく、動きベクトルを求めるために選択する必要があるのは、イメージ内の選択された一部のみ(例えば領域1001及び1002)とする。次に探索領域の外部が圧縮されるが、動き検出手順で求められた動きベクトルを再利用して消費電力を節約してもよい。或いは、消化管に沿った移動は口から肛門に向かう方向(+x)であることから、探索領域を−x方向に僅かにシフトさせて動き検出を行うことができる。このようにする理由は、現イメージの+x方向の前端にあるのは新たな情報だからである。
RPM、GMV何れの場合でも、いくつかの動きベクトル候補から動きベクトルを特定するために3次元ヒストグラムを用いることができる。例えば、3つの次元を、x方向の変位、y方向の変位、及びx、yの各方向変位を有する動きベクトルの数、とすることができる。例えばヒストグラムの位置(3、−4、6)は、x方向の変位3及びy方向の変位−4を有する6つの動きベクトルが記録されたことを表す。その場合、動きベクトルは、例えば、最も発生数の大きい(第3の軸の最大値に対応)動きベクトルとして選択される。
或いは、動きベクトルを2次元ヒストグラムを用いて求めてもよく、この場合2つの次元は前後方向及び横方向を表す。動きベクトルのx方向の変位は、前後方向での最も発生度の高い変位であり、動きベクトルのy方向の変位は、横方向で最も発生度の高い変位である。図16A及び図16Bは、この方法のためのx及びy変位のヒストグラムである。図16Aに示すように、x方向で最も発生度の高い変位は+8である。同様に図16Bに示すように、y方向で最も発生度の高い変位は0である。従って、動きベクトル(8,0)が最も発生しやすいものとして選択される。
GMVまたはPRM法で2以上のピーク点が存在する場合には、ピーク点の平均値、直前の動きベクトルに最も近いもの、又は他の任意の動きベクトルを選択し得る。動きベクトルが現イメージでは見つからないことが宣言されてもよい。
その上、一様なマッチング近傍(RPMの場合)又はブロック(GMVの場合)は、誤ったマッチングを生じることがある。高周波成分を有するマッチング近傍とブロックが好ましい。従って、或る実施形態では、異なる複雑さを有する近傍やブロックを探索するための異なる重み付けを用い得る。マッチング近傍またはブロックの複雑さを示すために種々の方法が用いられる。方法の1つとして挙げられるのは、活動度測定法であり、この場合、活動度とは、探索領域またはブロック内においてある行の連続した要素の差の絶対値の合計にある列の連続した要素の差の絶対値の合計を加えたものである。別の方法として挙げられるのは、差の絶対値平均(MAD)法であり、この場合、サイズがN×Nの正方形のサンプル探索領域またはブロックで、MAD=(1/N)Σ[j=0,N−1]Σ[j=0,N−1]|Yi,j−Yave|で与えられる。ここで、Yave=(1/N)Σ[j=0,N−1]Σ[j=0,N−1]Yi,jであり、Yi,jは、i行j列の画素の輝度である。図15は、(活動度で重み付けした)動きベクトル発生の3次元ヒストグラムの一例である。
カプセルカメラの用途では、撮影されない領域が生ずるのを避ける(それによって、消化管内の異常状態の検出率を高める)ため、イメージは非常に短い時間間隔で分割される。従って、連続した2つのイメージは相当量の重複部分を含み得る。連続したイメージの動きベクトルを見つけることによって、または異なる時点で撮られたイメージに対して、イメージの重複領域を特定し、イメージの一方から除去することができる。
例えば5万枚以上のイメージが小腸で撮られた場合、小腸が5.6m(通常の成人の実際の長さの概算)であるとすれば、各イメージは平均0.1mmのストリップを提供する。各イメージは、一般的にこのストリップよりかなり長い大きさをカバーする。重複部分を取り除き、動きベクトルを用いることによって、実際の圧縮比は大いに向上する。この方法は、前に述べた圧縮技術、特にMPEG様圧縮技術と結びつけることができる。この場合、動き推定能力が共有され、圧縮プロセスで導出された動きベクトルを利用して重複部分を除去することができる。
もちろん、基準フレームも他のフレームにおけるその基準フレームに対して符号化された動きベクトルに関連づけられている必要がある。Iフレーム及びPフレームを用いており、Iフレームのみが基準フレームとして利用され得る前述の実施形態では、Iフレーム全体が必要であり得る。しかし、そのような群は10以上のイメージを有し得ることから、圧縮比はさらに向上する。
或いは、JPEG様のフレーム内圧縮アルゴリズムが用いられる場合には、重複部分はストレージ内から除去されるか送信しないことによって除去し得る。
結果として、MPEGやJPEGで既に達成されたレベルよりずっと効率の高い圧縮比が得られる。イメージから除去された重複領域を圧縮する必要がないので、消費電力の節約にもなる。図12は重複部分を除去する方法の1つを示す。図12に示すように、フレームiに対して、フレームi+Δは、カプセルが+x方向に6単位進行した後のイメージを表す。ストリップ1201(x方向に6単位分の幅を有する)は、フレームiに対するフレームi+Δにある新しい情報を表す。フレームi+Δの残りの部分はフレームiのイメージと重複しており、従って除去され得る。動きベクトルの導き出す際の誤りを避けるために、ストリップ1202(x方向に2単位分の幅を有する)が保持される。(もちろん、保持された重複部分の長さの2単位は単なる例示であって、保持される長さを任意の合理的な長さにもし得る。)ストリップ1201及び1202を結合した領域は圧縮される。多くのイメージ処理アルゴリズムでは、画素は多くの場合8または16毎にグループ化される。(例えば、DCTは8×8画素ブロックを用いて行われることが多い。)例えば、得られるイメージがこれらのアルゴリズムの1つによって容易に取り扱いできるように、保持すべき重複部分の幅を選択し得る。
連続的なイメージによってカバーされる距離は、医師が問題がある可能性がある位置を決定する基準位置情報が得られるように蓄積され得る。各イメージに、またはいくつかに1つのイメージに、または一定の基準を満たすイメージとともにタイムスタンプを保存してもよい。最もよい一致を見つけるプロセスは、イメージを捕らえる際の露出時間、照明強度、カメラの利得が異なると複雑になり得、これらのパラメータは、移動探索を行う前に画素値を補償するために用いてもよい。画素値は、これらの個々の値と正比例する。画像データはオンボードで保存されるか体外に送信され、動き探索または他の操作は後で体外で行われる場合には、これらのパラメータ値は関連するイメージとともに保存または送信され、正確な計算がより容易にできるようにする。
圧縮は、移動のほとんど全部がx次元において正のx方向に行われる点を利用する。各イメージの重複部分は除去されて、保存または送信されるデータ量は劇的に減少する。
画素位置p=(x,x)でサンプリングされた基準イメージI(p)を考えると、現イメージI(p)を提供するベクトルを探す必要がある。そのようなベクトルは、例えば費用関数E=Σ[i]I(p+u)−I(p)を最小化することによって求めることができる。ここでu=(μ,ν)は移動または変位ベクトルである。費用関数の最小値は、例えばニュートンラプソン法によって求めることができる。通常、移動は僅かな大きさであり得、IとIはその操作の前に適切に補間され得る。
消化管における主要な方向は口から肛門に向かう方向であるが、y方向に沿った動きも存在し、またカプセルは回転したり、距離が変化するような状態で視野中の物体に焦点合わせする。より一般的な運動(即ち単純な平行移動でない)の場合、費用関数EはE=Σ[i]I(f(p;m))−I(p)で与えられ、ここでmは、複数の回転角をんだものであり得る、動きを記述する一般的なパラメータを含む多次元ベクトルである。或る実施形態では、mは3つの位置座標、3つの角度、及び焦点距離の関数(即ちm(x,y,z,θ,θ,d))である。費用関数の最小値は、例えばヤコビの行列を用いた演算によって求められる。最小のEに対応する関数fのパラメータ値を最適化することによって、IとIの間の対応関係と重複領域が求められる。
或いは、計算量を減らすため、最適な対応と一致を求める際に、イメージの前画素値を用いるのでなく、興味深い点の集合(例えば両イメージの局所的最小値及び最大値とその周囲の近傍のような特徴点)を用いてもよい。
パラメータ値は、実体像の表示のための全体イメージを形成するべく結合する準備のできた残りのイメージとともに送信され得る。カメラ姿勢パラメータを含むこっらのパラメータ、またはイメージ対が互いにどのように関係しているかは、後に、医師に見やすく表示するのを容易にするために利用することができる。例えば、姿勢パラメータによって一義的に特定されるカメラ位置は、所望の視点(例えば便利な視野角及び距離)に応じて選択される。対応する元のイメージ群の姿勢パラメータの組及び所望の姿勢パラメータに基づくイメージの非重複部分のマッピングまたは変換を用いて、イメージの非重複部分は所望の視点に応じて結合され得る。
上述の方法を用いて、パノラマビューフレームは、消化管の一部の内壁の「実体像」イメージを提供するべく互いに結合され得る。図17Aは、消化管の短い一部分を表すリング形状部1701を示す。見やすくするため、リング形状部1701は開かれて、湾曲した部分1702としても示され得る。湾曲した部分1702は、さらに伸ばされて矩形部分1703としても示され得る。パノラマビューは消化管のより長い部分を形成するように互いに結合されることから、得られるイメージは、図17Bに示す、管状(円筒形または蛇皮状)の「実体像」イメージ1741となる。見やすくするために、イメージ1741も、図17Aに示すような変換(即ち開放と結合)を用いて開放した形状とし、図17Bの矩形イメージ1742として表示できる。
上述の詳細な説明は、本発明の特定の実施形態を例示するものであり、本発明を記載の形態に限定しようとするものではない。本発明の範囲を逸脱せずにさまざまに改変した実施形態が可能である。本発明の範囲は特許請求の範囲の記載によって定められる。
本発明の一実施形態による、消化管内のカプセルシステム01を模式的に示す図であり、体腔内にあるカプセルを示す図。 カプセルシステム01におけるカプセルカメラの動作中の情報の流れを示す機能ブロック図。 カプセルシステム01からワークステーションへのデータ転送プロセスを示す機能ブロック図。 カプセルシステム01からワークステーション51への情報の流れを示す、カプセルからのデータアップロードプロセスを示す機能ブロック図。 本発明の一実施形態による、嚥下可能なカプセルシステム02を示す図。 カプセルカメラの動作中のカプセルシステム02の実施例1400における情報の流れを示す機能ブロック図。 本発明の一実施形態による、イメージの8×8画素ブロックへの分割を示す図。 本発明の一実施形態による圧縮技術を示す流れ図の一部を示す図。 本発明の一実施形態による圧縮技術を示す流れ図の一部を示す図。 本発明の一実施形態による圧縮技術を示す流れ図の一部を示す図。 本発明の一実施形態による、大きなフレームバッファを使用することなく達成されるMPEG様イメージ圧縮を示す図。 カプセルの前進を検出するグローバル動きメソッドを示す図。 カプセルの前進を検出する代表点マッチング(RPM)メソッドを示す図。 本発明の一実施形態による、重複を除去する一方法を示す図。 画素ブロック1301及び探索領域1303を示す図。 画素ブロック1301及び隣接するブロック1302それぞれの探索領域1303及び1307を示す図。 現フレームにおける一行の画素ブロック1402−1〜1402−nに対する参照フレームの探索領域1401を示す図。 現フレームにおける一行の画素ブロック1402−1〜1402−n、及び隣接する行の画素ブロック1403−1〜1403−nのそれぞれに対する参照フレームにおける探索領域1401及び1404を示す図。 本発明の一実施形態による、(活動度によって重み付けされた)動きベクトル発生の3次元ヒストグラムの一例を示す図。 本発明の一実施形態による、動きベクトルの導出する方法で用いられるx軸方向の変位のヒストグラム。 本発明の一実施形態による、動きベクトルの導出する方法で用いられるy軸方向の変位のヒストグラム。 消化管の短い部分を表すリング形状部分1701を示す図。観察を容易にするため、リング形状部分1701は、曲線形状1702に開かれて表示されても、矩形形状1703に伸ばされて表示されてもよい。 本発明の一実施形態による、「実体像」イメージ1741を示す図であり、観察の便宜のため矩形の現実イメージ1742に変換されて表示されてもよい。

Claims (53)

  1. イメージのデータ圧縮方法であって、
    前記イメージを複数のブロックに分割する過程と、
    予め定められたシーケンスに従ってブロックを選択する過程と、
    各選択されたブロックを処理する過程とを含み、
    前記ブロックを処理する過程が、
    前記イメージ内の複数の処理済みブロックから基準ブロックを特定する過程と、
    前記基準ブロックを用いて、前記選択されたブロックを圧縮する過程とを含むことを特徴とする方法。
  2. 前記選択されたブロックを圧縮する過程が、前記選択されたブロックと前記基準ブロックとの差を圧縮する過程を含むことを特徴とする請求項1に記載の方法。
  3. 前記差は、予め定められた値だけオフセットされていることを特徴とする請求項2に記載の方法。
  4. 前記基準ブロックの活動度の測定基準が、前記選択されたブロックの対応する活動度の測定基準を超えた場合にのみ、前記差が圧縮されることを特徴とする請求項2に記載の方法。
  5. 前記活動度の測定基準は、1つのブロックについて、前記ブロックの各画素値と前記ブロック内の画素値の平均値との差を合計することによって求められることを特徴とする請求項4に記載の方法。
  6. 前記予め定められたシーケンスは、行番号を増やしてゆく方向にブロックを横断し、かつ各行内では列番号を増やしてゆく方向にブロックを横断することを特徴とする請求項2に記載の方法。
  7. 前記圧縮する過程は、離散コサイン変換を行った後に量子化を行うことを特徴とする請求項1に記載の方法。
  8. 前記処理済みブロックが、前記選択されたブロックから予め定められた距離の範囲内にあることを特徴とする請求項1に記載の方法。
  9. 前記特定する過程が、
    複数の前記処理済みのブロックのそれぞれについて、そのブロックと前記選択されたブロックとの差の絶対値の和を計算する過程と、
    計算された前記和の最小値に対応する処理済ブロックを、前記基準ブロックとして選択する過程とを含むことを特徴とする請求項1に記載の方法。
  10. フレーム内イメージ圧縮を行う際に必要となるメモリ領域を小さくする方法であって、
    第1フレームのフレーム内データ圧縮を行う過程と、
    フレーム内圧縮済み第1フレームをフレームバッファに保存する過程と、
    第2フレームを受信する過程と、
    前記第2フレームにおけるブロックと前記第1フレームの選択された部分における圧縮解除されたブロックとを比較することによって、前記第1フレーム及び前記第2フレームのブロック同士の一致を検出する過程と、
    検出された一致ブロックに従って前記第2フレームを圧縮する過程とを含むことを特徴とする方法。
  11. 前記圧縮解除されたブロックは、前記第2フレームの受信と同時に圧縮解除されることを特徴とする請求項10に記載の方法。
  12. 前記第1フレーム及び第2フレームのブロックは、それぞれアレイをなすように配置され、
    前記検出する過程が、
    予め定められた順序で前記第2フレームにおける各ブロックを取り出す過程を含み、かつ、取り出した各ブロックごとに、
    前記取り出したブロックの位置に対応する前記第2フレームのブロックを含む探索領域に対応する前記第1フレームの圧縮解除されたブロックを、バッファメモリに供給する過程と、
    前記バッファメモリ内の前記圧縮解除されたブロックと前記取り出したブロックとを一致させる過程とを含むことを特徴とする方法。
  13. 前記予め定められた順序が、行番号を増やしてゆく順序であることを特徴とする請求項12に記載の方法。
  14. 前記予め定められた順序が、各行について、あるブロックから隣接するブロックに進んでゆく順序であることを特徴とする請求項13に記載の方法。
  15. 2つの連続して取り出されるブロックの前記探索領域どうしが重複しており、
    前記2つの連続して取り出されるブロックの後のブロックに対応する探索領域の圧縮解除されたブロックが、前記2つの連続して取り出されるブロックの前のブロックに対応する探索領域の圧縮解除されたブロックによって占有されている前記バッファメモリの領域に割り当てられることを特徴とする請求項12に記載の方法。
  16. 前記2つの連続して取り出されるブロックの後のブロックに対応する探索領域の非重複ブロックは、前記後のブロックが取り出されたとき圧縮解除されることを特徴とする請求項15に記載の方法。
  17. 前記第2フレームは、前記第1フレーム及び前記第2フレームから導出された残余フレームとして圧縮されることを特徴とする請求項10に記載の方法。
  18. 前記フレーム内データ圧縮を行う過程が、
    前記第1フレームのイメージを複数のブロックに分割する過程と、
    予め定めされたシーケンスに従ってブロックを選択する過程と、
    各選択されたブロックを処理する過程とを含み、
    前記ブロックを処理する過程が、
    前記イメージ内の複数の処理済みブロックから基準ブロックを特定する過程と、
    前記基準ブロックを用いて、前記選択されたブロックを圧縮する過程とを含むことを特徴とする請求項10に記載の方法。
  19. 前記選択されたブロックを圧縮する過程が、前記選択されたブロックと前記基準ブロックとの差を圧縮する過程を含むことを特徴とする請求項18に記載の方法。
  20. 前記差は、予め定められた値だけオフセットされていることを特徴とする請求項19に記載の方法。
  21. 前記基準ブロックの活動度の測定基準が、前記選択されたブロックの対応する活動度の測定基準を超えた場合にのみ、前記差が圧縮されることを特徴とする請求項19に記載の方法。
  22. 前記活動度の測定基準は、1つのブロックについて、前記ブロックの各画素値と前記ブロック内の画素値の平均値との差を合計することによって求められることを特徴とする請求項21に記載の方法。
  23. 前記予め定められたシーケンスは、行番号を増やしてゆく方向にブロックを横断し、かつ各行内では列番号を増やしてゆく方向にブロックを横断することを特徴とする請求項19に記載の方法。
  24. 前記圧縮する過程は、離散コサイン変換を行った後に量子化を行うことを特徴とする請求項18に記載の方法。
  25. 前記処理済みブロックが、前記選択されたブロックから予め定められた距離の範囲内にあることを特徴とする請求項18に記載の方法。
  26. 前記特定する過程が、
    複数の前記処理済みのブロックのそれぞれについて、そのブロックと前記選択されたブロックとの差の絶対値の和を計算する過程と、
    計算された前記和の最小値に対応する処理済ブロックを、前記基準ブロックとして選択する過程とを含むことを特徴とする請求項18に記載の方法。
  27. 実体像イメージを提供する方法であって、
    移動カメラを用いて第1イメージ及び第2イメージを撮影する過程と、
    前記第1イメージと前記第2イメージから、前記カメラの視野内の前記第1及び第2イメージ間の重複領域を特定する過程と、
    前記第2イメージから前記重複領域を除去する過程とを含むことを特徴とする方法。
  28. 前記除去する過程の後に、前記第1イメージと、前記重複領域を除去された前記第2イメージとを結合することによって前記実体像イメージを生成する過程をさらに有することを特徴とする請求項27に記載の方法。
  29. 各イメージがパノラマのリング形態であり、前記実体像イメージが管形状のものとして提示されることを特徴とする請求項28に記載の方法。
  30. 各イメージがパノラマのリング形態であり、前記実体像イメージが矩形のものとして提示されることを特徴とする請求項29に記載の方法。
  31. イメージがカプセルカメラによって撮影され、イメージ同士の結合は、前記カプセルカメラの内部で行われることを特徴とする請求項27に記載の方法。
  32. イメージがカプセルカメラによって撮影され、イメージ同士の結合は、そのイメージを前記カプセルカメラから取り出した後に行われることを特徴とする請求項27に記載の方法。
  33. 各イメージについて、そのイメージが撮影された時の前記移動カメラの位置を特定するカメラパラメータの値を記録する過程と、
    前記実体像イメージを生成するために、前記カメラパラメータの値を前記イメージに適用する過程とをさらに含むことを特徴とする請求項28に記載の方法。
  34. 前記カメラパラメータの値が、所望の視点に従って選択されることを特徴とする請求項29に記載の方法。
  35. 前記重複領域を特定する過程が、
    前記第2イメージにおける画素群を選択する過程と、
    対応する前記第2イメージにおける画素群を含む探索領域を選択する過程と、
    前記探索領域内で前記第1イメージにおいて選択された画素群に最も一致度が高い画素群を見出す過程と、
    前記第2イメージにおける対応する画素群からの最も一致度が高いものとして見出された画素群の変位を表す動きベクトルを導出する過程とを含むことを特徴とする請求項28に記載の方法。
  36. 前記選択された画素群は、前記第1イメージから選択された複数の画素群のなかの1つであり、動きベクトルは前記複数の画素群のそれぞれについて導出され、フレーム動きベクトルは、前記複数の画素群のそれぞれについて導出された動きベクトルのなかから選択されることを特徴とする請求項35に記載の方法。
  37. 前記フレーム動きベクトルは、発生頻度に応じて前記動きベクトルを集計するヒストグラムから導出されることを特徴とする請求項36に記載の方法。
  38. 前記フレーム動きベクトルは、前記動きベクトルの平均をとることから導出されることを特徴とする請求項36に記載の方法。
  39. 前記複数の画素群のそれぞれは、代表画素の組のなかの1つの代表画素と、その代表画素からの予め定められた距離内にある画素群とを含むことを特徴とする請求項36に記載の方法。
  40. 前記第1イメージ及び前記第2イメージを保存または送信する過程を更に含み、
    前記第2イメージは、前記重複領域を含めずに保存されることを特徴とする請求項27に記載の方法。
  41. 前記第1イメージ及び前記第2イメージを、保存または送信の前に圧縮する過程を更に含むことを特徴とする請求項40に記載の方法。
  42. 前記圧縮する過程が、
    前記イメージを複数のブロックに分割する過程と、
    予め定めされたシーケンスに従ってブロックを選択する過程と、
    各選択されたブロックを処理する過程とを含み、
    前記ブロックを処理する過程が、
    前記イメージ内の複数の処理済みブロックから基準ブロックを特定する過程と、
    前記基準ブロックを用いて、前記選択されたブロックを圧縮する過程とを含むことを特徴とする請求項41に記載の方法。
  43. 前記選択されたブロックを圧縮する過程が、前記選択されたブロックと前記基準ブロックとの差を圧縮する過程を含むことを特徴とする請求項42に記載の方法。
  44. 前記差は、予め定められた値だけオフセットされていることを特徴とする請求項43に記載の方法。
  45. 前記基準ブロックの活動度の測定基準が、前記選択されたブロックの対応する活動度の測定基準を超えた場合にのみ、前記差が圧縮されることを特徴とする請求項43に記載の方法。
  46. 圧縮により、前記第1及び第2イメージから時間冗長性が除去されることを特徴とする請求項41に記載の方法。
  47. 前記第1イメージ及び前記第2イメージに関連するパラメータ値の組が、前記第1イメージ及び前記第2イメージとともに保存または送信されることを特徴とする請求項40に記載の方法。
  48. 前記除去する過程の後に、前記第1イメージと、前記重複領域を除去された前記第2イメージとを結合することによって前記実体像イメージを生成する過程をさらに有し、
    前記パラメータ値は、より高いイメージ制度で前記実体像イメージを生成する際に適用されることを特徴とする請求項47に記載の方法。
  49. 前記パラメータ値は、露出時間、照明光強度、及びカメラ利得からなる群から選択されたパラメータであることを特徴とする請求項47に記載の方法。
  50. 各イメージはタイムスタンプとともに送信されることを特徴とする請求項47に記載の方法。
  51. 前記動きベクトルは、費用関数を最小化することによって導出されることを特徴とする請求項27に記載の方法。
  52. 前記費用関数は、位置座標の関数であることを特徴とする請求項51に記載の方法。
  53. 前記費用関数は、位置座標と角座標の両方の関数であることを特徴とする請求項51に記載の方法。
JP2008542532A 2005-11-23 2006-11-22 動き検出と「実体像」イメージの構築 Pending JP2009517138A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US73916205P 2005-11-23 2005-11-23
US76007906P 2006-01-18 2006-01-18
US76079406P 2006-01-19 2006-01-19
PCT/US2006/061229 WO2007062404A2 (en) 2005-11-23 2006-11-22 Movement detection and construction of an 'actual reality' image
US11/562,926 US20070116119A1 (en) 2005-11-23 2006-11-22 Movement detection and construction of an "actual reality" image

Publications (1)

Publication Number Publication Date
JP2009517138A true JP2009517138A (ja) 2009-04-30

Family

ID=38053495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008542532A Pending JP2009517138A (ja) 2005-11-23 2006-11-22 動き検出と「実体像」イメージの構築

Country Status (4)

Country Link
US (1) US20070116119A1 (ja)
EP (1) EP1952307A2 (ja)
JP (1) JP2009517138A (ja)
WO (1) WO2007062404A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012075083A (ja) * 2010-08-30 2012-04-12 Canon Inc 画像処理装置及びその制御方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983458B2 (en) * 2005-09-20 2011-07-19 Capso Vision, Inc. In vivo autonomous camera with on-board data storage or digital wireless transmission in regulatory approved band
US7940973B2 (en) * 2006-09-19 2011-05-10 Capso Vision Inc. Capture control for in vivo camera
EP1921867B1 (en) * 2006-10-17 2016-05-25 Harman Becker Automotive Systems GmbH Sensor assisted video compression
KR101444485B1 (ko) 2006-11-16 2014-09-24 스트리커 코포레이션 무선 내시경 카메라
US20080117968A1 (en) * 2006-11-22 2008-05-22 Capso Vision, Inc. Movement detection and construction of an "actual reality" image
US8187174B2 (en) * 2007-01-22 2012-05-29 Capso Vision, Inc. Detection of when a capsule camera enters into or goes out of a human body and associated operations
US7920746B2 (en) * 2007-04-23 2011-04-05 Aptina Imaging Corporation Compressed domain image summation apparatus, systems, and methods
JP5045320B2 (ja) * 2007-09-05 2012-10-10 ソニー株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US9285670B2 (en) 2007-09-14 2016-03-15 Capso Vision, Inc. Data communication between capsulated camera and its external environments
US8165374B1 (en) * 2011-06-09 2012-04-24 Capso Vision Inc. System and method for capsule camera with capture control and motion-compensated video compression
US10068334B2 (en) * 2013-05-29 2018-09-04 Capsovision Inc Reconstruction of images from an in vivo multi-camera capsule
US9778740B2 (en) * 2015-04-10 2017-10-03 Finwe Oy Method and system for tracking an interest of a user within a panoramic visual content
ES2742101T3 (es) 2015-11-25 2020-02-13 Ovesco Endoscopy Ag Endoscopio de tipo cápsula pasiva para el intestino
WO2018046092A1 (de) * 2016-09-09 2018-03-15 Siemens Aktiengesellschaft Verfahren zum betreiben eines endoskops und endoskop
US11321768B2 (en) 2018-12-21 2022-05-03 Shopify Inc. Methods and systems for an e-commerce platform with augmented reality application for display of virtual objects
US11276247B1 (en) * 2020-10-28 2022-03-15 Shopify Inc. Systems and methods for providing augmented media
US11593870B2 (en) 2020-10-28 2023-02-28 Shopify Inc. Systems and methods for determining positions for three-dimensional models relative to spatial features

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835389A (en) * 1996-04-22 1998-11-10 Samsung Electronics Company, Ltd. Calculating the absolute difference of two integer numbers in a single instruction cycle
US6184922B1 (en) * 1997-07-31 2001-02-06 Olympus Optical Co., Ltd. Endoscopic imaging system in which still image-specific or motion picture-specific expansion unit can be coupled to digital video output terminal in freely uncoupled manner
IL124814A (en) * 1998-06-08 2003-04-10 Grinvald Amiram System and method for imaging and analysis of the movement of individual red blood corpuscles
US6493469B1 (en) * 1999-06-28 2002-12-10 Xerox Corporation Dual video camera system for scanning hardcopy documents
US20030117491A1 (en) * 2001-07-26 2003-06-26 Dov Avni Apparatus and method for controlling illumination in an in-vivo imaging device
AU2002334354A1 (en) * 2001-09-05 2003-03-18 Given Imaging Ltd. System and method for three dimensional display of body lumens
JP2005074031A (ja) * 2003-09-01 2005-03-24 Pentax Corp カプセル内視鏡
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US20050085718A1 (en) * 2003-10-21 2005-04-21 Ramin Shahidi Systems and methods for intraoperative targetting
CN100399978C (zh) * 2004-02-18 2008-07-09 国立大学法人大阪大学 内窥镜系统
JP2005252626A (ja) * 2004-03-03 2005-09-15 Canon Inc 撮像装置および画像処理方法
US7983458B2 (en) * 2005-09-20 2011-07-19 Capso Vision, Inc. In vivo autonomous camera with on-board data storage or digital wireless transmission in regulatory approved band

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012075083A (ja) * 2010-08-30 2012-04-12 Canon Inc 画像処理装置及びその制御方法

Also Published As

Publication number Publication date
WO2007062404A2 (en) 2007-05-31
US20070116119A1 (en) 2007-05-24
WO2007062404A3 (en) 2008-04-24
EP1952307A2 (en) 2008-08-06

Similar Documents

Publication Publication Date Title
JP2009517138A (ja) 動き検出と「実体像」イメージの構築
US20080117968A1 (en) Movement detection and construction of an "actual reality" image
US7983458B2 (en) In vivo autonomous camera with on-board data storage or digital wireless transmission in regulatory approved band
JP4663230B2 (ja) 小さな横断面面積を有するインビボ・イメージング・デバイスおよびその構成方法
US7796870B2 (en) Lighting control for in vivo capsule camera
US8582853B2 (en) Device, system and method for automatic detection of contractile activity in an image frame
US7940973B2 (en) Capture control for in vivo camera
US20110135170A1 (en) System and method for display speed control of capsule images
US20080004503A1 (en) Data recorder and method for recording a data signal received from an in-vivo sensing device
US20060183993A1 (en) Device, system, and method for locating an in-vivo signal source
US10835113B2 (en) Method and apparatus for travelled distance measuring by a capsule camera in the gastrointestinal tract
US8724868B2 (en) System and method for display of panoramic capsule images
CN102639049B (zh) 信息处理装置以及胶囊型内窥镜系统
AU2006329540A1 (en) System device and method for estimating the size of an object in a body lumen
Swain et al. Wireless capsule endoscopy of the small bowel: development, testing, and first human trials
US9285670B2 (en) Data communication between capsulated camera and its external environments
JP4526245B2 (ja) 映像信号処理装置