JP5922841B2 - パターンのシンボル空間ベースの圧縮のための多層システム - Google Patents

パターンのシンボル空間ベースの圧縮のための多層システム Download PDF

Info

Publication number
JP5922841B2
JP5922841B2 JP2015510521A JP2015510521A JP5922841B2 JP 5922841 B2 JP5922841 B2 JP 5922841B2 JP 2015510521 A JP2015510521 A JP 2015510521A JP 2015510521 A JP2015510521 A JP 2015510521A JP 5922841 B2 JP5922841 B2 JP 5922841B2
Authority
JP
Japan
Prior art keywords
sequence
symbols
symbol
data layer
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015510521A
Other languages
English (en)
Other versions
JP2015519828A (ja
Inventor
レイチェルガウツ イガール
レイチェルガウツ イガール
オディナエフ カリナ
オディナエフ カリナ
ワイ.ジービ ヨシュア
ワイ.ジービ ヨシュア
Original Assignee
コルティカ リミティド
コルティカ リミティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コルティカ リミティド, コルティカ リミティド filed Critical コルティカ リミティド
Publication of JP2015519828A publication Critical patent/JP2015519828A/ja
Application granted granted Critical
Publication of JP5922841B2 publication Critical patent/JP5922841B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/46Conversion to or from run-length codes, i.e. by representing the number of consecutive digits, or groups of digits, of the same kind by a code word and a digit indicative of that kind

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Description

[関連出願への相互参照]
この出願は、2013年2月12日に出願された米国仮出願第61/763,554号の利益を主張し、その内容は、参照することにより、本出願に組み入れられる。
本発明は、パターン認識(pattern recognition)及びビックデータ(big−data)、特に、パターン認識技術、ビックデータ記憶装置、及び分析を利用するシステム及び方法に一般に関連する。
パターン認識及びそれらのパターン認識を適切に記憶装置に簡潔に整理することは、継続的に試みられている。しかしながら、特に指定がない限り、全てのパターンは、データに従って均等に分類(distribute)することは、想定できない。なぜなら、いくつかのパターンは、他のパターンよりも顕著だからである。それらのパターンは、他のパターンが非常に稀である間、大きな出現数を有する可能性がある。さらに、いくつかのパターンは、相互に関連し、非常に人気があるパターンの組み合わせとともに形成してもよい。これは、パターン認識システムのアプリケーションに問題を引き起こす。例えば、二つのコンテンツセグメント間の類似性測定(similarity measurement)を読み出すために、対応するパターンの数を考慮することは十分ではない。しかしながら、それぞれのパターンの出現確率も同様に考慮されるべきである。さらに、パターン間の相関関係も考慮されるべきである。例えば、二つのパターンが常にともに出現する場合、本質的に、二つパターンは、単独のパターンよりも多くの情報を含んでいない。
順々に、多大な影響は、拡張可能性及びパターン認識システムの正確性にとって弊害をもたらす。すなわち、異なるパターンの取扱いがパターン認識システムの複数のコンピュータ間に広がる場合、「人気のある(popular)」パターンを処理する少数のコンピュータは、アクセスに対して過度な負担を受けるのに対して、「人気の少ない(less−popular)」パターンを取り扱うほとんどのコンピュータは、作動しないままである。想定できないパターン間の相関関係が原因で、事前確率(a−priory probability)に従って、パターンの取扱いを分類することも不可能である。さらに、一般に、パターン認識システムの能力を高めるために、パターン空間の重複を回避することが好ましく、それぞれのコンピュータ内のパターンのコピーを保持する必要がある。
パターン等の複数のシンボルから簡単に認識される管理しやすい少数のシンボルへの削減(reduction)は、手動の場合、実行される。例えば、和音(chord)に組み合わされる音符の列(sequence of notes)を考慮して下さい。和音は、演奏されるニ以上の音符の組み合わせである。そうでなければ、和音は、同時に演奏されているように聞こえない。しかしながら、和音は、自然に反復するものの、演奏者(perfomer)に提供される音符の数を削減するために、音符の列は、複数の音符を表す和音のシンボルへと削減される。しかしながら、C7を示す和音は、演奏者が根音(root note)A、短3度(minor third)C、及び完全5度(perfect fifth)Eを同時に演奏しているかのように演奏することを意味する。人は、和音のシンボルをそれが示す特定の音符に簡単に変換できる。同様に、シンボルの二組間のマッピングの構築は、追加、削除、又は修正する特定のルールに必要に応じて基づいて、手動で実行される。
特に、認識処理に人手を介する必要がある先行技術の欠点を克服するパターン認識のために効率的な解決策を提供することが有利である。
一実施形態は、パターンのシンボル空間(symbol−space)ベースの圧縮のための方法を含む本明細書を開示する。方法は、入力列を受信し、入力列は、第一の長さであって、複数のシンボルを含み、入力列内の全ての共通のパターンを抽出し、共通のパターンは、少なくとも二つのシンボルを含み、全ての共通のパターンの抽出に応答する出力列を生成し、出力列は第一の長さよりも短い第二の長さを有し、出力列をデータ層としてメモリに格納し、出力列は、データ層の後続の生成のために、新たな入力列として供給されることを含む。
一実施形態は、パターンのシンボル空間ベースの圧縮のための装置も含む本明細書を開示する。装置は、処理ユニットと、処理ユニットに接続されたインターフェースであって、インターフェースは、入力列を受信するように構成され、入力列は、第一の長さであって、複数のシンボルを含むインターフェースと、処理ユニットに接続されたメモリであって、処理ユニットによって実行される際に、入力列内の全ての共通のパターンを抽出し、共通のパターンは、少なくとも二つのシンボルを含み、全ての共通のパターンの抽出に応答し、出力列を生成し、出力列は、第一の長さよりも短い第二の長さを有し、出力列をデータ層としてメモリに格納し、データ層の後続の生成のための新たな入力列として出力列を供給することを実行する複数の命令を格納するように構成されたメモリとを含む。
一実施形態は、ビックデータ記憶装置システムも含む本明細書を開示する。システムは、入力列に応答して皮質機能によって連続して生成された複数のデータ層を格納するためのメモリユニットであって、それぞれのデータ層は、データ層において使用されたシンボルの一群(collection)を含み、それぞれの生成されたデータ層のシンボル空間は、後に生成されるデータ層のいずれかのために生成されたシンボル空間よりも小さく、それぞれの生成されたデータ層は、後に生成されるデータ層のいずれかよりも、可変であって、反復可能ではなく、相関関係があって、均衡が保たれていないメモリユニットを含む。
本明細書に開示された主題は、請求項において、指摘され、明確に請求される。前述の発明の目的及び他の発明の目的、発明の特徴、及び発明の効果は、添付した図面と併用して以下の詳細な明細書から明らかである。
一実施形態に従って、処理のための入力として使用された第一のシンボル空間を有するシンボルのオリジナルの列を示す。 一実施形態に従って、シンボルの列のための入力列をマッピングすること、及び置換シンボルの判定のために利用される第一レベル表を示す。 一実施形態に従って、第一のシンボル空間よりも大きな第二のシンボル空間を使用することによって生成された削減された数のシンボルを示すシンボルの列を示す。 一実施形態に従って、シンボルの列のための入力列をマッピングすること、及び置換シンボルの判定のために利用される第二レベル表を示す。 一実施形態に従って、第二のシンボル空間よりも大きな第三のシンボル空間を使用することによって生成された削減された数のシンボルを示すシンボルの列を示す。 別の実施形態に従って、シンボルの列のための入力列をマッピングすること、及び置換シンボルの判定のために利用される第三レベル表を示す。 一実施形態に従って、第三のシンボル空間よりも大きな第四のシンボル空間を使用することによって生成された削減された数のシンボルを示すシンボルの列を示す。 一実施形態に従って、それぞれ使用される画像シンボル直線、四角形、円形、及び三角形の概略図を示す。 一実施形態に従って、それぞれ使用される画像シンボル直線、四角形、円形、及び三角形の概略図を示す。 一実施形態に従って、それぞれ使用される画像シンボル直線、四角形、円形、及び三角形の概略図を示す。 一実施形態に従って、それぞれ使用される画像シンボル直線、四角形、円形、及び三角形の概略図を示す。 一実施形態に従って、基礎シンボルからそれぞれ生成される「住宅」及び「椅子」の高レベル画像シンボルを示す。 一実施形態に従って、基礎シンボルからそれぞれ生成される「住宅」及び「椅子」の高レベル画像シンボルを示す。 対応する接続ポートをそれぞれ有する直線、四角形、円形、及び三角形の基礎シンボルを示す。 対応する接続ポートをそれぞれ有する直線、四角形、円形、及び三角形の基礎シンボルを示す。 対応する接続ポートをそれぞれ有する直線、四角形、円形、及び三角形の基礎シンボルを示す。 対応する接続ポートをそれぞれ有する直線、四角形、円形、及び三角形の基礎シンボルを示す。 一実施形態に従って、基礎シンボルからそれぞれ生成される「男性」、「女性」及び「犬」の高レベル画像シンボルを示す。 一実施形態に従って、基礎シンボルからそれぞれ生成される「男性」、「女性」及び「犬」の高レベル画像シンボルを示す。 一実施形態に従って、基礎シンボルからそれぞれ生成される「男性」、「女性」及び「犬」の高レベル画像シンボルを示す。 一実施形態に従って、パターンのシンボル空間ベースの圧縮を達成するための入力シンボルの列の入力に応答してデータ層の生成を描写するフローチャートを示す。 一実施形態に従って、パターンのシンボル空間ベースの圧縮を達成するための入力シンボルの入力列に応答してデータ層の生成のためのシステムを示す。
本明細書に開示された実施形態は、本明細書の革新的な教示の多数の有利な使用の例にすぎない。一般に、本出願の明細書内に作成された文章は、様々な請求された発明の限定を必要としない。さらに、いくつかの文章は、いくつかの発明の特徴に適用してもよいものの、他の発明には適用できない。一般に、指摘されていない限り、単一の要素は、複数であってもよく、一般性を失うことなく、その逆の場合も同様である。図面内において、同様の数字は、いくつかの図面を通して、同様の部分を参照する。
本明細書で開示された様々な技術は、自然信号及び/又は自然信号から抽出された特性を、反復可能性及び不変性を有する高次元空間内の圧縮された表現にマッピングさせる。特に、所定の入力空間(given input space)、複数のデータ層(皮質(Cortex))は、シンボルの直前のリストよりも少なくとも一つ以上シンボル等、より多いシンボルによって表現される入力データに応答して生成される。しかしながら、複数のデータ層は、短い全長、すなわち、シンボルの列の直前の長さよりも短い長さである。
したがって、情報は、より簡潔に表現され、より簡単にシンボル空間に認識される。入力データは、画像、動画、テキスト、音声、複数のデータ層内にマッピングできる他の種類のデータであってもよい。一実施形態において、開示された技術は、高次のデータ層(higher data layer)の「理想的な表(ideal table)」とそれとを比較することにより、「表」が何であるか決定する性能として描写できる。特に、パターン空間は、それぞれのコンピュータがパターン空間において異なる範囲(different range)を取り扱うパターン認識システムの複数のコンピュータ(又は、プロセッサ)に拡大するために十分大きく生成される。パターン空間は、一つ以上のパターンを含む。
一実施形態によると、入力された「パターン」は、コンテンツセグメント(content−segment)内の「パターン」を探し出すための設計された装置(又はシステム)から受信され、入力パターンは、コンテンツセグメント内のいくつかの特徴の任意の表現として漠然と定義される。しかしながら、受信した「パターン」は、これらのパターンが表現すること、及び、これらのパターンの局所性(locality)についての任意の情報に関連することに留意すべきである。そのようなパターンの一群は、「記述子(descriptor)」として本明細書で参照される。コンテンツセグメントは、一以上の「記述子」によって表現される。例えば、コンテンツセグメントが二次元の画像である場合、パターンは特定の形状又は特定の色は、その画像内に検出されたことを示してもよい。
開示された実施形態によると、受信した入力パターンのパターン空間は、サイズがより大きいパターン空間に変化する。しかしながら、受信した入力パターンのパターン空間は、詳細に本明細書にさらに記載されるように、より均衡した、無相関で、反復可能で、不変である。特に、それぞれの記述子において、オリジナルの入力パターンは、オリジナルのパターン空間からのパターンの組み合わせを表現する新たなパターンに置換される。したがって、一番目に、開示された技術は、より大きなパターン空間を作成するために利用されるので、拡張可能性が向上する。二番目に、開示された技術は、よりよい正確性のためのパターン空間を平坦化(flatten)し、無関係(de−correlate)にする。三番目に、開示された技術は、単独の分野(domain)からのコンテンツセグメント上の複数のパターンの大規模情報を含むことによって、不変性(invariance)及び反復可能性(repeatability)を向上させる。
以下は、一実施形態に従って開示した(以下に説明するシステム及び方法によって実現される)技術の工程(operation)の概要である。皮質(Cortex)は、任意のk{k=0,1, ...n}における関数(function)F: S→Snである。Sは、一つ以上のパターンを含むパターン空間である、初期パターン空間Sは、入力パターンによって定義され、皮質の次の層であるそれぞれの以下のシンボル空間は、一つ以上の所定の変更規則(conversion rules)に従って、S内のパターンの任意の組を、Sk+1内のパターンの一組に変更する「反復関数(iteration function)F」F:S→Sk+1によって、定義され、生成される。任意の「反復関数」内の変更規則は、特定分野からのコンテンツセグメント等のパターンの大規模な一群内のパターンの分類(distribution)に従って生成される。例えば、対象分野(domain of interest)が「二次元の自然の写真(2D natural photo)」である場合、S内のいくつかの大きなN記述子は、生成され、S...Sを意味(denoted)する。これらの例のコンテンツセグメントは、自然の二次元画像を含む。
一実施形態によれば、皮質のデータ層Fの生成のための反復(iteration)は、それらのN記述子内のパターンの分類に従って定義され、いくつかのステップを有する。まず、Sk+1は、Sのコピーとして初期化される。それから、S...Sは、⊂がサブセット関数(subset function)である{c⊂S}を意味するS内のパターンの共通の組み合わせの一群を構築するために使用される。それから、それぞれの組み合わせc{i=1,2,..,N}に対して、S...S内のcの可能性は、第一の閾値Tよりも大きく、新たなラベル(label)は、Sk+1に追加されるので、一ずつパターン空間を増加させる。S内のそれぞれの「オリジナルラベル(original label)」は、第二の閾値Tよりも大きな{S...S}内の可能性を有する。それぞれの「オリジナルラベル」は、Sk+1から除去される。最後に、それぞれの「オリジナルラベル」が含まれた組み合わせcの数であるS内のそれぞれの「オリジナルラベル」は、第三の閾値Tよりも大きい。それから、それぞれの「オリジナルラベル」はSk+1から除去される。一般的に、T,T,及びTは、本明細書で説明される例等の特定の確率を意味する数値である。
k+1内のそれぞれのパターンは、S内のパターンか、又はS内のパターンの一群として強く定義されるか、のいずれかである場合、この処理の終了時、データ層Fの一貫した定義(consistent definition)が達成される。したがって、新たなパターンが含まれるべきか否かを示す一群のためにテストできる。非常にありふれたパターンが除去及び/又は他のパターンの組み合わせに置換される場合、Sk+1がより大きな符号空間(signature−space)であるという結果になる。
閾値パラメータT,T,及びTは、パターンの価値を失うことなく、「ノイズ(noisy)」パターンの含有を同時に回避するように、注意深く調整されるべきである。長さが増加し、使用される固有のシンボルの数が増加する限り、階層的な処理は、閾値の選択とともに、所望の回数、反復できる。それぞれの反復は、直前のデータ層のより簡潔な表現であるデータ層を生成する。すなわち、それぞれの入力パターンの複数のシンボルは、単独のシンボルにマッピングされる。
一実施形態において、入力パターン又は入力データは、英語の文字列、人間の顔、クラシック音楽等の分野に特有である。別の実施形態において、分野からのデータの組み合わせは、使用できる。一実施形態によると、シンボルは、シンボルが高い相関関係を有する場合、連結される。しかしながら、シンボルは、シンボルが共通の共起性、すなわち、実際に相互に関連することなく、ともに出現する傾向を示すことによって相互に関連付けられない場合であっても、結合もできる。
本明細書で説明される処理への少なくとも二つの重要な結果を予想すべきである。まず、処理は、拡張性がある。すなわち、本明細書で説明される処理を実行後、パターン空間は、大きく、均衡になるので、パターン空間は、パターン空間のサブ範囲(sub−range)を取り扱うそれぞれのコンピュータとともに、複数のコンピュータ間に均等に広める(spread)ことができる。したがって、「ルート(route)」戦略は、重複問合せよりむしろ問い合わせることのために使用できる。
開示された処理の別の重要な結果は、その正確性である。すなわち、データ層反復構築処理(data layer iteration−building process)において、「実在の(real−world)」データS...Sの一組は、必要な統計を基準として用いるために使用できる。これは、本明細書に開示された教示を適用することによって、より重み(weight)は、無作為標本内のあまり人気のない(及びより有利な)パターンに付与されることを意味する。このように、同一の分野からの入力コンテンツセグメントを想定すると、生成されたデータ層は、重要な「検出(detection)」パターンから「ノイズのある(noisy)」パターンを分けるために使用される。さらに、開示された処理に従って生成されたデータ層は、より高レベル概念(higher level concept)に属するようにパターンを認識する能力がある脳機能(brain function)と同様である機能を提供する。
開示されたパターン認識処理は、ビックデータの分析において、特に利点があることに留意すべきである。ビックデータは、一般的に、関連技術で説明されるデータ処理アプリケーションのように、手製のデータベース管理ツール又は伝統的なデータ処理アプリケーションを使用して分析できない大きさで複雑なデータの組の一部を参照する。上述したように、開示された処理は、大きく、均衡が保たれたパターン空間となるという結果になる。したがって、それぞれのコンピュータがパターン空間のサブ範囲を取り扱う場合、パターン空間は、複数のコンピュータ間に均等に広めることができる。よって、開示された処理は、ビックデータ分析のために効果的に利用できる。
以下は、データ層を生成するための処理の動作(operation)のための非限定的な(non−limiting)二つの例である。第一の非限定的な例において、図1に示すように、500のシンボルの列(sequence)を含むオリジナル列は、4つの異なるシンボル「R」、「G」、「B」、及び「Y」がある場合、表現される。本明細書で説明される処理を適用すること、すなわち、シンボル、パターン、又は列を識別し、どのシンボルの列であるか判定するための閾値を適用することは、別のシンボルによって置換され、結果として、図2に示される表になる。この場合、シンボル列は、二つか三つのいずれかのシンボルの組み合わせであるということを表現し、入力列内の出現数として判定される。全てではない列が図2に示されるものの、列の全ての可能性は、考慮される。一番長い列は、データ自身である。それは、一度だけ出現し、必要な反復閾値未満である。
典型的な実施形態によると、図2に示される第一レベル表は、10に等しい又は10よりも大きい閾値等の第一の閾値Tを超えて出現する列のみ含む。閾値Tを超えるこれらの列から、長い列を有するこれらの列のみは、表内に示される列を含む場合、シンボル置換のために使用される。例えば、列「BYY」及び「YY」は従属するものの、長い列は、短い列よりも選ばれる。したがって、図2に描写するように、列「YY」が入力列に28回出現している間、それは8回のみ単独で出現しているのに対して、列「BYY」は、単独で13回出現している。10に等しく又は10よりも大きく決定された閾値とともに、列「BYY」がシンボル「A」によって置換される間、列「YY」は、代用シンボル(substitute symbol)によって置換されない。データ層生成処理ステップの第一の反復後の合成列(resultant sequence)は、図3に示される。図3に示される列は、4シンボルから17シンボル(A, C, D, E, F, H, I, J, K, L, M, N, O, Y, R, G, B)までのシンボル空間内のシンボルの数の増加、及び、初期の列の500のシンボルから後続の列の283のシンボルまで削減された列のシンボルの数の対応する減少を示す。
処理は、シンボル空間を拡大することにより列内のシンボルの数をさらに減少させるために別の反復を実行するとともに継続できる。次の反復において、入力列(図3に示される)は、283のシンボルの削減されたシンボル列を含む。図4は、5に等しい閾値又は5よりも大きい閾値を使用することにより作成される第二レベル表を示す。結果として、シンボルの特定列(certain sequence)は、対応する単独のシンボルによって置換されたそれぞれである。したがって、出力列内のシンボルの数を、20(A, C, D, E, F, H, I, J, K, L, M, N, O, Y, R, G, B, P, S, T)のシンボル空間とともに262のシンボルへ削減できる。第二の反復の結果となる出力列は、図5に示される。
しかしながら、別の反復は、図6の表に示される、閾値が3に等しい、又は、3よりも大きい場合、開示された処理によって実行される。シンボルの合成削減列(resulatant reduced sequence)は、図7に示される。図6の「置換シンボル」の欄(column)内にリストアップされるシンボルから分かるように、シンボル空間は、37のシンボルに増加される。出力シンボル列(図7)は、221のシンボルの長さに削減される。すなわち、500のシンボルのオリジナル長さの半分よりも少ない。それぞれの反復(図3,5,7に示されるように)で生成された列のそれぞれの組は、データ層又は皮質層(皮質のデータ層)として参照されることに留意すべきである。
したがって、開示した実施形態によれば、上記の例のデータ層の生成について、入力データ層において、4のシンボル空間を使用する500のシンボルのシンボル列の組が存在することが理解できる。第二のデータ層において、第一のデータ層処理後、17のシンボル空間を使用する283のシンボルを含むシンボルの列がある。第三のデータ層において、第二のデータ層処理後、20のシンボル空間を使用する262のシンボルを含むシンボルの列がある。最後に、第四のデータ層において、第三のデータ層処理後、37のシンボル空間を使用する221のシンボルを含むシンボルの列がある。
一実施形態において、シンボルは、同時係属の米国特許出願第12/084,150号明細書、及び米国特許出願第12/507,489号明細書だけでなく、米国特許第8,112,376号明細書、米国特許第8,266,185号明細書、米国特許第8,312,031号明細書、及び米国特許第8,326,775号明細書に記載されているような符号(signature)によって置換されてもよい。これらの全ては、共通の譲受人に譲渡され、これらの全てが含む全ての記載は、参照によって、本出願に組み入れられる。
開示されたデータ層生成処理の工程のための第二の非限定的な例において、4つの画像シンボル、直線810、四角形820、円形830、及び三角形840は、図8A〜8Dにそれぞれ示され、実施形態に従って使用される。必要最小限の画像シンボル(basic image symbols)810,820,830,及び840の組み合わせは、図9A,9Bにそれぞれ示され、実施形態に従って使用される住宅(house)910又は椅子920という様々な高レベル画像シンボルをもたらしてもよい。住宅910の画像シンボルは、「住宅」のシンボル画像として認識され、特定の方法で組み合わされた四角形820−1及び三角形840−1からなる。同様に、椅子920の画像シンボルは、「椅子」のシンボル画像として認識され、特定の方法で組み合わされた直線810−1,810−2,810−3,及び810−4の4個のシンボルからなる。
一実施形態によれば、必要最小限の4個の画像シンボル810,820,830,及び840のいずれか一つは、別の必要最小限の画像シンボル810,820,830,又は840に接続ポート(connecting port)で接続される。接続ポートの典型的で非限定的な記号表示(designation)であって、他のポートと区別するために番号を割り振られたそれぞれのポートは、図10A〜10Dにそれぞれ示される。例えば、限定のためではないものの、直線1010は、四角形1020が1,2,3,4,5,6,7,及び8等と番号を割り振られた8個のポートを有する。
それぞれの必要最小限の画像シンボル1010,1020,1030,及び1040のために割当てられた接続ポートの数は、単なる例であり、それぞれの画像シンボルは、より少ない又はより多い接続ポートからなってもよいことを理解すべきである。例えば、それぞれの画像シンボルは、直線は、文字列(character)「A」,四角形「B」,円形「C」,及び三角形「D」を有する等の識別文字列(identification character)によってさらに指定される。したがって、図9Aに示される「住宅」の上位画像は、以下に簡潔に記載される。
D(4)<0°>B(2)
これは、画像シンボル「D」が画像シンボル「B」に「4」及び「2」のポートで、相対配向(relative orientation)0°でそれぞれ接続することを意味する。したがって、同様に、図9Bに示される「椅子」の上位レベル画像は、以下の表記法を使用して簡潔に記載できる。
A(3)<[0°>A(1),90°>A(1),(3)<90°>A(1)]
これは、画像シンボル「A」がポート3を介して、相対配向0°で別の画像シンボル「A」のポート1に接続され、相対配向90°で別の画像シンボル「A」のポート1に接続され、同様に、そのポート3を介して、相対配向90°で別の画像シンボル「A」のポート1に接続される。
このように、一実施形態によれば、パターン識別及びパターン抽出は、データ層(皮質(Cortex))の結果として可能である。図11A,11B,及び11Cは、3個の上位レベルシンボル、「男性」の上位レベルシンボル1110、「女性」の上位レベルシンボル1120、及び「犬」の上位レベルシンボル1130を示し、それぞれの上位レベルシンボルは、図10に示される必要最小限の画像シンボルを含む。したがって、上記に記載された表記方法を使用して、「男性」の上位レベルシンボル1110は、以下のように記載できる。
C(6)<90°>A(1),(2)<0°>A(2)
「女性」の上位レベルシンボル1120は、以下のように記載できる。
C(6)<90°>A(1),(3)<0°>D(1)
そして、「犬」の上位レベルシンボル1130は、以下のように記載できる。
C(6)<90°>A(1),(2)<0°>A(1),(3)<90°>A(2)
一実施形態によれば、共通のパターンは抽出され、相対配向90°で接続ポート「6」を介して直線「A」のシンボルのポート1に接続する円形「C」の必要最小限のシンボルを含む。
C(6)<90°>A(1)
それから、識別されたパターンは、識別されたパターンが発見されたデータ層内のシンボルを受信する。例えば、シンボルΩを抽出した共通のパターンC(6)<90°>A(1)と置換する。したがって、「男性」の上位レベルシンボル1110は、現在のデータ層に以下のように記載できる。
Ω(2)<0°>A(2)
「女性」の上位レベルシンボル1120は、現在のデータ層に以下のように記載できる。
Ω(3)<0°>D(1)
そして、「犬」の上位レベルシンボル1130は、現在のデータ層に以下のように記載できる。
Ω(2)<0°>A(1),(3)<90°>A(2)
したがって、開示された処理を使用することにより、シンボルの数は、このデータ層において増加される。しかしながら、データ組それ自体は、短い。一実施形態において、データ層は、直前のデータ層内において使用されたシンボルの少なくとも一群を含む。さらに、上記の例において、C(6)<90°>A(1)は、共通のパターンである。これは、組み合わせC(6)<90°>A(1)は、第一の閾値Tよりも大きい確率(probability)があることを意味する。このように、新たなラベルΩは、Sk+1に追加されることにより、1ずつシンボル空間が増加される。組み合わせC及びA内のそれぞれの要素の確率は、第二の閾値Tよりも現在、大きいので、それぞれの「オリジナルラベル(original labels)」(C及びA)は、Sk+1から除去される。したがって、開示された処理に利用された閾値は、要素が後続のデータ層で発見されるという一定の確率に基づいている。
図12は、一実施形態に従って入力シンボルの入力列に応答したデータ層の生成を描写する典型的で非限定的なフローチャート1200を示す。ステップS1210において、シンボルの列を含む入力が受信される。シンボルは、信号(signal)等の表現を含む、文字列、画像、音声、動画、及びその他の入力列であってもよい。
一実施形態において、列は、マルチメディアコンテンツ要素のための生成された符号の組を含む。そのような符号は、上記で参照した同時係属の米国特許出願第12/084,150号明細書、米国特許出願第12/507,489号明細書だけでなく、米国特許第8,112,376号明細書、米国特許第8,266,185号明細書、米国特許第8,312,031号明細書、及び米国特許第8,326,775号明細書で説明されるように生成される。
ステップS1220において、全てのシンボルの組み合わせ、すなわち、所定閾値を超える頻度(frequency)(出現数(number of appearances)で出現する二つ以上のシンボルは、識別される。ステップS1230において、ステップS1220で識別されたシンボルの組み合わせの包含した組み合わせ及び派生した組み合わせは、除去される。一実施形態において、これは、使用される合成シンボルの組み合わせ(resultant symbol combination)をさらにフィルタリングするために、付加的な閾値(上述の閾値T等)の使用をさらに必要とする。例えば、シンボル列「YYR」は、図2に描写されるように、入力列(図1)内に識別されるものの、合成データ層(resultant data layer)内に含まれない。
ステップS1240において、残存するシンボルの組み合わせ(remaining symbol combination)は、固有の新たなシンボルによって、それぞれ置換される。一実施形態において、残存するシンボル組み合わせは、入力列内の出現数がシンボル組み合わせをフィルタリングするために使用される所定閾値を超えるシンボル組み合わせである。ステップS1250において、シンボルの合成列は、入力データ層の後続のデータ層としてメモリに格納される。
ステップS1260において、最後に生成されるデータ層のために、付加的なデータ層が派生したか否かチェックする。付加的なデータ層が派生した場合、シンボルの列の新たな入力がステップS1250においてメモリに格納される、ステップS1210を実行する。付加的なデータ層が派生してない場合、実行を終了する。
図13は、一実施形態に従って入力シンボルの入力列に応答してデータ層の生成のための典型的で非限定的なシステム1300を示す。システム1300は、コンピュータの主要部(computational core)等の一つ以上の処理要素を含んでもよい処理ユニット(PU:Processing Unit)を含む。PU1310は、メモリ1320に通信可能に接続される。メモリ1320は、揮発性メモリ及び非揮発性メモリの両方からなり、PU1310に近接又はPU1310から離れていてもよい。メモリ1320は、PU1310によって実行される際に、フローチャート1200について等、上記に詳細に説明した少なくともデータ層生成処理を実行する、メモリ部(memory portion)1325内の命令を含む。
入力シンボルの列は、PU1310に通信可能に結合された入出力インターフェース(Input/Output Inerface)1330を介して外部情報源(external source)から供給されてもよく、又は、メモリ1320から供給されてもよい。データ層を生成するための入力情報源(input source)は、限定をすることなく、音声、動画、接触、匂い、文字列等を含む。さらに、異なる入力データ情報源の組み合わせも可能である。
一実施形態において、システム1300は、PU1310及び/又はメモリ1320に通信可能に接続される符号生成器(signature generator)1340も含む。符号生成器1340は、入出力インターフェース1330に接続される一つ以上の情報源を介して供給されるデータに応答して符号を生成してもよい。生成された符号は、データ層を生成するために、PU1310によって処理される。符号生成器1340及びその機能性のための典型的な実装は、上記に参照される同時係属の米国特許出願第12/084,150号明細書、米国特許出願第12/507,489号明細書だけでなく、米国特許第8,112,376号明細書、米国特許第8,266,185号明細書、米国特許第8,312,031号明細書、及び米国特許第8,326,775号明細書において少なくとも発見できる。
データ層は、複数の属性(properities)を保持する。上位のデータ層は、新たな層が生成されるように、より大きなシンボル空間、すなわち、空間が増加することを実演(demonstrate)する。データ層は、シンボル間の相関関係が低下する間、シンボルが近接する確率の維持もする。薄層化処理(layering process)前に相互に近くにあるシンボルは、薄層化処理が実行された後、接近してもよい。
別の実施形態によれば、データ層は不変性(invariance)を維持する。すなわち、補完する二つのシンボルは、不変の属性(invariant property)を維持する。例えば、入力データ(シンボルの列)が顔である場合、生成されたデータ層は、同一の顔の閉じた目又は開いた目に関して不変である。データ層の生成は、異なる情報源からの入力パターンの組み合わせである共通のパターンを含む。データ層の出力は、索引(indice)の包括的な組(generic set)によって表現される複数の情報源からの情報の融合(fusion)である。
別の実施形態によれば、データ層の全ての属性は、生成された層において重要である。すなわち、例えば、動画と比較した場合、音声情報源は、データ層が関連の共通のパターン(relevant common patterns)を生成することによって音声パターンを抑制することに対して優位(dominant)すぎる。さらに、二つのデータ情報源が相互に関連がある場合、データ層は、無相関の結合した表現(de−correrated fused representation)を生成する。
本明細書に開示された様々な実施形態は、ハードウェア、ファームウェア、ソフトウェア、又はそれらの任意の組み合わせとして実装できる。さらに、ソフトウェアは、プログラムストレージユニット、又は、コンピュータ読み取り可能な媒体上に明確に具体化されるアプリケーションプログラムとして実装されることが好ましい。アプリケーションプログラムは、適切なアーキテクチャを含むコンピュータによってアップロード及び実行されてもよい。コンピュータは、一つ以上の中央演算ユニット(「CPU:Central Processing Units」)、メモリ、及び入出力インターフェース等のハードウェアを有するコンピュータプラットフォーム上に実装されることが好ましい。コンピュータプラットフォームは、OS(operating system)及びマイクロ命令コード(microinstruction code)を含んでもよい。本明細書に記載された様々な処理及び機能は、コンピュータ又はプロセッサが明確に示されていてもいなくても、CPUによって実行されてもよい、マイクロ命令コード、アプリケーションプログラムの一部、又は、それらの任意の組み合わせであってもよい。さらに、様々な他の周辺機器(peripheral unit)は、付加的なデータストレージユニット及び印刷ユニット等のコンピュータプラットフォームに接続されてもよい。さらに、非一時的なコンピュータ読み取り可能な媒体は、信号を伝搬する一時的な媒体を除いた、任意のコンピュータ読み取り可能な媒体である。
本明細書に列挙された全ての例及び条件付き言語(conditional language)は、開示された実施形態及び技術を前進させるための発明者によって寄与された概念を読者が理解するという教育上の目的があり、具体的に列挙された例及び条件等へ限定されることはないとみなされる。さらに、発明の原理、発明の態様、発明の実施形態も、それらの特定の例も列挙する本明細書の全ての文章は、構造的及び機能的にそれらと均等のものを包含する意図がある。付加的に、均等は、既知の均等のものも、将来に開発される均等のもの、すなわち、構造にかかわらず、同一の機能を発揮する開発された任意の要素も含む意図がある。

Claims (11)

  1. パターンのシンボル空間ベースの圧縮のための装置であって、
    処理ユニットと、
    前記処理ユニットに接続されたインターフェースであって、前記インターフェースは、入力列を受信するように構成され、前記入力列は、第一の長さであって複数のシンボルを含むインターフェースと、
    前記処理ユニットに接続されたメモリであって、
    処理ユニットによって実行される際に、
    前記入力列内の全ての共通のパターンを抽出し、共通のパターンは、少なくとも二つのシンボルを含み、
    前記抽出された全ての共通のパターンに基づいて、前記入力列内に頻度閾値を越えて単独で出現する列を抽出し、列は、少なくとも三つのシンボルを含み、
    前記の抽出した列を代用シンボルに置換することにより出力列を生成し、前記出力列は、前記第一の長さよりも短い第二の長さを有し、
    前記出力列をデータ層としてメモリに格納し、
    データ層の後続の生成のための新たな入力列として前記出力列を供給することを実行する複数の命令を格納するように構成されたメモリとを含む装置。
  2. 前記出力列の生成は、所定閾値よりも長さが短い共通のパターンを除去することをさらに含む、請求項1に記載の装置。
  3. 前記複数のシンボルのそれぞれのシンボルは、文字列、画像、音声信号、及び動画信号のいずれか一つである、請求項1に記載の装置。
  4. 前記処理ユニット及び前記メモリに通信可能に接続された符号生成器であって、前記符号生成器は、少なくとも一つのシンボルに応答して少なくとも一つの符号を生成するように構成される符号生成器をさらに含み、
    前記符号生成器によって生成された前記符号は、前記入力列として前記装置に処理される、請求項1に記載の装置。
  5. それぞれの生成されたデータ層は、前記データ層において使用されたシンボルの一群を含む、請求項1に記載の装置。
  6. パターンのシンボル空間ベースの圧縮のためのコンピュータ化した方法であって、
    入力列を受信し、前記入力列は、第一の長さであり、複数のシンボルを含み、
    前記入力列内の全ての共通のパターンを抽出し、前記共通のパターンは、少なくとも二つのシンボルを含み、
    前記抽出された全ての共通のパターンに基づいて、前記入力列内に頻度閾値を越えて単独で出現する列を抽出し、列は、少なくとも三つのシンボルを含み、
    前記の抽出した列を代用シンボルに置換することにより出力列を生成し、前記出力列は、前記第一の長さよりも短い長さである第二の長さを有し、
    前記出力列をデータ層としてメモリに格納し、前記出力列は、データ層の後続の生成のために新たな入力列として供給されることを含む方法。
  7. 出力列の生成は、所定閾値よりも長さが短い共通のパターンを除去することをさらに含む、請求項6に記載の方法。
  8. シンボルは、文字列、画像、音声信号、及び動画信号のいずれか一つである、請求項6に記載の方法。
  9. 少なくとも一つのシンボルに応答して少なくとも一つの符号を生成し、少なくとも一つの符号は、前記入力列として処理されることをさらに含む、請求項6に記載の方法。
  10. それぞれの生成されたデータ層は、前記データ層において使用されたシンボルの一群を含む、請求項6に記載の方法。
  11. コンピュータ上で実行される際に、請求項6の方法を実行する命令を含むコンピュータプログラム。
JP2015510521A 2013-02-12 2013-06-17 パターンのシンボル空間ベースの圧縮のための多層システム Active JP5922841B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361763554P 2013-02-12 2013-02-12
US61/763,554 2013-02-12
PCT/US2013/046155 WO2014126600A1 (en) 2013-02-12 2013-06-17 A multi-layer system for symbol-space based compression of patterns

Publications (2)

Publication Number Publication Date
JP2015519828A JP2015519828A (ja) 2015-07-09
JP5922841B2 true JP5922841B2 (ja) 2016-05-24

Family

ID=51297113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015510521A Active JP5922841B2 (ja) 2013-02-12 2013-06-17 パターンのシンボル空間ベースの圧縮のための多層システム

Country Status (7)

Country Link
US (4) US8922414B2 (ja)
JP (1) JP5922841B2 (ja)
KR (1) KR101655835B1 (ja)
CN (1) CN104583972B (ja)
DE (1) DE112013006650T5 (ja)
GB (1) GB2515938B (ja)
WO (1) WO2014126600A1 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9191626B2 (en) 2005-10-26 2015-11-17 Cortica, Ltd. System and methods thereof for visual analysis of an image on a web-page and matching an advertisement thereto
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US10776585B2 (en) 2005-10-26 2020-09-15 Cortica, Ltd. System and method for recognizing characters in multimedia content
US11003706B2 (en) 2005-10-26 2021-05-11 Cortica Ltd System and methods for determining access permissions on personalized clusters of multimedia content elements
US10387914B2 (en) 2005-10-26 2019-08-20 Cortica, Ltd. Method for identification of multimedia content elements and adding advertising content respective thereof
US10535192B2 (en) 2005-10-26 2020-01-14 Cortica Ltd. System and method for generating a customized augmented reality environment to a user
US10621988B2 (en) 2005-10-26 2020-04-14 Cortica Ltd System and method for speech to text translation using cores of a natural liquid architecture system
US10372746B2 (en) 2005-10-26 2019-08-06 Cortica, Ltd. System and method for searching applications using multimedia content elements
US10691642B2 (en) 2005-10-26 2020-06-23 Cortica Ltd System and method for enriching a concept database with homogenous concepts
US10742340B2 (en) 2005-10-26 2020-08-11 Cortica Ltd. System and method for identifying the context of multimedia content elements displayed in a web-page and providing contextual filters respective thereto
US10949773B2 (en) 2005-10-26 2021-03-16 Cortica, Ltd. System and methods thereof for recommending tags for multimedia content elements based on context
US9558449B2 (en) 2005-10-26 2017-01-31 Cortica, Ltd. System and method for identifying a target area in a multimedia content element
US10360253B2 (en) 2005-10-26 2019-07-23 Cortica, Ltd. Systems and methods for generation of searchable structures respective of multimedia data content
US9286623B2 (en) 2005-10-26 2016-03-15 Cortica, Ltd. Method for determining an area within a multimedia content element over which an advertisement can be displayed
US9477658B2 (en) 2005-10-26 2016-10-25 Cortica, Ltd. Systems and method for speech to speech translation using cores of a natural liquid architecture system
US10607355B2 (en) 2005-10-26 2020-03-31 Cortica, Ltd. Method and system for determining the dimensions of an object shown in a multimedia content item
US10380267B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for tagging multimedia content elements
US10698939B2 (en) 2005-10-26 2020-06-30 Cortica Ltd System and method for customizing images
US8266185B2 (en) 2005-10-26 2012-09-11 Cortica Ltd. System and methods thereof for generation of searchable structures respective of multimedia data content
US9639532B2 (en) 2005-10-26 2017-05-02 Cortica, Ltd. Context-based analysis of multimedia content items using signatures of multimedia elements and matching concepts
US10380623B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for generating an advertisement effectiveness performance score
US9953032B2 (en) 2005-10-26 2018-04-24 Cortica, Ltd. System and method for characterization of multimedia content signals using cores of a natural liquid architecture system
US8312031B2 (en) 2005-10-26 2012-11-13 Cortica Ltd. System and method for generation of complex signatures for multimedia data content
US9218606B2 (en) 2005-10-26 2015-12-22 Cortica, Ltd. System and method for brand monitoring and trend analysis based on deep-content-classification
US10193990B2 (en) 2005-10-26 2019-01-29 Cortica Ltd. System and method for creating user profiles based on multimedia content
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US9396435B2 (en) 2005-10-26 2016-07-19 Cortica, Ltd. System and method for identification of deviations from periodic behavior patterns in multimedia content
US8818916B2 (en) 2005-10-26 2014-08-26 Cortica, Ltd. System and method for linking multimedia data elements to web pages
US9384196B2 (en) * 2005-10-26 2016-07-05 Cortica, Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US9646005B2 (en) 2005-10-26 2017-05-09 Cortica, Ltd. System and method for creating a database of multimedia content elements assigned to users
US11386139B2 (en) 2005-10-26 2022-07-12 Cortica Ltd. System and method for generating analytics for entities depicted in multimedia content
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US9747420B2 (en) 2005-10-26 2017-08-29 Cortica, Ltd. System and method for diagnosing a patient based on an analysis of multimedia content
US9767143B2 (en) 2005-10-26 2017-09-19 Cortica, Ltd. System and method for caching of concept structures
US9330189B2 (en) * 2005-10-26 2016-05-03 Cortica, Ltd. System and method for capturing a multimedia content item by a mobile device and matching sequentially relevant content to the multimedia content item
US10635640B2 (en) 2005-10-26 2020-04-28 Cortica, Ltd. System and method for enriching a concept database
US11620327B2 (en) 2005-10-26 2023-04-04 Cortica Ltd System and method for determining a contextual insight and generating an interface with recommendations based thereon
US9466068B2 (en) 2005-10-26 2016-10-11 Cortica, Ltd. System and method for determining a pupillary response to a multimedia data element
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US10180942B2 (en) 2005-10-26 2019-01-15 Cortica Ltd. System and method for generation of concept structures based on sub-concepts
US9489431B2 (en) 2005-10-26 2016-11-08 Cortica, Ltd. System and method for distributed search-by-content
US9529984B2 (en) 2005-10-26 2016-12-27 Cortica, Ltd. System and method for verification of user identification based on multimedia content elements
US10191976B2 (en) 2005-10-26 2019-01-29 Cortica, Ltd. System and method of detecting common patterns within unstructured data elements retrieved from big data sources
US10614626B2 (en) 2005-10-26 2020-04-07 Cortica Ltd. System and method for providing augmented reality challenges
US9031999B2 (en) 2005-10-26 2015-05-12 Cortica, Ltd. System and methods for generation of a concept based database
US10585934B2 (en) 2005-10-26 2020-03-10 Cortica Ltd. Method and system for populating a concept database with respect to user identifiers
US9372940B2 (en) 2005-10-26 2016-06-21 Cortica, Ltd. Apparatus and method for determining user attention using a deep-content-classification (DCC) system
US11361014B2 (en) 2005-10-26 2022-06-14 Cortica Ltd. System and method for completing a user profile
US11019161B2 (en) 2005-10-26 2021-05-25 Cortica, Ltd. System and method for profiling users interest based on multimedia content analysis
US10380164B2 (en) 2005-10-26 2019-08-13 Cortica, Ltd. System and method for using on-image gestures and multimedia content elements as search queries
US10733326B2 (en) 2006-10-26 2020-08-04 Cortica Ltd. System and method for identification of inappropriate multimedia content
US8922414B2 (en) * 2013-02-12 2014-12-30 Cortica, Ltd. Multi-layer system for symbol-space based compression of patterns
US10061822B2 (en) * 2013-07-26 2018-08-28 Genesys Telecommunications Laboratories, Inc. System and method for discovering and exploring concepts and root causes of events
US9971764B2 (en) 2013-07-26 2018-05-15 Genesys Telecommunications Laboratories, Inc. System and method for discovering and exploring concepts
IT201800006644A1 (it) * 2018-07-09 2020-01-09 Carlo Amanti Metodo per la rappresentazione simbolica di oggetti geometrici digitali

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915041A (en) 1993-03-04 1999-06-22 Unisys Corporation Method and apparatus for efficiently decoding variable length encoded data
US5666114A (en) 1994-11-22 1997-09-09 International Business Machines Corporation Method and means for managing linear mapped address spaces storing compressed data at the storage subsystem control unit or device level
JP3111958B2 (ja) 1997-12-26 2000-11-27 日本電気株式会社 パタン符号化を用いた符号化装置及び符号化方法
US6208273B1 (en) 1999-01-29 2001-03-27 Interactive Silicon, Inc. System and method for performing scalable embedded parallel data compression
DE60100416T2 (de) * 2000-04-28 2004-06-09 Matsushita Electric Industrial Co., Ltd., Kadoma Dekoder für Kode variabler Länge
US6362756B1 (en) 2001-03-28 2002-03-26 Hewlett-Packard Company System and method for compressing data
US7126500B2 (en) 2002-06-26 2006-10-24 Microsoft Corporation Method and system for selecting grammar symbols for variable length data compressors
US7546158B2 (en) 2003-06-05 2009-06-09 The Regents Of The University Of California Communication methods based on brain computer interfaces
JP4548184B2 (ja) * 2005-03-31 2010-09-22 富士通株式会社 圧縮規則生成方法、圧縮通信装置及びプログラム
US8266185B2 (en) 2005-10-26 2012-09-11 Cortica Ltd. System and methods thereof for generation of searchable structures respective of multimedia data content
WO2011105463A1 (ja) * 2010-02-23 2011-09-01 日本電気株式会社 データ圧縮装置、データ圧縮方法およびプログラム記憶媒体
WO2012030262A1 (en) 2010-09-03 2012-03-08 Telefonaktiebolaget Lm Ericsson (Publ) Co-compression and co-decompression of data values
CN102033924B (zh) * 2010-12-08 2012-10-31 浪潮(北京)电子信息产业有限公司 一种数据存储方法和系统
EP2530843A3 (en) 2011-06-03 2013-01-02 Alcatel Lucent Dictionary based data compression
JP6123975B2 (ja) 2011-07-29 2017-05-10 パナソニックIpマネジメント株式会社 特徴量抽出装置及び特徴量抽出方法
US8922414B2 (en) * 2013-02-12 2014-12-30 Cortica, Ltd. Multi-layer system for symbol-space based compression of patterns

Also Published As

Publication number Publication date
US20140225757A1 (en) 2014-08-14
KR20150127101A (ko) 2015-11-16
US20150102948A1 (en) 2015-04-16
CN104583972B (zh) 2016-05-11
DE112013006650T5 (de) 2015-12-31
CN104583972A (zh) 2015-04-29
GB2515938B (en) 2016-02-10
JP2015519828A (ja) 2015-07-09
US8922414B2 (en) 2014-12-30
GB201417750D0 (en) 2014-11-19
US9197244B2 (en) 2015-11-24
US20160328863A1 (en) 2016-11-10
GB2515938A (en) 2015-01-07
US20160079997A1 (en) 2016-03-17
WO2014126600A1 (en) 2014-08-21
KR101655835B1 (ko) 2016-09-08
US9691164B2 (en) 2017-06-27
US9438270B2 (en) 2016-09-06

Similar Documents

Publication Publication Date Title
JP5922841B2 (ja) パターンのシンボル空間ベースの圧縮のための多層システム
Li et al. Mid-level deep pattern mining
Mao et al. Explain images with multimodal recurrent neural networks
Furuya et al. Dense sampling and fast encoding for 3D model retrieval using bag-of-visual features
CN106570141B (zh) 近似重复图像检测方法
JP2019008778A (ja) 画像の領域のキャプション付加
Pedrosa et al. From bag-of-visual-words to bag-of-visual-phrases using n-grams
CN109933656A (zh) 舆情极性预测方法、装置、计算机设备及存储介质
CN111696635A (zh) 疾病名称标准化方法及装置
Manger Large-scale tattoo image retrieval
JP5955925B2 (ja) カスケード式のオーバ・コンプリート・ディクショナリに基づいた画像認識システム
CN114287000A (zh) 信息检索和/或可视化方法
JP2013196680A (ja) 共学習に基づく概念認識方法および概念認識装置
CN113487024A (zh) 交替序列生成模型训练方法、从文本中抽取图的方法
CN114328988A (zh) 多媒体数据的特征提取方法、多媒体数据检索方法及装置
Gupta et al. Visual semantic-based representation learning using deep CNNs for scene recognition
Kulkarni et al. An effective content based video analysis and retrieval using pattern indexing techniques
Gupta et al. Recognition of varying size scene images using semantic analysis of deep activation maps
Zhu et al. Multi‐image matching for object recognition
CN110047569A (zh) 基于胸片报告生成问答数据集的方法、装置及介质
Rui et al. Data Reconstruction based on supervised deep auto-encoder
Mehta et al. Adaptive Near Duplicate Image Retrieval Using SURF and CNN Features.
Chambers et al. Character-based models for adversarial phone extraction: Preventing human sex trafficking
Wang et al. Learning to parameterize visual attributes for open-set fine-grained retrieval
CN113515662A (zh) 一种相似歌曲检索方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20150610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150616

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160414

R150 Certificate of patent or registration of utility model

Ref document number: 5922841

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250