JPH07203400A - マルチメディアレンダリングマーカーとその使用方法 - Google Patents

マルチメディアレンダリングマーカーとその使用方法

Info

Publication number
JPH07203400A
JPH07203400A JP6246654A JP24665494A JPH07203400A JP H07203400 A JPH07203400 A JP H07203400A JP 6246654 A JP6246654 A JP 6246654A JP 24665494 A JP24665494 A JP 24665494A JP H07203400 A JPH07203400 A JP H07203400A
Authority
JP
Japan
Prior art keywords
information
rendering
analog
digital
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6246654A
Other languages
English (en)
Inventor
Pii Ropuresutei Danieru
ピー. ロプレステイ ダニエル
Esu Sandobaagu Jiyonasan
エス.サンドバーグ ジヨナサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JPH07203400A publication Critical patent/JPH07203400A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/081Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division the additional information signals being transmitted by means of a subcarrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3204Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium
    • H04N2201/3205Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium of identification information, e.g. name or ID code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3212Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a job, e.g. communication, capture or filing of an image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3271Printing or stamping

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Television Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 メインチャンネルアナログ情報の生成と再生
に関する広範な情報、例えば、誤り訂正符号化、スキャ
ニング順序符号化、対象物同定、および、アナログ情報
生成用アルゴリズムなど、について、生成用あるいは前
処理用コンピューターと認識用コンピューターとの間の
通信を可能とすること。 【構成】 アナログレンダリングのサイドチャンネルに
符号化され供給されているマーカーがアナログレンダリ
ングに関するディジタル情報を供給し、同時に、マーカ
ーは、レンダリングを供給される。プリント、手書き、
絵文字、あるいはビデオ通信レンダリングに組込まれ
た、知覚可能ではあるが邪魔にならない、コンピュータ
ー解釈可能な符号化や、また、オーディオレンダリング
における、音声信号だが邪魔にならずコンピューター知
覚可能な符号化が、それらのメディア上での利用可能な
「サイドチャンネル」の帯域を利用して記録又は伝送さ
れる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は主として知覚可能なアナ
ログ情報に付随して供給される、知覚可能で、ディジタ
ルで、それらとともに供給されるアナログ情報の再生な
いしは処理における「認識コンピューター (reco
gnizing computer)」での使用を目的
としたコンピューター認識可能情報の供給に関する。よ
り詳細に言えば、知覚可能ではあるが邪魔にはならない
「サイドチャンネル」に、「メインチャンネル」の内容
に付随するディジタル情報を同時に提供することによっ
て、アナログ内容情報をコンピューターで解釈、再生、
ならびに、使用することに関する。
【0002】
【従来の技術】アナログ情報に付随して、その強化情報
を提供することは、通信されたアナログ情報をより確実
なものとするために、よく用いられる手段である。強化
情報というのは、いくつかの例をあげると、たとえば、
プリントされたテキストのBraille「変換」(点
字)の形を取ることもあるだろうし、聴取障害のあるテ
レビジョン視聴者のためのテレビジョンプログラムの閉
回路字幕放送、サブタイトル文字、あるいは、フィルム
中に収録されている外国語対話場面の吹き替えオーディ
オ変換などである場合もあるだろう。これらの例では、
強化情報が対応している特定のアナログ情報の内容は、
全て、アナログ情報のためのメディアと同一のメディア
を通して、対象ユーザーにも知覚され得る形で受信され
る。アナログ情報の強化、同定あるいは解釈用の付加的
情報を提供するいま一つの方法には、物品の識別ならび
に/あるいは値段付けのためのバーコード、文書同定な
らびに再生用のコンピューター常駐文書による絵文字符
号化(例えば、Johnson らによる米国特許 5,
060,980号に述べられているゼロックス技術)、
ビデオカセット録画の自動頭出し用の VCR 強化シス
テム、などがある。後の2つの例は、アナログ情報につ
いて、ある限られた量のデータを提供するもので、その
データはアナログ情報に全面的に対応しているわけでは
ない。先行技術システムのまず第1のグループでは、情
報は、その対象としている人間の知覚に対して供給され
ており、一方、第2のグループでは、情報はその対象と
している機械における使用のために供給されている。符
号化された同定ならびに変換用の情報が特に適合してい
る機械の類にはコンピューター認識システムがある。コ
ンピューター認識システムは、非常に広範な種類のメデ
ィアにレンダリングされたアナログ情報の認識ならびに
再生用として発達してきている。例えば、そのようなシ
ステムは、手書き情報、絵でレンダリングされたデー
タ、音声ならびに非音声オーディオ、アナログ情報のビ
デオ化、プリントされた媒体、などの認識用として発展
してきている。
【0003】プリント媒体の領域では、光学式文字読取
りシステムが、その効率と確度についてかなり洗練され
たレベルにまで到達している。しかし、100%以下の確度
は、機械介入による折角の省力化が人手による「あと処
理」によって完全に無効にされてしまうために、一般的
には受入れ難いものである。にもかかわらず、コンピュ
ーター認識ならびに同定の分野における進歩や、それに
よってもたらされるアナログ情報の同定、認識、解釈な
らびに再生などについての強化は、当該技術を、広範囲
な受け入れと使用が実現されるだけの確度レベルにまで
高めるのに必要なことである。発明者による2件の先行
する米国特許出願(米国出願番号07/958.93
8、1992年10月9日出願の「サーティフィキット
可能光学的文字認識」、ならびに、米国特許出願番号0
8/138,467、1993年10月15日出願の
「プリント文書の光学的文字認識強化のための方法と手
段」)に詳細に述べてあるように、光学的文字読取りシ
ステムにおいて、文書上のアナログプリント情報やレイ
アウトの詳細の認識や再生の支援用に、プリント文書上
に組込まれた符号化データ依存形の文書マーカーが提案
されている。上記の特許出願の教えるところは、参照文
献の形で本出願の内容に組込まれている。この参照され
ている特許出願においては、まず、プリントアナログ情
報を生成あるいは前処理する際、データ依存形の単数あ
るいは複数の数値発生に適用されるコンピューターによ
って供給されたプリントアナログ情報とともに、第1の
数値化された単数あるいは複数の数値を伝達するための
方法が提供されている。関連するコンピューター認識シ
ステムは、認識プロセスで再生されるアナログデータに
対して、同じくデータ依存形単数あるいは複数の数値発
生に適用され、更に、レイアウトの存在、位置、ならび
にその特性や、再生されたアナログ情報中での置換、脱
落、挿入などの誤りを確認するために、この再生時に発
生された単数あるいは複数の数値を先の最初に発生され
た単数あるいは複数の数値と比較するのにも適用され
る。誤りの位置同定に加えて、誤り訂正が、この出願中
特許の文書マーカー符号化システムによって実現されて
いる。
【0004】前記のもの以外に必要なものには、誤り訂
正やアナログレンダリングの内容に関するレイアウト情
報のみならず、レンダリングのアナログ内容の生成につ
いての情報(例えば、文書生成に用いたコンピューター
プログラムの同定)も供給できるマーカー符号化システ
ムがある。更に、マーカー符号化の概念は、種々のメデ
ィア(例えば、プリント、オーディオ、ビデオ、手書
き、絵文字によるレンダリング)でレンダリングされた
アナログ内容の情報のコンピューター認識ならびに再生
に用いるための知覚可能情報を含むように拡張できるだ
ろう。受信コンピューターが常駐形のアナログデータの
ディジタル変換版を内蔵して絵文字をそのアクセスに使
っているだけの絵文字技術とは違い、サーティフィキッ
トの概念の拡張はアナログレンダリングに認識システム
コンピューターによる正確な再生に必要なすべての情報
を与えるものである。
【0005】
【発明が解決しようとする課題】したがって、同時伝送
アナログ情報の正確な認識と再生を目的とするコンピュ
ーター認識システムに使用可能なサイドチャンネル情報
を供給することが本発明の目的である。また、アナログ
レンダリングの内容についての情報を符号化し、アナロ
グ情報として知覚可能ではあるが邪魔にはならない方法
で同一のメディア上に符号化情報を供給することが本発
明の更なる目的である。符号化情報を、アナログ情報の
直接の利用者である人間にも知覚し得るように準備する
とともに、認識用コンピューターによっても知覚され、
解釈され、用いられるよう供給することも本発明のいま
一つの目的である。コンピューター認識と再生実行時に
アナログレンダリングに混入する誤りについての訂正の
手段と方法を提供することも本発明のもう一つの目的で
ある。レンダリングのコンピューター認識と再生の期間
中、認識される対象物の範囲を改善することも本発明の
なおもう一つの目的である。なお本発明で用いる用語、
レンダリングとは、メインチャンネルの情報の概要、構
成の理解を助けるため、サイドチャンネル情報によっ
て、光学的、音響的な、また静的、動的な形での描出、
表現、伝達をすること、及びそのために、記号、パター
ン、音の列、動画上のある場所の明度などの時間的変
化、などの種々の形により、光学的、音響的、静的、動
的に表示する信号の形態、構造などを言う。
【0006】
【課題を解決するための手段】以上に述べてきた目的や
その他の目的は、一連のアナログ・メインチャンネル情
報を生成する第1のコンピューターが、そのメインチャ
ンネル情報の内容に関するサイドチャンネル情報を符号
化し、そのサイドチャンネル情報をメインチャンネルの
アナログ情報と同時に同一の知覚可能メディアにのせて
サイドチャンネル情報として伝達することで、本発明に
よって実現される。プリント、手書き、絵文字、あるい
はビデオ通信レンダリングに組込まれた知覚可能ではあ
るが邪魔にならない、コンピューター解釈可能な符号化
が、また、オーディオレンダリングにおける、可聴で、
邪魔にならないコンピューター知覚可能な符号化が、そ
れらのメディア上での利用可能な「サイドチャンネル」
の帯域を利用して、メインチャンネルアナログ情報の生
成と再生に関する広範な情報、例えば、誤り訂正符号
化、スキャニング順序符号化、対象物同定、および、ア
ナログ情報生成用アルゴリズムなど、について、生成用
あるいは前処理用コンピューター=認識用コンピュータ
ー間の通信を可能としている。これに加えて、前処理用
コンピューターは、特に、レンダリングを生成するもの
ではないが、スキャンや符号化の処理ができ、認識用コ
ンピューターによるアナログレンダリングの認識を正確
なものとすべく、レンダリングに対して発明の符号化を
組入れることができる。
【0007】請求項1の発明のレンダリングは、アナロ
グ情報を具備する少なくとも1つの第1の成分と、前記
のアナログ情報をスキャンし認識するために適用される
コンピューターによって使われる目的で符号化された知
覚可能なディジタル情報を具備する少なくとも1つの第
2の成分と、を具備する構造をもつ。
【0008】請求項2の発明は、請求項1の発明のレン
ダリングにおいて前記のディジタル情報が前記のアナロ
グ情報に割当てられた少なくとも1つの誤り訂正符号を
具備する。
【0009】請求項3の発明は、請求項1の発明のレン
ダリングにおいて前記のディジタル情報が前記のアナロ
グ情報の生成に関する符号化情報を具備する。
【0010】請求項4の発明は、請求項1の発明のレン
ダリングにおいて前記の第1と第2の成分が時間変化情
報を具備する。
【0011】請求項5の発明は、請求項4の発明のレン
ダリングにおいて前記の第1と第2の成分がオーディオ
情報を具備する。
【0012】請求項6の発明は、請求項5の発明のレン
ダリングにおいて前記の第1と第2の成分が機械受信可
能なフォーマットで準備されている。
【0013】請求項7の発明は、請求項4の発明のレン
ダリングにおいて前記の第1と第2の成分がビデオ情報
を具備する。
【0014】請求項8の発明は、請求項7の発明のレン
ダリングにおいて前記の情報が機械読取り可能なシンボ
ル化技術で準備されている。
【0015】請求項9の発明は、請求項3の発明のレン
ダリングにおいて前記の第1と第2の成分がプリントさ
れた情報を具備する。
【0016】請求項10の発明は、請求項9の発明のレ
ンダリングにおいて前記の第2の成分が機械読取り可能
なシンボルでプリントされている。
【0017】請求項11の発明は、無誤り認識に適用す
るアナログレンダリングを提供するための方法であっ
て、少なくとも1つの第1のディジタル値を前記のアナ
ログレンダリングに割当てることによって、前記のアナ
ログレンダリングを処理するステップ、および、前記の
少なくとも1つのディジタル値を前記のアナログレンダ
リングで知覚可能に供給するステップ、を具備する。
【0018】請求項12の発明は、請求項11の発明の
方法において前記の割当てが前記のアナログレンダリン
グの生成に関するディジタルデータの符号化を具備す
る。
【0019】請求項13の発明は、請求項11の発明の
方法において前記の割当てが前記のアナログレンダリン
グの内容に依存するディジタルデータの符号化を具備す
る。
【0020】請求項14の発明は、請求項13の発明の
方法において前記の符号化が前記のアナログレンダリン
グに対する誤り訂正を具備する。
【0021】請求項15の発明は、請求項11の発明の
方法において前記の割当てが前記のアナログレンダリン
グの内容に対する空間的分割スキャニング順序情報の符
号化を具備する。
【0022】請求項16の発明は、請求項11の発明の
方法において前記の供給が機械受信可能なフォーマット
での前記の少なくとも1つの第1のディジタル値の生成
を具備する。
【0023】請求項17の発明は、請求項11の発明の
方法において前記のアナログ情報がオーディオ情報を具
備し、また、前記の少なくとも1つのディジタル値がオ
ーディオディジタル情報を具備している。
【0024】請求項18の発明は、請求項11の発明の
方法において前記のアナログ情報がビデオ情報を具備
し、また、前記の少なくとも1つのディジタル値が目に
見える時間変化ディジタル情報を具備している。
【0025】請求項19の発明は、請求項11の発明の
方法において前記のアナログ情報が画像情報を具備し、
また、前記の少なくとも1つのディジタル値が目に見え
るディジタル情報を具備している。
【0026】請求項20の発明は、少なくとも1つの知
覚可能なディジタル符号化を含む第1のアナログ情報の
無誤り再生を行なう方法であって、前記の第1のアナロ
グ情報と前記の少なくとも1つのディジタル符号化をス
キャニングするステップ、前記の少なくとも1つのディ
ジタル符号化を復号するステップ、および、第2のアナ
ログ情報を生成するステップ、を具備する。
【0027】請求項21の発明は、請求項20の発明の
方法において前記の第2のアナログ情報を生成するため
に前記の復号されたディジタル情報の適用をさらに含
む。
【0028】請求項22の発明は、請求項21の発明の
方法において前記の少なくとも1つのディジタル符号化
が前記の第1のアナログ情報に対する誤り訂正符号化を
含み、また、前記の適用が前記の第2のアナログ情報中
の誤りの位置同定とその訂正を具備する。
【0029】請求項23の発明は、請求項22の発明の
方法において前記の誤り訂正符号化が前記の第1のアナ
ログ情報について計算される。
【0030】請求項24の発明は、請求項21の発明の
方法において前記の少なくとも1つのディジタル符号化
が前記の第1のアナログ情報の生成に対するディジタル
情報を含み、また、前記の適用が前記の第2のアナログ
情報の生成についての前記の第1のアナログ生成情報の
使用を具備する。
【0031】請求項25の発明は、請求項21の発明の
方法において前記の第1のアナログ情報がプリントされ
た情報を具備し、前記の少なくとも1つのディジタル符
号化が、空間的に分割されたスキャニング順序を含んで
いる。
【0032】請求項26の発明は、請求項21の発明の
方法において前記の第1のアナログ情報がプリントされ
た情報を具備し、前記の少なくとも1つのディジタル符
号化が前記の第1のアナログ情報の生成についてのディ
ジタル情報を含んでおり、前記の第1のアナログ情報か
らでは、何れのディジタル情報であるか明らかでない。
【0033】請求項27の発明の時間変化マーカー(時
間軸上の変化によるマーカー)は、アナログ情報につい
ての知覚可能なディジタル情報を有し、そのアナログ情
報と一緒に同じメディアムで伝送されるよう作られてい
る。
【0034】請求項28の発明は、請求項27の時間変
化マーカーにおいて前記のアナログ情報がオーディオ情
報を具備し、前記のディジタル情報が干渉を与えない可
聴音を具備する。
【0035】請求項29の発明は、請求項27の時間変
化マーカーにおいて前記のアナログ情報がビデオ情報を
具備し、前記のディジタル情報が目に見えるディジタル
・ピクセルパターンを具備する。
【0036】請求項30の発明は、請求項27の時間変
化マーカーにおいて前記のアナログ情報がビデオ情報を
具備し、前記のディジタル情報が干渉を与えない可聴音
を具備する。
【0037】請求項31の発明は、請求項27の時間変
化マーカーにおいて前記のアナログ情報がビデオ情報を
具備し、前記のディジタル情報が干渉を与えない可聴音
と目に見えるディジタル・ピクセルパターンを具備す
る。
【0038】請求項32の時間変化マーカーは、前記の
アナログ情報の生成に関する知覚可能なディジタル情報
を具備するアナログ情報と同じメディアムで伝送され
る。
【0039】請求項33の時間変化マーカーは、前記の
アナログ情報に対して空間的分割されたスキャニング順
序の知覚可能なディジタル情報を具備するアナログ情報
と同じメディアムで伝送される。
【0040】
【作用】以下に、本発明を、特に付属の図面を参照し
て、より詳細に述べる。付属図面には以下のものがあ
る。図1は、本発明が適用できる各種のメディアを表示
する図であり、その中で、それらのメディアに対して認
識や再生について、現時点で実現可能な確度の程度を示
している。図2は、本発明とともに用いるよう適用でき
る光学的文字認識(OCR)システムを図示している。
図3Aおよび図3Bは、スプレッドシート形レンダリン
グの見掛け上、ならびに意味上の内容をそれぞれ図示し
ている。図4は本発明の方法に従うプロセスのフローチ
ャートを示している。
【0041】本発明は、物理的なレンダリングメディア
が信頼性のあるサイドチャンネルの確立を可能とすると
ころであれば、どこでも、そのようなサイドチャンネル
を、知覚可能かつ機械使用可能な情報の「マーカー」
の、そのマーカーが属しているメイン内容情報の伝送と
の同時供給に利用することができる。サイドチャンネル
の存在に加えて、本発明実行のための基本的な要件は、
サイドチャンネル情報の表現可能で信頼性のある符号化
のためのシンボル化技術が存在することである。上で、
「サイドチャンネル」と呼んだが、マーカーを搬送して
いるレンダリングの部分はメイン内容のチャンネルと分
離された別個のものではない。むしろ、レンダリングメ
ディアムの利用可能な帯域のうちの他の目的には使われ
ていない部分のことである。サイドチャンネルマーカー
によって提供することのできる情報は、認識対象物(空
間的、時間的、ならびにレンダリングのディジタル表示
で埋め込まれたグラフィック情報などを含むが、それら
に限られるものではない)の数とタイプを拡大すること
ができ、また、誤り訂正を提供することができ、それ以
外の方法ではスキャニングコンピューターに取込めなか
ったレンダリングについての意味上の情報を供給するこ
ともできる。本明細書と特許請求範囲を通じて、「対象
物」とか「項目」言う単語は、レンダリングメディアの
種類にかかわらず、また、可視、可聴のいずれであるか
にかかわらず、すべてのレンダリングされるべき情報に
わたって、認識すべきメインチャンネル情報を指すのに
用いられる。
【0042】レンダリングにかけることのできるデータ
量の限度は物理的メディアに対するディジタイジング・
スキャナーの技術的性能、計算時間によるコスト、メデ
ィアの利用可能空きバンド幅、などに依存している。話
音または非話音オーディオの認識能力の強化に対して、
一連の可聴音がサイドチャンネル中ではマーカーとして
の働きをする。光学的文字認識装置(OCR)では、前
述の同時出願の特許申請で議論されたように、ページの
一部が人間ユーザーに対しては知覚可能である必要はな
いが、知覚可能なマーカー用に使われる。静止画ならび
に動画に対しては、画像フレームの一部が強化マーカー
用のサイドチャンネルとして働く。
【0043】
【実施例】本発明が適用できる標準的メディアの代表例
が図1に概略示してある。図中に示されているように、
各メディアムに対して、利用できる次元、現時点の技術
で利用可能な認識ならびに再生の確度、各メディアムに
対応するスキャナーの例、などが詳しく示されている。
当該技術分野に精通した何人にとっても明らかなよう
に、符号化の機能を展開させるためには、レンダリング
中に認識さるべき対象物の一連の符号化が樹立されてい
なければならない。話音のごとき、1次元のレンダリン
グに対しては、時間的に、1つの対象物(単語、あるい
は、その他の発声)が次の対象物に続いて起こるもので
あり、したがって、そのスキャニングの順序は本来的に
決められている。同様に、典型的なプリント文書に対し
て、英語テキストの場合、左から右へ、上から下へ(他
のレンダリング言語に対しては、当然了解されるよう
に、その他の順序があり得るが)、という標準的なスキ
ャニングの順序が一般的に認識コンピューターによって
自動的に適用される。しかしながら、プリント文書がグ
ラフィックやその他の非標準的なレイアウト特性を含む
場合には、スキャニングコンピューターは、それらの内
容を効果的に認識するために、そのページの紙面を如何
に分解するかを「話され」ていなければならない。更
に、多重に録画された動画のごとき多次元のレンダリン
グに対しては、認識さるべき対象物の順序付けが、多重
画像の次元(例えば、時間、フレーム、フレーム中の位
置、カラー、などの)や多重音声次元(例えば、複数話
者、複数サウンドトラック、などの)が起こり得るとい
う事実のために、更に複雑になってくる。本発明のマー
カーは、したがって、上に出てきた誤り訂正や生成情報
のみならず、参照すべき空間の分解のためのスキャニン
グの順序に関する情報についても、それらを組込んでい
なければならない。さらに、2、3の複数のマーカー
が、いくつかの個々に独立のメディア(例えば、音と動
画のごとき)に対して同時に送出されることもあり得
る。
【0044】以下のモデルは、次のような状況を設定し
ている。すなわち、もしディジタルスキャニングの過程
が、ソースのレンダリングに近いスキャニング結果のレ
ンダリングを再生できるのであれば、簡単な誤り訂正技
術が残りの誤りを除去でき、一方、更に、マーカーに符
号化して組込まれている意味上の情報がレンダリングの
追加的な確度情報を提供することができる。区分化され
た参照空間 S(すなわち、Z×Z, Zn×Zn, Z×Z
×Z, など )を仮定する。ただし、S はセット Bi,
i, Di と、Bi,Ci,Di⊂S である。そこで、大か
っこで囲まれたSの添え字付きのサブセット{Bi}=
{B12 ...BN}は S についてのサブセットの並
びを表わすことになる。一般的に、ひと組の大かっこ
{ }は、要素の並びを表わすものとしている。ディジ
タルデータをレンダリングするメディアには非常に種々
のバラエティーがあり得るので、参照空間の定義は抽象
的にならざるを得ない。最もありふれたメディアは、参
照空間が Zn×Zm であるプリントページ上のテキスト
のレンダリングについてのものである。その他の重要な
参照空間には、聞き取り限界以上にある(話者一人の場
合の)音声英語を表わす1次元空間 Z、スクリーン上
に投影されたフルモーションビデオを表わす3次元空間
m×Zn×Zp、などがある。参照空間は、1ページの
プリントページに対するレンダリングの場合のように、
有限でもあり得るし、あるいは、聞き取り限界以上に対
するレンダリングの場合のように、無限であることもあ
り得ることに注意すべきである。
【0045】アルファベットは、レンダリングで認識さ
るべき個々の要素、あるいは、対象物を表わしている。
アルファベットは Σ で表わされる。すなわち、αi
ii∈Σ である。Σ* をΣ上の列のセットとしよう。
参照空間によって、アルファベットの性質はそれぞれ非
常に異なってくる。もし、参照空間が2次元の紙片に対
応するものとすれば、アルファベットは、単に普通の言
語で使われているアルファベットに過ぎない。もし参照
空間が一連の音声英語であれば、アルファベットは個々
の音韻に対応することになる。符号化機能は、まず、ア
ルファベットの要素、あるいは、認識さるべき画像を伴
った対象物を非負の整数にマッピングする機能として定
義される。第2に、レンダリングは、参照空間のサブセ
ットに対してアルファベット要素の割り当てを記述する
ことであり、それによって、参照空間内でのアルファベ
ット要素の画像の位置とレイアウトを表現することがで
きる。第3に、ディジタルスキャン関数Dは既存の物理
的レンダリングのディジタイジングの過程をモデル化し
ている。レンダリングのアナログ画像とディジタル画像
の間のディジタルスキャン変換は誤りが入り込むポイン
トである。第4に、レンダリング空間の全体にわたって
定義された計測機能dが2つのレンダリングが「近い」
場合、正確に定義するのに使われる距離の概念を確立す
る。最後に、サーティフィキット機能Fが前処理の期間
中に計算され、データ再生に用いられるサイドチャンネ
ルデータを記述する。
【0046】前処理計算を行なう符号化関数はε:Σ
→ Z として定義される。符号化関数は、レンダリング
のサーティフィキットアルファベットの範囲内でできる
だけ簡単なものであればよい。符号化関数に対する、こ
れ以外の選択としては、たとえば、ASCII、日本工
業規格(JIS)、あるいは、Huffman 符号な
どが、レンダリングによって生ずるアルファベットの並
びの構造に依存して特に選ばれる。例えば、ある符号化
は、英語テキストよりも日本語テキストの再生をより高
い信頼性をもって実行することができ、また、その逆も
あり得る。なお、他の対象物の符号化が話音や画像の表
示に適当な場合もある。特定の符号化関数が、よりよい
誤り余裕度、あるいは、より高速なデータ再生を提供す
るためにサーティフィキット関数と整合するよう選ばれ
ることもあり得る。ディジタルに表現された対象物の画
像が如何にして参照空間によってモデル化されたメディ
ア上の方向付けと位置決めされるかを記述する機能が必
要となる。これらの画像の方向付けと位置決めがレンダ
リングと呼ばれているものである。例えば、テキストは
ページ上でレンダリングされ、単語は音響的にレンダリ
ングされ、また、運動する対象物はテレビジョンスクリ
ーン上で視覚的にレンダリングされる。したがって、定
義したように、レンダリングとは、アルファベットΣの
要素のサブセット S の並びの要素への割り当て、すな
わち、サブセットの並びにおける各要素 Bi⊂S 、
{B12 ...BN}を要素 αi に割り当てることで
ある。ここでαi は αi∈Σ である。
【0047】個々のサブセット Bi⊂S は、各サブセ
ットにレンダリング、すなわち、割り当てられたアルフ
ァベットの1つの要素だけが存在するように参照空間を
分割する。 ここで、R (S)は S 中のレンダリング
のセットである。このような抽象的な分割は、交叉、あ
るいは、オーバーラップしているアルファベット要素、
可変分解能レンダリングの解釈、多重対象物の解釈、な
どについてのモデリングを可能とするものである。この
場合、サブセットは一定のサイズや形である必要はな
く、また、参照空間全体をカバーしていてもカバーして
いなくてもかまわない。参照空間の分割に加えて、レン
ダリングはまた、サブセット Bi についての番号付け
を確立しなければならない。レンダリングの番号付け
は、Σに関して誘導される並びを定義するのに用いられ
る。誘導される並びについて(あるいは、誘導される並
びの空間、すなわち言語について)注意深く解析するこ
とによって、特に、サーティフィキット関数の選択に関
して、データ伝送過程の能力と性能を増大することがで
きる。
【0048】列の連鎖の操作は、セット中の連続する要
素を、seq1seq2seq3...あるいは、αβ...γ
のようにリストアップすることによって表わすことがで
き、それらの要素は、参照空間に対するレンダリングの
空間であり、参照空間はRi,seqi∈R(S)であ
る。レンダリング R0, R1, ならびに R2 は、それぞ
れ、
【0049】
【数1】
【0050】である。いずれのレンダリングにしても、
たとえば、R0、はアルファベットΣについて並びを生
成する。R0 の場合には、生成された並びは α1α2...
αN ∈Σ* である。与えられた R(S)のサブセット
に対して、Σ* に含まれる並びの対応するセットはレン
ダリングのサブセットの言語と呼ばれている。例えば、
この文書で用いられるレンダリングのセットに対して、
レンダリングのサブセットの言語は英語言語のサブセッ
トである。
【0051】ディジタル・スキャン関数は、実際のディ
ジタル・スキャニング過程で見られるような誤りの混入
に対するモデルを提供している。ディジタル・スキャニ
ング過程によって行なわれる要素ごとの解釈機能は、
I:R(S)×R(S)→R(S)がS上の空間のレン
ダリングのそれ自身とのデカルト積をR(S)にマップす
ることである。すなわち、
【0052】
【数2】
【0053】ディジタル・スキャン関数は、添え字指数
の順序を用いたレンダリングのサブセット Bi のおの
おのに対して解釈機能を適用することとして定義でき
る。それによって、D:R(S)→R(S) は参照空
間 S のレンダリングをそれ自身にマップする。j1
2,...,jN を列 1,2,...,N の任意の
順列とすれば、
【0054】
【数3】
【0055】このようなレンダリング R0 の「ディジ
タルスキャン」は、レンダリング R1 をつくる際、明
らかに、追加、脱落、置換、交換(他の操作との間の)
などが起こり得る。明らかに、ディジタル・スキャンは
もとのものと関連性の低い新しいレンダリングを生ずる
可能性を持っている。しかしながら、Dを定義する際の
要点は、スキャニングによって混入する誤りを可能な限
り制限されたセットで表現する機構を樹立することであ
る。例えば、文字「l」を数字「1」に、文字「o」を
数字「0」に、ランダムに置換してしまう誤りだけを起
こすOCRスキャナーを表現することは可能である。
【0056】R(S)の要素間の距離の概念は、レンダ
リングすべき空間にわたって、距離の計測尺度を定義す
ることを要求する。もし、2つのレンダリング、R0
1とが、計測尺度が定義された上で、小さな距離だけ
隔たっていると言われる場合、一方のレンダリング、例
えば、R0からの距離が計算できる関数を見出さなけれ
ばならない。このような関数が見出されれば、誘導され
たアルファベットの並びをR0から導出されるアルファ
ベットに変換することが可能となる。レンダリング空間
計測尺度は、したがって、d:R(S)×R(S)→
+ である。計測尺度関数は、デカルト積R(S)×R
(S)を非負整数にマップする。選ばれた計測尺度関数
は以下の条件を満足しなければならない。:
【0057】
【数4】
【0058】ディジタル・スキャン関数によって混入す
る誤りの性質は、選択した計測尺度の適合性を決定する
ものである。レンダリング空間計測尺度は、したがっ
て、1つのレンダリングから導出されるアルファベット
をいま1つのレンダリングから導出されるアルファベッ
トに変換するのに適した関数形を決定することができ
る。文献において提案されている計測尺度には、つぎの
ようなものがある。すなわち、ハミング(Hammin
g)距離、編集距離、リー(Lee)距離、ボーズ(B
ose)距離、BCH距離、算術距離、自由距離、マハ
ラノビス(Mahalanobis)距離、板倉・斉藤
(Itakura−Saito)距離のごとき歪み測度
ならびに線形予測符号化距離、などである。
【0059】例示のために、ハミング距離による計測尺
度を以下に詳しく述べる。2つのレンダリングの間のハ
ミング距離は、レンダリングが異なる添え字指数位置の
数(かず)として定義できる。ハミング距離は、ディジ
タル・スキャン関数が、誘導された並びの間に置換誤り
を混入するだけのものである場合には、よく適合した計
測尺度であると言える。ここで、置換誤りとは、一方の
レンダリングにおける添え字付きアルファベット要素α
iが他のアルファベット要素βi、ただしβi≠αi、に置
換される時におこる。もし、ディジタル・スキャン関数
が、置換誤りだけでなく、挿入誤りや脱落誤りを混入さ
せる場合には、ハミング距離計測尺度は、その計測への
応用のためには、もはや、特によく適合した計測尺度と
は言えなくなる。レンダリングに対する挿入誤りは、添
え字指数付き要素 i と i+1との間のレンダリング中
へ(Bnew,αnew)なる挿入を行なうことに対応してい
る。レンダリングに対する脱落誤りは、レンダリング
0 から(Bi,αi)を除去することに対応する。ある
場合には、第2のレンダリングは、ただ1個の挿入ある
いは脱落誤りを含んでつくられることも起こり得る。こ
のような場合、2つのレンダリングの間のハミング距離
は、レンダリングそのものの長さに比例することにな
る。ハミング距離のこのような動きは、挿入誤りや脱落
誤りの面で、ハミング距離があまり望ましい計測尺度で
はないことを意味している。
【0060】計測尺度としてのいま一つのやり方は、編
集距離である。2つのレンダリングの間の編集距離の1
つの定義は、一方のレンダリングから導出される並びを
他方のレンダリングから導出される並びに変換するのに
必要な挿入、脱落、置換の最小の数(かず)であると言
うことができる。標準的な文字列編集距離関数:d(R
0,R1)=editdistance(α1α2 ...
αN1β2 ...βN+m1)は、付加誤り、脱落誤りな
どが混入するディジタル・スキャン関数に対して適合す
る計測尺度の1例である。レンダリング時、前処理計算
において計算され、ディジタル情報再生過程において用
いられるマーカーは、検出、位置同定、ならびに、ディ
ジタル・スキャニング過程で混入する誤りの訂正などを
支援することができる。誤り訂正過程は、レンダリング
に先立ってディジタル情報を符号化することによって実
行され、付加的な冗長情報をマーカーに供給し、データ
再生時にディジタル情報を復号することによって行なわ
れる。マーカー、あるいは、サーティフィキット関数
は、
【0061】
【数5】
【0062】である。この値は、R0 の「マーカー」あ
るいは「サーティフィキット」と呼ばれる。k0 をレン
ダリング、Ri,ki=F(Ri)、から計算されるマー
カーとしておこう。再生されると期待されるが、スキャ
ニング過程によって完全に正確に認識され得ないすべて
の情報はマーカー中で符号化されなければならない。ス
キャニング過程によって認識される対象物のセットのサ
イズとマーカー中に符号化される対象物セットのサイズ
との間には、トレードオフの関係が成立する。スキャナ
ーによる、よりよい対象物認識とは、より高能力で複雑
で高価なスキャニング技術を意味している。復号過程に
よる、よりよい対象物再生は、より長いマーカーとより
高価な復号のための計算を意味している。先にも注意し
たように、予想されるスキャニングの誤りを克服するた
めに、マーカーに意味的情報を含めることが望ましい。
明らかに、マーカーの長さと当該技術についての復号化
の制限が、その実際上の制限を課すことになる。
【0063】本明細書に述べられ、特許請求されている
ような本発明の表式化は、レンダリングされ受信される
対象物のタイプに依存するものではない。もちろん、O
CRについて述べている際には、主として遭遇する対象
物はASCIIテキストであろう。しかしながら、対象
物は、一般的には、ディジタルな表現を通じて伝達され
る機能的情報であれば、何であってもよい。例えば、ス
プレッドシート(図3A、3Bを参照して詳述されてい
るような)において、テーブルは、普通、その中の要素
を指定するために、ラベルを持った行と列を含んでい
る。ディジタル情報のテーブルによる表現は、すなわ
ち、ディジタルデータにおいて機能的情報を符号化する
ことである。前に与えた定義の抽象的な性質、特に、ア
ルファベットとサーティフィキットの定義は、機能的情
報と同様それ以外の情報をもレンダリングし再生するこ
とを可能にしている。もしサーティフィキット関数が位
置的な設定やレイアウトの情報に依存しないならば、
【0064】
【数6】
【0065】と表わされる。このクラスのサーティフィ
キット関数は、線形ブロック、BCH、バースト誤り訂
正や通常符号などの古くから使われている誤り訂正符号
を含んでいる。いま一つの単純なサーティフィキット関
数の組は、テキスト LZW や算術圧縮用、画像−JP
EG や MPEG 用、ならびに、スピーチ ADPCM
や LPC 用などのデータ圧縮アルゴリズムを含んでい
る。これ以外のサーティフィキット関数として、レンダ
リングに含まれる位置決めやレイアウト情報の再生を支
援するものがあってもよい。このような、空間的に分割
されたスキャニングの順序などを含む位置依存形のサー
ティフィキット関数は、ラベルを持つグラフあるいは図
表や動画像からの再生機能情報を再生するために望まれ
ているものである。更に、位置ならびに時間依存形(例
えば、ベクトル)サーティフィキット関数は、動画像の
再生(例えば、映画中の対象物の運動経路を符号化する
など)を支援することができる。
【0066】レンダリングのサーティフィキットシステ
ムは、従来技術のレンダリングスキャニング再生による
ディジタル情報の符号化/復号化過程に計算ステップと
そのコストを付加する。レンダリング時、データは、適
宜な符号化とサーティフィキット関数でレンダリングさ
れるよう前処理される(オンラインに、あるいは、オフ
ラインに)。前処理の計算はレンダリングさるべきデー
タの統計的な解析はもちろん、符号化ならびに圧縮の処
理を含んでいる。前処理計算の出力は、k0=F(R0)
であり、ここに R0 は最初のレンダリングである。ス
キャニングのステップは、R0 を何らかの過程で他のレ
ンダリング R1 に変換してしまうものであり、この過
程では、従来技術の処理と異なるところはない。もし、
スキャニングが誤りを導入しなければ、R0 = R1
あり、すべてのもとの情報は再生されたことになる。こ
の場合には、従来技術ならびにレンダリングのサーティ
フィキットの何れも、この段階で終了する。従来技術の
レンダリングスキャニング再生過程と異なるところは、
もし R0 ≠ R1 ならば、レンダリングのサーティフィ
キット過程が継続されることである。これによって、サ
ーティフィキット内に保持されている冗長情報により検
出された誤りの位置同定と訂正との実行が期待できる。
レンダリングサーティフィキットの問題は、参照空間
SとアルファベットΣ、ならびに以下の事項を仮定して
いる。
【0067】
【数7】
【0068】問題の定式化における入力パラメータは、
参照空間、レンダリング、および、サーティフィキット
関数である。レンダリングは、もとのディジタルデータ
のレンダリングと前処理ステップで計算されるサーティ
フィキットのレンダリングの両方を含むものと考えるこ
とができる。サーティフィキット関数の同定は暗黙に行
なわれてもよいし、マーカー中に同定用指標を含めても
よい。入力として供給されるレンダリングに対応するマ
ーカーは、サーティフィキット関数が指定されたなら
ば、直ちに計算することができる。計測尺度の不等式
は、入力レンダリングR1 が目標レンダリング R0
「近い」という仮定で言い換えできる。 2つのレンダ
リングは、サブセット{Bi}や{Ci}の列、および、
アルファベット要素{αi}や{βi}に近いことが要求
される。問題に対して要求される出力は、Σから選択さ
れる要素を具備する並びであり、問題の定式化における
レンダリング R0 が顕に再生されることはない。適宜
に選択されたサーティフィキット関数に対して、並び
α'1α'2 ...αN が1つだけ存在し、それは、α1α
2 ...αN と同一である。解の存在と一意性は、レン
ダリングのファミリーと特別なサーティフィキット関数
の選択に依存している。多くの応用に対しては、導出さ
れたアルファベット要素の配列あるいは対象物を単に圧
縮するだけのサーティフィキット関数を選択することで
十分である。このようなマーカーはテキストのASCI
I表示から計算して容易に得ることができる。このよう
な例においては、ASCIIテキスト文字列の再生は、
埋め込まれた機能情報の再生は何も行なわずになされ
る。サーティフィキット関数FがLZW圧縮アルゴリズ
ムであれば、サーティフィキットk0 はASCIIテキ
ストの圧縮版である。k0 を表現するのに必要とされる
ビット数は、平均で、もとのASCIIテキストを表現
するのに必要なビット数の1/3である。ディジタルス
キャニング機能が R1 を生ずる時には、データが全体
的に誤りであると見なされ、棄却される。マーカーは、
そこで、もとのASCII文字並びを得るよう伸張さ
れ、データ再生過程が完了する。このようなマーカー機
能は、広範な種類の条件で動作でき、N個のアルファベ
ット要素の文字の列においてN個までの誤りを訂正でき
るという利点を持っている。しかし、明らかに、このよ
うな例ではマーカーの値が非常に大きくなり、決して実
用的ではない。
【0069】先にも述べたように、本発明の実施は、信
頼性の高いサイドチャンネルの存在とその使用を必要と
するものである。メインチャンネル情報の正確な認識と
再生についての性能が欠如している場合には、明らか
に、サイドチャンネル情報の伝達について、より信頼性
の高いシンボル化技術を用いないかぎり、サイドチャン
ネル情報の再生も不可能である。図1の表に詳しく示し
た各メディアごとに、適度の表示能力と高い信頼度を持
つ「バーコード」が存在する。次の表は、各メディアム
ごとに、「バーコード」符号化で得られる情報密度を示
しいる:
【0070】
【数8】
【0071】オーディオのバーコードは、予め決められ
た時間の周期中にレンダリングされた目標音に対応する
符号化されたマーカー値を含み時間軸上で出される音の
列、すなわち時間変化マーカーである。誰でも音楽を聴
いている間にも、邪魔される程ではないが、コンピュー
ターの動作音や空気循環システムの空気の擦過音などを
知覚できる。同様にして、メインチャンネル情報に明確
な干渉を与えることなく、メインチャンネルのオーディ
オ情報にのせた可聴信号としてのレンダリングマーカー
を導入することができる。このようなやり方で、オーデ
ィオのレンダリングマーカーを、アナログ情報の受信デ
ィジタイズならびに再生を行ない、また同時に受信復号
化ならびにディジタルマーカー情報の利用をも行なうコ
ンピューター援用オーディオ認識システムに提供するこ
とができる。オーディオ認識システムを有効に支援し得
るこの種のレンダリング情報としては、音響発生手段
(例えば、音声であるとか、キーボードであるとか)、
またそれの個々の区別(例えば、話者、あるいは歌手の
名前)、テンポや音量の詳細や、考えられるものとして
は、声楽や器楽演奏の音楽あるいは、話者によるスピー
チなどの 調子、叙情性、音韻、ピッチ、等々の、一般
的な指標などがある。個別単語合成話音の認識において
は、マーカーを符号化する音の並びが、各単語の終わり
に出されてもよい。連続合成話音の認識においては、オ
ーディオバーコードを音声と同時に発生させてもよい。
この場合には、与えられた文節に対応する値は、例え
ば、文節の単語が聞える期間のみ送出される。オーディ
オバーコードは合成され、前処理された話音からの再生
情報やその他のオーディオレンダリング、ムービー、な
らびに、自然言語の翻訳などに有用である。オーディオ
バーコードに対する参照テーブルに含まれている情報密
度の数値は、差分位相シフト変調を用いたv.22の1
200bit/s の二重モデム標準から導出すること
ができる。
【0072】プリントされたバーコードは、前述の先行
する米国特許出願に詳述したように、メディア上のどこ
か他のところでレンダリングされたデータに対応するマ
ーカーを符号化するプリントされたシンボルのセットで
あると言える。プリントされたバーコードについて引用
された情報密度の数値は、当該技術について達成されて
いる典型的な実際の密度である。プリントされたバーコ
ードは、紙面、書籍、手書き文書、写真などへマーカー
を付けるのに適している。紙面に対する、このような適
用の改良については、本特許においても述べられている
が、別件の出願においても詳しく述べられている。上に
引用した先行する米国特許出願に詳述したように、マー
カーという概念のプリント物への適用は、図2に示した
ようなレンダリングスキャニング再生と言う方法論を用
いることによって、光学的文字認識(OCR)システム
にその用途を見出している。
【0073】図2は、人間による知覚と理解のためのア
ナログ部分と、人間によって知覚され得るが主として認
識用コンピューターで用いるために生成された符号化さ
れた文書マーカー27の部分と、の両方を備えた文書2
4を示している。ボックス22で示すコンピューターシ
ステム−Iでは、もとの文書20の諸データにしたが
い、サーティフィキット生成部21で、プリントされる
レンダリング中に含まれるべきアナログ情報にもとづく
文書マーカーのデータを生成する。この文書マーカーの
データはプリンタードライバー23を経てプリンター1
3を動作させ、文書24のアナログ部分のプリントに付
随する文書マーカー27としてプリントされる。次にデ
ィジタイジングスキヤナー18は文書24の文書マーカ
ー27に従ってアナログ文書情報をスキャンし、コンピ
ュータシステムーII28への 入力を作る。コンピュ
ータシステム28の中のOCRソフトウェア29はスキ
ャニングにより入力された情報を翻訳・認識する。一旦
アナログ文書情報がOCRソフトウェア29で認識・再
生されると、サーティフィキット検証部26では再生さ
れた情報のための新たなサーティフィキットを計算し且
つ計算されたサーティフィキットの値をスキャンした文
書マーカー27の値と比較する。もし両方の値がマッチ
すれば再生された文書25は誤り無しであると推定され
る。文書マーカーの概念をなお一層拡張すると、レイア
ウトや内容についてだけでなく、プリントされたレンダ
リングの生成に関する付加的な意味情報をも包含するこ
とができる。拡張「レンダリングマーカー」に含ませる
のが好ましい付加的な意味情報の例は、空間的に分割さ
れたスキャン順序、プリントされたアナログ情報の生成
に用いられる特定のコンピューターソフトウエアの指
定、情報の源が人間か又はコンピュータかの指定、情報
の伝播に関する詳細、ページ上の対象物の指定、ならび
に、当然ながら、誤り訂正情報、などがある。例とし
て、プリントされたスプレッドシートに付随するレンダ
リングマーカーは、それが含む統計のソース、統計が処
理されているプログラムあるいはその他の数学アプリケ
ーションソフトウエア、統計が導出されたプログラムあ
るいは数学アプリケーションソフトウエア、などを指定
する符号化に使うことができる。
【0074】画像処理の分野では、レンダリング情報
は、見えるけれども邪魔にはならなマーカーの形で人間
用の知覚可能画像中に組み込まれるか、あるいはそれに
付加的に、例えば画像面上のこの目的以外には使用され
ていない余白などに組み合されて含められる。画像の認
識、再生、利用を支援するために含ませることのできる
詳細なマーカー情報としては、スキャニング順序、空間
的位置測定、形状、あるいは、対象物の特定、カラーの
詳細、等々である。このようなマーカーによって、認識
システムは、相互に隣接する画像間の区別などに関し
て、能力を高めることができる。以上、「プリントされ
た」バーコードとして議論してきたけれども、マーカー
をプリントするという概念は、広い意味では、メディア
によってその具体的に意味することが異なっており、
「プリントする」とか「プリントされた」という本来の
言葉の意味を、種々のメディアに対してそのまま適用す
るのでないことは明らかであろう。例えば、マーカーが
画像認識に適用されるときには、空間的に分割されたス
キャニング順序を知らせてやる通信の必要性を、例え
ば、バットとボールの写真を解析することを例にして説
明することができる。もし、バットの領域が部分的に
か、あるいは、全面的にボールの像で隠されているなら
ば、そのことを「知らされていない」スキャニングコン
ピューターは、その画像をうまく区別し、同定し、再生
することはできないだろう。その写真がバットとボール
を含んでいるというスキャニングコンピューターへの通
信だけでは、それらの相対的な位置を知らせるのに十分
でない。しかし、もし、マーカーが、空間の分割法を知
らせ、それによって、バットがボールの像の何れの側の
空間座標で認識されるかを知らせるならば、スキャニン
グコンピューターは画像を正しく認識し、それを再生す
ることができるだろう。
【0075】手書き文字の認識の分野では、認識システ
ムは、手書き文字を正確に同定するために、相当な「前
プログラミング(pre−programming)」
を必要とする。前プログラミング情報は、最初のレンダ
リングで収集した空間、時間データの両方を含んで、既
知の文字の実際のアナログならびにディジタル表現に関
連した典型的な手書き文字のサンプルのテーブルを含ん
でいる。このような前認識(pre−recogniz
ed)文字と時間的データの集積は、与えられた手書き
入力の解釈を支援するものである。しかし、より正確な
解釈のためには、認識コンピューターあるいは入力受信
コンピューターは、手書き文字の各入力者に関する前認
識文字の常駐テーブルを持っているものと見なされてい
る。もし各システムが、可能性のあるすべての入力者に
ついてのサンプル翻訳テーブルをあらかじめロードされ
ていなければならないものとすれば、手書き文字認識シ
ステムは、その利用がごく限られたものにとどまらざる
を得ないことは明白であろう。手書き入力をともなうレ
ンダリングマーカーは、本発明によれば、あらかじめロ
ードされたテーブルが準備されている場合、「生の(r
aw)」翻訳にともなう不確実性を除去することができ
る。翻訳テーブルは、手書き入力をともなうコンピュー
ター生成マーカーを通して、いずれの認識コンピュータ
ーに対しても伝達することができる。しかし、手書き入
力の認識の実行に対して、手書き入力片の前処理は、そ
れの最初のレンダリングの後では、最初の入力における
手書き入力の処理(すなわち、サーティフィキット関数
を適用した処理)程には効果的ではない。
【0076】ダイナミックバーコードは、時間の経過と
ともにディスプレイされる画像の並びであり、各画像が
含んでいるマーカーの値は、あらかじめ決められた時間
周期でディスプレイされるレンダリングデータに対応し
ている。このようなバーコードは、映画、遠隔ビジョン
応用における対象物、テレビジョン、視覚化応用などに
対するマーカーに適している。前述の表で引用された情
報密度は、プリントされたバーコードが毎秒32フレー
ムごとにディスプレイされるものと仮定して計算してあ
る。例えば、テレビジョン上、あるいは、映画スクリー
ン上の指定されたピクセルに割り当てられた、白黒の目
には見えるが邪魔にはならない時間変化をする列は、メ
インチャンネル情報の人間への知覚に干渉することな
く、そのメインチャンネル情報の認識システムへの受信
を支援することができる。上に述べたことから、マーカ
ーに含まれる情報は、必ずしも同時に知覚できるメイン
チャンネル情報に応用されるだけとは限らないことは、
明らかであろう。例えば、マーカーが、すぐ後に引続い
て通信される予定の特定の情報の受信とその処理につい
て、認識システムに準備するよう指令することもでき
る。
【0077】マルチメディアバーコードは多重のメディ
アにまたがってレンダリングされた符号化マーカーの値
を具備している。例えば、マーカー情報は、オーディオ
チャンエルやダイナミックバーコードチャンネルにまた
っがって、例えば、多重録音された映画についての再生
情報を支援するのに、同時に流すことができる。このよ
うなバーコードは、マルチメディアのディスプレイにマ
ーカーを付けるのに適しており、その情報密度は、1つ
のオーディオバーコードと1つのダイナミックバーコー
ドから得られる情報密度の和として計算されている。1
つのメディアム中に、異なるメディア間での変換を可能
とするよう符号化されたマーカー、例えば、話されてい
るある言語から書かれたその言語への変換や、その逆変
換、あるいは、1つの書かれた、あるいは、話された言
語から、他のそれらの言語への変換などを可能とするマ
ーカーを提供することもできる。より詳しく例をあげれ
ば、英文ビジネスレターから日本文ビジネスレターへの
変換のためのスキャニングを指令する特定マーカーを含
む英文ビジネスレターとか、ディジタルマイクによって
録音され、コンピューターによってモニターされている
日本語スピーチの前処理済みオーディオテープのそれに
対応する英語スピーチへの変換、前処理済み音楽からの
自動採譜、特に在宅難聴者のための音声認識などが考え
られる。
【0078】本発明の実行は、(1)メインチャンネル
の第1バージョン(原バージョン)の内容のレンダリン
グをするステップ、(2)そのレンダリングのスキャニ
ングをするステップ、ならびに、(3)メインチャンネ
ルの(第1バージョン)の内容の情報をスキャンして読
みとって第2のバージョンを作る(内容情報を再生す
る)ステップ、という典型的なデータ認識法における3
つの明瞭に区別できるステップによって開始される。先
ず(1)のレンダリングをするステップは、もとのディ
ジタルデータを、物理的な表現あるいはアナログ「信
号」に変換することを備えている。そのアナログ信号な
いし物理的表現は、(2)の、第2のつまりスキャニン
グコンピューターによってなされるスキャニングのステ
ップの間にディジタルデータに変換される。最後に、そ
のディジタルデータの信号は、(3)の再生のステップ
において、再生されたディジタルデータとして、オリジ
ナルのディジタルデータのフォーマットに変換される。
本発明は、図4に示したプロセスのフローを参照して、
以下に詳細に説明するように、これらすべての3段階の
プロセスのステップ(1)、(2)、(3)を増強す
る。
【0079】本発明に対して、もとのレンダリングは、
コンピューターシステム−I 22によってその生成か
らなされるか、あるいは、そのコンピューターシステム
−I22による、引続いての処理によりなされるものと
想定される。メインチャンネルの内容情報のレンダリン
グから、アナログレンダリング100(図4=FIG.
4)において、レンダリングの過程に関連する附加的な
情報、予想されるスキャニングと再生段階での誤り、レ
ンダリングの内容、等々、がサーティフィキット関数1
02において抽出され、さらにそこで前処理され、符号
化され、ディジタルレンダリングユニット103におい
て、ディジタルデータからアナログサイドチャンネル情
報(サーティフィキット関数102)へと変換され、同
じメディアムによって、メインチャンネル情報が105
でのレンダリング混合ステップを経て供給される。メイ
ンチャンネルのレンダリングの詳細は、必ず、アナログ
レンダリングユニット104による第1のレンダリング
のステップから、利用可能なサイドチャンネルがレンダ
リング上のどこにあるかを決定するプロセスのためのサ
ーティフィキット関数に供給されなければならない。レ
ンダリング混合のステップ105は、そこで、混合され
たレンダリング106を生成する。図4においては、レ
ンダリング中あるいは、レンダリングの伝送中に誤り原
因107から誤りが混入するかも知れず、また、このよ
うな誤り以外に、スキャニングシステム109によるレ
ンダリングのスキャニング中にさらに誤り原因111に
よる誤りが混入するかも知れない、ということが示され
ている。図4のスキャニングシステム109におけるス
テップでは、図2(FIG.2)のディジタイジングス
キャナ18によってサイドチャンネル情報がスキャンさ
れ(すなわち、受信され)、図2(FIG.2)のOC
Rソフトウエア29によってディジタル信号に変換さ
れ、図4(FIG.4)のマーカー復号器110で復号
される。復号されたサイドチャンネル情報は、FIG.
2のサーティフィキット検証部26の機能により、メイ
ンチャンネル情報の再生における訂正、あるいは、その
強化のために、再生ステップで使われ、図2(FIG.
2)の完全な形で再生された文書25を作成させる。
【0080】より詳細な例として、図3(FIG.3
A),図5(FIG.3B−I)及び図6(FIG.3
B−II)は、4半期財務報告の1例のアナログ・スプレ
ッドシートの1部と、それに対する意味内容を図示して
いる。図3(FIG.3A)のアナログ版のスプレッド
シートの紙面から明白に分る各項目は、それぞれの明白
な意味(例えば、3,592 となっている第1・4半
期売り上げ台数)のみならず、図5(FIG.3B−
I,すなわち図3に対応するスプレッドシート形レンダ
リングの意味上の内容を示す図の左半分部分の図)と図
6(FIG.3B−II,すなわち図5の右側に続く右半
分の部分の図)の対応する場所に説明されているよう
に、その内容的な意味(例えば、第1・4半期売り上げ
台数に対する数字が関数、
【0081】
【数9】
【0082】によって導出されたこと)をも持ってい
る。スプレッドシートは第1コンピューターにおいて、
スプレッドシートのディジタル表現として存在している
ので、レンダリングの際に、第1コンピューターにおい
ては、その内容的な意味を利用することができる。もし
もスプレッドシートがディスクにセーブさるべきもので
あったならば、その明白な内容と、スプレッドシートプ
ログラムの意味的な指示が、ディスクファイル中に符号
化されてしまわれているはずであろう。したがって、レ
ンダリングのディジタル表現の完全な再生に関して、理
想的には、明白な意味と利用可能な意味的な情報の両方
が伝達でき、再生できるはずである。
【0083】サーティフィキット関数の理想的な符号化
ができたと仮定すると、スプレッドシート用のマーカー
の再生によってまず、スキャニングの順序と、スキャニ
ングプロセスによって認識されることが期待される符
号、シンボル、項目などの標識が抽出されるだろう。サ
ーティフィキットによって同定される認識可能な項目の
セットは、項目自体がアルファベットの要素であるか
ら、そのアルファベットである。アルファベットの要素
は、個々のシンボルであっても、より上位の項目を表現
するシンボルの集合であってもよい。したがって、スプ
レッドシートのOCRスキャニングに対して、アルファ
ベットは、スプレッドシートの文字やテーブルを表わす
のに用いられている12ポイントのローマンフォントの
アルファベットを含み、ディスプレイされた情報の文字
並びを表わし、スプレッドシートは、文字列をつくり出
した表示の、指示された非周期グラフを表わしている。
テーブルやスプレッドシートのごとき集合したアルファ
ベット要素がレンダリングの意味上の内容を伝達する。
一般に、スキャニング・システムにとって、レンダリン
グにおいて用いられる成分の文字と数字を認識し再生す
るよりも、レンダリングにおいて意味上の情報を認識し
再生することの方が、より困難である。現今のスキャニ
ング技術では、システムがレンダリングの全内容を自動
的に認識することを期待することはできない。しかしな
がら、サーティフィキット中で符号化された十分な情報
をもってすれば、かなりの意味上の内容を持った特定の
対象物を認識することは可能であろう。
【0084】そこで、アルファベットは2つのタイプの
項目を具備している。第1のセットの項目は、高い確率
で正確にスキャンされ認識されるものである。第2のセ
ットの項目は、「アウト・オブ・バンド」情報(プライ
マリアナログデータを含まない符号化情報)のたすけを
借りてはじめて、高い確率で正確にスキャンされ認識さ
れるごときものである。マーカー中に符号化されたスプ
レッドシートに対する「アウト・オブ・バンド」情報
は、その項目の位置とタイプならびに項目の成分の位置
と数を指定することができるだろう。復号器でのマーカ
ーからのアルファベット情報の完全な再生は、各アルフ
ァベット要素についてのディジタル符号化の再生の達成
を意味している。ディジタル符号化とは、ここでは、ア
ルファベットやそれ以外のインデクスの範囲内で要素の
インデクスを符号化することである。アルファベット再
生の次のマーカー処理のステップは、レンダリングの再
生である。レンダリングの再生のステップでは、1つの
レンダリング中である1つの項目(object)が何
度発生するか、レンダリング中のどこでそれら各項目が
発生し、またレンダリング中の各項目の発生の正規な順
序はどうなっているか、などが決定される。レンダリン
グで発生する項目のタイプ、数、位置、およびスキャニ
ング順序を知ることが、基本のレンダリングをつくりだ
すのために用いられるディジタルデータの完全な再生を
可能とするのである。しかしながら、これらの項目の情
報のいくつかが誤っていれば、再生されたディジタルデ
ータは完全には正確でないだろう。プロセスのこの部分
でのサーティフィキットの役割は、レンダリングされた
項目の並びについての十分な冗長情報を提供して、ある
程度限られた数の誤りのセットに対しては、システムソ
フトウエアに誤り訂正を許すことである。誤り発生の予
想される数と分布に応じて、サーティフィキットが、正
しく定義された誤り訂正符号に従ったサイドチャンネル
データを供給することである。
【0085】最後に、基本のレンダリングで起こる対象
物の画像を認識した後に、それらのレンダリング中で見
付けられた対象物に対応する関数/プログラムを発生さ
せることで、データ抽出が完了する。発生された関数
は、レンダリングの適用対象によって変化する。スプレ
ッドシートに対しては、例えば、図3(FIG.3A)
の各項目に対応して図5と図6(FIG.3B−IとF
IG.3B−II)の中に示されている、それぞれに対応
するプログラム入力は、符号化された関数であってもよ
い。これらの関数は、スキャンされた文字の正確さを検
証する必要がある場合に呼び出され、それによって、ス
キャニング・コンピューターは当該データに呼び出され
た関数を適用して、その結果をスキャニングで得た値と
比較することができる。
【0086】マーカーを発生するコンピューターが必ず
しもレンダリングを始めておく必要はないということを
理解すべきである。上に注意したように、レンダリング
は、あらかじめ別のコンピューター、及びレンダリング
に組込むためにその内容に対して発生されたマーカーに
よって、「オフライン」で前処理しておくことができ
る。その1例として、印刷された本の1ページをスキャ
ンし、コンピューターに与えられた入力がサーティフィ
キット関数を適用するべくなされ、マーカーを発生する
ことができる。コンピューターは関連情報を符合化し、
そのページの新しい版は作らずに、もとの印刷ページの
紙面に含まれる印刷その他の内容に対するマーカーを生
成する。同様にして、オーディオレンダリングの場合、
もとのオーディオレンダリングに「マーカートラック」
を追加することができる。このようなレンダリングの前
処理は、スキャナーの確度に依存し、それ自身が誤りの
ソースとなってしまう。したがって、前処理されたレン
ダリングのためのマーカーを符合化する際に、生成コン
ピューターは、マーカー中に、同定用指標としての情報
や、マーカーを発生したスキャニングとサーティフィキ
ットシステムの相対的な確度などの情報を附加的に含む
ことができる。その後で使用されるスキャニング・シス
テムでは、レンダリングを認識したり再生する時に、そ
れ自身の障害に対する許容度の評価という点で、スキャ
ナー測定用情報を用いることができる。したがって、よ
り信頼性の高いスキャニング・システムが、もとのレン
ダリングの第2のスキャニングにおいて用いられるなら
ば、スキャニング・システムは、データのそれによる解
釈の方が、より信頼性の低いスキャニングに頼っていた
マーカー発生用のコンピューターによる解釈よりも、よ
り正しいというこいとを「知っている」ことになる。
【0087】レンダリングマーカーの応用の極端なもの
としては、マーカー中のすべてのアナログデータの内容
のディジタル表現をすべて供給することである。このよ
うに極端な場合には、すべてのアナログ情報(例えば、
1ページのスプレッドシートデータのレンダリングにお
いて用いられたスプレッドシートプログラムの全内容)
のディジタル表現を含めるに必要なだけのバンド幅は、
アナログ情報の供給に対して利用可能なバンド幅を制限
することになるだろうし、実際そうすると、メインチャ
ンネル情報の供給の必要性がなくなってしまうことにな
る。明らかに、本発明の教える所を実行しようとすれ
ば、その応用についての実際的な限界を評価しておかな
ければならない。以上、本発明を、特定のいくつかの応
用を参照することによって、説明してきた。当該技術分
野に精通した何人でも、本発明の精神と付属の特許請求
範囲から逸脱しない範囲での応用と変形を認めることで
あろう。
【0088】
【発明の効果】本発明によると、同時伝送アナログ情報
の正確な認識と再生を目的とし、コンピューター認識シ
ステムに使用可能なサイドチャンネル情報を供給するこ
とができる。本発明ではまた、アナログレンダリングの
内容についての情報を符号化し、アナログ情報として知
覚可能ではあるが邪魔にはならない方法で同一のメディ
ア上に符号化情報を供給することができる。さらに符号
化情報を、アナログ情報の直接の利用者である人間にも
知覚し得るように準備するとともに、認識用コンピュー
ターによっても知覚され、解釈され、用いられるよう供
給することも本発明では可能である。コンピューター認
識と再生実行時にアナログレンダリングに混入する誤り
についての訂正の手段と方法を提供することも本発明で
は可能である。またレンダリングのコンピューター認識
と再生の期間中、認識される対象物の範囲を改善するこ
とも本発明で可能である。本発明は、物理的なレンダリ
ングメディアが信頼性のあるサイドチャンネルの確立を
可能とするところであれば、どこでも、そのようなサイ
ドチャンネルを、知覚可能かつ機械使用可能な情報の
「マーカー」の、そのマーカーが属しているメイン内容
情報の伝送との同時供給に利用することができる。サイ
ドチャンネルの存在に加えて、本発明実行のための基本
的な要件は、サイドチャンネル情報の表現可能で信頼性
のある符号化のためのシンボル化技術が存在することで
ある。サイドチャンネルマーカーによって提供すること
のできる情報は、認識対象物(空間的、時間的、ならび
にレンダリングのディジタル表示で埋め込まれたグラフ
ィック情報などを含むが、それらに限られるものではな
い)の数とタイプを拡大することができ、また、誤り訂
正を提供することができ、それ以外の方法ではスキャニ
ングコンピューターに取込めなかったレンダリングにつ
いての意味上の情報を供給することもできる。本発明に
よると、アナログレンダリングのサイドチャンネルに符
号化され供給されているマーカーがアナログレンダリン
グに関するディジタル情報を供給し、同時に、マーカー
は、レンダリングを供給される。そしてプリント、手書
き、絵文字、あるいはビデオ通信レンダリングに組込ま
れた、知覚可能ではあるが邪魔にならず、コンピュータ
ー解釈可能な符号化や、また、オーディオレンダリング
における、音声信号だが邪魔にならずコンピューター知
覚可能な符号化が、それらのメディア上での利用可能な
「サイドチャンネル」の帯域を利用して記録又は伝送さ
れる。その結果メインチャンネルアナログ情報の生成と
再生に関する広範な情報、例えば、誤り訂正符号化、ス
キャニング順序符号化、対象物同定、および、アナログ
情報生成用アルゴリズムなど、について、生成用あるい
は前処理用コンピューターと認識用コンピューターとの
間の通信が可能となる。
【図面の簡単な説明】
【図1】(FIG.1)本発明が適用できる各種のメデ
ィアを表示する図で、それらのメディアに対して認識や
再生について、現時点で実現可能な確度の程度を示す。
【図2】(FIG.2)本発明とともに用いるよう適用
できる光学的文字認識(OCR)システムを示す図。
【図3】(FIG.3A)スプレッドシート形レンダリ
ングの見掛け上の内容を示す図。
【図4】(FIG.4)本発明の方法に従うプロセスの
フローチャート。
【図5】(FIG.3B−I)スプレッドシート形レン
ダリングの意味上の内容を示す図の左半分部分の図。
【図6】(FIG.3B−II)スプレッドシート形レン
ダリングの意味上の内容を示す図の右半分部分の図。
【符号の説明】
13 プリンター 18 ディジタィジングスキャナー 20 もとの文書 21 サーティフィキット生成部 22 コンピューターシステム−I 23 プリンタードライバー 24 文書 25 誤りない形で再生された文書 26 サーティフィキット検証部 27 文書マーカー 28 コンピューターシステム−II 29 OCRソフトウエア 100 アナログレンダリング 102 サーティフィキット関数 103 ディジタルレンダリングユニット 104 アナログレンダリングユニット 105 レンダリング混合 106 レンダリング 107 誤り原因 108 人間 109 スキャニングステップ 110 マーカー復号器 111 誤り原因
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G10L 3/00 551 Z H04B 14/04 Z 9372−5K

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】アナログ情報を具備する少なくとも1つの
    第1の成分と、 前記のアナログ情報をスキャンし認識するために適用さ
    れコンピューターによって使われる目的で符号化された
    知覚可能なディジタル情報を具備する少なくとも1つの
    第2の成分と、 を具備する構成のレンダリング。
  2. 【請求項2】前記のディジタル情報が前記のアナログ情
    報に割当てられた少なくとも1つの誤り訂正符号を具備
    する請求項1のレンダリング。
  3. 【請求項3】前記のディジタル情報が前記のアナログ情
    報の生成に関する符号化情報を具備する請求項1のレン
    ダリング。
  4. 【請求項4】前記の第1と第2の成分が時間変化情報を
    具備する請求項1のレンダリング。
  5. 【請求項5】前記の第1と第2の成分がオーディオ情報
    を具備する請求項4のレンダリング。
  6. 【請求項6】前記の第1と第2の成分が機械受信可能な
    フォーマットで準備されている請求項5のレンダリン
    グ。
  7. 【請求項7】前記の第1と第2の成分がビデオ情報を具
    備する請求項4のレンダリング。
  8. 【請求項8】前記の情報が機械読取り可能なシンボル化
    技術で準備されている請求項7のレンダリング。
  9. 【請求項9】前記の第1と第2の成分がプリントされた
    情報を具備する請求項3のレンダリング。
  10. 【請求項10】前記の第2の成分が機械読取り可能なシ
    ンボルでプリントされている請求項9のレンダリング。
  11. 【請求項11】無誤り認識に適用するアナログレンダリ
    ングを提供するための方法であって、 少なくとも1つの第1のディジタル値を前記のアナログ
    レンダリングに割当てることによって、前記のアナログ
    レンダリングを処理するステップ、および、 前記の少なくとも1つのディジタル値を前記のアナログ
    レンダリングで知覚可能に供給するステップ、 を具備するアナログレンダリングの提供の方法。
  12. 【請求項12】前記の割当てが前記のアナログレンダリ
    ングの生成に関するディジタルデータの符号化を具備す
    る請求項11の方法。
  13. 【請求項13】前記の割当てが前記のアナログレンダリ
    ングの内容に依存するディジタルデータの符号化を具備
    する請求項11の方法。
  14. 【請求項14】前記の符号化が前記のアナログレンダリ
    ングに対する誤り訂正を具備する請求項13の方法。
  15. 【請求項15】前記の割当てが前記のアナログレンダリ
    ングの内容に対する空間的分割スキャニング順序情報の
    符号化を具備する請求項11の方法。
  16. 【請求項16】前記の供給が機械受信可能なフォーマッ
    トでの前記の少なくとも1つの第1のディジタル値の生
    成を具備する請求項11の方法。
  17. 【請求項17】前記のアナログ情報がオーディオ情報を
    具備し、また、前記の少なくとも1つのディジタル値が
    オーディオディジタル情報を具備している請求項11の
    方法。
  18. 【請求項18】前記のアナログ情報がビデオ情報を具備
    し、また、前記の少なくとも1つのディジタル値が目に
    見える時間変化ディジタル情報を具備している請求項1
    1の方法。
  19. 【請求項19】前記のアナログ情報が画像情報を具備
    し、また、前記の少なくとも1つのディジタル値が目に
    見えるディジタル情報を具備している請求項11の方
    法。
  20. 【請求項20】少なくとも1つの知覚可能なディジタル
    符号化を含む第1のアナログ情報の無誤り再生を行なう
    方法であって、前記の第1のアナログ情報と前記の少な
    くとも1つのディジタル符号化をスキャニングするステ
    ップ、前記の少なくとも1つのディジタル符号化を復号
    するステップ、および、第2のアナログ情報を生成する
    ステップ、を具備する方法。
  21. 【請求項21】前記の第2のアナログ情報を生成するた
    めに前記の復号されたディジタル情報の適用をさらに含
    む請求項20の方法。
  22. 【請求項22】前記の少なくとも1つのディジタル符号
    化が前記の第1のアナログ情報に対する誤り訂正符号化
    を含み、また、前記の適用が前記の第2のアナログ情報
    中の誤りの位置同定とその訂正を具備する請求項21の
    方法。
  23. 【請求項23】前記の誤り訂正符号化が前記の第1のア
    ナログ情報について計算される請求項22の方法。
  24. 【請求項24】前記の少なくとも1つのディジタル符号
    化が前記の第1のアナログ情報の生成に対するディジタ
    ル情報を含み、また、前記の適用が前記の第2のアナロ
    グ情報の生成についての前記の第1のアナログ生成情報
    の使用を具備する請求項21の方法。
  25. 【請求項25】前記の第1のアナログ情報がプリントさ
    れた情報を具備し、且つ前記の少なくとも1つのディジ
    タル符号化が空間的に分割されたスキャニング順序を含
    んでいる請求項21の方法。
  26. 【請求項26】前記の第1のアナログ情報がプリントさ
    れた情報を具備し、前記の少なくとも1つのディジタル
    符号化が前記の第1のアナログ情報の生成についてのデ
    ィジタル情報を含んでおり、前記の第1のアナログ情報
    からでは、何れのディジタル情報であるか明らかでない
    請求項21の方法。
  27. 【請求項27】アナログ情報についての知覚可能なディ
    ジタル情報を具備し、そのアナログ情報と一緒に同じメ
    ディアムで伝送されるべき時間変化マーカー。
  28. 【請求項28】前記のアナログ情報がオーディオ情報を
    具備し、前記のディジタル情報が干渉を与えない可聴音
    を具備する請求項27の時間変化マーカー。
  29. 【請求項29】前記のアナログ情報がビデオ情報を具備
    し、前記のディジタル情報が目に見えるディジタル・ピ
    クセルパターンを具備する請求項27の時間変化マーカ
    ー。
  30. 【請求項30】前記のアナログ情報がビデオ情報を具備
    し、前記のディジタル情報が干渉を与えない可聴音を具
    備する請求項27の時間変化マーカー。
  31. 【請求項31】前記のアナログ情報がビデオ情報を具備
    し、前記のディジタル情報が干渉を与えない可聴音と目
    に見えるディジタル・ピクセルパターンを具備する請求
    項27の時間変化マーカー。
  32. 【請求項32】前記のアナログ情報の生成に関する知覚
    可能なディジタル情報を具備するアナログ情報と同じメ
    ディアムで伝送される時間変化マーカー。
  33. 【請求項33】前記のアナログ情報に対して空間的分割
    されたスキャニング順序の知覚可能なディジタル情報を
    具備するアナログ情報と同じメディアムで伝送される時
    間変化マーカー。
JP6246654A 1993-10-15 1994-10-13 マルチメディアレンダリングマーカーとその使用方法 Pending JPH07203400A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13761793A 1993-10-15 1993-10-15
US08/137617 1993-10-15

Publications (1)

Publication Number Publication Date
JPH07203400A true JPH07203400A (ja) 1995-08-04

Family

ID=22478273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6246654A Pending JPH07203400A (ja) 1993-10-15 1994-10-13 マルチメディアレンダリングマーカーとその使用方法

Country Status (2)

Country Link
US (2) US5793903A (ja)
JP (1) JPH07203400A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009001886A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7387253B1 (en) 1996-09-03 2008-06-17 Hand Held Products, Inc. Optical reader system comprising local host processor and optical reader
JPH1044513A (ja) * 1996-08-07 1998-02-17 Olympus Optical Co Ltd コード印刷装置及びそれに適用されるコード印刷媒体
US6088484A (en) * 1996-11-08 2000-07-11 Hughes Electronics Corporation Downloading of personalization layers for symbolically compressed objects
US6266053B1 (en) * 1998-04-03 2001-07-24 Synapix, Inc. Time inheritance scene graph for representation of media content
US6714909B1 (en) * 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
US6738153B1 (en) * 2000-02-08 2004-05-18 International Business Machines Corporation Method, system, and program for error checking raster objects
US6862113B1 (en) * 2000-05-19 2005-03-01 Xerox Corporation Assist channel coding with character classifications
US6768560B1 (en) * 2000-05-19 2004-07-27 Xerox Corporation Assist channel coding with vertical block error correction
US20020126918A1 (en) * 2001-03-08 2002-09-12 Ernesto Solis Apparatus and method for interacting with printed materials
US7268906B2 (en) * 2002-01-07 2007-09-11 Xerox Corporation Systems and methods for authenticating and verifying documents
US6959865B2 (en) * 2002-03-28 2005-11-01 Hand Held Products, Inc. Customizable optical reader
US20030222147A1 (en) 2002-06-04 2003-12-04 Hand Held Products, Inc. Optical reader having a plurality of imaging modules
US8596542B2 (en) 2002-06-04 2013-12-03 Hand Held Products, Inc. Apparatus operative for capture of image data
US7236653B2 (en) * 2003-03-27 2007-06-26 Sharp Laboratories Of America, Inc. System and method for locating document areas using markup symbols
US20050045635A1 (en) * 2003-09-03 2005-03-03 Jane Dong Containers for storing articles
US7367514B2 (en) * 2003-07-03 2008-05-06 Hand Held Products, Inc. Reprogramming system including reprogramming symbol
US7934660B2 (en) 2006-01-05 2011-05-03 Hand Held Products, Inc. Data collection system having reconfigurable data collection terminal
US7913155B2 (en) 2006-02-15 2011-03-22 International Business Machines Corporation Synchronizing method and system
JP2008052709A (ja) * 2006-07-26 2008-03-06 Canon Inc 画像処理装置、画像処理装置の制御方法およびプログラム
US8635309B2 (en) 2007-08-09 2014-01-21 Hand Held Products, Inc. Methods and apparatus to change a feature set on data collection devices
WO2009041869A1 (en) * 2007-09-25 2009-04-02 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement relating to a media structure
US8141784B2 (en) 2009-09-25 2012-03-27 Hand Held Products, Inc. Encoded information reading terminal with user-configurable multi-protocol wireless communication interface
US8517269B2 (en) 2010-11-09 2013-08-27 Hand Held Products, Inc. Using a user'S application to configure user scanner
US8561903B2 (en) 2011-01-31 2013-10-22 Hand Held Products, Inc. System operative to adaptively select an image sensor for decodable indicia reading
US8608071B2 (en) 2011-10-17 2013-12-17 Honeywell Scanning And Mobility Optical indicia reading terminal with two image sensors
US8608053B2 (en) 2012-04-30 2013-12-17 Honeywell International Inc. Mobile communication terminal configured to display multi-symbol decodable indicia
US8915441B2 (en) 2012-10-15 2014-12-23 At&T Intellectual Property I, L.P. Synchronizing mobile devices and displays
CN108198625B (zh) * 2016-12-08 2021-07-20 推想医疗科技股份有限公司 一种分析高维医疗数据的深度学习方法和装置
US11295762B2 (en) * 2020-04-20 2022-04-05 International Business Machines Corporation Unsupervised speech decomposition

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4021777A (en) * 1975-03-06 1977-05-03 Cognitronics Corporation Character reading techniques
US4157783A (en) * 1977-10-21 1979-06-12 Burroughs Corporation Item responsive print inhibiting apparatus
US4736447A (en) * 1983-03-07 1988-04-05 Gersh Korsinsky Video computer
US5241671C1 (en) * 1989-10-26 2002-07-02 Encyclopaedia Britannica Educa Multimedia search system using a plurality of entry path means which indicate interrelatedness of information
US5247591A (en) * 1990-10-10 1993-09-21 Interfax, Inc. Method and apparatus for the primary and secondary routing of fax mesages using hand printed characters
US5251273A (en) * 1992-04-15 1993-10-05 International Business Machines Corporation Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009001886A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
US9905242B2 (en) 2007-06-27 2018-02-27 Nec Corporation Signal analysis device, signal control device, its system, method, and program

Also Published As

Publication number Publication date
US5793903A (en) 1998-08-11
US5852684A (en) 1998-12-22

Similar Documents

Publication Publication Date Title
JPH07203400A (ja) マルチメディアレンダリングマーカーとその使用方法
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
CA2365937C (en) System and method for distributing multilingual documents
US7747655B2 (en) Printable representations for time-based media
US5761686A (en) Embedding encoded information in an iconic version of a text image
CN111968649A (zh) 一种字幕纠正方法、字幕显示方法、装置、设备及介质
JP3139521B2 (ja) 自動言語決定装置
Steinmetz et al. Multimedia fundamentals, Volume 1: Media coding and content processing
JPH06282679A (ja) 原データから電子的に再生されたデータの正確さを確保するための方法、コンピュータで生成されて印刷された文書のデータを電子的に再生するための方法、及び印刷された文書の電子再生物を提供するための方法
CA2114771A1 (en) Method and apparatus for providing dual language captioning of a television program
US8180164B2 (en) OCR-guided text tokenization of digital images
US7253917B2 (en) Image processing apparatus and its control method, computer program, and storage medium
KR100905857B1 (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
CN117596433B (zh) 一种基于时间轴微调的国际中文教学视听课件编辑系统
KR102541008B1 (ko) 화면해설 컨텐츠를 제작하는 방법 및 장치
JP3058491B2 (ja) 録音及び再生方式
JPS63276672A (ja) 知的ワ−クステ−シヨン
CN116561294A (zh) 手语视频的生成方法、装置、计算机设备及存储介质
KR20050012864A (ko) 음소 필체 이미지를 자동 조합하여 자동으로 자필 문장이미지를 형성하는 시스템 및 구현 방법
JP6422647B2 (ja) 二次元コード記録方法及び該二次元コードの読み取り装置
KR101934393B1 (ko) 전자문서의 이미지 자동변환을 통한 강의영상 컨텐츠 제작시스템
JPH0991371A (ja) 文字表示装置
CN117542056A (zh) 图文数据生成文本的方法、装置、存储介质及处理器
KR20230135361A (ko) 다채널 식별코드 생성 및 인식 시스템과 그 방법
JPS6386676A (ja) フアクシミリ通信方式