JP4558404B2 - 文書品質値計算装置 - Google Patents

文書品質値計算装置 Download PDF

Info

Publication number
JP4558404B2
JP4558404B2 JP2004224612A JP2004224612A JP4558404B2 JP 4558404 B2 JP4558404 B2 JP 4558404B2 JP 2004224612 A JP2004224612 A JP 2004224612A JP 2004224612 A JP2004224612 A JP 2004224612A JP 4558404 B2 JP4558404 B2 JP 4558404B2
Authority
JP
Japan
Prior art keywords
document
value
measure
style
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004224612A
Other languages
English (en)
Other versions
JP2005050357A (ja
Inventor
ジェイ.ハリントン スティーブン
フェルナンド ナヴェダ ホセ
プライス ジョーンズ リース
サー ネイサン
アタル サッカー ニシャント
ジー.レトリング ポール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2005050357A publication Critical patent/JP2005050357A/ja
Application granted granted Critical
Publication of JP4558404B2 publication Critical patent/JP4558404B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00034Measuring, i.e. determining a quantity by comparison with a standard
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00068Calculating or estimating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30144Printing quality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Geometry (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Graphics (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、広く、ドキュメント(文書)のレイアウト、デザイン、及び分析の分野に関し、より詳細には、そのドキュメント自体に特有の特性に基づいて、ドキュメントの品質を定量的に測定する方法に関する。
ドキュメントを作成する際には、スタイル、内容(コンテンツ)、レイアウトなどに関して、多くの決定を行わなければならない。テキスト、画像、及びグラフィックは、観察者の注意を引き付けて、好ましくは、意図するメッセージを理解するのに十分な時間その注意を維持するような、プレゼンテーションを観察者に提供するように、2次元形式で編成してレイアウトしなければならない。様々な内容(コンテンツ)要素には異なるスタイルオプションが利用可能であり、選択を行わなければならない。スタイル及びレイアウトの最適な選択は、コンテンツ、意図、観察者の興味などによって決まる。ドキュメントの最終バージョンのルック・アンド・フィールに関して行われた1セットの選択が良かったか悪かったかを知るために、1セットの観察者からそのドキュメントを見た後にフィードバックを要求し、そのフィードバックをまとめて、ドキュメントの作成者若しくは開発者が修正、変更、又はその他の改善を行うことができるような意味のあるものにしてもよい。このサイクルは、ドキュメントの所有者が、最終バージョンが意図した結果に達したと満足するまで繰り返される。
ドキュメントに対するレイアウト及びスタイルの決定の質並びに有効性に寄与する要因は、スタイル及びレイアウトの選択がコンテンツのグループに影響を及ぼす場合、コンテンツ要素のグループのハンドリングである。グループとは、コンテンツ要素の集合である。グループの帰属関係は、そのドキュメントの論理構造の特性である。グループの近傍(neighborhood)は、レイアウト特性と考えることができる。レイアウト構造は論理構造と一致することが多いが、これは必要条件ではない。
そのドキュメント自体に特有の特性に基づいて、ドキュメントの様々な価値特性の定量的測度(「良質(goodness)」というドキュメントの測度)を得ることが好ましい。このように、そのドキュメント自体が定量的フィードバックのレベルを提供する。例えば、開発者が測定を望む1つの特性は、ドキュメントがどの程度使いやすいかということである。ドキュメントの使いやすさの測度は、ドキュメント・デザインを評価する又はドキュメント・デザインの決定を行うのに用いることができる。
ドキュメントの使いやすさの1つの態様は、どの要素がグループに属していて、どの要素がグループに属していないかを示す機能である。ドキュメントのプレゼンテーションにおいて行われるスタイル及びレイアウトの決定は、ドキュメントが表すグループ同一度(degree of group identity)に影響を及ぼし得る。ドキュメントのデザインの使いやすさを評価する際には、グループ同一度の測度を得ることが有用である。グループに関する使いやすさの条件としては、空間コヒーレンス、空間分離(separation)、位置合わせ分離、見出し分離、背景分離、及び/又はスタイル分離が挙げられる。コンテンツ、機能などの様々な特性の測度を意図、適合性、及びその他のパラメータによって重み付けし、これらを結合すれば、そのドキュメント自体に対する1つ以上の全体測度を得ることができる。そのドキュメント自体に特有の特性を評価する方法があれば、ドキュメントの開発処理中にこのような測度を用いることによって、最適なプレゼンテーションの決定を促すことができる。
ドキュメントの使いやすさの1つの態様は、その検索機能(searchability)である。検索機能とは、ドキュメントが所望のコンテンツ要素の検索を構造的に支援する程度と定義することができる。検索機能の高いドキュメントは、所望のコンテンツの検索を支援する。通常、検索機能測度の高いドキュメントの方が、対象となる情報を含むドキュメントの部分を検出しやすいので、使いやすい。
ドキュメントの使いやすさの別の態様は、ドキュメントの識別度(degree of distinguishability)である。コンテンツの識別性とは、ドキュメント内における1つの特定のコンテンツ要素を別のコンテンツ要素から識別する機能と定義することができる。識別性は、その要素によって開示される情報のコンテキストを設定するのに重要である。この識別性は、その要素が何であるかということと、その要素がどのグループ若しくは設定に属するかということに関して、混乱を軽減することができる。また、この識別性は、所望の要素の検出にも役立つ。従って、ドキュメント要素の識別性は、ドキュメントの使いやすさに寄与する要因である。
定量的に測定することが望まれる別の特性は、観察者の注意及び興味を保つというドキュメントの機能である。ドキュメントの使いやすさは、実際のコンテンツ及びそのコンテンツの観察者に対する適合性によってほとんど決まるが、そのコンテンツが提示されるスタイルにも寄与し得る。スタイルの決定が使いやすさに及ぼす影響の測度を定義することができるとすると、この測度は最適なプレゼンテーションの測度を決定するのに用いることができる。
ドキュメントは、個々の項目を検出しやすくする方法で、コンテンツを提示することができる。これを、「検出性(locatability)」と呼ぶことができる。1つのコンテンツオブジェクトを別のコンテンツオブジェクトから識別する1つの方法は、その目標オブジェクトの検出性、即ち、ドキュメント内においてオブジェクトがどの程度検索しやすいかということを評価する方法である。これは、1つの項目をその近傍からどの程度よく識別することができるかを示す識別性とは少し異なる。表又は黒丸リスト(bullet lists)のレイアウトのような構造的支援は、ドキュメントの観察者がオブジェクトを検出するのに役立つ。コンテンツを表で提示すると、その位置を行又は列で識別することができる。この行及び列に見出しを付ければ、さらに項目を検出しやすくすることができる。コンテンツ項目をリストで提示すると、順序付けがなされて、これらのコンテンツ項目の検出を促し、黒丸リスト(list bullets)又は項目番号を用いると、これらのコンテンツ項目の検出をさらに促す。分離性(separability)及び識別性は、オブジェクトの検出性に寄与する。
コンテンツ、機能などの様々な態様の測度を意図、適合性、及びその他のパラメータによって重み付けし、これらを結合すれば、そのドキュメント自体に対する1つ以上の全体測度を得ることができる。そのドキュメント自体に特有のこのような特性を評価する方法があれば、ドキュメントの開発処理中にこのような測度を用いることによって、最適なプレゼンテーションの決定を促すことができる。
米国特許第6,748,097号明細書
従って、ドキュメントの品質を定量化可能に測定する方法論を提供することが望ましい。さらに、ドキュメントを介して伝えられる情報に価値を追加するために、そのドキュメントを評価してその品質を改善するのに使用可能である、定量化可能な品質測定法を提供することも望ましい。
本発明の第1の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された美観の値を前記ドキュメントに対して生成する。
本発明の第2の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の注目性結合関数に基づいて、定量化された注目性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の面白さ結合関数に基づいて、定量化された面白さの値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の利便性結合関数に基づいて、定量化された利便性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の快適性結合関数に基づいて、定量化された快適性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の伝達性結合関数に基づいて、定量化された伝達性の値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と、生成した前記定量化された使いやすさの値と、生成した前記定量化された注目性の値と、生成した前記定量化された面白さの値と、生成した前記定量化された利便性の値と、生成した前記定量化された快適性の値と、生成した前記定量化された伝達性の値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の第3の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された使いやすさの値を前記ドキュメントに対して生成する。
本発明の第4の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された注目性の値を前記ドキュメントに対して生成する。
本発明の第5の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された面白さの値を前記ドキュメントに対して生成する。
本発明の第6の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された快適性の値を前記ドキュメントに対して生成する。
本発明の第7の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された利便性の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性を結合する所定の結合関数に基づいて、前記ドキュメントの品質の測度である定量化された伝達性の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の注目性結合関数に基づいて、定量化された注目性の値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と、生成した前記定量化された使いやすさの値と、生成した前記定量化された注目性の値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の注目性結合関数に基づいて、定量化された注目性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された注目性の値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の面白さ結合関数に基づいて、定量化された面白さの値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された面白さの値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の注目性結合関数に基づいて、定量化された注目性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の面白さ結合関数に基づいて、定量化された面白さの値を前記ドキュメントに対して生成し、生成した前記定量化された注目性の値と生成した前記定量化された面白さの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の注目性結合関数に基づいて、定量化された注目性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の快適性結合関数に基づいて、定量化された快適性の値を前記ドキュメントに対して生成し、生成した前記定量化された注目性の値と生成した前記定量化された快適性の値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の面白さ結合関数に基づいて、定量化された面白さの値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と生成した前記定量化された面白さの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の面白さ結合関数に基づいて、定量化された面白さの値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された面白さの値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の伝達性結合関数に基づいて、定量化された伝達性の値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と生成した前記定量化された伝達性の値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の伝達性結合関数に基づいて、定量化された伝達性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された伝達性の値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の快適性結合関数に基づいて、定量化された快適性の値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と生成した前記定量化された快適性の値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明のさらなる態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の快適性結合関数に基づいて、定量化された快適性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された快適性の値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の美観結合関数に基づいて、定量化された美観の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の利便性結合関数に基づいて、定量化された利便性の値を前記ドキュメントに対して生成し、生成した前記定量化された美観の値と生成した前記定量化された利便性の値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明の別の態様は、ドキュメントの品質の測度を定量化する方法である。この方法は、前記ドキュメントの所定セットの特性を測定し、測定した前記ドキュメントの所定セットの特性を定量化し、定量化した前記所定セットの特性の所定サブセットを結合する所定の利便性結合関数に基づいて、定量化された利便性の値を前記ドキュメントに対して生成し、定量化した前記所定セットの特性の所定サブセットを結合する所定の使いやすさ結合関数に基づいて、定量化された使いやすさの値を前記ドキュメントに対して生成し、生成した前記定量化された利便性の値と生成した前記定量化された使いやすさの値とを結合する所定の品質結合関数に基づいて、定量化された品質の値を前記ドキュメントに対して生成する。
本発明は、ドキュメント現像者がドキュメント品質を判断する際の補助とすべく、様々なドキュメント特性を定量化する種々の方法に関する。品質は競合する幾つかの様態を有することがあり、総合品質はドキュメントの絶対的特性のみならず、観察者にとってのこれらの特性の相対的重要性にも依存する。ドキュメント品質の一様態もしくはクラスは、その美観、すなわち美しさ、観察者がその外観から得る満足度である。この特性は、美的でないレイアウトによって生ずる不快度において現れることが多い。
ドキュメント品質に寄与する別の様態もしくはクラスは、ドキュメントがユーザに情報を伝達する際の有効性である。ドキュメントは情報を入れる「容器」であり、観察者が容易に情報を収集・理解できるということは、ドキュメントの役割において重要な要因である。
ドキュメント品質に寄与する第3の様態もしくはクラスは、使いやすさである。使いやすさに寄与する要素の1つは、ドキュメントの利便性、すなわち最小限の労力を以ってドキュメントを扱い得る点である。総合的な使いやすさに寄与する第2の要因は、コンテンツの分類である。多くの場合、情報はある種の論理構造を有し、この構造はコンテンツの分類によってドキュメントに反映され得る。ドキュメントがこの分類を伝達し、観察者がこれを利用する際の有効性が、使いやすさに寄与する。
ドキュメント品質に寄与する第4の様態もしくはクラスは、ドキュメントが観察者に与える満足度である。一般的に、観察者に不安を与えるドキュメントは、観察者に落ち着き・親しみを与えるドキュメントに比べ、望ましくない。
ドキュメント品質に対する寄与度の高い第5の様態もしくはクラスは、観察者の注目度である。例えば広告は、注意を惹き、容易に看過されぬよう努力している。
ドキュメント品質の上記と同様の第6の様態もしくはクラスは、観察者の関心を持続させる能力である。注意を惹くことと、そのドキュメントの使用期間に亘り注意を持続させ、飽きさせないこととは別である。
ドキュメント品質の第7の様態もしくはクラスは、作成側・観察者双方にとっての経済性であろう。ドキュメント品質に寄与する他の要素が同じであれば、低コストのドキュメントのほうがよいと考えるのが一般的である。ドキュメント品質に寄与する要素は他にもあり得るが、上記7つの様態もしくはクラスを測定することは、ドキュメント品質を評価する上での十分な根拠をなす。
ドキュメント品質に寄与する要素として上に列挙した様態もしくはクラス(経済性は除く)は、通常は定性的であり、且つ定義されにくい概念である。但し、これらの特性は定量化できる。これらの特性の測定・定量化方法では、まず、その特性に寄与するドキュメント特徴を識別する。次いで、個々の特徴について定量化可能な測度を考案する。最後に、個々の特徴値を組み合わせ、より抽象的な特性に関する総合スコアを得る。
図1は、本発明の諸概念に則り、ドキュメント品質を定量化可能に測定するための体系的配置を示すブロック図である。同図に示すように、メモリ91、ドキュメントプロセッサ回路92、マイクロプロセッサ90、ユーザインタフェース94、及びディスプレイ93を含むシステムアーキテクチャにおいて、ドキュメント品質の定量化が実行できる。メモリ91には、ドキュメントの一部、ドキュメントの1ページ、ドキュメントの1ページのうちの一部、ドキュメント全体、又は複数のドキュメントを処理目的で格納できる。
ディスプレイ93には、品質について定量化を行っているドキュメントもしくはその一部を表示できる。ディスプレイ93は、ユーザインタフェース94を介してユーザが選択可能な定量化したいクラスに関する各種オプションや、選択された定量化クラス内で測定される、ユーザがユーザインタフェース94を介して選択可能な各種パラメータを表示してもよい。
図1の定量化アーキテクチャは、ドキュメント品質の種々の様態もしくはクラスを測定、定量化するための諸回路を更に含む。諸回路には、美観定量化器10、使いやすさ定量化器20、注目性定量化器30、興味定量化器40、伝達性定量化器50、快適性定量化器60、利便性定量化器70、及び経済性定量化器75が含まれる。これらの諸回路に関して以下に詳述する(測度及びその方法が公知であるため、経済性に関する定量化器は除く。)。
図2は、1つの品質定量化器すなわち結合器80を示す。該結合器80は、美観、使いやすさ、注目性、興味、伝達性、快適性及び/又は利便性を表す、測定及び/又は計算された定量化値を受け取り、分析対象のドキュメントの一部もしくは全体について品質定量化値を生成すべく、所定のアルゴリズムに基づきこれらの値を処理する。上記の諸特性に代えてもしくは更に別の特性について品質測度を求める場合、これらも結合器80で組み合わせ得る。
各値はドキュメント自体に特有の諸特性に基づく。値は個別に組み合わされ、当該ドキュメントの総合値又は総合スコアとされる。ドキュメント品質に関する定量化可能な値の、他の方法による測定、割り当て、もしくは関連付けは本発明の範囲内にある。本発明は本明細書に開示する特定の方法に限定されず、ドキュメント品質に関する値の決定というより広い概念に関連する。
本発明の好適な実施形態では、各ルールは0から1の範囲にある値を生成すべく定義される。0は低い値、1は高い値を示す。これにより、定量化された品質の値を計算し、組み合わせて総合的なドキュメント品質測度を生成できる。
i番目のルールについて値Viが計算される場合、これらの寄与度の関数Eとして、VQ = E(V1, V2, … VN)となるドキュメント品質測度VQが生成される。組み合わせ関数Eは、寄与度の重み付き平均等、簡易なものであってよい。但し、他の寄与度が如何によくても、悪い寄与度が存在すればドキュメント品質は低下し得ることから、直線的な組み合わせは望ましくない。
上記式を書き換えると、VQ = (Σwi (Vi)-p )-1/pとなる。好適な実施形態では、wiファクタはルールの相対的な重要性を特定する重みであり、その和は1である。指数pにより、1つの悪値が多くの良値を圧倒し得る非直線性を採り入れる。指数pの値が大きければその分効果は大きい。
上記式を更に書き換えると、VQ = (Σwi (d + Vi)-p )-1/p−dとなる。wiファクタはルールの相対的な重要性を特定する重みであり、その和は1である。指数pにより、1つの悪値が多くの良値を圧倒し得る非直線性を採り入れる。パラメータdは0よりもやや大きい数字である。指数pの値が大きければその分効果は大きい。
他の組み合わせ関数は、例えば各寄与度の積である。寄与度の重み付けが望ましければ、VQ = ΠVi wi'で得られる。
なお、説明では品質定量化処理に関する(諸)回路を示すが、この処理はマイクロプロセッサやファームウェアにより、ソフトウェアで実行してもよい。定量化は特定の回路に限定されず、以下に説明する方法を実施できるものであれば、任意のソフトウェアやハードウェアの組み合わせが可能である。
美観
ドキュメントの美観に関して、ここに述べる方法は、バランス、均一性、余白部分、余白のフリーフロー、位置合わせ、規則性、ページの安全性(ページ保護)、及び/又はアスペクト比(最適比率)といった寄与度である特徴についての定量化可能な値を生成するためのものである。図3に示すように、結合回路10(図1の美観定量化器10)はバランス、均一性、余白部分、余白のフリーフロー、位置合わせ、規則性、ページの安全性、及び/又はアスペクト比(最適比率)を表す、測定及び/又は計算された定量化値を受け取り、分析対象のドキュメントの一部もしくは全体について美観定量化値を生成すべく、所定のアルゴリズムに基づきこれらの値を処理する。
各値はドキュメント自体に特有の諸特性に基づく。値は個別に組み合わされ、当該ドキュメントの総合値又は総合スコアとされる。ドキュメント品質に関する定量化可能な値の、他の方法による測定、割り当て、もしくは関連付けは本発明の範囲内にある。本発明は本明細書に開示する特定の方法に限定されず、ドキュメント品質に関する値の決定というより広い概念に関連する。
本発明の好適な実施形態では、各ルールは0から1の値を生成すべく定義される。0は低い値、1は高い値を示す。これにより、定量化された品質の値を計算し、組み合わせて総合的なドキュメント品質測度を生成できる。
i番目のルールについて値Viが計算される場合、これらの寄与度の関数Eとして、VA = E(V1, V2, … VN)となるドキュメント品質測度VAが生成される。組み合わせ関数Eは、寄与度の重み付き平均等、簡易なものであってよい。但し、他の寄与度が如何によくても、悪い寄与度が存在すればドキュメント品質は低下し得ることから、直線的な組み合わせは望ましくない。
上記式を書き換えると、VA = (Σwi (Vi)-p )-1/pとなる。好適な実施形態では、wiファクタはルールの相対的な重要性を特定する重みであり、その和は1である。指数pにより、1つの悪値が多くの良値を圧倒し得る非直線性を採り入れる。指数pの値が大きければその分効果は大きい。
上記式を更に書き換えると、VA = (Σwi (d + Vi)-p )-1/p−dとなる。wiファクタはルールの相対的な重要性を特定する重みであり、その和は1である。指数pにより、1つの悪値が多くの良値を圧倒し得る非直線性を採り入れる。パラメータdは0よりもやや大きい数字である。指数pの値が大きければその分効果は大きい。
他の組み合わせ関数は、例えば各寄与度の積である。寄与度の重み付けが望ましければ、VA = ΠVi wi'で得られる。
なお、説明では美観定量化処理に関する(諸)回路を示すが、この処理はマイクロプロセッサやファームウェアにより、ソフトウェアで実行してもよい。定量化は特定の回路に限定されず、以下に説明する方法を実施できるものであれば、任意のソフトウェアやハードウェアの組み合わせが可能である。
図3に示すように、美観の決定に用いられるパラメータもしくはファクタの1つは、ドキュメントのバランスすなわちページレイアウトにおけるバランスの測度及び定量化である。
本発明の好適な実施形態では、バランスは少なくとも2通りの主要な方法で定義される。視覚の重みの中心がドキュメントのページの視覚の中心にある場合、総合バランスが存在する。すなわち、図5に示すように、ドキュメント100上のオブジェクト110の視覚の重みの実質的中心は、ドキュメントのページの視覚の中心と一致している。更に、左右のバランスが存在する。すなわち、図6及び図7に示すように、ドキュメント100上のオブジェクト110は、ページ左側のオブジェクト110と、同一の水平方向位置にあるページ右側のオブジェクト110の重みと一致している。バランスに関する他の定義は、本発明の範囲内にあるものとする。
図4において視覚の重みの中心を決定し、それが図4のページ101の視覚の中心とどの程度相違するかに注目することで、総合バランスが計算される。図8に、ドキュメントのページの総合バランス決定の詳細な例を示す。
図8に示すように、オブジェクトi(図8の110)の視覚の重みをMi(図8の115)とし、オブジェクトの中心を(xi, yi)、ページレイアウト116の視覚の重みの中心を(xm, ym)とすると、xm = (ΣxiMi)/(ΣMi)及びym = (ΣyiMi)/(ΣMi)が当該ページの全オブジェクトの和となる。ここでは、オブジェクト110は写真、絵画、グラフィックその他である。
ページ116の視覚の中心を(xc, yc)とし、オブジェクトが視覚の中心102から離れ得る最大x距離及びy距離(117はx距離を示す)をdx及びdyとすると、バランス値はVOB = 1−[(((xm-xc)/dx)2+((ym-yc)/dy)2)/2]1/2で計算できる。
なお、サブクラスに属するオブジェクトのみを検討することで、同様の方法によりオブジェクトのサブクラスのバランスを計算できる。例えば、当該ページの全画像の視覚的バランス、或いは全テキストブロックの視覚的バランスを計算できる。
左右のバランスについては、x成分に関する視覚の重みの中心(図9の118)は上述の如く計算される。但し、y成分に関しては、全体が中心に位置するよりも、左右の半分が同一位置を有することが望ましい。このためには、左側の重みの中心(118)をyL = (ΣyiMi)/(ΣMi)により計算すればよい。但し和はオブジェクト110の部分より大きく、xi<xcである。同様に、yR = (ΣyiMi)/(ΣMi)である。但し和はオブジェクト110の部分より大きく、xi>xcである。
コンテンツオブジェクトがページの左右両側に亘って存在する場合、上記計算を行うため、ページの垂直方向中心線でオブジェクトを分割する。オブジェクトの左右に分割された部分は各々左右の和に組み入れられる。ページ高さをdhとすると、左右バランス値はVLR = 1−[(((xm - xc)/dx)2 + ((yL - yR)/dh)2 )/2]1/2となる。なお、他の定義も可能である。
例えば、バランスが非直線的であることを表示すべく、これらのバランス値をべき乗してもよい。バランスに対する人間の反応を測定し、該反応に一致する機能を定義すべく精神物理学的実験を行うことが理想的である。
上記各式はオブジェクトの視覚の重みを利用している。まず、オブジェクトの視覚の重みはオブジェクトの面積にその光学濃度を乗ずることで定義できる。但し、他の心理学的効果も考慮してよい。例えば、カラーはグレイに比べ重みが大きい。丸い形状は矩形に比べ重みが大きい。ページ上部に位置することは下部に位置することに比べ重みが大きい。
図4に示すように、バランスはページの視覚の中心101に対して定義される。視覚の中心101はページの左右端の中間に位置するが、上下端の中間ではない。一般的に、視覚の中心101は、幾何学的中心102から上方向にページ高さの20分の1オフセットされているとみなされる。
図10に示すように、バランスは上述の2つのアプローチを結合したものと考えられる。図10では、総合バランスと左右バランスとをバランス定量化・結合回路11で結合することにより、定量化された総合バランス値が得られる。
1つのアプローチはVbl= 1−[wob (1 - Vob)-q + wLR (1 - VLR)-q ]-1/qである。重みwob及びwLRは、2つのバランスアプローチに相対的な重要性を与え、その和は1である。いずれかのバランス測度が1(良い)に近ければ、総合的な結果も1に近くなる。指数qはこの挙動の強度を決定付ける。
なお、説明では一例としてバランス定量化処理のための回路を示すが、この処理はマイクロプロセッサやファームウェアにより、ソフトウェアで実行してもよい。定量化は特定の回路に限定されず、以下に説明する方法を実施できるものであれば、任意のソフトウェアやハードウェアの組み合わせが可能である。
図11及び図12に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントの均一性の測度及び定量化である。
本発明の好適な実施形態では、コンテンツオブジェクト110は図11のように集中せず、図12のようにページ100に均一に分布していることが好ましい。但し、注目性等の他の値に関しては、オブジェクトが集中したり位置的バランスを欠くことが有益となり得る。均一性が好ましい。
ここで、非均一性は視覚的密度の変化として定義される。ページの一部の場合、視覚的密度は当該部分に含まれるオブジェクトの視覚の重みによって決定され、当該部分の面積で除算される。すなわち、Di = ΣMj/Aiとなる。但し、和はページ部分iに含まれるオブジェクトjより大きい。密度は0から1の間とされることが好ましい。光学密度に加えて、視覚の重みが値の範囲を変更するファクタを含む場合、設計しなおすことも必要となり得る。また、ページの平均密度は、当該ページの画像化可能面積で除算した全オブジェクトに関する視覚の重みの和として定義できる。
画像化可能面積Apiは、通常、マージンを除いたページ面積であり、DAV = ΣMi/Apiが成り立つ。非均一性の値は、画像化可能面積を少数の部分に分割し、これらの部分の視覚的密度を平均ページ密度と比較することで算出される。
非均一性値はこれらの部分の視覚的密度と平均ページ密度との間の差異として計算できる。平均ページ密度を平方し、当該部分の面積で重み付けする。ここから1を減ずることで均一性値が得られる。すなわち、非均一性値は式VNU = 1−(Σ(Di - Dav)2 Ai)/ΣAiで定義できる。
平均ページ密度はページ毎に個別に計算してもよいし、全ページの部分及び全ページの面積の全オブジェクトの視覚の重みから総合平均ページ密度を決定してもよい。
ドキュメントの1つの非均一性の値を直接計算する方法として、他に、個々のページについて非均一性の値を計算し、平均法、或いはいずれかのページの値が低い場合に低い結果を生ずる非線型法により、そのページ値を結合する方法がある。密度における真の変化を計算し、これを利用して非均一性を得る等、他の均一性測度も可能である。或いは、様々な均一性に対する人間の反応を測定し、これを用いて関数を構成してもよい。
図13乃至図15に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントの余白部分の測度及び定量化である。
本発明の好適な実施形態では、好適なページ設計として、余白(マージンを含む)が合計で全ページ面積の約半分を占めるものが挙げられる。非余白部分の面積はコンテンツオブジェクトの全面積により推定される。
図13では、ページ100の余白部分すなわちオブジェクト110に関連しない面積の量は合計で画像化可能面積の半分以上を占めているゆえに望ましくない。図14では、ページ100の余白部分すなわちオブジェクト110に関連しない面積の量は合計で画像化可能面積の半分以下であり、これも望ましくない。最後に、図15では、ページ100の余白部分すなわちオブジェクト110に関連しない面積の量は合計で画像化可能面積の約半分であり、最適である。
全オブジェクト面積110は全ページ面積Apからスケーリングでき、この値と望ましい50%との差が得られる。この差を平方することで、当該レイアウトが50%ルールからどの程度乖離しているかの測度を生成する正数が得られる。4でスケーリングすることで、0から1の数字が得られ、これを1から減ずれば定量化された余白部分の値が得られる。ゆえに、Vws = 1 − 4((ΣAi / Ap) - 0.5)2が成り立つ。
ドキュメントの美観及びドキュメント品質に関する余白部分の効果の他の方法による測定(例えば様々な余白部分に対する人間の反応の関数等)はここに想定され、本発明の範囲内とする。
図16乃至図21に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントのトラップされた(ドキュメントに割り込んだ)余白部分の測度及び定量化である。
本発明の好適な実施形態では、ページの中ほどに、コンテンツにトラップされた余白が大きなブロックとして存在しないことが望ましい。余白は常にマージンと連続していなければならない。
このクラスのトラップされた余白(割り込み余白)を定量化すべく、トラップされた余白の効率的な検出方法を図16乃至図21に図示し、以下に詳しく説明する。
このクラスのトラップされた余白は、主として比較的大きいブロックとして存在する余白に関する。ここで使われる「効率」を向上させる方法の一つは、トラップされた余白の分析を低解像度で実施する方法である。このアプローチでは、マージンから直接連続している全余白面積を決定する。そしてこの面積をコンテンツオブジェクト(図16の110)の面積に加え、ページ面積と比較する。差があれば、この差がトラップされた余白(図16の120)の量となる。
トラップされた余白量を得るため、余白の4つの輪郭(図17乃至図20)は、構成されたドキュメントの4つのマージンから連続している。これらの輪郭は低解像度で配列され格納されることが好ましい。ここで配列をTopProf、BottomProf、LeftProf、及びRightProfと呼ぶことにする。TopProf及びBottomProf配列の要素の初期値はページ高さ、LeftProf及びRightProf配列の初期値はページ幅である。
次に、全コンテンツオブジェクト110の周囲、すなわち左側(図17)、右側(図18)、上側(図19)及び下側(図20)をそれぞれ段状に囲み、各々の境界位置121、122、123、124を検出する。この情報を利用し、輪郭配列を更新する。
左から右の境界の各ポイントにおいて、TopProf配列に格納された値は上の境界と比較され、上の境界の値が小さければ配列値は上の境界の値で置き換えられる。下の境界とページ高さとの差がBottomProf配列値と比較され、配列値はいずれか小さい方の値により更新される。これは、以下において捕捉される。
for (x = L; x < R; x++)

if (T < TopProf[x])
TopProf[x] = T;
if (H - B < BottomProf[x])
BottomProf[x] = H - B];

ここで、L、R、T、Bは、各々コンテンツオブジェクトの左、右、上、下の境界位置を含み、Hはページ高さである。同様の計算で、コンテンツオブジェクトのLeftProf配列及びRightProf配列が更新される。
ページ端と連続する全余白面積(図21の125)は、ページ全体を調査し、各ポイント位置を輪郭配列と比較・照合することで検出される。ページ端とそれに対応する輪郭境界との間に存在する全ポイントの和が計算される。このように全ポイントを加算することで、輪郭が重複する部分の面積の二重計算を回避できる。この計算に用いる擬似コードを次に示す。
Freeflow = 0;
for (x = 0; x < W; x++)

for (y = 0; y < H; y++)

if (x < LeftProf[y] || W - x < RightProf[y]
|| y < TopProf[x] || H - y < BottomProf[x])
Freeflow = Freeflow + pixelArea;


コンテンツオブジェクトでカバーされる全面積(オブジェクトが重複している面積を二重計算しないこと)をCountAreaとすると、ページ面積はPageArea = W * Hとなり、余白のフリーフローの値はVWF = (Freeflow + ContentArea) /PageAreaとなる。
ドキュメント全体についての余白のフリーフローの測度は、各ページの余白のフリーフローの平均値として定義できる。ページ値のべき乗の平均の平方根をとる等、非直線的な結合も可能である。
ドキュメントの美観及びドキュメント品質に関するトラップされた余白の効果の他の方法による測定(例えば様々な程度にトラップされた余白に対する人間の反応の関数等)はここに想定され、本発明の範囲内とする。
図22乃至図24に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントの位置合わせの測度及び定量化である。
本発明の好適な実施形態では、コンテンツオブジェクトは位置合わせされて表示されることが好ましい。位置合わせは、x値を等しくすべく、全ての左端に関して行うような場合もあろう。或いは、全オブジェクトが同一の中心線を共有する場合もあろう。右端が左端と同様に位置合わせされれば、より好ましい。同様に、オブジェクトの列は垂直方向に位置合わせすべきである。
図22は、ページ100の、位置合わせを実施していないオブジェクト110を示す。図23は、ページ100の、位置合わせを実施したオブジェクト110を示す。
オブジェクトの左エッジ、右エッジ、もしくは水平方向の中心線に適用可能な、位置合わせ測度を計算する方法を示す。この方法は、上エッジ、下エッジ、及び垂直方向の中心線にも適用できる。各アプリケーションにより異なる位置合わせ測度が得られる。これらを結合し、総合位置合わせ測度を得る。
この位置合わせ測度は全てのコンテンツオブジェクトに適用できる。或いは、ドキュメント構成における1つの論理グループに属する全てのオブジェクト等、限定的な1セットのオブジェクトに適用できる。所与のタイプ(全パラグラフ、全画像等)のオブジェクトに対し、限定的に位置合わせを実施してもよい。
ページベースで位置合わせ測定基準を各々確立し、当該ページ上の異なる構成要素を如何に好適に位置合わせするかに関する定量化可能な表示を設けてもよい。このアプローチでは、個々のページの位置合わせを結合し、ドキュメント全体の位置合わせ測度を得られる。また、多数のページに亘るドキュメントオブジェクトを用いて位置合わせの値を算出してもよい。構成要素が好適に位置合わせされると、測定基準により与えられる数は1である。構成要素が好適に位置合わせされなければ、測定基準により与えられる数は1より小さい。当該ページ上の構成要素の位置を変更し、この数を平滑で連続したものとすることが有利である。
このためには、まず、ページ100のオブジェクト110のエッジからの距離(図24では左エッジからの距離)を反映させた、エッジ(もしくは中心)位置のヒストグラム(図25)を作成する。ヒストグラムは実際の位置決めに比べ低解像度で作成することが好ましい。これにより位置合わせ感度が低下し、所要メモリや演算の要求条件が低減する。
ヒストグラム配列をEdgeCountと称することにし、オブジェクトに関するエッジ位置をx、解像度低下ファクタをbとすると、各コンテンツオブジェクトについてEdgeCount[b*x] += 1が成り立つ。位置合わせを厳密に行えば、ほとんどの位置で同一ヒストグラム要素に寄与する結果となる。オブジェクトの左エッジにおける位置合わせに関心があれば、左エッジ位置を用いてヒストグラムを作成する。右、上、下エッジについての位置合わせ及び中心位置についても同様の計算が適用できる。
位置合わせの測度はヒストグラムの隣接エントリーとの間の距離に依存する。エントリー間の距離が近ければ、スコアは高い。この依存関係は非直線的でなければならない。非直線的でない場合、オブジェクトがその隣接オブジェクトに接近する方向へ移動しても、この移動は当該オブジェクトのもう一方の側の隣接オブジェクトから離れる方向への移動によりキャンセルされる。距離zだけ離間されたエントリーに適用される非線形関数はA/(A+z)であり、Aは、エントリー間の距離が増大するにつれ如何なる速度で値が1から減少するかを制御する定数である。
2つのエッジが位置合わせされ、これらを隔てる距離がz=0であるとき、値は1となる。このことは、その位置におけるエントリーの強度に寄与する。
すなわち、ある位置にn本のエッジが寄与しているとき、距離0のエッジ間にn−1の分離が存在する。従って、nのエントリーカウントからn−1の寄与が存在し、また隣接エントリー位置間の分離からの寄与が存在する。構成要素の総数をNumberOfObjectsとすると、これらが全て完全に位置合わせされている場合、最大寄与はNumberOfObjects−1となる。最終結果が0から1の間となるようスコアを正規化すべくこの値で除算する。
位置合わせに関する計算は次のようになる。
while (EdgeCount[i] is 0)
i = i + 1;
align = EdgeCount[i] - 1;
for (j = i+1; j < b*W; j++)
if (EdgeCount[j] is not 0)
{ align = align + A/(A+j-i) + EdgeCount[j] - 1;
i = j;

align = align / (NumberOfObjects - 1);
上記は、alignL、alignR、及びalignCと称する位置合わせ測度を計算すべく、左エッジ、右エッジ及び中心位置に適用される。唯一の相違は、この場合エッジ値を用いてEdgeCountヒストグラム配列を満たす点である。エッジ及び中心に関する位置合わせ測度は前述のバランス測度の場合と同様の方法で結合される。すなわち、alignH = 1 - (wL (1 - alignL)-q + wR (1 - alignR)-q + wC (1 - alignC)-q)-1/qが成り立つ。ここで、wL、wR、wCは、3つの位置合わせの各々の相対的な重要性の重みであり、指数qは1つの位置合わせがどの程度の強度の影響を有するかを制御する。
同様に、上、下、及び垂直方向の中心位置(alignT、alignB、及びalignM)について位置合わせ測度が計算される。これらの値を結合し、垂直方向位置合わせ測度alignVを得る。水平方向及び垂直方向の位置合わせ測度がすでにドキュメント品質測度に寄与していても、これらを結合することが有利である。従って、ValH = alignH, and ValV = alignV.が成り立つ。ページの総合位置合わせ測度は、水平方向及び垂直方向の寄与の加重和、すなわちVal = wV ValV + (1 - wV) ValHとして定義される。
図26に示されるように、位置合わせは、上述の左位置合わせ、右位置合わせ、上位置合わせ、下位置合わせ、垂直方向中心位置合わせ、及び水平方向中心位置合わせの各値を結合したものとみなす。図26では、定量化された位置合わせの値は、左位置合わせ、右位置合わせ、上位置合わせ、下位置合わせ、垂直方向中心位置合わせ、及び水平方向中心位置合わせの各値を、位置合わせ定量化器すなわち結合器回路12により結合することにより得られる。
なお、説明では位置決め定量化処理に関する回路を示すが、この処理はマイクロプロセッサやファームウェアにより、ソフトウェアで実行してもよい。定量化は特定の回路に限定されず、以下に説明する方法を実施できるものであれば、任意のソフトウェアやハードウェアの組み合わせが可能である。
総合的なドキュメントの位置合わせは、別々のページに関して決定された位置合わせの値を結合することで得られる。或いは、総合的なドキュメントの位置合わせは、全コンテンツオブジェクトをページ毎に分離せず一度に考察することで計算してもよい。別々のページからの値を結合する際、結合メカニズムとして平均法を用いてもよいし、他の方法を用いてもよい。いずれかのページの値が低い場合に低い結果を生ずる結合方法が好適である。例えば、相互のべき乗の平均の相互根をとる技術がある。
ドキュメントの美観及びドキュメント品質に関する位置合わせの効果の他の方法による測定(例えば様々な程度の位置合わせに対する人間の反応の関数等)はここに想定され、本発明の範囲内とする。
図27乃至図30に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントの規則性の測度及び定量化である。
本発明の好適な実施形態において、多数の位置合わせ位置が発生する場合、これらの位置合わせ位置を規則的に離間させることが最良である。すなわち、表の列と行とが相対的に同じ高さと幅であれば更に好ましい。
図27は、ページ100のオブジェクト110の低い位置規則性の一例を示し、図28は、ページ100のオブジェクト110の高い位置規則性の一例を示す。図29は、ページ100のオブジェクト110の低い空間規則性の一例を示し、図30は、ページ100のオブジェクト110の高い空間規則性の一例を示す。
規則性を測定する方法の一つに、各オブジェクト(110)の隣接オブジェクトを識別し、当該オブジェクトと隣接オブジェクトの対応するエッジ(例えば当該オブジェクトの左エッジと隣接オブジェクトの左エッジ)間の距離を考察する方法がある。但し、隣接オブジェクトの識別はコストが高いため、より簡易な近似法が好適であることが多い。
オブジェクトを厳密に位置合わせしてドキュメントが設計されていると想定すると、位置合わせ位置間の距離のヒストグラムに鋭利なピークが現れる。位置合わせ位置は、既述の位置合わせヒストグラムにおいて識別されるピークである。位置合わせピーク間の距離を捕捉し、それをここでSepCountと称する新しいヒストグラムに格納すべく、この処理を延長してもよい。
if (EdgeCount [0] > EdgeCount [1])

peakCount++;
SepCount[1]++;
prevPeak = 0;

else
prevPeak = -1;

for (i = 1; i < b*W - 1; i++)
if (EdgeCount [i-1] < EdgeCount [i] && EdgeCount [i+1] < EdgeCount [i])

peakCount++;
SepCount[i - prevPeak]++;
prevPeak = i;


if (EdgeCount [b*W-1] > EdgeCount [b*W-2])

peakCount++;
SepCount[i - prevPeak]++;

SepCountヒストグラムが作成されると、このヒストグラムは、位置合わせのためEdgeCountヒストグラムと同様の方法で処理される。NumberOfObjectsの代わりにpeakCountで除算する点が相違する。
while (SepCount [i] is 0)
i = i + 1;
preg = SepCount [i] - 1;
for (j = i+1; j < b*W; j++)
if (SepCount [j] is not 0)

preg = preg + A/(A+j-i) + SepCount [j] - 1;
i = j;

preg = preg / (peakCount - 1);
これにより規則性の測度が得られるが、この測度は位置合わせ位置の分離を抽出する際にいずれの位置合わせ測度を用いるかに依存する。合わせて6つの位置合わせ値が用いられ、その結果が結合されるが、水平方向の規則性の決定に関しては左の位置合わせが好適であり、垂直方向の規則性の検出に関しては上の位置合わせが好適である。
これらの規則性の測度をVRH及びVRVとしてドキュメント品質測定値に結合することが有利である。このとき、EdgeCountが左エッジ位置で満たされる場合にVRH = pregが計算され、EdgeCountが上エッジ位置で満たされる場合にVRV = pregが計算される。総合的な規則性の値は水平方向及び垂直方向の寄与の加重和として定義できる。
ドキュメントの美観及びドキュメント品質に関する位置規則性の効果の他の方法による測定(例えば様々な位置規則性に対する人間の反応の関数等)はここに想定され、本発明の範囲内とする。
また、ドキュメント品質を決定すべく、オブジェクト間の均一な分離を計算できる。これは、位置合わせ及び位置規則性と同様に計算することが好ましい空間規則性の測度である。但し、この例では、EdgeCountに対応するデータ値の配列はオブジェクト間の空間値のヒストグラムを含む。
各オブジェクトについて水平方向の空間規則性に関する空間値を決定するには、まず、当該オブジェクトの右側の、垂直方向に重複する直近オブジェクト(あれば)を決定する。現在のオブジェクトの右エッジから当該隣接オブジェクトの左エッジまでの距離が空間値である。同様の計算で垂直方向の分離が決定される。
パフォーマンスが問題である場合、エッジ位置の配列を調査することで、(位置合わせ計算の際に生成されたように、)空間の近似値を生成でき、隣接オブジェクトを識別するコストが不要である。水平方向の空間に関しては、右エッジ位置の配列を段状に囲む。各位置について、左エッジ配列から当該位置の右までの第1左エッジを決定する。分離値は右と左のエッジ位置間の距離である。1以上のオブジェクトがこれらの位置にエッジを有する可能性を勘案し、これらの位置における右エッジヒストグラムから左エッジヒストグラムへのエッジカウントの積をヒストグラムに入力する。次いで、位置合わせ計算で用いたNumberOfObjectsの代わりにこれらの積の和を用いて最終結果を正規化する。近似する分離カウントは次のように求められる。
for (i = 0; i < b*W - 1; i++)
if (LeftEdgeCount [i] != 0)

j = i + 1;
while (RightEdgeCount[j] == 0)

j = j + 1;

totalSepCount += LeftEdgeCount[i] * RightEdgeCount[j];
SpacSepCount[j - i] += LeftEdgeCount[i] * RightEdgeCount[j];

ここで、LeftEdgeCount及びRightEdgeCountは、左エッジ値及び右エッジ値で各々満たされる場合、EdgeCount配列の値を含む。水平方向の分離について、計算は上及び下エッジ値を用いた場合と類似する。空間規則性の測度の計算は次のようになされる。
while (SpacSepCount [i] is 0)
i = i + 1;
sreg = SpacSepCount [i] - 1;
for (j = i+1; j < b*W; j++)
if (SpacSepCount [j] is not 0)

sreg = sreg + A/(A+j-i) + SpacSepCount [j] - 1;
i = j;

sreg = sreg / (totalSepCount - 1);
垂直方向空間ヒストグラムの近似値は、上下エッジ位置配列を用いて同様に決定される。これらの規則性の測度をVSH及びVSVとしてドキュメント品質測定値に結合することが有利である。このとき、SpacSepCountが左右エッジから計算される場合VSH = sreg、SpacSepCountが上下エッジから計算される場合VSV = sregである。総合的な空間規則性の測度は水平方向及び垂直方向の寄与の加重和として定義できる。
ドキュメントの美観及びドキュメント品質に関する空間規則性の効果の他の方法による測定(例えば様々な空間規則性に対する人間の反応の関数等)はここに想定され、本発明の範囲内とする。
図31に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントのページの安全性の測度及び定量化である。
本発明の好適な実施形態では、小さなオブジェクト110は、不安定で見落とされることがあるため、ページ100の端もしくは端付近に位置しないことが好ましい。このことは、マージンの外側に位置するページ番号等のオブジェクトに特に当てはまる。
オブジェクトのページの安全性を定量化するには、当該オブジェクトの中心から各ページ端までの距離を決定する。オブジェクトは下端付近にある場合に、上端付近にある場合と比べて安定性が低いため、いずれのエッジを用いたかによりこの距離を重み付けしてもよい。最小重み付け距離を保存すべきである。
各オブジェクトのオブジェクト中心が(xi, yi)、ページサイズがW×Hで定義される場合、psi = min (sL xi, sT yi, sR (W - xi), sB (H - yi))を計算する。このとき、SL、ST、SR、SBは各々左、上、右及び下エッジの重みである。総合的なページの安全性の値は当該ページの全オブジェクト値の最小値としてPS = min(psi)で定義される。閾値距離Tが存在し、この閾値距離Tを上回るとその特性について値1を得る場合、ほとんどのオブジェクトは好適に見える。この挙動に関する測定値を調整するには、Vps = min(1, PS*T-1)を計算する。
ドキュメントの美観及びドキュメント品質に関するオブジェクト位置の効果の他の方法による測定(例えばページ端付近に位置するオブジェクトの不安定性等、様々な位置に対する測定された反応の関数等)はここに想定され、本発明の範囲内とする。
図32に示すように、美観の決定に用いられる別のパラメータもしくはファクタは、ドキュメントの最適な比率の測度及び定量化である。
本発明の好適な実施形態では、快適さを与える比率が存在する。幅と高さとのアスペクト比RはR = 2/(1 + √5) = 0.618…が理想的であることが多い。ページのコンテンツの幅と高さの比が決定され、このアスペクト比と比較される。
幅と高さに関しては、コンテンツ(1101、1102、1103、1104、1105)の境界ボックスが好適である。境界ボックスは次のように計算される。コンテンツオブジェクトを段状に囲み、最小左エッジ、最大右エッジ、(上から測定して)最小上エッジ、及び最大下エッジを検出する。幅は、最大右エッジと最小左エッジ間の差である。高さは最小上エッジと最大下エッジ間の差である。
次いで、幅もしくは高さのいずれが小さいかを判断し、小さい方を大きい方で除し、アスペクト比Aを得る。0から1の範囲の数字を得るべく、Var = 1 - | A - R |/Rにより、理想的な比Rからの絶対的な差及びスケールが決定できる。
図32では、オブジェクト1101は好適な比率すなわちアスペクト比を有するが、オブジェクト1102は好適な比率すなわちアスペクト比を有していない。
ドキュメントの美観及びドキュメント品質に関するアスペクト比の効果の他の方法による測定(様々なアスペクト比に対する測定された反応の関数等)はここに想定され、本発明の範囲内とする。
ドキュメントの美観並びにドキュメント品質に寄与する他の定量化可能な特性も存在し得る。ここで取り上げた特定の実施形態は、定量化可能な美観の測度が如何にして構成され、またこれらが直接的もしくは美観を介してドキュメント品質に寄与するかを説明するためのものである。特にこれらを取り上げたが他の特徴を不適切として排除する意図はない。
使いやすさ
ドキュメントの使いやすさに関してここで説明する方法は、寄与している特徴、すなわち分離性、識別度、検出性、検索機能、及び/又はグループ同一性について、定量化可能な値を生成するためのものである。図35に示すように、結合回路20(図1の使いやすさ定量化器20)は分離性、識別度、検出性、検索機能、及び/又はグループ同一性を表す、測定及び/又は計算された定量化値を受け取り、分析対象のドキュメントもしくはドキュメントの一部について定量化された使いやすさの値を生成すべく、所定のアルゴリズムに基づきこれらの値を処理する。
各値はドキュメント自体に特有の諸特性に基づく。値は個別に組み合わされ、当該ドキュメントの総合値又は総合スコアとされる。ドキュメント品質に関する定量化可能な値の、他の方法による測定、割り当て、もしくは関連付けは本発明の範囲内にある。本発明は本明細書に開示する特定の方法に限定されず、ドキュメント品質に関する値の決定というより広い概念に関連する。
本発明の好適な実施形態では、各ルールは0から1の範囲にある値を生成すべく定義される。0は低い値、1は高い値を示す。これにより、定量化された品質の値を計算し、組み合わせて総合的なドキュメント品質測度を生成できる。
i番目のルールについて値Viが計算される場合、これらの寄与度の関数Eとして、VEU = E(V1, V2, … VN)となるドキュメント品質測度VEUが生成される。組み合わせ関数Eは、寄与度の重み付き平均等、簡易なものであってよい。但し、他の寄与度が如何によくても、悪い寄与度が存在すればドキュメント品質は低下し得ることから、直線的な組み合わせは望ましくない。
上記式を書き換えると、VEU = (Σwi (Vi)-p )-1/pとなる。好適な実施形態では、wiファクタはルールの相対的な重要性を特定する重みであり、その和は1である。指数pにより、1つの悪値が多くの良値を圧倒し得る非直線性を採り入れる。指数pの値が大きければその分効果は大きい。
上記式の代替式は、VEU = (Σwi (d + Vi)-p )-1/p - dとなる。wiファクタはルールの相対的な重要性を特定する重みであり、その和は1である。指数pにより、1つの悪値が多くの良値を圧倒し得る非直線性を採り入れる。パラメータdは0よりもやや大きい数字である。指数pの値が大きければその分効果は大きい。
他の組み合わせ関数は、例えば各寄与度の積である。寄与度の重み付けが望ましければ、VEU = ΠVi wi'で得られる。
なお、説明では使いやすさの定量化処理に関する(諸)回路を示すが、この処理はマイクロプロセッサやファームウェアにより、ソフトウェアで実行してもよい。定量化は特定の回路に限定されず、以下に説明する方法を実施できるものであれば、任意のソフトウェアやハードウェアの組み合わせが可能である。
美観の測定の場合と同様、使いやすさの測定では、使いやすさに寄与している定量化可能な特徴の識別が必要である。このような特徴を測定・組み合わせる方法の例を示す。
最初に考察される特徴は、ドキュメントの論理構造、すなわちドキュメントコンテンツのグループへの組織化に関する特徴である。ドキュメント品質の評価では、これらのオブジェクトが如何なる種類のコンテンツであるか(画像、写真、見出し、タイトル、ブロック、境界線、リスト、表等)に関して、当該コンテンツオブジェクトを識別する必要がある。当然ながら、これはドキュメント作成者もしくは現像者が想定し、作成中もしくは既に作成したドキュメントの種類に依存するところが大きい。
当該ドキュメントのコンテンツが識別されると、図33に示すように、他のコンテンツ、他のコンテンツグループ、他のコンテンツグループメンバー(1104、1105、1106)や要素、隣接コンテンツ(1101、1102、1103)から当該コンテンツを識別すべく、如何にして当該コンテンツがグループ化されようとしているかに関し、当該コンテンツを特徴付けることが必要である。これは、図34に示すように、当該コンテンツオブジェクトをコンテンツのツリー構造に解剖することにより実施される。コンテンツツリーのノード135はコンテンツグループ(リスト、表等)、コンテンツツリーの枝130のリーフはコンテンツ要素(パラグラフ、画像等)である。なお、コンテンツツリー、枝、ノード等の作成、及びコンピュータサイエンスのコンテキストでツリーを如何にしてトラバースするかは当業者には自明である。
コンテンツツリーが作成されると、当該コンテンツオブジェクトに隣接するコンテンツを識別する必要がある。1回の手順でコンテンツツリーを得て、ツリーの上方にトラバースし、隣接する枝々を識別する。もう1回の手順でコンテンツツリーを下方に移動させ、識別された隣接枝の要素を調査する。このようにして当該コンテンツに隣接するコンテンツが識別できる。
最初に、コンテンツグループGと関連された隣接コンテンツリストが空リストとして初期化される。コンテンツツリーは上方にトラバースされ、コンテンツグループGに隣接する枝が識別される。次いで、識別されたコンテンツの枝の要素を調査すべくコンテンツツリーは下方にトラバースされる。グループGのノードから所定距離外にあるとみなされる枝は削除される。「付近」の枝とみなされる枝のみを繰り返し分析する。なお、ここで説明する処理はグループGの隣接コンテンツNを識別することを含むが、グループGは実際にはコンテンツグループを含まなくてもよく、グループGはコンテンツの一つの要素(パラグラフ、画像等)であってもよい。
手順IsNeighbor(G,N)は、ここではノードNをグループGの隣接ノードとして考察すべく、ノードNがコンテンツグループGの閾値距離内にあるか否かを確認するための手順である。この手順は、グループGと隣接ノードNとの間の距離を計算し、この距離を閾値変数CloseEnoughと比較し、Distance(G,N)<CloseEnoughであるか否かを判断することで容易に実施できる。
距離は、コンテンツ境界間の距離もしくはコンテンツ中心間の距離とすることができる。コンテンツ境界間の距離の場合、グループGのコンテンツ中心を(xG, yG)、隣接ノードNを(xN, yN)、グループG及び隣接ノードNの幅及び高さを各々(wG, hG)及び(wN, hN)とすると、距離は、max(abs(xG-xN) - (wG+wN)/2, 0) + max(abs(yG-yN) - (hG+hN)/2, 0)の関係により容易に計算できる。コーナ間の最小ユークリッド距離のように、より複雑な距離計算も利用できる。
閾値CloseEnoughは定数であってもよいし、コンテンツサイズに応じて調整可能な値であってもよい。オブジェクトGの面積の平方根を利用し、CloseEnough = (Area(G))1/2となるよう閾値を決定してもよい。CloseEnough = S* (Area(G))1/2となるよう、ファクタSによっても閾値をスケーリングできる。Sは、典型的には1に近い。
距離の評価もしくは閾値の決定方法は、本発明を制限するものではない。コンテンツオブジェクトに対する、他の方法による距離測度の決定は本発明の範囲内にある。本発明はドキュメント品質評価のコンテキストにおけるコンテンツオブジェクト間の距離測度の利用というより広い概念に関連する。
下に示す擬似コードは、コンテンツツリーがどのようにトラバースできるかを示す。なお、この擬似コードは一例であり、コンピュータ科学及びプログラミングに関わる当業者が自らのシステムにおいて実施すべく、アンドゥー(undo)実験を経ずとも変更し得ることを意図している。また、グループGは調査が進行中のコンテンツ、Cはノード、Pはノード、Nは調査中のノードを識別すべく便宜上の指数として使用される。
TraverseUp(G, C)

if node C is the root node then return /* done */
P = parent(C)
for each child node N of parent P
if child N is different from C then
TraverseDown(G, N)
TraverseUp(G, P)
return


TraverseDown(G, N)

if IsNeighbor(G, N)
then add node N to the list of neighbors of group G
otherwise return
if node N is not a leaf node
then for each child C of node N
TraverseDown(G, C)
return

コンテンツグループGに対する隣接ノードNのツリーの深さは、深さのパラメータdを加えることで得られる。但し、d+1は再帰呼出しにおいてTraverseUpにパスされ、d−1は再帰呼出しにおいてTraverseDownにパスされる。深さdの初期値は0、すなわちTraverseUp(G, G, 0)である。深さは、他の情報と共に、グループGの隣接ノードの既述のリストに格納できる。
ドキュメントのコンテンツが解剖され、当該コンテンツオブジェクトの全てについて隣接コンテンツが識別されると、コンテンツ分離に関する各種特性が決定できる。各種特性は続いてドキュメント品質の定量化に使用される。
図36乃至図41に示すように、使いやすさの決定に用いられる別のパラメータもしくはファクタは、ドキュメントの分離性の測度及び定量化である。
本発明の好適な実施形態では、ドキュメントの総合的な分離度は、ドキュメントに含まれる当該コンテンツオブジェクトの総合的な分離度を決定することで確認できる。コンテンツオブジェクトの分離性の個々の測度として、特に、空間分離(図37)、位置合わせ分離(図38)、スタイル分離(図39)、背景分離(図40)、及び特有の分離(図41)が挙げられる。
コンテンツに関する分離性の測度の結合は、図36に示すように、ドキュメントコンテンツの、効果的なコンテンツ分離度を評価する上で有用である。効果的な分離は、ドキュメントコンテンツの、総合的なコンテンツ分離度を評価する上で有用である。すなわち、ドキュメントの総合的な分離性の度合もしくは測度を評価する上で有用である。総合的な分離度は、続いてドキュメント品質の評価に用いられる。
詳細には、図36に示すように、効果的な分離性は、空間分離、位置合わせ分離、スタイル分離、背景分離、及び/又は特有の分離を結合したものとみなす。図36では、定量化された位置合わせの値は、空間分離、位置合わせ分離、スタイル分離、背景分離、及び/又は特有の分離を、効果的な分離性定量化器すなわち結合器回路21により結合することにより得られる。
なお、説明では一例として効果的な分離性定量化のための回路を示すが、この処理はマイクロプロセッサやファームウェアにより、ソフトウェアで実行してもよい。定量化は特定の回路に限定されず、以下に説明する方法を実施できるものであれば、任意のソフトウェアやハードウェアの組み合わせが可能である。
図37に示すように、使いやすさの決定に用いられる別のパラメータもしくはファクタは、ドキュメントの空間分離の測度及び定量化である。
本発明の好適な実施形態では、グループもしくは要素に関する空間分離(SpatialSep)は、当該グループもしくは要素と、各識別された隣接グループもしくは要素との間の最小離間距離とすることができる。評価中のコンテンツの境界ボックス(中心位置、幅及び高さ)の寸法を用いて、空間分離は、フロアを0とし、水平方向及び垂直方向の成分間の距離とすることができる。最大分離ファクタによりスケーリングする(例えば、ページの幅(Wp)及び高さ(Hp)によりスケーリングする)ことで、(max(abs(xG-xN) - (wG+wN)/2,0)/Wp + max(abs(yG-yN) - (hG+hN)/2,0)/Hp )/2を用いて0から1までの値を得るべく空間分離を更に正規化できる。
コンテンツオブジェクト間の空間的距離を評価する上述の特定の方法は一例であり、本発明を制限するものではない。他の方法(様々な空間分離に対する測定された人間の反応の関数等)は本発明の範囲内とする。本発明はドキュメント品質評価のコンテキストにおける総合的な分離度の決定に空間分離測度を利用するという、より広い概念に関連する。
図38に示すように、使いやすさの決定に用いられる別のパラメータもしくはファクタは、ドキュメントの位置合わせ分離の測度及び定量化である。
本発明の好適な実施形態では、ここで使われる「位置合わせ分離」は特定ページのオブジェクトGの1以上の位置が隣接コンテンツNの対応位置と一致することを意味する。位置合わせ分離は、コンテンツがページ中で対応する位置の一致を如何に回避するかである。グループG(110)の左、右、上、下の各ページ位置(xGL, xGR, yGT, yGB)、及び隣接コンテンツN(1101)のページ位置(xNL, xNR, yNT, yNB)を利用すると、位置合わせ分離は、min(abs(xGL-xNL), abs(xGR-xNR), abs(yGT-yNT), abs(yGB-yNB))により与えられる、対応位置の絶対差の最小値である。
位置合わせ分離は、ドキュメントページの、min(abs(xGL-xNL)/Wp, abs(xGR-xNR)/Wp, abs(yGT-yNT)/Hp, abs(yGB-yNB)/Hp)により表されるように、コンテンツが存在する位置(ページ幅Wp及びページ高さHp)における最大可能差を除することで、0から1までの値に更に正規化できる。
或いは、位置合わせ分離は、min((abs(xGL-xNL) + abs(xGR-xNR))/Wp, (abs(yGT-yNT) + abs(yGB-yNB))/Hp)もしくはmin(max(abs(xGL-xNL)/Wp, abs(xGR-xNR)/Wp), max(abs(yGT-yNT)/Hp, abs(yGB-yNB)/Hp))で与えられる、多数のエッジ間の位置合わせ分離の和を求めることで測定し得る。
位置合わせ及び位置合わせ分離を評価する上述の特定の方法は一例であり、本発明を制限するものではない。他の方法(様々な位置合わせ分離量に対する測定された人間の反応の関数等)は本発明の範囲内とする。本発明はドキュメントの使いやすさ及びドキュメント品質評価のコンテキストにおける総合的な分離度の決定にコンテンツオブジェクトの位置合わせ分離測度を利用するという、より広い概念に関連する。
図39に示すように、使いやすさの決定に用いられる別のパラメータもしくはファクタは、ドキュメントのスタイル分離の測度及び定量化である。
本発明の好適な実施形態では、ここで使われる「スタイル分離(StyleSep)」はオブジェクトを更に識別する手段を与える。スタイル分離度を得るには、コンテンツタイプを他のあらゆるスタイルタイプ及びその間のスタイル分離量に割り当てられた値と比較する必要がある。このような値の割り当てにより、ドキュメント現像者により判断呼出しが行われる。例えば、あるドキュメント現像者はTEXTのIMAGEからの識別を、LISTのTABLEからの識別に比べ容易とみなす場合がある。従って、この現像者は、LISTとTABLEの2つのコンテンツタイプを識別する方がはるかに難しいことから、LIST対TABLEのタイプについてより小さいスタイル分離値を割り当てる。
すなわち、LISTとTABLEではスタイル分離度が小さい。一方、TEXT対IMAGEでは、上述のように、現像者はこの2つのコンテンツタイプの識別ははるかに容易だとみなす場合がある。従って、スタイル分離度は大きく、タイプTEXT対タイプIMAGEには、スタイル分離表(例えば、TypeSepTable)において高い値が割り当てられる。スタイル分離表は多次元で、タイプによりインデックスされていることが好ましい。
スタイル分離表(TypeSepTable)は、全てのタイプの値を全ての他のタイプと対比させて含む。例えば、コンテンツタイプIMAGEには、コンテンツの他の全てのタイプ(TEXT、IMAGE、GRAPHIC、LIST、TABLE等)に対するスタイル分離値が割り当てられる。既述のごとく、タイプIMAGEに対するタイプTEXTはそれぞれのスタイル分離度に関する値を1つ有する。タイプIMAGEに対するタイプGRAPHICはそれぞれのスタイル分離度に関する値を有する。全てのタイプは、2つのコンテンツタイプ間のスタイル分離度に関する値を容易に検索できる方法で格納される。
いったんスタイル分離表が作成されると、コンテンツグループのオブジェクトGと識別された隣接オブジェクトNとの間のスタイル分離値は、ここでType()と称する、コンテンツタイプの数をリターンする関数を用いて、分離値の表から容易に検索できる。2つのコンテンツタイプ間の分離の所定値は、関数にtype(G)及びtype(N)に関する値をリターンさせることで、スタイル分離値の表から検索される。この例では、StyleSep = TypeSepTable[type(G)][type(N)]である。
2つのオブジェクトがいずれも同一タイプに属する場合、一方のオブジェクトのスタイル値を他方の対応するスタイル値と比較してよい。スタイル値の対毎に、スタイル差を計算できる。フォントサイズ、行送り等の数に関するパラメータに関しては、サイズ値の単なる絶対的な差としてスタイル差を計算してよい。色等の多角的な値に関しては、スタイル差を値間の距離としてよい。クワッディング、フォントファミリー、フォントスタイル等の計数値に関しては、当該2つのオブジェクトの差を検索するため、計数値でインデックスされた二次元ルックアップテーブルを利用できる。総合的なスタイル分離差は、当該オブジェクトタイプについて得られる様々なスタイル差の加重和となる。例えば、StyleSep = Σwi di(G, N)となる。このとき和は利用可能なスタイルパラメータiより大きく、wiはi番目のスタイルパラメータの重み、diはi番目のスタイルパラメータの差の測度である。
スタイル分離を評価する上述の特定の方法は一例であり、本発明を制限するものではない。他の方法(様々なスタイルに対する測定された人間の反応の関数等)は本発明の範囲内とする。本発明はスタイル分離を決定する特定の方法に限られず、ドキュメントの使いやすさ及びドキュメント品質評価のコンテキストにおけるコンテンツの分離性の決定にスタイル分離測度を利用するという、より広い概念に関連する。
図40に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの背景分離の測定及び定量化である。
本発明の好適な実施の形態において、異なる色の背景上のオブジェクトを別個の異なったものとみなすことができる。よって、背景分離を、2つのオブジェクト(110及び1101)の背景1102の差異として考えることができる。例えば、背景色1102がオブジェクトG1101又はその先祖(上位のもの)のうちの1つのスタイルパラメータである場合、指定された背景を有する第1のオブジェクトが見出されるまでコンテンツツリーが上方向に検索される。下記の擬似コードはこの検索を示す。
FindBackground(G)

if G specifies a background color
then return that color
otherwise
if G is the root of the content tree
then return the default background color (e.g. white)
otherwise
return FindBackground(parent(G))

すなわち、
FindBackground(G)

if Gが背景色を特定
then 当該色をリターン
otherwise
if Gがコンテンツツリーのルート
then デフォルトの背景色(例えば、白)をリターン
otherwise
FindBackground(parent(G))をリターン

一方、背景が、問題のオブジェクトと同一グループ(又はおそらく親グループ)のメンバーである長方形などのコンテンツオブジェクトである場合、他の検索を行う必要がある。その擬似コードは以下の通りである。
FindBackground(G, C)

if C is the root of the content tree
then return the default background color (e.g. white)
P = parent(C)
for each child K of P
if K is different from C and K is a rectangle and K encloses G
then return the color of K
return FindBackground(G, P)

すなわち、
FindBackground(G, C)

if Cがコンテンツツリーのルート
thenデフォルトの背景色(例えば、白)をリターン
P = parent(C)
for Pの各子孫(下位のもの)K
if KがCと異なる and Kが長方形である and KがGを囲む
then Kの色をリターン
FindBackground(G, P)をリターン

Gを囲むKのテストを、例えばK及びGの境界ボックスを用いて行い、Gの境界ボックスの角がKのボックスの角の内側にあることを確実にすることができる。
2つのオブジェクトの背景を決定した後、差の測度を得ることができる。L*a*b*座標のような、視覚的均一性を追求する色空間内の距離を用いて色の差を決定することができる。他の色空間も使用可能である。
簡単に見分けがつくほど色が十分に異なっている場合、これらの色の差異が更に大きくなっても分離性は高まらないため、背景分離の測度を単に色空間内の色と色の間の距離とするべできはない。ゼロに近いものを除いた色差の全ての値に対して1である距離の関数が好ましい。この関数を得るための1つの方法は、大きな係数で色差Dcをスケーリングし、その結果を1にクランプすることである。
例えば、BackgroundSep=min(s*Dc,1)とすることができる。代わりの方法は、差の値のn乗根を用いて、色差Dcを0乃至1の範囲に制限することである。例えば、BackgroundSep=Dc1/rとする。ここで、rの値が大きいほど、これらの色の適合がより密になり、背景分離を提供することができなくなる。
本明細書に述べられるこの特定の背景分離評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において、特定の背景分離計算方法のみでなく、コンテンツ分離性の決定に背景分離の測度を用いる、という更に広範囲の概念にも関連するように、例えば、異なる背景に対する人間の反応の測定によって得られる関数など、他の背景分離決定方法を本発明の範囲内にあるとみなすべきである。
図41に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの特有分離の測定及び定量化である。
本発明の好適な実施の形態では、特徴が構築されてコンテンツオブジェクトになることが多い。このような特徴は、オブジェクト自体に特有のものとみなされる。一例としては、オブジェクトの境界1103又はインデントされた第1のラインであり、又は他のオブジェクトからの分離を特有に示す他の特徴である。内部のラインの間隔とは異なる、段落の前又は後にある間隔も分離を示すことができる。また、単一の境界で区別をつける、即ち、側部ではなく上部での分離を示すようにしか機能しないセパレータもある。
そのため、特有分離を計算するには、調査対象のオブジェクトの4つの側部の各々を別々に考慮する必要がある。例えば、wiが、上部境界fTopi(G)に対するi番目の相対重要度を表す重みであると仮定する。これらの重みは合計で1にならなくてはならない。そして、パラメータpは、功を奏する分離特徴が他の特徴をいかに強く圧倒するかを決定し、1近くになるべきであるが0による分割を避けるためにそれよりもわずかに大きくてもよい定数cがあると仮定する。そして、特有分離をInherentSepTop=c-[Σwi *(c-fTopi(G))-p]-1/pによって定義することができる。同様の式が、InherentSepBottom、InherentSepLeft、及びInherentSepRightの特有分離を定義する。
近傍物Nが主にオブジェクトGの上にあるか、下にあるか、左にあるか、又は、右にあるか、により、これらのInherentSep値のうちの1つを近傍物Nに対してより適切なものにすることができる。例えば、
q1 = wG * (yN - yG) + hG * (xN - xG), and
q2 = wG * (yN - yG) - hG * (xN - xG) then:
if q1 > 0 then if q2 > 0 then
use InherentSepTop
otherwise
use InherentSepRight
otherwise if q2 > 0 then
use InherentSepLeft
otherwise
use InherentSepBottom.
すなわち、
q1 = wG * (yN - yG) + hG * (xN - xG), and
q2 = wG * (yN - yG) - hG * (xN - xG) then:
if q1 > 0 then if q2 > 0 then
InherentSepTopを使用
otherwise
InherentSepRightを使用
otherwise if q2 > 0 then
InherentSepLeftを使用
otherwise
InherentSepBottomを使用.
近傍物Nも特有分離を有することに注意する。よって、オブジェクトG及び近傍物Nの双方からの相補的特有分離を組み合わせることもできる。例えば、近傍物NがオブジェクトGよりもやや上にある場合、GのInherentSepTop及びNのInherentSepBottomの合計を使用する。あるいは、G及びNからの相補的特有分離の最大値を使用することができる。近傍物からのInherentSepは、前述のようにして選択された上、下、左又は右の特有分離のうちの1つである。
本明細書に述べられるこの特定の特有分離評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において、特定の特有分離計算方法のみでなく、コンテンツ分離性の決定に特有分離の測度を用いる、という更に広範囲の概念にも関連するように、例えば、異なる特有分離特徴に対する人間の反応の測定によって得られる関数など、他の特有分離決定方法を本発明の範囲内にあるとみなすべきである。
図36に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの効果的分離の測定及び定量化である。
本発明の好適な実施の形態では、分離性の測度に対する寄与度を組み合わせ、特定の近傍物からのコンテンツオブジェクトの効果的分離(EffectiveSep)の程度を形成することができる。これは、EffectiveSep=c-[wx *(c-SpatialSep)-p+wa *(c-AlignmentSep)-p+ws *(c-StyleSep)-p+wb *(c-BackgroundSep)-p+wn *(c-InherentSep)-p]-1/pによって得られ、項wx、wa、ws、wb及びwnは合計で1になる重みである。個々の分離測度を組み合わせる他の方法が実施可能であるが、この方法は、オブジェクトGと近傍物Nとの間の分離値のうちのいずれかが1に近い場合、効果的分離も1に近くなる、という特性をもつ。
本明細書に述べられるこの特定の効果的分離評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において、特定の効果的分離決定方法のみでなく、コンテンツの分離性の決定にコンテンツの効果的分離の測度を用いる、という更に広範囲の概念にも関連するように、例えば、異なる効果的分離デバイスに対する人間の反応の測定によって得られる関数など、他の効果的分離決定方法を本発明の範囲内にあるとみなすべきである。
本発明の好適な実施の形態では、全分離、即ち全ての近傍物からのオブジェクトの全分離の総合測度を得るために、オブジェクトGとその全ての近傍物との間の効果的分離の最小値を決定しなければならない。
本実施の形態では、この決定は、各近傍物の分離値を組み合わせることを意味する。全分離は、TotalSep=mini(EffectiveSepi)によって得られ、EffectiveSepiはi番目の近傍物のEffectiveSep値であり、全ての近傍物に対する最小値を得る。平均分離を用いた代替法も想定される。最も近い距離に対して最も大きい重みを与える平均法を、逆数の冪の合計の逆数根によって定義することができる。例えば、TotalSep=[(1/n)*Σ(c+EffectiveSepi)-p]-1/p-cである。式中、nは近傍物の数、cはゼロによる分割を防ぐための小さな定数、そして冪pは小さな分離がどの程度強く支配するかを決定する。オブジェクトに近傍物がない場合、そのTotalSep値は1であるべきである。
本明細書に提供されるこの特定の全分離評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、全体的なコンテンツの分離を計算する特定の方法のみでなく、ドキュメントの質の評価にドキュメントコンテンツの全分離の測度を用いる、という更に広範囲の概念にも関連するように、他の全分離決定方法を本発明の範囲内にあるとみなすべきである。
ドキュメントの総合的な分離性の測度は、全てのドキュメントコンテンツオブジェクト及びグループの全分離を組み合わせることによって決定される。この決定を、単純平均で行うことができる。しかし、分離性の値が小さいオブジェクト又はグループはドキュメント全体の値に不利な影響を与える可能性があるため、冪の根として組み合わせることによって更に大きな重みが与えられなくてはならない。
本明細書に提供されるこの特定の全分離性評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が全分離性計算方法のみでなく、ドキュメントの使いやすさやドキュメントの質の評価にドキュメントコンテンツの全分離性の測度を用いる、という更に広範囲の概念にも関連するように、他の全分離性決定方法を本発明の範囲内にあるとみなすべきである。
分離性は、オブジェクトが存在するコンテンツツリー階層内のレベルによって変わり得る。コンテンツツリーを再帰的にトラバースすることにより分離性を計算するアルゴリズムが本明細書において提供される。このアルゴリズムは、コンテンツのツリーレベルLによって変わる重みwLを用いて重み付き平均を計算する。下記の擬似コードが例として提供される。
Separability(G)

if G is a leaf node
then return TotalSep(G)
otherwise
for each child C of G
call Separability(C) and find the average of these values A
return wL * TotalSep(G) + (1 - wL) * A

すなわち、
Separability(G)

if Gがリーフノード(末端のノード)
then TotalSep(G)をリターン
otherwise
for Gの各子孫(下位のもの)C
Separability(C)をコール and 値Aの平均を求める
wL * TotalSep(G) + (1 - wL) * Aをリターン

前述のSeparability()ルーチンは、コンテンツツリーのルートノードから開始すべきである。
ドキュメントの分離性の総合的な程度を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において測定される個々のコンテンツの分離性の組み合わせに基づいてドキュメントの分離性を決定する、という更に広範囲の概念に関連するように、例えば、異なる分離技術に対する人間の反応の測定によって得られる関数など、他の分離性決定方法を本発明の範囲内にあるとみなすべきである。
図43乃至図46に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの識別度の測定及び定量化である。
本発明の好適な実施の形態において、2つの同一段落が複数頁のドキュメントの2枚の別個の頁の最上部に位置し、これらの段落が各々の頁における唯一のコンテンツであると仮定した場合、これらのオブジェクトの段落の分離性の程度を、1つのオブジェクトが終わって他のオブジェクトが始まる箇所の決定に基づいて決定することができる。この場合、これらのオブジェクトには同頁に近傍オブジェクトがないため、分離性の値は大きくなる。即ち、オブジェクトが互いに近いほど、これらの差異の認知が容易になる。
一方、これら2つのオブジェクトの識別度の測度は小さい。これは、関係枠を提供する近傍オブジェクトがなく、2つの段落のどちらが実際に調べられているのかに関する手がかりが殆ど与えられないためである。
図44に示されるように、見出しは後に続くコンテンツを区別することができる。見出しを、コンテンツオブジェクトのグループの始めにある別個の段落(通常は見出しとして区別するために異なるスタイルをもつ)とすることができる。リスト要素の番号付けや、リスト要素ほど多くはないが、黒丸のついた要素も、コンテンツの区別を助ける。例えば、章、セクション、リスト要素など、見出しには階層があり得る。各見出しは、その下にあるオブジェクトを、近傍のオブジェクトと区別できるようにすることに寄与する。
一般に、見出しがコンテンツツリー内で低い(下位にある)ほど、見出しが適用されるコンテンツのセットは小さくなる。よって、識別が更に明確になる。コンテンツツリー内のレベルの低い見出しや、物理的により近接した見出しは、より高いレベルのものよりも有用である。
下記の再帰的アルゴリズムは、オブジェクトGの識別度に対する見出しの寄与度を決定する。このアルゴリズムは、見出しのコンテンツオブジェクトが識別済みであると仮定する。見出しの寄与度は、ツリーでのオリジナルオブジェクトからの上方向の距離に従って重み付けされる。
HeadingDistinguish(G)

if G is the root
then return 0
P = parent(G)
if P is a list
then if P numbers the list elements
then R = ListNumberWeight
otherwise if P is a bulleted list
then R = ListBulletWeight
otherwise R = 0
if a child of P is a heading
then R = minimum(R + HeadingWeight, 1)
return w * R + (1 w) * HeadingDistinguish(P)

すなわち、
HeadingDistinguish(G)

if Gはルート
then 0をリターン
P = parent(G)
if Pはリスト
then if Pはリスト要素に番号を付す
then R = ListNumberWeight
otherwise if Pは黒丸リスト
then R = ListBulletWeight
otherwise R = 0
if Pの子孫(下位のもの)はリスト
then R = minimum(R + HeadingWeight, 1)
w * R + (1-w) * HeadingDistinguish(P)をリターン

ListNumberWeight、ListBulletWeight及びHeadingWeightといった表現は、見出しの結果に対する一定の寄与度である。これらは、0と1の間の値を有する。リスト番号は明瞭であり、これらに対応するリスト要素のコンテンツオブジェクトに近接しているため、ListNumberWeightは最大の値を有するはずである。これに対し、見出しは全てのリスト要素に適用されるため、HeadingWeight及びListBulletWeightはより少ない値を有する。黒丸の付いた要素は、リスト内の全ての要素の値と同一の値を有する。オブジェクトに近接した黒丸があるため、ListBulletWeightはHeadingWeightより大きくてもよい。重みwは、現行のツリーレベルにある見出しの、より高いレベルの見出しに対する相対重要度を示す。例えば、w=0.5である場合、現行レベルの見出しは、より高いレベルの見出しを組み合わせたものと同じくらい重要であるとみなされる。
オブジェクトG及び近傍物Nは、図45に示すように、コンテンツのタイプや値に基づいて区別可能でなくてはならない。異なるタイプのコンテンツ(1106、1107及び1108)に関し、これらの値の差を、コンテンツタイプによって索引が付けられた2次元テーブルから取得することができる。このテーブルは、単にこれらのコンテンツタイプがどの程度異なるかを表す値を含むことが好ましい。タイプ(G)がタイプ(N)に適合しない場合、ContentDistinguish=TypeDistinguishTable[type(G)][type(N)]となる。
これらのタイプが適合する場合、コンテンツの特性を比較することができる。グループ、リスト及びテーブルに関しては、これらに含まれる全ての要素の単語又は文字の総数を比較することができる。
例えば、段落の場合、単語又は文字の数を数えることができる。リストの場合、リスト要素の数を比較することができる。テーブルの場合、行及び列の数を比較することができる。グラフィックオブジェクトの場合、サイズ及び形状を比較することができる。あるオブジェクトタイプはいくつかの特性を備え、その特性によって差異が測定される場合があるため、総合的な差異は、オブジェクトタイプに対する種々のコンテンツの差異の加重和として計算されることが好ましい。例えば、ContentDistinguish=Σwicdi(G,N)であり、ここで合計は利用可能なスタイルパラメータiに関するものであり、wiはi番目のコンテンツの差異の測度の重みであり、cdiは実際のi番目の差異の測度である。
また、図46に示されるように、オブジェクトを各々の頁上の位置によって区別することができる。オブジェクトG、近傍物N、並びに頁100上のこれらのオブジェクト110の中心位置(xG, yG)及び(xN, yN)を与えられたとすると、これらの間の距離を計算することができ、好ましくは頁の寸法WP×HPで正規化することができる。
例えば、PositionDistinguish=(((xG-xN)2+(yG-yN)2)/(WP 2+HP 2))1/2である。同一頁上のすぐ近くの近傍物のみを考慮することにより、この位置を更に限定することができる。そして、分離性のために生成された近傍物のリストと同一のものを利用することができる。しかし、頁上のオブジェクトに比較を限定することの代償は、異なる頁上のオブジェクトが区別不可能であるという事例を認識できないことにある。
(前述の)AlignmentSep、StyleSep、BackgroundSep及びContentDistinguish測度のうちのいずれかが大きな差異をもたらす場合、総合的な効果的識別度は高くなるはずである。近傍物がオブジェクトに近いほど、それらの差異の観測が容易になるはずである。この最終結果は、SpatialSepからブーストを受けなくてはならない。PositionDistinguishの値を、更なる区別要素とすることができる。ブーストbがb=d/(d+SpatialSep)によって定義され、パラメータdが空間的近さのブースト効果の強度を制御する場合、EffectiveDistinguish=c-[wa *(c-b*AlignmentSep)-p+ws *(c-b*StyleSep)-p+wb *(c-b*BackgroundSep)-p+wc *(c-b*ContentDistinguish)-p+wp *(c- b*PositionDistinguish)-p]-1/pであり、wa、ws、wb、wc及びwpはそれぞれ位置合わせ、スタイル、背景、コンテンツ及び位置の差異の相対重要度を与える重みの値であり、これらは合計で1になるべきである。定数cは、ゼロによる分割を防ぐため、1よりもわずかに大きい。これは、オブジェクトとその近傍物のうちの1つとの間の効果的識別度であることに注意する。
コンテンツオブジェクトの全識別度を定量化するために、コンテンツオブジェクトを全ての近傍物から区別しなくてはならない。また、ヘッダーなどの特有の特性も考慮する必要がある。全ての近傍物に対する全てのEffectiveDistinguish値の最小値を得ることにより、全識別度を決定することができる。
あるいは、各項を累乗し、その逆数の冪を合計に適用することができる。すなわち、TotalDistinguish=wh *HeadingDistinguish+(1-wh)*([(1/n)*Σ(c+EffectiveDistinguish)-p]-1/p-c)である。ここで、whは近傍を差異化する特性に対するHeadingDistinguish特性の重みであり、nは近傍物の数であり、定数cはゼロによる分割を防ぐための小さい定数であり、冪pは、近い類似性がどの程度強く支配するかを決定する。
図43に示されるような識別度測度の組み合わせは、ドキュメントの全識別度の評価に有用である。
より詳細には、図43に示されるように、全識別度は効果的識別度及び見出し識別度の組み合わせとみなされる。図43では、定量化された識別度の値は、全識別度定量化器又は結合器回路23を用いて、効果的識別度及び見出し識別度を組み合わせることにより得られる。
この図は全識別度定量化プロセス用の回路を示しており、このプロセスをマイクロプロセッサ及び/又はファームウェアによってソフトウェア内で実行することもできることに注意する。定量化は特定の回路に限定されておらず、後述の方法を実施することのできるソフトウェア及び/又はハードウェアの任意の組み合わせが可能である。
ドキュメントの総合識別度を、全てのコンテンツオブジェクト及びグループに対する全ての全識別度の組み合わせとして定義することができる。これらの値を、単純平均を用いて組み合わせることができる。しかし、代わりの方法も可能である。
オブジェクトとの区別が困難な近傍物が存在する場合、ドキュメントの総合識別度は低くなるはずである。識別度の値が小さいオブジェクト又はグループはいずれもドキュメント全体に不利な影響を与えるため、冪の合計の根として組み合わせることによって更に大きな重みが与えられるべきである、と論じられる場合がある。
他の論点は、識別度の重要度がコンテンツの階層レベルによって変わるか否か、ということである。例えば、章の区別が可能であることを段落の区別が可能であることよりも重要にすべきか否か、ということである。コンテンツツリーの再帰的トラバースによってドキュメントの識別度を計算するアルゴリズムを前述した。これは、重み付き平均を計算するものである。前述したように、重みwLはツリーレベルLによって変わる場合がある。
コンテンツツリーを用いたドキュメントの識別度の決定を、コンテンツツリーのルートノードに対して呼び出される下記の擬似コードによって実行することができる。
Distinguishability (G)

if G is a leaf node
then return TotalDistinguish(G)
otherwise
for each child C of G
call Distinguishability(C) and find the average A of values
return wL * TotalDistinguish(G) + (1 - wL) * A

すなわち、
Distinguishability(G)

if Gはリーフノード
then TotalDistinguish(G)をリターン
otherwise
for Gの各子孫(下位のもの)C
Distinguishability(C)をコール and 値Aの平均を求める
wL * TotalDistinguish(G) + (1 - wL) * Aをリターン

ドキュメントの識別度の総合的な程度を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において測定される個々のコンテンツの識別度の組み合わせに基づいてドキュメントの識別度を決定する、という更に広範囲の概念に関連するように、例えば、異なる識別デバイスに対する人間の反応の測定によって得られる関数など、他の識別度決定方法を本発明の範囲内にあるとみなすべきである。
図47乃至図51に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの検出性の測定及び定量化である。
本発明の好適な実施の形態において、検出性という用語は、全ての他のコンテンツ項目の中から特定のコンテンツ項目を見出す、すなわち、位置付ける能力を意味するように用いられる。検出性の測度は、コンテンツオブジェクトの位置付けを助けるか又はこれを阻止するドキュメント要因を調べることによって構築される。
図50に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの視認性の測定及び定量化である。
本発明の好適な実施の形態において、オブジェクトの検出性を決定する1つの要因は、オブジェクトの視認性、即ち、オブジェクトがその背景に対してどの程度良く見えるかを決定することである。本明細書に使用されるように、視認性は、オブジェクトを見ることがどの程度容易であるか、又はオブジェクトを見落とすことがどの程度難しいかを意味する。本明細書では、オブジェクトの視認性の値の測定に2つの特性を用いる。1つはオブジェクトのサイズ1110であり(オブジェクトが大きいほどオブジェクトの検出及び識別が容易になる)、もう1つはオブジェクトの背景との差異(1111)である。
背景との差異(1111)の測度として輝度対比が用いられるが、他の、そしてより多くの複雑な測度も想定される。背景にテクスチャーがある場合、輝度対比及び色差が明確に定義されない場合がある。テクスチャーは、オブジェクトを隠すように作用してしまう場合もある。
色が、0と1との間の範囲に及ぶように正規化された赤、緑及び青(R、G、B)の座標で特定されている場合、輝度をY=yrR+ygG+ybBによって得ることができ、yr、yg及びybはそれぞれ赤、緑及び青の原色の輝度値である。yr、yg及びybの値は実際に使用される色空間の詳細によるが、一般的な値はそれぞれ0.25、0.68及び0.07である。
コントラストは前景の輝度Yf及び背景の輝度Ybから計算され、Contrast=2|Yb-Yf|/(Yb+Yf)となる。コントラスト及びサイズは共に視認性に影響を及ぼすため、これらの値は互いに乗算することによって組み合わされることを指摘しなくてはならない。コントラストは0と1との間の範囲にわたるが、サイズを無限にすることができる。0及び1によって制限されるサイズの場合、オブジェクトのサイズは、その最大サイズで割ることによって正規化される。例えば、視認性=コントラスト×(オブジェクト面積)/(最大面積)である。一般に、最大面積はドキュメントの面積である。しかし、オブジェクトが頁に制限される場合、頁サイズを用いることができる。
オブジェクトの視認性の程度を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。例えば、視認性に関連するオブジェクトの特性に対する人間の反応の測定によって得られる関数など、他の視認性決定方法を本発明の範囲内にあるとみなすべきである。
図49に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの構造的検出性の測定及び定量化である。
本発明の好適な実施の形態において、ドキュメント要素の位置付けやすさにおける他の要因は、構造的支援(ドキュメント内の見出しや黒丸など)の存在である。この測度は構造的検出性と呼ばれ、ツリー又はテーブル検索によってこの測度を実施することができ、その結果、要素を含む構造のタイプ及びスタイルに依存する事前定義された値が得られる。例えば、要素Eの構造的位置の用語StructLocateを設定した決定ツリーは、下記のようになり得る。
G = parent(E)
if G is a table
then if G has row headings
then if G has column headings
then StructLocate = Vtrc
otherwise StructLocate = Vtr
otherwise if G has column headings
then StructLocate = Vtc
otherwise StructLocate = Vt
otherwise if G is a list
then if G has bullets
then StructLocate = Vlb
otherwise if G has numbers
then StructLocate = Vln
otherwise StructLocate = Vl
otherwise StructLocate = Vg
すなわち、
G = parent(E)
if Gはテーブル
then if Gは行見出しを有する
then if Gは列見出しを有する
then StructLocate = Vtrc
otherwise StructLocate = Vtr
otherwise if Gは列見出しを有する
then StructLocate = Vtc
otherwise StructLocate = Vt
otherwise if Gはリスト
then if Gは黒丸を有する
then StructLocate = Vlb
otherwise if Gは番号を付す
then StructLocate = Vln
otherwise StructLocate = Vl
otherwise StructLocate = Vg
ここで、Vtrc、Vtr、Vtc、Vt、Vlb、Vln、Vl及びVgは、構造的事例に対する所定の検出性の寄与度である。
ドキュメントの構造的検出性を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において測定される個々のコンテンツ構造の組み合わせに基づいてドキュメントの構造的検出性を決定する、という更に広範囲の概念に関連するように、例えば、オブジェクトを位置付けるための構造的支援に対する人間の反応の測定によって得られる関数など、他の構造的検出性決定方法を本発明の範囲内にあるとみなすべきである。
構造的な寄与度の他に、グループのメンバーをその効果的識別度によって他のグループメンバーから識別することができる。例えば、あるグループ内で長い段落を位置付けて(すなわち、検出して)短い段落を無視したり、リストの中間の段落を位置付けたり(すなわち、検出したり)する場合がある。効果的識別度の測定方法を検出性のために使用することもできる。しかし、オブジェクトをその近傍物と比較する代わりに、オブジェクトをグループ内の同胞メンバー(同位のメンバー)と比較する。
考慮中のグループ要素のEffectiveDistinguish値を計算した後、その結果をDistinguishLocate=[(1/n)Σ(c+EffectiveDistinguish)-p]-1/p-cとして他の同胞メンバー(同位メンバー)の各々と組み合わせることができ、この合計は総合的なn個の同胞グループメンバー(同位グループメンバー)である。定数c及びpはTotalDistinguishの計算の場合と同一の効果を有し、その際と同一の値にすることができる。
グループ内でのメンバー項目の位置付けやすさ(検出しやすさ)は、グループが含む項目の数に依存する。グループ内に1又は2の項目しかない場合、項目の位置付け(検出)は容易である。しかし、1000の項目がある場合、特定の1つを位置付ける(検出する)タスクはより困難になる。これは、プレゼンテーション方法に依存する。例えば、100の要素のテーブルに提示された項目を見つけることは、100の要素のリスト内の項目を見つけることよりも難しくはない。要素Eを含むグループのサイズの影響を示す係数を下記のように計算する。
G = parent(E)
if G is a table
then GroupSizeFactor = (1-A+A/rows(G))*(1-A+ A/columns(G))
otherwise GroupSizeFactor = (1 - A + A/elements(G));
すなわち、
G = parent(E)
if Gはテーブル
then GroupSizeFactor = (1-A+A/rows(G))*(1-A+ A/columns(G))
otherwise GroupSizeFactor = (1 - A + A/elements(G));
ここで、rows(G)及びcolumns(G)はテーブルG内の行及び列の数であり、elements(G)はグループG内の要素の数であり、Aはグループサイズを用いて係数の強さを制御するパラメータである。
グループメンバーの位置付けに対する構造的寄与度を、識別度寄与度と組み合わせる。この2つの寄与度の加重和を使用し、ここで重みはこれら2つの係数の相対重要度を決定する。しかし、いずれかの寄与度によって要素を位置付けることができる場合、全体的な結果はもう一方の寄与度に関わらず大きくなるはずである、と論じることができる。
組み合わされた結果は、グループのサイズに従って減少するはずである。これは、MemberLocate=(c-[wm *(c-StructLocate)-p+(1-wm)*(c-DistinguishLocate)-p]-1/p)*GroupSizeFactorによって達成することができ、wmは識別度寄与度に対する構造的寄与度の重みであり、cは1よりもわずかに大きい定数であり、pは1よりも大きい数である。
図48に示されるような検出性測度の組み合わせは、ドキュメントのメンバー検出性の評価に有用である。
より具体的に、図48に示されるようなメンバー検出性は、前述の構造的検出性、及び/又は前述の識別された検出性の組み合わせとみなされる。図48において、定量化されたメンバー検出性の値は、メンバー検出性定量化器又は結合器回路25を用いて、構造的検出性及び識別された検出性を組み合わせることによって得られる。
この図はメンバー検出性定量化プロセス用の回路を示しており、このプロセスをマイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行することもできることに注意する。定量化は特定の回路に限定されておらず、後述の方法を実施することのできるソフトウェア及び/又はハードウェアの任意の組み合わせが可能である。
図47に示されるような検出性測度の更なる組み合わせが、ドキュメントの直接検出性の評価に有用である。
より具体的には、図47に示される直接検出性は、メンバー検出性、識別度、分離性、及び/又は視認性の組み合わせとみなされる。図47において、定量化された直接検出性の値は、直接検出性定量化器又は結合器回路24を用いて、メンバー検出性、識別度、分離性、及び/又は視認性を組み合わせることによって得られる。
この図は直接検出性定量化プロセス用の回路を示しており、このプロセスをマイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行することもできることに注意する。定量化は特定の回路に限定されておらず、後述の方法を実施することのできるソフトウェア及び/又はハードウェアの任意の組み合わせが可能である。
本発明の好適な実施の形態において、要素の位置付けを助ける他のメカニズムは、目次の頁番号、又は電子ドキュメント内のハイパーリンクのような、その要素の参照又はその要素へのリンクである。例えば、目次によって、又は特定の単語の位置の索引を調べることにより、段落が見出される場合がある。位置付けやすさは、参照の数に伴って線形的に変わらない場合がある。考慮中の要素の参照数がNrである場合、Nrの増加に伴って0から1に非線形的に増加する関数をReferenceLocate=1-(Nr+1)-1/Pとして表すことができ、pは更なる参照がどの程度強く寄与するかを決定する。
オブジェクトを位置付ける能力の参照の寄与度を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において検出性の測度に対する参照の影響を決定する、という更に広範囲の概念に関連するように、例えば、異なる程度の参照に対する人間の反応の測定によって得られる関数など、参照から寄与度を決定する他の方法を本発明の範囲内にあるとみなすべきである。
図51に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの全検出性の測定及び定量化である。
本発明の好適な実施の形態において、前述の個々の検出性寄与度を組み合わせて全検出性測度とすることができる。まず、ある項目に対して最初の4つの寄与測度のうちのいずれかが小さい場合、その特定の項目は、見分けが難しいか、その近傍物や同胞(同位のもの)と混同されるために、位置付けが難しい傾向にあることに注意する。これらの4つの寄与度を、DirectLocate=([wv *(c+Visibility)-p+ws *(c+TotalSep)-p+wd *(c+TotalDistinguish)-p+wdl *(c+DistinguishLocate)-p]-1/p-c)のように組み合わせることができ、wv、ws、wd及びwdlは寄与度の相対重要度を示す重みであって合計で1になり、cはゼロによる分割を防ぐために用いられる小さい数であり、pは、検出性に対する1つの不適当な寄与度が総合的な結果をどの程度激しく悪化させるかを決定する。
次に、項目を直接位置付けるための測度、参照によって項目を位置付けるための測度、及びその親によって項目を位置付けるための測度を全て組み合わせることができる。よって、TotalLocate=c-[wn *(c-DirectLocate)-p+wr *(c-ReferenceLocate)-p+wp *(c-TotalLocate(parent))-p]-1/pであり、重みwn、wr及びwpは合計で1であり、cは1よりもわずかに大きい数であり、pは1以上の数である。
ドキュメントの総合検出性は、全てのドキュメントコンテンツオブジェクト及びグループの全検出性を組み合わせることによって決定される。これらの値を組み合わせる最も簡潔な方法は、単純平均である。分離性及び識別度と同様に、検出性の値の小さいオブジェクト又はグループはいずれもドキュメント全体に不利な影響を著しく与えるため、冪の根を組み合わせるなどによって更に大きな重みが与えられなくてはならないことが論じられる。
ドキュメントの総合検出性は、各ドキュメントコンポーネントの位置付けがどの程度容易であるかを示す測度を計算してこれらの測度を組み合わせることにより、ドキュメント内の項目の位置付けがどの程度容易であるかに関する総合的な能力を示す。ドキュメントの検出性を計算するアルゴリズムが本明細書において提供される。このアルゴリズムは、コンテンツツリーを再帰的にトラバースして重み付き平均を計算するが、重みwLはツリーレベルLによって変わる場合がある。下記のルーチンがコンテンツのルートノードに対して実行される。
Locatability(G)

if G is a leaf node
then return TotalLocate(G)
otherwise
for each child C of G
call Locatability(C) and find the average of these values A
return wL * TotalLocate(G) + (1 - wL) * A

すなわち、
Locatability(G)

if Gはリーフノード(末端のノード)
then TotalLocate(G)をリターン
otherwise
for Gの各子孫(下位のもの)C
Locatability(C)をコール and 値Aの平均を求める
wL * TotalLocate(G) + (1 - wL) * Aをリターン

ドキュメントの検出性の総合的な程度を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において測定される個々のコンテンツの分離性の組み合わせに基づいて分離性を決定する、という更に広範囲の概念に関連するように、例えば、異なるコンテンツオブジェクト位置付け技術に対する人間の反応の測定によって得られる関数など、他の検出性決定方法を本発明の範囲内にあるとみなすべきである。
図51に示されるような検出性測度の組み合わせは、ドキュメントの全検出性の評価に有用である。
より具体的には、図51に示される全検出性は、直接検出性、参照検出性、及び/又は親の検出性の組み合わせとみなされる。図51において、定量化された全検出性の値は、全検出性定量化器又は結合器回路26を用いて、直接検出性、参照検出性、及び/又は親の検出性を組み合わせることによって得られる。
この図は全検出性定量化プロセス用の回路を示しており、このプロセスをマイクロプロセッサ及び/又はファームウェアによってソフトウェア内で実行することもできることに注意する。定量化は特定の回路に限定されておらず、後述の方法を実施することのできるソフトウェア及び/又はハードウェアの任意の組み合わせが可能である。
本発明の好適な実施の形態において、まずドキュメントの検索機能の強さの値を決定し、次に、検索機能の強さに対するドキュメントの検索密度を決定することにより、ドキュメントの検索機能の程度を決定することができる。検索密度は、0と1との間の範囲に及ぶ値にマップされ、1つの実施の形態では、1-c/(c+SearchDensity)によって示される関係の評価からなる。cは典型的な検索密度のサイズである定数であり、Pは検索密度の増加に伴って検索機能がどの程度速く1に達するかを決定する。
検索機能の強さは、検索を助けるように意図されるドキュメントの特徴によって決定される。これらの特徴は、テーブル要素の数、リスト要素の数、リストの黒丸の数、及びリスト要素番号の数又は他の参照ターミナルの数のうち少なくとも1つを含む。参照ターミナルは、ラベル、本文参照用の章番号、又はハイパーリンク用のアンカーのような、参照によって用いることのできる位置インジケータである。
このような特徴を集める1つの方法は、コンテンツツリーをトラバースしてこれらの特徴を検索し、見つけた際にカウンタのカウントを増加させることである。
これらの特徴を集めるための例示的な再帰的アルゴリズムは、以下の通りである。
CollectSearchFeatures(G)

if G is a table
then Ft = Ft + number of elements is G
for each element E of G
CollectSearchFeatures(E)
otherwise
if G is a list
then Fl = Fl + number of elements in G
if G is bulleted
then Fb = Fb + number of bullets in the list G
if G is numbered
then Fn = Fn + number of numbered elements in G
for each element E of G
CollectSearchFeatures(E)
otherwise
if G is a group
then for each element E of G
CollectSearchFeatures(E)
otherwise
if G acts as a reference label
then Fr = Fr + 1
if G is an anchor
then Fa = Fa + 1

すなわち、
CollectSearchFeatures(G)

if Gはテーブル
then Ft = Ft + Gの要素の数
for Gの各要素E
CollectSearchFeatures(E)
otherwise
if Gはリスト
then Fl = Fl + Gの要素の数
if Gは黒丸を付す
then Fb = Fb + リストGの黒丸の数
if Gは番号を付す
then Fn = Fn + Gの番号付けされた要素の数
for Gの各要素E
CollectSearchFeatures(E)
otherwise
if Gはグループ
then for Gの各要素E
CollectSearchFeatures(E)
otherwise
if Gは参照ラベルとして機能
then Fr = Fr + 1
if Gはアンカー
then Fa = Fa + 1

検索機能の総合的な強さを、種々の特徴寄与度の加重和として形成することができる。例えば、SearchStrength=wt *Ft+wl *Fl+wb *Fb+wn *Fn+wr *Fr+wa *Faであり、wt、wl、wb、wn、wr及びwaは重みであり、これらは合計で1になる。
ドキュメントのサイズも検索機能に影響を及ぼす可能性がある。小さなドキュメント内にn個の特徴があることは、大きいドキュメント内のn個の特徴よりも有用であるはずである。よって、ドキュメントサイズを、ドキュメントが含む情報の量として定義することができる。ドキュメント情報を、ドキュメント記述内の文字の数によって近似することができる。例えば、SearchDensity=SearchStrength/NumberOfCharactersである。
これにより、ドキュメントの検索を可能にする特性の測度がもたらされるが、これは潜在的に無限である。この測度を、0と1との間で変化する測度に変換することができる。例えば、Searchability=1-c/(c+SearchDensity)Pであり、c及びPは、SearchDensityの増加に伴い、Searchabilityがどの程度速く1に達するかを決定する。
ドキュメントの検索機能の総合的な程度を評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において、個々のコンテンツ検索支持特徴の組み合わせに基づいてドキュメントの検索機能を決定する、という更に広範囲の概念に関連するように、例えば、検索に影響を及ぼす異なる特徴に対する人間の反応の測定によって得られる関数など、他の検索機能決定方法を本発明の範囲内にあるとみなすべきである。
図52乃至図57に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントのグループ同一性の測定及び定量化である。
本発明の好適な実施の形態において、グループ同一性は、グループのメンバーをグループとして判断する能力である。グループ同一性の1つのインジケータは、本明細書では空間コヒーレンスと呼ばれ、これは、グループのメンバーが全て頁上で互いに近接して位置することを意味する。他のインジケータは、共通の背景又は取り囲む境界の存在、要素間の均一なスタイル、要素の位置合わせ、リスト又はテーブルへの要素の編成、及びグループの見出しの存在を含む。以下、これらのインジケータの測定及び組み合わせの態様を論じる。
図53及び図54に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントの空間コヒーレンスの測定及び定量化である。
本発明の好適な実施の形態において、空間コヒーレンスは、全てのグループ要素(図55の110)が同一頁(図55の100)にある場合に計算される。ここで、グループ又はグループ要素の境界ボックス(図55の1120)を見出すことができると仮定する。境界ボックス1120は、項目を囲み、垂直方向に位置合わせされた最小の長方形の幅及び高さを与える。この決定では、面積は幅と高さを掛けたものであり、即ち、A(E)=W(E)*H(E)である。グループGの空間コヒーレンスは、SpatialCoherence=(ΣA(Ei))/A(G)であり、合計はグループGの要素Eiに対するものである。
あるいは、例えば、前述の式の二乗根を用いて、面積ではなく周長の比較を行ってもよい。あるいは、グループオブジェクトの凸包の周長を実際に計算し、これを割り、面積が要素の全面積に適合する円の円周を得てもよい。
グループ要素が2頁以上にわたる場合、各頁の空間コヒーレンスを決定し、その結果を組み合わせることができる。重み付き平均を用いることができ、その場合、頁の重みはその頁上の要素の数に比例する。複数の頁にわたるグループを分離するペナルティーも含めるべきである。例えば、関与する頁の数によって割ることができる。
図53は、空間コヒーレンスの低い例である。図54は、空間コヒーレンスの高い例である。
本明細書に設けられるこの特定の空間コヒーレンス評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を決定するという状況において、特定の空間コヒーレンス決定方法のみでなく、コンテンツグループ同一性の決定にコンテンツオブジェクトの空間コヒーレンスの測度を用いる、という更に広範囲の概念に関連するように、例えば、コンテンツオブジェクトの異なる空間配置に対する人間の反応の測定によって得られる関数など、他の空間コヒーレンス決定方法を本発明の範囲内にあるとみなすべきである。
図56及び図57に示されるように、使いやすさの決定に用いられる他のパラメータ又は要因は、ドキュメントのスタイルの一貫性の測定及び定量化である。
本発明の好適な実施の形態において、複数の要素が1つのグループに属することを示す他のインジケータは、これらの要素が全て同一のスタイルをもつ、ということである。グループに対するスタイルの一貫性の測度は、スタイルの同一性を1-StyleSepとして定義することである。StyleSepはスタイルの差異を測定し、全てのグループ要素をペアワイズで比較し、これらの同一性の値を組み合わせる。組み合わせは、平均することにより行うことができる。
本明細書に設けられるこの特定のスタイル同一性評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を決定するという状況において、特定のスタイル同一性決定方法のみでなく、コンテンツグループ同一性の決定にスタイルの同一性を用いる、という更に広範囲の概念に関連するように、他のスタイル同一性決定方法を本発明の範囲内にあるとみなすべきである。
グループの単なる第1のレベルよりも深く調べ、スタイルを比較する1つの方法は、コンテンツツリーを再帰的に下方向に移動し、スタイルの一貫性に関してリーフ(末端)を比較する方法である。見つけられたリーフのスタイルを、ツリー内の第1のリーフのスタイルと比較することができる。グループの全てのメンバーを互いに関連付けるスタイルの特性を調べているため、簡潔なチェックとして、スタイル特性を第1のリーフと比較する。異なる特性値を有するリーフがあった場合、その特性をグループメンバーシップのインジケータとして使用することはできない。
全てのメンバーにおいて一貫性のあるスタイル特性の数をカウントし、その値はスタイル一貫性の測度となる。第1のリーフを得るための手順は、以下の通りである。
GetFirstLeaf(G)

if G is a leaf
then return G
otherwise return GetFirstLeaf(FirstElement(G))

すなわち、
GetFirstLeaf(G)

if Gはリーフ(末端)
then Gをリターン
otherwise GetFirstLeaf(FirstElement(G))をリターン

ツリーをトラバースしてスタイル特性を比較し、総合的な一貫性を戻す例示的な手順は以下の通りである。
LeafConsistency(G, StyleProperties, CurrentConsistency)

if G is a leaf
then CurrentConsistency =
CheckConsistency(G, StyleProperties, CurrentConsistency)
otherwise
for each element E of G
CurrentConsistency =
LeafConsistency(E, StyleProperties, CurrentConsistency)
return CurrentConsistency

すなわち、
LeafConsistency(G, StyleProperties, CurrentConsistency)

if Gはリーフ
then CurrentConsistency =
CheckConsistency(G, StyleProperties, CurrentConsistency)
otherwise
for Gの各要素E
CurrentConsistency =
LeafConsistency(E, StyleProperties, CurrentConsistency)
CurrentConsistencyをリターン

ここで、StylePropertiesは第1のリーフのスタイル特性値を含む配列であり、CurrentConsistencyは、これまでにチェックした全てのリーフが均一な値を有するか否かを各スタイル特性毎に示す配列である。
第1のリーフのスタイル特性に対するスタイル特性の実際のチェックを、以下のように行うことができる。
CheckConsistency(G, StyleProperties, CurrentConsistency)

for each style property i
if StyleValue(G, i) does not match StyleProperties[i]
then CurrentConsistency[i] = 0
return CurrentConsistency

すなわち、
CheckConsistency(G, StyleProperties, CurrentConsistency)

for 各スタイル特性i
if StyleValue(G, i)がStyleProperties[i]に適合しない
then CurrentConsistency[i] = 0
CurrentConsistencyをリターン

スタイルの一貫性をチェックする手順は以下の通りである。
StyleConsistency(G)

E = GetFirstLeaf(G)
for each style property i

StyleProperties[i] = StyleValue(E, i)
CurrentConsistency[i] = 1

LeafConsistency(G, StyleProperties, CurrentConsistency)
return the sum of the CurrentConsistency array value
divided by the array size.

すなわち、
StyleConsistency(G)

E = GetFirstLeaf(G)
for 各スタイル特性i

StyleProperties[i] = StyleValue(E, i)
CurrentConsistency[i] = 1

LeafConsistency(G, StyleProperties, CurrentConsistency)
return 配列サイズで除したCurrentConsistency配列値の合計をリターン.

更に洗練された計算を行うことができる。図56は、スタイルの一貫性に乏しい例である。図57は、スタイルの一貫性が良好な例である。
本明細書に設けられるこの特定の一貫性評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を決定するという状況において、特定の一貫性決定方法のみでなく、コンテンツグループ同一性の決定に一貫性の測度を用いる、という更に広範囲の概念に関連するように、例えば、コンテンツオブジェクトのスタイルの一貫性に対する人間の反応の測定によって得られる関数など、他の一貫性決定方法を本発明の範囲内にあるとみなすべきである。
リーフ(末端)ノードの探索でツリーを下るほど、そのノードが、分析されている実際のグループの特性を反映することが少なくなると論じることができる。従って、リーフノードに関しては、固定した深さまでのツリーの検索のみを望む場合がある。非リーフ(末端でない)ノードを、その特性の一貫性のために互いに比較することもできる。また、非リーフノードの場合は、単にテーブル同士やリスト同士などを比較してもよい。しかし、このことにより、検索に使用する適切な深さの問題が提起される。これに対処する1つの方法は、全ての深さに対して一貫性を計算してその結果を組み合わせ、深さの浅い部分に、深い部分よりも大きい重みを付けることである。
本発明の好適な実施の形態において、グループ同一性に対する寄与度の測度を、構造、見出し、境界及び背景から計算することもできる。グループオブジェクトに背景(又は境界)があるか、グループオブジェクトに見出し要素があるか、そしてグループオブジェクトがリスト又はテーブルであるかを決定する手段を仮定し、グループが見出しを含むか否かに基づいて見出しインジケータを生成することができる。下記の擬似コードはこのことを示す。
if first element of the group is a heading
then HasHeading = 1
otherwise HasHeading = 0
すなわち、
if グループの第1要素は見出し
then HasHeading = 1
otherwise HasHeading = 0
同様に、下記の擬似コードに示されるように、明確な背景要素及び/又は境界を調べることができる。
if the group has its own background
then HasBackground = 1
otherwise HasBackground = 0
if the group has a border
then HasBorder = 1
otherwise HasBorder = 0
すなわち、
if グループは背景を有する
then HasBackground = 1
otherwise HasBackground = 0
if グループは境界を有する
then HasBorder = 1
otherwise HasBorder = 0
テーブル索引を用いて、構造的寄与度をグループのタイプに基づいて得ることができる。StructuralIdentity=StructIdentTable[type(G)]によって得られるように、リスト及びテーブルを、コヒーレントなオブジェクトとして、未構築のグループよりも容易に認識できるはずである。
これらのグループ同一性インジケータを組み合わせて総合的な同一性測度にすることができる。この測度は重み付け平均によって得られるが、好適な実施の形態では、以下のように冪の重み付け平均の根を用いる。
GroupIdentity = c - [wsp * (c - SpatialCoherence)-p
+ wst * (c - StyleConsistency)-p
+ wah * (c - alignH)-p + wav * (c - alignV)-p
+ wh * (c - HasHeading)-p
+ wbk * (c - HasBackground)-p
+ wbd * (c - HasBorder)-p
+ wsi * (c - StructuralIdentity)-p]-1/p
ここで、wsp、wst、wah、wav、wh、wbk、wbd及びwsiは重みであり、合計で1になる。パラメータc及びpは、単一の良好な値が支配する程度を制御する。定数cは1よりもわずかに大きく、冪pは一般的に1以上である。大きな値を支持する冪関数を用いてインジケータを組み合わせることができる。
分離性及び識別度と同様に、グループ同一性の値の小さいオブジェクト又はグループはいずれもドキュメント全体に強い影響を与える可能性があり、例えば冪の根として組み合わせるなどでより大きな重みが与えられることが好ましい。コンテンツツリーを再帰的にトラバースすることによってドキュメントグループ同一性を計算する擬似コードアルゴリズムが提供される。このアルゴリズムは、単純な重み付き平均を計算する。重みwLはツリーレベルLによって変わり得る。DocumentGroupIdentityを見出すために、コンテンツツリーのルートノードに対してこのルーチンを呼び出す。
DocumentGroupIdentity(G)

if G is a leaf node
then return 1
otherwise
for each child C of G
call DocumentGroupIdentity(C) and find the average of these values A
return wg * GroupIdentity(G) + (1 - wg) * A

すなわち、
DocumentGroupIdentity(G)

if Gはリーフノード
then 1をリターン
otherwise
for Gの各子孫(下位のもの)C
DocumentGroupIdentity(C)をコール and 値Aの平均を求める
wg * GroupIdentity(G) + (1 - wg) * Aをリターン

本明細書に設けられるこの特定のグループ同一性評価方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、特定のグループ同一性決定方法のみならず、ドキュメントの総合的なグループ同一性の決定に個々のグループ同一性の測度を用いる、という更に広範囲の概念に関連するように、例えば、グループ同一性に関する異なるドキュメント特性に対する人間の反応の測定によって得られる関数など、他のグループ同一性決定方法を本発明の範囲内にあるとみなすべきである。
図52に示されるような測度の組み合わせは、ドキュメントのグループ同一性の評価に有用である。
より具体的には、図52に示されるように、グループ同一性は、空間コヒーレンス、スタイルの一貫性、構造的同一性、水平方向の位置合わせ、垂直方向の位置合わせ、見出し、背景、及び/又は境界の組み合わせとみなされる。図52では、定量化されたグループ同一性の値は、グループ同一性定量化器又は結合器回路27を用いて、空間コヒーレンス、スタイルの一貫性、構造的同一性、水平方向の位置合わせ、垂直方向の位置合わせ、見出し、背景、及び/又は境界を組み合わせることにより得られる。
この図はグループ同一性定量化プロセス用の回路を示しており、このプロセスをマイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行することもできることに注意する。定量化は特定の回路に限定されておらず、後述の方法を実施することのできるソフトウェア及び/又はハードウェアの任意の組み合わせが可能である。
前述のように、コンテンツグループの使いやすさを、寄与要因の測度の組み合わせとして計算する。これらの要因は、分離性、識別度、検出性、検索機能、及び/又はグループ同一性を含むことができる。グループ要素同士の関係や、グループ要素とグループに属さない近傍物との関係を用いて、これらの要因を計算することができる。
これらの関係は、例えば、空間コヒーレンス、空間分離、位置合わせ分離、見出し分離、背景分離、及び/又はスタイル分離を含むことができる。各要因が、0と1の間の範囲に及ぶ値を生じるように定義され、0が、品質値に対する使いやすさの寄与度が低いか又は不十分であることを意味し、1が、品質値に対する使いやすさの寄与度が高いか又は十分であることを意味する場合、これらの要因(及びおそらく他のこのような規則)を計算し、組み合わせて、使いやすさに対する総合的な寄与度の測度をコンテンツグループの処理から形成する。Viがi番目の規則に対して計算された値である場合、グループの使いやすさの測度VEUは、これらの寄与度の関数Eとして形成される。即ち、VEU=E(V1,V2, …, VN)である。
結合関数Eを寄与度の重み付き平均と同じ位簡潔にできるが、良くない寄与度が1つでもあると、残りがどんなに良くても使いやすさを台無しにしてしまう可能性があるため、線形結合は好ましくない。その代わりに、VEU=(Σwi(d+Vi)-p)-1/p-dを用いる。
係数wiは、各規則の相対重要度を特定する重みであり、これらは合計で1になるはずである。指数pは、1つの不良な値が多くの良い値を圧倒する可能性のある非線形性を導入する。pが大きいほど、この影響は大きくなる。
他の結合関数が可能であり、例えば、寄与度の積を用いることができる。寄与度の重み付けが必要である場合、これを累乗法で行うことができる。即ち、VEU=ΠVi wi'である。
本明細書に設けられた、コンテンツグループの使いやすさを評価するこの特定の方法は例示的なものであり、本発明の範囲を限定するものとみなされない。本発明が、ドキュメントの使いやすさやドキュメントの質を評価するという状況において、特定の使いやすさ決定方法のみでなく、個々のグループ特性の測度の組み合わせを用いる、という更に広範囲の概念に関連するように、例えば、グループの使いやすさに関する異なるドキュメント特性に対する人間の反応の測定によって得られる関数など、グループの使いやすさを決定する他の方法を本発明の範囲内にあるとみなすべきである。
図35に示されるような使いやすさの測度の組み合わせは、ドキュメントの使いやすさの評価に有用である。
より具体的には、図35に示されるように、グループの使いやすさは、分離性、識別度、検出性、検索機能、及び/又はグループ同一性の組み合わせとみなされる。図35では、定量化されたグループの使いやすさの値は、使いやすさ定量化器又は結合器回路20を用いて、分離性、識別度、検出性、検索機能、及び/又はグループ同一性を組み合わせることにより得られる。
この図は使いやすさ定量化プロセス用の回路を示しており、このプロセスをマイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行することもできることに注意する。定量化は特定の回路に限定されておらず、後述の方法を実施することのできるソフトウェア及び/又はハードウェアの任意の組み合わせが可能である。
注目性
広告や警告表示等の幾つかの文書では、文書が見る人の目及び注意を引くことが重要である。従って、これらの文書の品質に寄与する重要な特性は、所与のレイアウトの注目性である。本発明は、このような注目性の測度を計算する方法を提供する。
注目性は、より単純な複数の特性の組み合わせとして計算される。より単純な注目性特性のいずれかが強く存在する場合には、その全体的な効果として目を引く文書となる。寄与ファクタには、色彩の豊かさ、色の不調和、フォントサイズ、情報の軽さ、画像の割合、及び/又は目新しさが含まれ得る。各ファクタは、0(注目性の値が低い、即ち悪いことを意味する)〜1(注目性の値が高い、即ち良好であることを意味する)の範囲の値を生じるよう定義される。これら(及び可能であれば他のこのような規則)を計算して結合し、全体的な注目性の測度を構成できる。Viがi番目の規則について計算された値である場合に、注目性の測度VECはこれらの寄与の関数Eとして構成される。即ち、VEC = E(Vcl,Vd,Vf,Vil,Vp ... Vn)となる。
結合関数Eは、これらの寄与の重み付き平均のような簡単なものであってよいが、他の寄与因子がいかに悪くても、いずれかの良好な寄与因子によって、目を引く文書を生じ得るので、線形結合は好ましくない。或いは、VEC = d - [Σwi(d - Vi)-p]-1/pを用いる。
式中、dは1より僅かに大きい数である。dの値が1に近いほど、良好な値によって他の値が強く補償される。wi係数は、各規則の相対的な重要度を指定する重みであり、これらの合計は1になるべきである。指数pは非線形性を導入するものであり、1つの良好な値が多くの悪い値を圧倒する強さを増加させることもできる。pが大きいほどこの効果は大きい。なお、この寄与ファクタを結合する式は、美観のファクタ又は使いやすさのファクタを結合するための好ましい方法とは異なる。美観及び/又は使いやすさの場合には、いずれかの悪いファクタが品質を損なう。従って、結合すると、いずれかの低い寄与によって低い結果が生じる。しかし、注目性に関しては、いずれかの良好なファクタが他を救済し、結合すると、いずれかの高い寄与によって高い結果が生じる。
他の結合関数も可能であり、例えば、寄与の逆数の積の逆数をとることもできよう。寄与の重み付けが望ましい場合には、これは指数計算によって行うことができる。即ち、VEC = 1 - Π(1 - i)wi' となる。
本明細書で提供される、文書の注目性を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、注目性を判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況において個々の測度の組み合わせを用いるという遙かに広い概念にも向けられるように、例えば、人目を引く能力に関する文書特性の変化に対して測定された人間の反応の関数等の、注目性を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図58に示されるような測度の組み合わせは、文書の注目性の評価において有用である。
具体的には、図58に示されるように、注目性は、色彩の豊かさ、色の不調和、フォントサイズ、情報の軽さ、画像の割合、及び/又は目新しさの組み合わせであると考えられる。図58では、定量化された注目性の値は、注目性定量化器又は結合回路30を用いて、色彩の豊かさ、色の不調和、フォントサイズ、情報の軽さ、画像の割合、及び/又は目新しさの組み合わせによって導出される。
なお、この図は、注目性定量化処理のための回路を示しており、この処理は、マイクロプロセッサ及び/又は他のファームウェアによってソフトウェアで実行されてもよい。定量化は特定の回路に限定されず、後述する方法論を実行可能なソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本発明の好ましい実施形態において、色は人目を引くものであり、グレーのページよりも明るいオレンジのページの方が良好に注意を引くことができる。ここで対象となる色の第一の特性は彩度(又はクロミナンス(色差))である。1つの文書又はページの全体的な色彩の豊かさの判定に使用可能な近似彩度値の計算には、複数の可能な方法がある。RGB色空間で表される色の恐らく最も簡単な計算は、c = max(R,G,B) - min(R,G,B)であり、図59に示されるように、式中、cは彩度(又はクロミナンス)であり、max及びminはそれぞれ最大関数及び最小関数である。
これに代わる計算は、c = [E2 + S2]1/2であり、式中、E = R - Gであり、S = (R + G) / 2 - Bである。
色がL*a*b*色空間で表される場合には、クロミナンスはc = [(a*)2 + (b*)2]1/2として計算できる。
色の彩度値は、その色のオブジェクトの面積によって重み付けされる。次に、これを文書の合計面積で除算し、色彩の豊かさの測度を得る。即ち、Vcl = Σci Ai / Adとなる。式中、Vclは色彩の豊かさの測度であり、ciはi番目のオブジェクトの彩度値であり、Aiはそのオブジェクトの面積である。Adは文書全体の面積である。この合計は、文書中に見られる全オブジェクトである。
本明細書で与えられる、コンテンツの色彩の豊かさを評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、色彩の豊かさを判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況において色彩の豊かさの測度を用いるという概念にも向けられるように、例えば、色の量及びタイプの変化に対して測定された人間の反応の関数等の、色彩の豊かさを判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、1つのページに複数の色が存在する場合には、重要なのは存在する色の彩度の量だけでなく、これらの色がどの程度調和しているかも重要である。例えば、ピンクと緑は、ピンクとオレンジよりも遙かに調和する。ぶつかり合う色は人目を引く。従って、注目性特性に対する寄与因子の1つは色の不調和である。
以下の議論では、色の不調和の計算を、一緒に見ることができる複数のオブジェクト(即ち、1つのページ上の複数のオブジェクト)に関して説明する。文書が複数のページを有する場合には、全てのページに対する色の不調和の平均値を決定可能である。
2つの色の間の色の不調和(又は調和)は、主にそれらの色相差によって決定される(但し、色は十分な彩度と注目に値する面積とを有するべきである)。
当該技術分野では、近似色相値を色差成分の角度として計算する複数の方法が知られている。例えば、上述したE値及びS値を用いて、色相をh = arctan(S/E)として定義することができる。
当該技術分野で周知のように、E=0の場合には特別な扱いが必要であり、E/Sと(-E)/(-S)との混乱を回避するために、象限を判定するための符号の確認を行うべきである。この結果を2πで除算して、0〜1の値を得ることもできる。
L*a*b*色空間では、h = arctan((b*)/(a*))を与える同様の計算を行うことができる。
A.R.スミス(A. R. Smith)によって説明されている、近似色相値を計算する別の方法は、以下の擬似コードで表される。
v = max(R, G, B)
w = min(R, G, B)
c = v - w
r1 = (v - R) / c
g1 = (v - G) / c
b1 = (v - B) / c
if (R = = v)
if (G = = w)
h = 5 + b1
else
h = 1 - g1
else if (G = = v)
if (B = = w)
h = 1 + r1
else
h = 3 - b1
else
if (R = = w)
h = 3 + g1
else
h = 5 - r1
h = h / 6
色の不調和を計算するためには、まず、図60に示されるように、どの色相が、問題となるのに十分な強さをもって存在するかを判定しなければならない。ページ上の各オブジェクトについて、上述したように、その色の彩度及び面積を計算する。彩度が低いオブジェクトは強く寄与するべきではない。これを実行する1つの方法は、彩度を閾値と比較して、彩度が不十分なオブジェクトを無視することである(即ち、Tcは閾値であり、ciはTcよりも大きくなくてはならない)。
別の手法は、Ai' = Ai*ciのように、オブジェクトの面積を彩度によって重み付けすることである。彩度を面積の重み付けに用いる前に、彩度を累乗する等の別の変形も可能である。
そのページ上で見られる各色相の面積を決定するために、識別された色の面積を全てのオブジェクトにわたって合計することができる。H[n*hi] = H[n*hi] + Ai'等の疑似コード表現によって、これらの面積を、n個の可能な色相のバケットのテーブルHに集めることができる。式中、hiはi番目のオブジェクトの色相であり、Ai'はその重み付き面積である。
色の不調和を判定するために、見出された各色相を、見出された他の各色相と比較する。即ち、Hテーブルによって表される全ての色を互いに比較する。Hテーブルによって各色相で見える面積の量がわかり、Hテーブルを用いて、或る色の合計面積が考慮するに値しないほど小さい場合を無視することができる。或いは、1つのページ上の複数のオブジェクトの色を集める別の方法は、各オブジェクトの色をその近傍の色と比較することである。どの方法を用いるかに関わらず、全ての比較結果を何らかの方法で結合しなければならない。これを行う簡単な方法は、単に、比較によって遭遇した最大不調和値を保存することである。擬似コードの例は以下の通りである。
Vd = 0
for i from 1 to n
{ for j from i to n
{ dissonance = calculateDissonance(i, j, H[i], H[j])
if dissonance > Vd
Vd = dissonance


このcalculateDissonance関数は、以下のようになり得る。
calculateDissonance(i, j, ai, aj)

if ai > bigEnough and aj > bigEnough
return dissonanceTable[j - i]
otherwise
return 0

ここで、bigEnoughは、色の小さな面積を無視するために用いられる閾値であり、dissonanceTableは色の不調和値のテーブルである。
テーブルを用いることにより、任意の所望の関数形状を用いることが可能になるが、不調和値を直接計算することも可能である。不調和テーブルは、色の調和及び不調和のモデルを捕捉する。簡単なモデルは、色の調和がそれらの色相差のみに依存し、それらの絶対的な色相には依存しないものである。このモデルを用いる場合、不調和テーブルは色相差のみでインデックスされればよい。このようなモデルの一例では、類似した(離間が0度に近い)色相角、又は反対の(180度離間した)色相角、又は色相環を3分の1回った(120度離間した)色相角を有する色が、調和していると見なされ、他の色相角の差は不調和であると見なされる。不調和テーブルに格納されたこれらの値は、図96でグラフィカルに示されるものと類似して見える。
別の計算も可能である。例えば、各不調和索引を、測定において考慮中の2つの色相の面積の積で重み付けして、全ての比較にわたる重み付きの不調和の結果を合計してもよい。この合計は、全ての面積の積の合計(不調和の結果は要素に入れない)によって除算することによって正規化されるべきである。この計算により、最大不調和の代わりに、より多くの且つ全体的な平均不調和測度が与えられる。本明細書で与えられる、コンテンツの色の不調和を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、色の不調和を判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況において色の不調和の測度を用いるという概念にも向けられるように、例えば、色の量及びタイプの変化に対して測定された人間の反応の関数等の、色の不調和を判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、注目性のための別のメカニズムは大きなフォントを用いることである。これにより、離れた位置からもテキストを読むことができると共に、そのテキストに重要な印象を与える。文書が白黒で表される場合にこのメカニズムを用いることができる。ここで重要なのは(平均ではなく)最大フォントサイズである。これは、全ての使用フォントをステップスルーし(又は、全テキストをステップスルーしてフォントを見出し)、最大のものを記録することによって求めることができる。他の測度と結合するために、求められた最大フォントサイズは0〜1の数に変換されるべきである。
これを行う方法はVf = f / (fn + f)である。式中、fは求められた最大フォントサイズであり、fnは一般的な文書中に見出される一般的なフォントサイズに近い(例えば8又は10ポイント)。
最大フォントを、文字数の関数によって重み付けすることを考慮してもよい。しかし、存在する文字が少ない場合にのみ、文字数の増加が文書の注目性を高め得る一方で、文字数が多い場合にはこの効果は低減されることがある。
文書内の全てのフォントを同時に考慮することにより、フォントサイズの影響を計算できるが、別の方法として、各ページの影響を個別に判定し、次に、これらのページの結果を結合する方法がある。ページの結果の結合は単純な平均によって行ってもよく、これはプレゼンテーション等の文書に対しては適切であり得る。しかし、多くの文書にとっては、1つのページ(例えば表紙)が人目を引けば十分であり、個々のページ寄与のいずれかが高い場合に高スコアを与える非線形の結合方法を用いる方が良好であり得る。或いは、最初のページが他のページよりも高く重み付けされる重み付き平均を用いてもよい。
本明細書で与えられる、フォントサイズの影響を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、フォントサイズの測度を判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況においてフォント及びフォントサイズの測度を用いるという概念にも向けられるように、例えば、フォントのサイズ及びタイプの変化に対して測定された人間の反応の関数等の、フォントサイズを判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、情報が密に詰まったページでは、一般的に、情報が小さく且つ均一であることが必要であり、人目を引く可能性が低い。情報は、例えば、無視され易い小さな黒いテキストと人目を引く大きな色付きのテキストとの混合体として示される場合があるので、これは色やフォントサイズのような厳密な指標ではない。それにも関わらず、情報の軽さ(情報の密度の逆)を、文書の注目性挙動に関するまた別の手掛かりとして用いることができる。
テキストについては、存在する情報の大まかな測度は、単に、その情報の符号化に用いられた文字数Ncである。単語数のカウント等の別の測度を考慮してもよい。
グラフィック図形については、その図形を構築するために用いられている基本的図形構成体(線、矩形、円、弧、ストローク、三角形、多角形等)の数をカウントすることができる。図形構成体のカウントNgを倍率値(scaling value)で乗算して、テキストの測度に対して標準化してもよい。
画像の情報量Npの見積りは、より厄介である。1つの簡単な手法は、単に、各画像に対して一定の情報見積り値を含むことである。
別の手法は、近傍の値からの画素値の分散を合計し、画像面積によって除算することである。画像中に見出される情報を見積るために、別の手法を用いることも可能である。この測度をテキストの測度と一致させるために、見積りには画像の倍率(scaling factor)も必要となり得る。総情報量は、Nt = Nc + sgNg + spNpとなる。
情報密度は、総情報量を文書面積で除算したもの、即ち、Id = Nt / Adである。
これを0〜1の範囲の数に変換するために、ここでもVid = Id / (a + Id)の方法を用いることができる。式中、aは一般的な情報密度の値に近い定数である。
情報の軽さは、Vil = 1 - Vidによって計算されるような、情報密度の逆数として定義できる。
本明細書で与えられる、情報の密度及び軽さを評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、情報の密度又は軽さを判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況において情報の軽さの測度を用いるという概念にも向けられるように、例えば、情報の量及び面積の変化に対して測定された人間の反応の関数等の、情報の軽さを判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、画像は純粋なテキストよりも人目を引く。中身は話を伝えるための単純なテキストのみであるペーパーバック本の表紙に、見る人を惹きつけて購入させることを意図した画像がある理由は、これである。当然ながら、全ての画像が等しく面白いわけではなく、画像の注目性の真の測度には、画像コンテンツの何らかの分析が必要であろう。それでも、文書中に何らかの画像が存在することは、一般的に、より高い注目性の指標である。このことの簡単な測度は、画像が占める文書面積の割合Apである。標準化された測度はVp = Ap / Adである。
本明細書で与えられる、画像の割合を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、画像の割合を判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況において画像の割合の測度を用いるという概念にも向けられるように、例えば、画像情報の量の変化に対して測定された人間の反応の関数等の、画像の割合を判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、文書がどの程度人目を引くかの別の指標は、文書の目新しさ、即ち、予期されないものや従来的でないものの存在である。当然ながら、何かが予期されない又は従来的でないものであるか否かを知るには、まず、予期されるものや従来的なものの何らかのモデルがなければならない。このようなモデルはかなり複雑になり得ると共に、文書のタイプ及び想定される使用法等のファクタを含み得る。しかし、この目新しさの使用は簡単なモデルで示される。そのモデルは、各スタイルパラメータに対して期待される単一の典型値である。
スタイルパラメータとは、文書の外観及びプレゼンテーションを支配する使用可能な選択肢である。スタイルパラメータは、背景及び飾り罫の存在、飾り罫及び罫線の太さ、段落のインデント及び間隔、リストのインデント、リストの黒丸、フォントのスタイル、フォントの太さ等を含み得る。スタイルパラメータには、フォントサイズ及び色の選択も含まれ、これらについては先に個別に考慮した。
完全を期するためには、色及びフォントサイズを目新しさの見積りに含むことが適切であると思われるが、注目性に関する色及びフォントサイズの寄与は、非従来性のみで説明されるよりも遙かに大きいので、これらは、注目性の計算において区別されるべきであるとも思われる。
簡単なモデルでは、各スタイルパラメータPiは期待値P0iを有する。しかし、任意のスタイルパラメータ、特に二値の(又は列挙された)選択肢を有するパラメータについては、実際のスタイルPiが期待値P0iに一致しない場合には、一定の目新しさの寄与niを単純に加えることができる。例えば、(恐らくは罫線の幅又はフォントサイズの場合のように)スタイルパラメータが期待値から絶えず変化し得る場合には、より複雑な計算も可能である。スタイルの違いの関数は、目新しさの寄与として、ni = F(Pi - P0i)で計算できる。
列挙されたスタイル値については、テーブル索引を用いて、目新しさの寄与に対するより高い柔軟性及び制御を得ることができる。即ち、ni = T[Pi] となる。
文書全体の目新しさは、全てのスタイル設定についての目新しさの寄与の平均をとることによって求めることができる。従って、文書がm個のスタイル選択肢を有していた場合には、平均的な目新しさはVn = Σni / mとなる。
期待値P0iは先験的に設定可能であり、或いは、好ましくは、典型的な文書のスタイル設定を調べることによって求めることができる。期待値P0iが文書の分析によって決定される場合には、分析を進行形で(on-going basis)行うことができ、現在の典型的な文書スタイルに合わせることが可能となる。
より複雑なモデルでは、スタイルの期待値は、その文書の論理構造におけるコンテンツ項目の位置に依存し得る。従って、見出しに期待されるフォントスタイルには、本文テキストに期待される設定とは異なる重み付けがされてもよい。しかし、どのように計算されても、目新しさは、文書の注目性に関する手掛かりを提供できる。
本明細書で与えられる、目新しさを評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。例えば、異なるスタイルに対して測定された人間の反応の関数等の、目新しさを判定する他の方法も、本発明の範囲内であると考えられるべきである。本発明は、目新しさを判定する特定の方法のみでなく、文書の注目性及び文書の品質を評価する状況において目新しさの測度を用いるという概念にもかかるものである。
面白さ(興味)
文書の品質に寄与する注目性に類似した文書特性は、文書が注意及び興味を持続させる能力である。文書の面白さに対する主な寄与因子はその主題であるが、その主題のプレゼンテーション(スタイル及びフォーマット)も面白さのレベルに影響し得る。本発明は、スタイル及びフォーマットの決定のために、面白さに寄与するより単純なファクタの組み合わせとして計算される、面白さの測度を計算する方法を提供する。より単純な面白さのファクタのいずれかが強く存在する場合には、全体的な効果として面白い文書になる。
ファクタとしては、多様性、変化率、強調、グラフィックの割合、色彩の豊かさ、色の不調和、画像の割合、及び/又は目新しさが含まれ得る。これらの各ファクタに対する計算方法が定められると共に、各ファクタは、0(面白さ(興味)の値が低い、即ち悪いことを意味する)〜1(面白さの値が高い、即ち良好であることを意味する)の範囲の値を生じるように設計される。これら(及び可能であれば他のこのようなファクタ)を計算して結合し、全体的な面白さの測度Viを構成できる。注目性特性について上述した方法と同様の方法により、個別のファクタを結合できる。
本明細書で提供される、文書が興味を持続させる能力を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、興味を持続させる能力を判定する特定の方法のみでなく、文書の面白さ及び文書の品質を評価する状況において個々の測度の組み合わせを用いるという遙かに広い概念にも向けられるように、例えば、興味を持続させる能力に関する文書特性の変化に対して測定された人間の反応の関数等の、文書がどの程度良好に興味を持続させるかを判定する他の方法も、本発明の範囲内であると考えられるべきである。
図62に示されるように、面白さの判定に用いられる別のパラメータ又はファクタは、文書の多様性の測定及び定量化である。
本発明の好ましい実施形態において、文書を見て面白いものにする1つの方法は、そのプレゼンテーションに多様なスタイルを含むことである。スタイルパラメータは、文書の外観及びプレゼンテーションを支配する使用可能な選択肢である。スタイルパラメータは、背景及び飾り罫の存在、飾り罫及び罫線の太さ、段落のインデント及び間隔、リストのインデント、リストの黒丸、フォントのスタイル、フォントの太さ、フォントのサイズ、色の選択等を含み得る。
スタイルパラメータは、グループ化してコンテンツの論理構造と関連付けることができる。例えば、文字列と関連付けられるスタイルパラメータとしては、フォントファミリー、フォントのサイズ、フォントのスタイル、フォントの太さ及び色が含まれる。
段落と関連付けられるスタイルパラメータとしては、インデント、行の長さ、行間隔、前後の間隔及び行揃え(quadding)が含まれる。
リストと関連付けられるスタイルパラメータとしては、リストの左右のインデント、黒丸又は番号のスタイル、及び黒丸の位置が含まれる。
多様なスタイルを判定する際に、その文書中に存在するスタイルの数をカウントするが、このことは、異なるスタイルを構成するものは何であるかという疑問を提起する。スタイルパラメータは個々に考慮されるべきであるのか、それともグループとして考慮されるべきであるのか。
例えば、文書が12ポイントの太字のフォントと、10ポイントの通常の太さのフォントとを含む場合、これは4つのスタイル(2通りのサイズと2通りの太さ)であるのか、又は単に2つのスタイル(2通りのフォント)であるのか。好ましい実施形態においては、この答えは2つであり、スタイルは組み合わせで考慮されるべきである。
しかし、これは依然として、どの組み合わせを考慮すべきかという疑問を残す。黒丸を用いないリストに12ポイントの太字を用いると共に、黒丸を用いたリストに10ポイントの通常の太さの字を用いる場合、これは、依然として2つのスタイルのみであるのか、又は、リストのスタイルとフォントのスタイルとを個々に考慮すべきであるのか。この答えはあまり明確ではない。
しかし、任意のスタイルパラメータが変更された場合に全体として新たなスタイルが生じるというように、正しくグループ化されたスタイルパラメータがスタイルパラメータの全セットになると考える場合には、スタイルの組み合わせの事例が爆発的に増える可能性がある。この手法を除外するものではないが、好ましい方法では、スタイルパラメータは、それらが関連付けられたコンテンツのタイプに従ってグループ化される(即ち、テキストスタイル、段落スタイル、グラフィックスタイル、リストスタイル、表スタイル、コンテンツ要素背景スタイル、等)。
従って、上述した例では、文書中の4つのスタイル選択肢に対して、2つのテキストスタイル及び2つのリストスタイルを有する。この手法では、文書の階層構造によるスタイルパラメータの肥大から生じる問題も回避される。文書がリストの中にリストを含み、その中にさらにリストを含む場合には、好ましい手法では、この構造の全てのスタイル選択肢を含む何らかの新たな大きなグループではなく、単純なリストスタイルグループの3つの事例が与えられる。
スタイルの多様性を見積もるために、まず、分析に含めるスタイルパラメータ及びパラメータグループを決定する。例えば、テキストスタイル、段落スタイル及びグラフィックスタイルのみを考慮するよう決定してもよい。テキストについては、フォントファミリー、サイズ、太さ、スタイル及び色を考慮する。グラフィックについては、塗りつぶし色、エッジ色及びエッジの太さを考慮する。段落については、行の長さ、行間隔、行揃え及び1行目のインデントを考慮する。
各タイプのスタイルグループに対して1つずつの、3つのリストが構成される。リストの要素は、そのグループのスタイルパラメータの値を含む。次に、文書の論理構造をステップスルーして、スタイル設定について分析される各論理要素を調べる(この例では、各テキストセグメント、グラフィック要素及び段落である)。各論理コンテンツ要素のスタイルパラメータ設定を検討し、対応するリストをチェックして、一致する値のセットを有するエントリーが作られているか否かを確認する。
一致するリストエントリーが見出された場合には、このコンテンツ要素についてはこれ以上何かを行う必要はない。しかし、一致するものをリストが含んでいない場合には、新たなスタイル値のセットを含む新たなリスト要素を構成してリストに加えるべきである。
文書の分析の終了時には、リストは、見出されたスタイルパラメータの組み合わせの全てを含んでいるべきである。次に、単にリスト要素の数をカウントして、用いられているスタイルの数を判定することができる。全てのリストのサイズを組み合わせて、1つの全体的スタイルカウントを構成すべきである。1つのコンテンツ形態の多様性を、他のコンテンツ形態の多様性よりも高くカウントすることが望まれる場合には、複数のリストサイズを加算する際に、それらに重み付けを行ってもよい(例えば、段落スタイルの多様性を、グラフィックの多様性よりも高くカウントしてもよい)。その結果、スタイルの変化sの全体的な重み付きカウントは、s = Σwxsxとなる。式中、sxはx番目のスタイルリストのサイズであり、wxはその重みである。
スタイルの多様性の測度を、面白さに対する他の寄与と結合するために、この重み付きカウントを0〜1の範囲の数に変換すべきである。これは、VV = s / (as + s)として行うことができる。式中、VVは多様性の測度であり、asは、一般的な文書において期待されるスタイル数のサイズに関する定数である。図62は高い多様性の一例である。
本明細書で与えられる、文書のコンテンツ及びスタイルの多様性を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、多様性を判定する特定の方法のみでなく、文書の面白さ及び文書の品質を評価する状況において多様性の測度を用いるという遙かに広い概念にも向けられるように、例えば、多様性に関する文書特性の変化に対して測定された人間の反応の関数等の、多様性を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図63に示されるように、面白さの判定に用いられる別のパラメータ又はファクタは、文書の変化率の測定及び定量化である。
本発明の好ましい実施形態において、興味を持続させるのは文書中のスタイルの多様性のみでなく、スタイルの変化率も興味を持続させる要素である。表されているスタイルの組み合わせが2つだけの場合でも、文書がそれらの間で頻繁に切り替われば、1回だけ切り替わる場合よりも面白い。
スタイルの変化率の計算は、上述したスタイルの多様性の計算と類似しており、同じスタイルパラメータ及びグループ化を用いる。しかし、各グループについて、(それまでに遭遇した全セットのリストではなく)最も最近遭遇したスタイルパラメータセットの単一の記述を保存すればよい。例えば、最も最近遭遇したテキストスタイルパラメータの単一のセットと、グラフィックスタイルパラメータの単一のセットと、最も最近遭遇した段落パラメータの単一のセットとになる。文書の論理的記述をステップスルーして、スタイル設定を調べる。コンテンツ要素が、最も最近見たものとは異なるスタイルパラメータを有する場合には常に、そのスタイルグループの変化のカウントが増分され、次のコンテンツ要素に用いられている新たなスタイル値のセットが記憶される。多様性の計算と同様の方法で、変化のカウントを重み付けして組み合わせ、全体的な重み付き変化カウントcを構成できる。c = Σwxcxであり、式中、cxはx番目のスタイルグループの変化のカウントのサイズであり、wxはその重みである。
スタイルの変化率の測度を、面白さに対する他の寄与と結合するために、この重み付きカウントを0〜1の範囲の数に変換すべきである。これは、Vch = c / (ach + c)として行うことができる。式中、Vchは多様性の測度であり、achは、典型的な文書に期待されるスタイル変化数のサイズに関する定数である。図62は高い変化率の一例である。
本明細書で与えられる、文書のスタイルの変化率を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、変化率を判定する特定の方法のみでなく、文書の面白さ及び文書の品質を評価する状況において変化率の測度を用いるという遙かに広い概念にも向けられるように、例えば、知覚される変化率に関する文書スタイル特性の変化に対して測定された人間の反応の関数等の、変化率を判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、フォントスタイルにはテキストの強調のために選択されるものもある。大きいテキスト、太字のテキスト及び下線付きテキストは全て、通常のテキストのプレゼンテーションよりも重要であるという暗示を有する。この暗示された重要性は、読み手に、目を覚まして注意を払うように伝える。従って、観察者の注意を持続させることに対して特別に寄与する。各文字に対する強調の値を合計し、合計文字数で除算することにより、1つの文書中のテキストに対する平均強調測度を計算できる。即ち、Ve = Σe(t) / ncとなる。式中、Veは強調の測度であり、eは文字tに対する強調関数であり、その合計は強調された全ての文字であり、ncは合計文字数である。
関数e(t)は、テキストのサイズ、太さ、変形及びコントラストについてのファクタを含むべきである(フォントスタイル等の他のファクタも含まれ得る)。フォントサイズが大きいほど強調が強いが、0〜1の範囲のファクタを有するのが好ましい。size(t) / afs + size(t)のような式でこれを行う。式中、afsは一般的なフォントサイズに関する定数である。フォントの太さ(例えば、細字、通常、太字、特太)は一般的な列挙された値であり、各太さについての適切な強調ファクタのテーブルであるew[weight(t)]を強調関数に用いることができる。同様に、フォントの変形(例えば、通常、下線、取り消し線、白抜き)を、ev[variant(t)]のようなテーブル索引として扱うことができる。
テキストの強調の強さには、コントラストも関与する。背景に対するコントラストが低いテキストが有するインパクトは、コントラストが高いテキストと同程度ではない。上述したように、輝度コントラストは2|Yb - Yf| / (Yb + Yf)として計算できる。式中、Ybは背景の輝度であり、Yf = Lum(t)はテキストの輝度である。
強調関数の一例は次の通りである。
e(t) = (size(t) / (afs + size(t))) ew[weight(t)] ev[variant(t)] (2|Yb - Lum(t)| / (Yb + Lum(t)))
なお、フォントスタイル(例えばイタリック体)等の他の特性を含んでもよい。本明細書で与えられる、強調を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、強調を判定する特定の方法のみでなく、文書の面白さ及び文書の品質を評価する状況において強調の測度を用いるという遙かに広い概念にも向けられるように、例えば、強調に関する文書スタイル特性の変化に対して測定された人間の反応の関数等の、強調を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図64に示されるように、面白さの判定に用いられる別のパラメータ又はファクタは、文書のグラフィックの割合の測定及び定量化である。
本発明の好ましい実施形態において、概念及び考えを説明又は図示するために、グラッフィク構成体が頻繁に用いられる。グラッフィク構成体は、コンテンツに多様性も加味する。従って、グラフィックは文書をより面白くできるので、グラフィックコンテンツの測度は、文書がどの程度面白いかの見積もりに寄与すべきである。
グラフィックの寄与の1つの簡単な測度は、文書中で遭遇したグラフィックコンテンツオブジェクトの単純なカウントである。
別の手法は、遭遇した各グラフィックコンテンツオブジェクトを囲む境界ボックスの面積を合計することである。次に、この合計を文書全体の面積で除算し、0〜1の範囲の数を得ることができる。
第3の手法は、グラフィックコンテンツオブジェクトを詳細に調べて、オブジェクトを構成する線、曲線、矩形、多角形及び楕円形等の基本的描画オブジェクトをカウントすることである。この手法は、グラフィックの複雑さのより良好な測度を与え、そのグラフィックがどの程度面白いかを表すより良好な測度となり得る。様々な基本描画のカウントを、その基本描画がどの程度面白いかを示すために重み付けして(例えば、楕円形を矩形よりも面白いと見なしてもよい)合計し、全体的な重み付きグラフィックカウントを与えることができる。即ち、g = Σwxgxとなる。式中、gxはグラフィック構成体のx番目のタイプのカウントであり、wxはその重みである。
グラフィック割合の測度を、面白さに対する他の寄与と結合するために、この重み付きカウントを0〜1の範囲の数に変換すべきである。これは、Vg = g / (ag + g)として行うことができる。式中、Vgは多様性の測度であり、agは、一般的な文書に期待されるグラフィックの基本描画数のサイズに関する定数である。
或いは、グラフィックの基本描画のカウントを、文書中の合計基本描画(文字及び画像を含む)のカウントNdpで除算する。この手法では、文書サイズに対する依存性が取り除かれる。即ち、Vg = g / Ndpとなる。図64は高いグラフィック割合の一例を示す。
本明細書で与えられる、グラフィックの割合を評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、グラフィックの割合を判定する特定の方法のみでなく、文書の面白さ及び文書の品質を評価する状況においてグラフィック割合の測度を用いるという遙かに広い概念にも向けられるように、例えば、グラフィック割合に関する文書スタイル特性の変化に対して測定された人間の反応の関数等の、グラフィック割合を判定する他の方法も、本発明の範囲内であると考えられるべきである。
注意を引くと共に文書を見る人の目を引くファクタの幾つかは、注意及び興味を持続させる役割もする。この統合的に使用するファクタの例として、色彩の豊かさ、色の不調和、画像の割合及び目新しさを挙げることができる。注意と興味との間の挙動の違いは、相対的な重要性又は重みの1つである。例えば色彩の豊かさは、目を引くためには非常に重要であり得るが、興味を持続させるためにはそれほど重要ではないことがある。一方、目新しさは、注意を引くよりも興味を持続させるためにより重要となり得る。これらの4つの測度の強さを見積もる方法については上述した。
本明細書で提供される、色彩の豊かさ、色の不調和、画像の割合及び目新しさを評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、これらの測度を判定する特定の方法のみでなく、文書の面白さ及び文書の品質を評価する状況において色彩の豊かさ、色の不調和、画像の割合及び目新しさの測度を用いるという遙かに広い概念にも向けられるように、例えば、これらの測度に関する文書の色、画像及びスタイル特性の変化に対して測定された人間の反応の関数等の、これらの測度を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図61に示されるような複数の測度の組み合わせは、文書の面白さの評価において有用である。
具体的には、図61に示されるように、面白さは、多様性、変化率、強調、グラフィックの割合、色彩の豊かさ、色の不調和、画像の割合及び/又は目新しさの組み合わせであると考えられる。図61では、面白さの定量化器又は結合回路40を用いて、多様性、変化率、強調、グラフィックの割合、色彩の豊かさ、色の不調和、画像の割合及び/又は目新しさを組み合わせることにより、定量化された面白さの値が導出される。
なお、この図は面白さ定量化処理のための回路を示しており、この処理は、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行されてもよい。定量化は特定の回路に限定されず、後述する方法論を実行可能なソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
伝達性
文書デザインの品質に寄与する別のファクタは、文書が含む情報がユーザに伝達されるのを、そのデザインがどの程度良好に補助するかである。本発明は、そのような伝達性の測度を計算する方法を提供する。
美観及び使いやすさと同様に、この伝達性を定量化する手法は、伝達の有効性に寄与するものとして識別されるファクタを評価するものである。次にこれらのファクタを結合して複合的な測度を構成する。これらのファクタは、文書デザインの品質に寄与する。より単純な複数の伝達性ファクタのいずれかが不在であれば、その文書の全体的な伝達性が低減される。
構成ファクタとしては、可読性、情報の軽さ、技術的レベル、テキストと画像とのバランス、赤緑色覚異常への配慮、読み進み易さ、及び/又はナビゲーションの容易さが含まれ得る。各ファクタは、0(伝達性の値が低い、即ち悪いことを意味する)〜1(伝達性の値が高い、即ち良好であることを意味する)の範囲の値を生じるよう定義される。これら(及び可能であれば他のこのようなファクタ)は、美観について上述したのと同様の方法で、全体的な伝達性の測度を構成するよう計算及び結合可能である。Viがi番目の規則について計算された値である場合に、これらの寄与の関数Eとしての伝達性の測度VCMが構成される。即ち、VCM = E(VL,Vil,Vtl,Vtib,Vrg,Vep ... Ven)となる。
結合関数Eは、これらの寄与の重み付き平均のような簡単なものであってよいが、他の寄与因子がいかに良好でも、いずれかの悪い寄与因子によって文書の伝達性が低くなり得るので、線形結合は好ましくない。或いは、VCM = (Σwi(d + Vi)-p)-1/p - dを用いる。式中、dは0より僅かに大きい数である。dの値が0に近いほど、悪い値が他の全ての値をより強く相殺する。wiファクタは、各規則の相対的な重要度を指定する重みであり、これらの合計は1になるべきである。指数pは非線形性を導入するものであり、1つの悪い値が多くの良好な値を圧倒する強さを増加させることもできる。pが大きいほどこの効果は大きい。
上述したような他の結合関数も可能である。本明細書で提供される、文書の伝達性を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、伝達性を判定する特定の方法のみでなく、文書の伝達性及び文書の品質を評価する状況において個々の測度の組み合わせを用いるという遙かに広い概念にも向けられるように、例えば、伝達性に関する文書特性の変化に対して測定された人間の反応の関数等の、文書の伝達性がどの程度良好であるかを判定する他の方法も、本発明の範囲内であると考えられるべきである。
図65に示されるような測度の組み合わせは、文書の伝達性の評価において有用である。
具体的には、図65に示されるように、伝達性は、可読性、情報の軽さ、技術的レベル、テキストと画像とのバランス、赤緑色覚異常への配慮、読み進み易さ、及び/又はナビゲーションの容易さの組み合わせであると考えられる。図65では、伝達性定量化器又は結合回路50を用いて、可読性、情報の軽さ、技術的レベル、テキストと画像とのバランス、赤緑色覚異常への配慮、読み進み易さ、及び/又はナビゲーションの容易さの組み合わせることにより、定量化された伝達性の値が導出される。
なお、この図は、伝達性定量化処理のための回路を示しており、この処理は、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行されてもよい。定量化は特定の回路に限定されず、後述する方法論を実行可能なソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
更に、図66に示されるような測度の組み合わせは、文書の可読性の評価において有用である。
具体的には、図66に示されるように、可読性は、判読性、行の引き返し、相対的行間隔及び/又は行揃えの組み合わせであると考えられる。図66では、可読性定量化器又は結合回路51を用いて、判読性、行の引き返し、相対的行間隔及び/又は行揃えを組み合わせることにより、定量化された可読性の値が導出される。
なお、この図は可読性定量化処理のための回路を示しており、この処理は、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行されてもよい。定量化は特定の回路に限定されず、後述する方法論を実行可能なソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本発明の好ましい実施形態において、文書の伝達の有効性の見積もりにおいて真っ先に考慮されるファクタの1つは、テキストの可読性である。可読性の測度は、文書を読む際の単語の追い易さ及び認識し易さである。可読性は、複数の寄与構成要素に分けることが可能な特性である。上述したように、これらの構成要素の主なものは、判読性、行の引き返し、相対的な行間隔及び/又は行揃えである。考慮され得る他のファクタとしては、単語及び文字の間隔及びハイフンの使用が含まれる。
図67に示されるような測度の組み合わせは、文書の判読性の評価において有用である。
具体的には、図67に示されるように、判読性は、表示装置の特性、フォント、文字の親しみやすさ及び/又は輝度コントラストの組み合わせであると考えられる。図67では、判読性定量化器又は結合回路51を用いて、表示装置の特性、フォント、文字の親しみやすさ及び/又は輝度コントラストを組み合わせることにより、定量化された判読性の値が導出される。
なお、この図は判読性定量化処理のための回路を示しており、この処理は、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行されてもよい。定量化は特定の回路に限定されず、後述する方法論を実行可能なソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本発明の好ましい実施形態において、最も複雑な可読性のファクタである判読性は、文字の形状の認識能力を測るものである。判読性は、より簡単な部分に分けることができる。上述したように、判読性に寄与するファクタには、表示装置、フォント、文字の親しみやすさ及び/又は輝度コントラストが含まれる。
表示装置及びフォントの特性は、共に考慮されることが多い。即ち、特定の装置上における特定のフォントの判読性の程度を判定する。例えば、セリフ付きのフォントは、サンセリフフォントよりも判読が容易であるのが通例であるが、セリフを効果的に生成できない装置では、これは当てはまらない。フォントファミリー、フォントのサイズ、フォントの太さ、フォントのスタイル及びフォントの変形の全てが、判読性に寄与し得る。
特定の装置上の完全に指定されたフォントに対する、フォント指定及び装置選択の効果を扱う1つの手法は、判読性(表示された文字を正しく判定する能力)の実験による測定である。次に、この測度をフォント特性として扱うことができる。所与のフォント指定について、フォントテーブル(df = DF[font specification])から、そのフォントの判読性への寄与度を検索できる。
そのフォントが、測定に用いられたものと同じタイプの装置上で表示される場合には、そのフォントの寄与を、その装置に対して更に調整する必要はない。しかし、異なるタイプの表示装置が用いられる場合には、ある種の調整が必要になる。例えば、フォントは一般的に、CRTディスプレイに表示された場合よりも、用紙にプリントされた場合の方が遙かに判読性が高い。フォントの判読性の調整の一例は、判読性をその表示装置に対する調整係数adで乗算することである。
調整係数を決定する1つの方法は、その装置が有効に表示可能な最小フォントサイズの関数としてのものである。この関数は、例えば、実際に用いるディスプレイの最小有効テキストサイズに対する、フォントの判読性の測定に用いられた装置の最小有効テキストサイズの比率であってもよい。例えば、フォント特性は8ポイント以上のフォントのみを有効に表示可能なCRTで測定されたが、4ポイント以上のフォントを支持可能な用紙にプリントする場合には、装置調整係数は2になるべきである。大きなテキストの場合、ディスプレイの影響はさほど重要ではないことがあるので、実際に用いるフォントサイズに従って、この係数を調整することが望まれ得る。
文字を正しく判読する際の容易さは、その文字の親しみやすさに依存する。全て大文字のテキストを読むのは、通常のテキストを読むよりも困難である。数字及び句読点は、それぞれ固有の困難さの程度を有する。従って、文字の親しみやすさについての別の調整係数acを乗算すべきである。この調整係数は、文字コードによってインデックスされるテーブルから求めることができる。
背景に対する文字のコントラストも判読性に寄与する。白い背景上の薄黄色の文字を判読するのは、黒い文字を判読するよりも困難である。第3の調整係数は、検出性について上述したように、al = 2|Yb - Yt| / (Yb + Yt)(式中、Ybは背景の輝度であり、Ytはテキストの輝度である)で計算可能な、輝度コントラストである。
従って、ある文字の全体的な判読性は、dc = df ad ac alによって与えられる。
文字列中の各文字の判読性の測度の合計を求め、次に文字列中の文字の合計カウントで除算することにより、テキストの文字列全体の平均判読性dを求めることができる。
本明細書で提供される、判読性を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、判読性を判定する特定の方法のみでなく、文書の可読性、伝達性及び文書の品質を評価する状況において判読性の測度を用いるという遙かに広い概念にも向けられるように、例えば、判読性に関する文書のテキスト特性の変化に対して測定された人間の反応の関数等の、判読性を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図68に示されるように、可読性の判定に用いられる別のパラメータ又はファクタは、文書の行の引き返しの測定及び定量化である。
本発明の好ましい実施形態において、テキストの可読性に寄与する第2のファクタは、テキストの行の長さである。1つの行の終わりから次の行の始めに目を動かすことには幾分の負担がかかるが、この負担は行の長さと共に増加する。判読性に行の引き返し係数rを乗算することによって、この負担が算入される。この係数を求めるのに用いることができる関数の一例は、r = B / (n2 + B)である。式中、Bは(3600程度の値を有する)定数であり、nは1行当たりの平均文字数である。
図68において、行グループ1101はテキストの行が長いので、読み手が行グループ1101を辿り直す際、次の行を見つけるのが比較的困難である。一方、図68において、行グループ1102はテキストの行が短いので、読み手が行グループ1102を辿り直す際、次の行を見つけるのが比較的容易である。
本明細書で提供される、可読性に関する行の引き返し特性を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、行の引き返し特性を判定する特定の方法のみでなく、文書の可読性、伝達性及び文書の品質を評価する状況において行の引き返しの測度を用いるという遙かに広い概念にも向けられるように、例えば、行の引き返し及び可読性に関する文書のテキストの行特性の変化に対して測定された人間の反応の関数等の、可読性に対する行の引き返しの影響を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図69に示されるように、可読性の判定に用いられる別のパラメータ又はファクタは、文書の相対的な行間隔の測定及び定量化である。
本発明の好ましい実施形態において、可読性に対する第3の寄与は、相対的な行間隔である。行間隔を大きくすると可読性が向上する。目が、行の終わりから次の行の始めへと正しく辿り易くなる。行間隔の影響は、行間隔係数sによって算入される。用いることができる関数の一例は、s = y/(y + g)である。式中、gは行間隔と共に可読性が向上する程度を制御する定数(例えば0.1)である。yはバイアスされた相対的間隔であり、y = (hL - hf) / hf + bsによって定義され、式中、hLは行の高さ(行のベースラインからベースラインまで)であり、hsはフォントの高さであり、bsは、行が読み取り不可能になる限度の行の重なりを示す小さなバイアス項(例えば0.1)である。
図69において、行グループ1101の相対的な行間隔は、テキストの行が密集しているので、読み手が次の行を見つけるのが比較的困難である。一方、図69において、行グループ1102の相対的な行間隔は、テキストの行が広く離間しているので、読み手が次の行を見つけるのが比較的容易である。
本明細書で提供される、可読性に対する相対的な行間隔の影響を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、行間隔を判定する特定の方法のみでなく、文書の可読性、伝達性及び文書の品質を評価する状況において行間隔の測度を用いるという遙かに広い概念にも向けられるように、例えば、相対的な行間隔及び可読性に関する文書のテキストの行間隔特性の変化に対して測定された人間の反応の関数等の、行間隔の影響を判定する他の方法も、本発明の範囲内であると考えられるべきである。
図70〜図73に示されるように、可読性の判定に用いられる別のパラメータ又はファクタは、文書の行揃えの測定及び定量化である。
本発明の好ましい実施形態において、可読性は、行揃え(即ち、テキストの位置揃え及び均等割付け)にも影響される。左揃えで均等割付けされていないテキストは読むのが最も容易であり、均等割付けされたテキストもほぼ同程度に容易である。中央揃えのテキストはより困難であり、右揃えのテキストはこれらの中で最も困難である。行揃えの影響についてのファクタをテーブルに格納して、テキストtの可読性を計算するために検索できる。q = Q[quadding(t)]。
本明細書で提供される、可読性に対する行揃えの寄与を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、行揃えの寄与を判定する特定の方法のみでなく、文書の可読性、伝達性及び文書の品質を評価する状況において行揃えの測度を用いるという遙かに広い概念にも向けられるように、例えば、可読性に関する文書のテキストの行揃え選択の変化に対して測定された人間の反応の関数等の、行揃えの寄与を判定する他の方法も、本発明の範囲内であると考えられるべきである。
完全な可読性の計算は、VL = d r s qによって与えられる。
これは、段落等の特定のテキスト要素の可読性を与えるものである。
文書全体の可読性の測度を得るには、各段落の可読性を測定し、それらを結合しなければならない。結合は、簡単な平均によって実行可能であるが、いずれかの段落における低い可読性のスコアによって、簡単な平均によって得られる全体的スコアが低くなり得るような、非線形の方法を用いるのが好ましい。上述した累乗値の平均の平方根等の方法を用いて、この効果を得ることができる。
図70は左揃えされた文書の一例を示している。図71は右揃えされた文書の一例を示している。図72は中央揃えされた文書の一例を示している。図73は均等割付けされた文書の一例を示している。
本明細書で提供される、文書の可読性を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、可読性を判定する特定の方法のみでなく、文書の可読性、伝達性及び文書の品質を評価する状況において個々の測度の組み合わせを用いるという遙かに広い概念にも向けられるように、例えば、可読性に関するテキスト特性の変化に対して測定された人間の反応の関数等の、文書の可読性を判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、テキストを判読して概念を理解するには時間がかかる。一般的に、短い道路標識の方が長い道路標識よりも効果的に伝達される。文書がいかに良好に伝達されるかに関する別のファクタとして、文書の情報の軽さ(情報密度の逆)が含まれる。このファクタは可読性ほど重要ではなく、そのように重み付けされる。
情報の軽さの計算方法は、注目性の議論において説明された。
本明細書で与えられる、情報の密度及び軽さを評価する特定の方法は例示的なものであり、範囲の限定とは見なされてはならない。本発明が、情報の密度又は軽さを判定する特定の方法のみでなく、文書の伝達性及び文書の品質を評価する状況において情報の軽さの測度を用いるという概念にも向けられるように、例えば、情報の量及び面積の変化に対して測定された人間の反応の関数等の、情報の軽さを判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、文書による伝達の容易さは、文書がデザインされる対象である受け手にも依存する。恐らくは技術マニュアルよりも児童書の方が、意味をとるのが容易であろう。技術的レベルは、この意図された複雑性の程度を見積もる測度である。これは、読み易さ、数字の割合及び/又は画像の割合を含み得る簡単な複数の測度で構成できる。グラフィック構成体の存在も、技術的レベルに対する影響を有し得るが、ここでは、その影響が技術的レベルを高めるのか又は下げるのかが不明確である。従って、グラフィック構成体の存在は、この例の測度には含まれない。
図74に示されるような複数の測度の組み合わせは、文書の技術的レベルの評価において有用である。
具体的には、図74に示されるように、技術的レベルは、読み易さ、数字の割合及び/又は画像の割合の組み合わせであると考えられる。図74では、技術的レベル定量化器又は結合回路53を用いて、読み易さ、数字の割合及び/又は画像の割合を組み合わせることにより、定量化された技術的レベルの値が導出される。
なお、この図は技術的レベル定量化処理のための回路を示しており、この処理は、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行されてもよい。定量化は特定の回路に限定されず、後述する方法論を実行可能なソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本発明の好ましい実施形態において、読み易さは文書のテキストについての周知の測度である。読み易さアルゴリズムの一例は、RE = 206.835 - 0.846Sy - 1.015Wである。式中、Syは単語100個当たりの平均音節数であり、Wは1文当たりの平均単語数である。
技術的レベルの計算には、読み難さの測度が望まれ、これは、Rd = 0.85Sy + Wとして概算できる。
本明細書で提供される、技術的レベルに対する読み易さの寄与を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、読み易さの寄与を判定する特定の方法のみでなく、文書の技術的レベル、伝達性及び文書の品質を評価する状況において読み易さの測度を用いるという遙かに広い概念にも向けられるように、例えば、読み易さに関する文書のテキスト要素の変化に対して測定された人間の反応の関数等の、読み易さの寄与を判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施形態において、単語は数字よりも理解し易く、数字が沢山並んだ表は、一般的に、同じ量の単語よりも内容の把握が困難である。このことを捕捉するために、数字の割合Fnを計算し、数字及び単語の合計に対する数字の比率を測定する。
本明細書で提供される、技術的レベルに対する数字の割合の寄与を評価する特定の方法は、例示的なものであり、範囲の限定とは見なされてはならない。本発明が、数字の割合の寄与を判定する特定の方法のみでなく、文書の技術的レベル、伝達性及び文書の品質を評価する状況において数字の割合の測度を用いるという遙かに広い概念にも向けられるように、例えば、技術的レベルに関する数字の量の変化に対して測定された人間の反応の関数等の、数字の割合の寄与を判定する他の方法も、本発明の範囲内であると考えられるべきである。
本発明の好ましい実施の形態において、ピクチャは理解を助けるために使用される。ピクチャの使用により、技術的レベル測度が低減される。ピクチャ部分は、以下の式のように上記で定義されている。
Fp=Ap/Ad
ここで、Apはピクチャの面積であり、Adはドキュメントの全面積である。
実際のところ、画像部分の逆作用を必要とするので、Fpが増加するにつれ、技術的レベルが減少する。Fnp=1−Fpを使用することは可能であるが、画像が少数であると、技術的レベルに大きな相違を生じる可能性がある上、更なる画像が追加されると、効果が減少することもある。したがって、以下のような非線形関数がより良い選択である。
Fnp=1/(ap+Fp)
ここで、apは1に近い定数である。
本明細書において提供される、技術的レベルに対するピクチャ部分からの寄与度を評価するための特定の方法は例示であり、本発明の範囲を限定するものとして考えるべきではない。ピクチャ部分寄与度を決定するための他の方法、例えば、技術的レベルに関する文書における図形要素の異なる量に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、ピクチャ部分寄与度を決定する特定の方法だけでなく、文書技術的レベル、伝達性、及び文書品質を評価する背景においてピクチャ部分測度を使用するというもっと広範の概念をも対象にする。
技術的レベル測度は、Tl=Rd Fn Fnpとして算出することができる。
しかしながら、Rd(すなわち、Tl)は、0乃至1の範囲内にのみ限定されてはいない。これは、以下の関数によって修正できる。
tl=Tl(atl+Tl)
ここで、atlは正の定数である。
本明細書において提供される、文書技術的レベルを評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考えるべきではない。文書技術的レベルを決定するための他の方法、例えば、技術的レベルに関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、技術的レベルを決定する特定の方法だけでなく、文書技術的レベル、伝達性、及び文書品質を評価する背景において、個々の測度の組み合わせを用いるもっと広範の概念をも対象にする。
図75乃至図77に示すように、伝達性を決定するのに使用される別のパラメータ又はファクタ(因数)は、文書のテキスト及び画像バランスの測定及び定量化である。
本発明の好ましい実施の形態において、技術的レベルを考慮する場合、画像が多くなるほど、(収益逓減とともに)レベルが低下すると仮定されている。伝達性がなければ、この規則は一般には適用しない。文書が、テキストの説明のない画像から構成されるだけである場合、著者のメッセージを確信することは困難である。設計の規則として、理想的にはほぼ同量の文書領域がテキスト及びイラストに対し充てられることになる。領域間の相違は、アンバランス(不平衡)の測度であり、バランスの測度を付与するように逆数が適用できる。例えば、テキストに充てられる全体領域がAtであり、ピクチャに充てられる全体領域がApである場合、テキスト及び画像バランスの測度は、以下の式によって付与される。
Vtib=1−|At−Ap|/(At+Ap)
図75は、好ましくないテキスト及び画像バランスの例を示している。図76は、好ましくないテキスト及び画像バランスの例を示している。図77は、望ましいテキスト及び画像バランスの例を示している。
本明細書において提供される、伝達性に対するテキスト及び画像バランスからの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考えるべきではない。テキスト及び画像バランス寄与度を決定するための他の方法、例えば、伝達性に関する文書テキスト及び画像要素の異なる比率に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、テキスト及び画像バランス寄与度を決定する測定の方法だけでなく、文書伝達性及び文書品質を評価する背景においてテキスト及び画像バランス測度を用いるもっと広範の概念をも対象にする。
本発明の好ましい実施の形態において、文書がどの程度良く伝達するかについての別の態様は、ハンディキャップや障害を有する観察者に供される機能である。この例は、文書が、赤緑色盲である人々の一部によって使用できるか否かに関する。赤緑色盲フレンドリネス(friendliness)の1つの要素は、対象の色とその背景色が少なくとも赤緑コントラストだけ異なることを検査している。輝度コントラスト及び青黄コントラストは、色盲者が前景対象を背景から区別できるようにするメカニズムである。文書内をわたって、対象ごとに前景及び背景の各色を検査する。色が、赤、緑、及び青の各成分(R、G、B)によって特定される場合、輝度及び輝度コントラストCYは上記のように算出できる。
青黄コントラストは、以下の式として定義されるSクロミナンス成分から算出することができる。
S=(R+G)/2−B
青黄コントラストは、以下に示す式のように、輝度の場合と同様に算出される。
Cby=2|Sf−Sb|/(2+Sf+Sb)
ここで、Sf及びSbは、それぞれ、前景及び背景のSクロミナンス成分である。
赤緑色盲フレンドリネス(friendliness)の対象は、以下に示すように、輝度及び青黄クロミナンス・コントラスト成分を結合することによって推定できる。
Frg=(CY+Cby)/2
加重平均は、コントラスト成分を結合するために使用することもできる。
文書全体に対し、すべての文書対象に対する赤緑色盲フレンドリネス値を結合するために、あるメカニズムが必要とされる。これを実行する1つの方法は、対応する対象領域によって重み付けされた値を平均化することである。Frgiがi番目の対象の赤緑色盲フレンドリネス値であり、Aiがその面積である場合、平均は、以下の式によって付与される。
rg=(ΣFrgii)/ΣAi
ここで、合計はすべての対象にわたる。
しかしながら、1つの小さな対象、又は、解読するのが難しい対象のセットが文書全体の理解に対して大きな影響を及ぼす可能性がある。したがって、面積によって重み付けする以外の、フレンドリネス値を結合するためのある方法が、好ましいとされ得る。代わりの方法として、Vrg=MIN(Frgi)にあるような最小値を選択する。
第3のアプローチでは、上述の2つの方法の特徴を結合する。これらの値は、面積によって重み付けされているが、小さな値を強調するように、べき指数により引き上げられる。
rg=((Σ(drg+Frgi-pi)/ΣAi-1/p−drg
ここで、drgは、0に近い正の定数であり、pは、少なくとも1である正のべき指数である。
フレンドリネス値を結合する他の方法も考えられる。本明細書において提供される、伝達性に対する赤緑色盲フレンドリネスからの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考えるべきではない。ハンディキャップを有するユーザをサポートする、赤緑色盲フレンドリネス又は他の文書特性を決定するための他の方法、例えば、伝達性に関して異なる色に対する測定した色盲者の反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、赤緑色盲フレンドリネス寄与度、あるいは、他のハンディキャップ補償特性を決定する特定の方法だけでなく、文書伝達性及び文書品質を評価する背景において、ハンディキャップ補償測度を使用するもっと広範の概念をも対象とする。
本発明の好ましい実施の形態において、文書の伝達性に関連がある1つ以上の特性は、図78に示されるような、読み進み易さである。読み進み易さは、論理順序で1つの文書成分から次の成分へと進行する際の困難さを測定する。例えば、1つのコラムの下部から次のコラムの上部へと移動する際、などである。読み進み易さの評価は、進行プロセスに役立つ、それぞれの特性の複合物として計算される。これらの特性として、識別度、グループ同一性、空間コヒーレンス、リストの黒丸、進行リンク、見出し、位置合わせ、余白、走査一貫性、及び/又は序列一貫性が挙げられる。
これらの要因は、これらすべてが等しく重要ではないことから、加重平均を用いて結合される。
ep=wdsds+wgigi+wscsc+wlblb+wplkplk+whdhd+walal+wwsws+wcscs+wcoco
ここで、w部分は、重みであり、V部分は、寄与因子である。
代わりの結合方法が可能であることは、留意すべきである。本明細書において提供される、文書の読み進み易さを評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考えるべきではない。文書の読み進み易さを決定するための他の方法、例えば、読み進み易さに関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、読み進み易さを決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において、個々の測度の組み合わせを用いたもっと広範の概念をも対象とする。
図78に示されるような、測度の組み合わせは、文書の読み進み易さを評価する際に有用である。
さらに具体的に言うと、図78に示されるような、読み進み易さは、識別度、グループ同一性、空間コヒーレンス、リストの黒丸、進行リンク、見出し、位置合わせ、余白、走査一貫性、及び/又は序列一貫性の組み合わせであると考えられる。図78において、定量化された読み進み易さの値は、読み進み易さ量子化器又は結合器回路54を用いて、識別度、グループ同一性、空間コヒーレンス、リストの黒丸、進行リンク、見出し、位置合わせ、余白、走査一貫性、及び/又は序列一貫性の組み合わせによって得られる。
この図には読み進み易さ定量化プロセス用の回路が示されているが、このプロセスがマイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行できることに留意すべきである。定量化は特定の回路に限定されず、後述される方法論を実行できるソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
発明の好ましい実施の形態において、要素を近傍からどの程度良く識別できるかを示す識別度、どの対象が論理グループの一部として属しているか否かをどの程度容易に見分けるかを示すグループ同一性、グループのメンバがどの程度密着して詰めこまれているかを測定する空間コヒーレンス性、及び論理構造を記述する見出し、が、使い易さに対するグループの寄与度の説明において定義されている。これらの因数は、文書がどの程度良く伝達するかに対しても寄与するものであるが、異なる相対的重要度を示すための重みを含んでいる。空間コヒーレンスは、読み進み易さに特に関連性があるという理由で、ここに選出され、グループ同一性を介して入力する異なる重み形式に対し、その寄与度を付与することが望まれる。
見出しに関する論議は、上記の結合した見出し、リストの黒丸、及びリスト番号のすべてを1つの測度として測定したが、リストの黒丸及びリスト番号に関するチェックを削除し、見出しのみを見るようにその方法を使用することができる。これにより、見出し及びリストの黒丸を別々に計算し、個別に重み付けすることができる。
本明細書において提供される、読み進み易さに対する、識別度、グループ同一性、及び見出しからの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考えるべきではない。これらの寄与度を決定するための他の方法、例えば、識別度、グループ同一性、又は見出しに関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、これらの寄与度を決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において、識別度、グループ同一性、及び/又は、見出しの測度を使用するもっと広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、リストの黒丸及び番号は、リスト要素を識別し、リストの中を進行するのに役立つ。黒丸リスト、及び/又は、番号付けされたリストを使用する文書は、そうでない文書よりも、読み進み易いはずである。この特性に関する測度を計算するための方法は、リストの黒丸Nlbの総数、又は、リストの番号Nlnをカウントし、リスト要素Nleの総数で割ることである。
lb=(Nlb+Nln)/Nle
2つのリストの黒丸を混同するよりも、2つのリスト番号を混同させる可能性が少ないので、黒丸よりもリストの番号のメリットの重みを増すことが望ましいとされることもある。黒丸及び番号の総数が全リスト要素に対する比率の分子に結合される時に、それぞれに重み付けすることは、これを容易に実行できる。 Vlb=(albNlb+alnNln)/Nle
ここで、alb及びalnは、黒丸の総数及びリスト番号の総数に付加される固定重みである。
あるいはまた、黒丸要素の一部及び番号付けされた要素の一部に対して個々の独立した測度を計算することが望ましいとされる。
本明細書において提供される、読み進み易さ及び伝達性に対するリストの黒丸及び番号からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考慮すべきではない。テキスト及び画像バランスの寄与度を決定するための他の方法、例えば、読み進み易さ及び伝達性に関する異なるリストの黒丸及び番号の仕様に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、テキスト及び画像バランスの寄与度を決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において、リストの黒丸及び番号の測度を使用するもっと広範囲な概念をも対象にする。
本発明の好ましい実施の形態において、内部参照(例えば、「7ページに続く」)は、意図された進行が基本的な約束事とは異なる場合に読者を案内する役割を有する。電子文書は、読者を案内するという同じ働きを行うハイパーリンク形式を含むことがある。読者を案内する際に文書がどの程度有用であるかを示す簡単な測度は、このようなハイパーリンク及び/又は基準NLの総数である。このカウントは、リンク密度を得るために、(コンテンツ対象NOの数など)文書のサイズのある測度によって割らなければならない。
plk=NL/NO
進行が代表的な走査順序NSOにしたがっていないすべての地点の総数で基準の総計を割ることによって、より好ましい測度が得られる。従来の洋式の走査順序においては、次の論理的コンテンツ要素は現在の対象の右側又は下に位置合わせされるべきである。論理的順序におけるコンテンツ要素の位置を検査し、この規則が適用されない場合、該当する事例をカウントすることができる。読者をリダイレクトさせる(読者の進行方向を替える)ための基準が最も有益であり、走査順序における中断に対する基準の比率を算出できる場合が多い。これは、一般には、0乃至1の間の数であるが、値が1以下の範囲に限定されるように保証されていない。範囲を限定するために上記で使用されたような関数を使用することができるが、この場合、単純に値を1に固定すればよい。
plk=MINIMUM(1,NL/NSO)
本明細書において提供される読み進み易さ及び伝達性に対する進行リンクからの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するものとして考えるべきではない。進行リンク寄与度を決定するための他の方法、例えば、読み進み易さ及び伝達性に関する進行リンク仕様書の存在に対して測定した人的反応の関数は、本発明の範囲内であると考慮しなければならない。すなわち、本発明は、進行リンク寄与度を決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において進行リンク測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、要素が位置合わせされていれば、従来の進行の規則に従いやすい(例えば、次の論理要素が、現在の要素の真下に位置付けられていれば、など)。これにより、現在の要素の下及び右にあるのはどの要素であるのかを明確にする。文書位置合わせValの測度は、文書美観の論説において上記に述べられている。
本明細書において提供される、読み進み易さ及び伝達性に対する位置合わせからの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。位置合わせ寄与度を決定するための他の方法、例えば、読み進み易さ及び伝達性に関する異なる位置合わせ仕様に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、位置合わせ寄与度を決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において、位置合わせ測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、多くの余白を備えた文書は、一般に、込み合っていない。多くの余白があれば、要素を識別し、それに追随することが容易になる。したがって、余白の量が大きいと、全体的に読み進み易さに対する寄与度が小さくなる可能性がある。非余白領域は、コンテンツ対象の面積(コンテンツ対象iに対するAi)を合計することによって想定できる。全対象領域は、文書総面積Adによってスケーリングできる。
ws=(Ad−ΣAi)/Ad
本明細書において提供される、読み進み易さ及び伝達性に対する余白からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。余白寄与度を決定するための他の方法、例えば、読み進み易さ及び伝達性に関して異なる余白仕様に対する測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、余白寄与度を決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において、余白の測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、洋式文書の進行の取り決めの1つは、左から右に、上から下に走査位置決めすることである。これは、テキストが応ずる取り決めであるが、他の対象(コミックブックにおけるコマなど)に適用することもできる。この取り決めでは、これら項目が同じ程度の高さであって、列ごとに配列されることが望ましいとされる。この列の左側エッジは垂直方向に一直線に合わせなければならない。この規則からの偏差を示す測度を構成することができる。この偏差測度の逆数は、規則に適合することを示す。
論理的順序で文書要素内を進行する。各要素ごとに、対象を含むとともに、その上部yt、底部yb、左側xl、及び右側xrの各位置を示す、バウンディング・ボックスを求める。対象内を進行しながら、新しい対象の垂直位置(ytn、ybn)を、前の対象の垂直位置(yto、ybo)と比較する。対象は、右側及び下側に設置され、上側に設置してはならないので、偏差量は、新しい対象が前の対象の上側にある度合いである偏差累算dcsに加算されるべきである。以下の式は、これを実行する(ページの下方に動くにつれて、y座標が増加すると仮定する):
if ytn < yto and ybn < ybo
then dcs = dcs + (yto - ytn) * (ybo - ybn)/(ybo - ytn)2
新しい対象が前の対象と垂直方向に同じ行にある場合、前の対象の右側に位置付けられることが望まれるる。前の対象の左側にある程度は、走査順序モデルからずれている量である。この偏差を以下の式で計算できる。
if ytn <= ybo and xln < xlo and xrn < xro
then dcs = dcs + (xlo - xln)*(xro - xrn)/(xro - xln)2
これらの計算は、論理的順序で文書内を進行するにつれて、コンテンツ要素の連続する対ごとに実行される。この結果は、対比較の数(要素の数から1を引く)で割ることによって正規化され、1に固定される。この逆数が戻される。
Vcs=1−MINIMUM(1,dcs/(NO−1))
図79は、走査一貫性に対する配置の例を示している。
本明細書において提供される、読み進み易さ及び伝達性に対する走査一貫性からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。走査一貫性の寄与度を決定するための他の方法、例えば、読み進み易さと伝達性に関する順序付けられたコンテンツの異なる配置に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、走査一貫性の寄与度を決定する特定の方法だけでなく、読み進み易さ、伝達性、及び文書品質を評価する背景において、走査一貫性の測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、進行順序の代わりのモデルは、上から下、左から右である。すなわち、例えば、この順序は、新聞や雑誌における記事の配置に対して一般に使用されている。コラムを下部まで下方移動し、右側の次のコラムの上部にシフトする。上記の走査順序付け計算と同様にして、この順序付けからの偏差を計算することができる。しかしながら、この場合、前の対象の左側に対象を配置することを望むことはなく、同じコラム内の対象は前の項目の上に配置されるべきではない。これに対応する検査は以下の通りである。
if xln < xlo and xrn < xro
then dco = dco + (xlo - xln)*(xro - xrn)/(xro - xln)2
および
if xln <= xro and ytn < yto and ybn < ybo
then dco = dco + (yto - ytn)*(ybo - ybn)/(ybo - ytn)2
および
Vco = 1- MINIMUM(1, dco/(NO-1))
上記したように、走査一貫性及び序列一貫性の項目を独立に読み進み易さの式に付加する代わりに、これら2つの測度を結合し、読み進み易さに当該結合結果を使用してもよいことに留意されたい。これを実行する理由は、2つの測度のいずれかの値が高い場合、結合した値が高くなるような方法で、これら2つの測度が結合され得るからである。言い換えれば、文書は、いずれか一方のレイアウト・モデルに従えばよく、両方に従う必要はない。
図80は、序列一貫性に対する配置の例を示している。
本明細書において提供される、読み進み易さ及び伝達性に対する、序列一貫性からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。序列一貫性の寄与度を決定するための他の方法、例えば、読み進み易さ及び伝達性に関する順序付けられたコンテンツの異なるレイアウトに対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、序列一貫性の寄与度を決定する特定の方法だけでなく、文書の読み進み易さ、伝達性、及び文書品質を評価する背景において、序列一貫性の測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、読み進み易さと類似の特性が、ナビゲーションし易さである。進行が、作成者によって意図される順序で文書内を移動する容易さ又は困難さを測定する一方、ナビゲーションし易さは、文書の任意要素を位置付ける(検出する)能力を測定する。ナビゲーションし易さを推定する時、要素又はセクションを見つけるのに役立つ特徴を主として捜し求める。本明細書に提供される方法例として、見出し、リストの黒丸及び番号、欄外見出し及びページ番号、内部リンク、及び/又はグループ同一性が挙げられる。これらの特性はそれぞれ、ナビゲーションし易さに役立ち、総合測度は、加重平均から生成できる。
Ven=whdVhd+wlbVlb+wrhVrh+wlnkVlnk+wgiVgi
ここで、w部分は重み特性であり、V部分は価値特性である。更なる寄与因子と同様に、別の結合方法もまた可能であることに留意すべきである。特性の多くは、読み進み易さに対しても使用されたが、ナビゲーションし易さを計算する際に使用される重みは異なることがある。
図81に図示されるような測度の組み合わせは、文書のナビゲーションし易さを評価する際に有益である。
さらに具体的には、図81に示されるような、ナビゲーションし易さは、見出し、リストの黒丸及び番号、欄外見出し及びページ番号、内部リンク、及び/又はグループ同一性の組み合わせであると考えられる。図81において、定量化されたナビゲーションし易さの値は、ナビゲーションし易さ量子化器又は結合回路55を用いて、見出し、リストの黒丸及び番号、欄外見出し及びページ番号、内部リンク、及び/又はグループ同一性を組み合わせることによって導出される。
この図では、ナビゲーションし易さ定量化プロセス用の回路が示されているが、このプロセスが、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行してもよいことに留意すべきである。定量化は、特定の回路に限定されず、後述する方法論を実行できるソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本明細書において提供される、文書のナビゲーションし易さを評価するための方法は、例示であり、本発明の範囲を限定するように考えるべきではない。文書のナビゲーションし易さを決定するための他の方法、例えば、ナビゲーションし易さに関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、ナビゲーションし易さを決定する特定の方法だけでなく、文書のナビゲーションし易さ、伝達性、及び文書品質を評価する背景において、個々の測度の組み合わせを用いるより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、ページ番号は、文書のナビゲーションに大いに役立つことができる。欄外見出しについては、それらの値の測度は、異なる見出しの数をページの数で除したものである。見出しに対する文書を検査し、個々の見出しのリストを作成することによって、これを求めることができる。そして、リスト内の見出しの数をカウントすることができる。ページ番号に関して、それらの存否について照会し、存在する場合、測度に寄与を付加することができる。
Vrh=wh Nh/Np+(1-wh)Bpn
ここで、whは、欄外見出しに付与される重みであり、Nhは個々の見出しの数であり、Npは、文書内のページ番号であり、Bpnは、ページ番号があれば1であり、それ以外は0である。
本明細書において提供される、ナビゲーションし易さ及び伝達性に対するページ番号からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。ページ番号からの寄与度を決定するための他の方法、例えば、ナビゲーションし易さ及び伝達性に関するページ番号の存否に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明はページ番号寄与度を決定する特定の方法だけでなく、文書のナビゲーションし易さ、伝達性、及び文書品質を評価する背景において、ページ番号測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、ナビゲーションし易さは、グループの使い易さに関する上記議論において述べられたグループ要素の検出特性に大きく関連している。見出し、リストの黒丸及び番号、ならびに内部リンクの各測度は、上記のように取得できる。
読み進み易さに関する議論において、進行リンクの一部を測定した。ナビゲーションし易さに関して、内部リンク又は基準(単に進行性のものではない)の総数をカウントすることが望まれる。これは、文書の本文内の基準又はリンクと同様、目次、及びインデックス内の記入項目を含む。上記に示唆されたように、コンテンツ対称の数で割ることによってカウントを基準化することができる。
lnk=MINIMUM(1,NLT/NO)
ここで、NLTは、内部リンクの総数であり、NOは、コンテンツ対象の数である。
文書内を苦労しながら進もうとする場合、1つのコンテンツのグループが終了し、別のグループが開始する時を認識することは有益である。したがって、グループ同一性の測度からナビゲーションし易さに対する寄与があるべきである。これは、読み進み易さの推定においても使用される別の測度である。グループ同一性の測度は、グループの使い易さに関する議論において述べられている。グループ同一性は、空間コヒーレンス、境界若しくは背景の存在、スタイル均一性、及び要素の位置合わせなどの他の測度から算出される。
本明細書において提供される、ナビゲーションし易さ及び伝達性に対する見出し、黒丸、内部リンク、及びグループ同一性からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。これらの特性からの寄与度を決定するための他の方法、例えば、これられの特性、ナビゲーションし易さ、及び伝達性に関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は寄与度を決定する特定の方法だけでなく、文書のナビゲーションし易さ、伝達性、及び文書品質を評価する背景において、見出し、黒丸、内部リンク、及びグループ同一性の各測度を使用するより広範囲の概念をも対象にする。
快適性
本発明の好ましい実施の形態において、文書の品質に寄与する別の特性は、文書を知覚する快適性レベルである。文書の快適性レベルを定量化するための方法を以下に述べる。
快適性は、より単純な特性又は規則の組み合わせとして算出される。コンポーネント規則のいずれかに違反することによって、不快感が生じ、文書レイアウトの全体的な快適性を損なう可能性がある。コンポーネント規則として、フォント形式の制限、色の制限、グループ別番号、整然性、判読性、非威圧性、慣習性、色の調和、色の適合性、輝度一貫性、及び/又はサイズ一貫性を挙げることができる。各規則は、0が低い若しくは好ましくない快適値を意味し、1が高い又は好ましい快適値を意味するように、0乃至1の範囲内の値を生成するように定義されている。これら(及び他のこうした規則)は、全体的快適性測度となるように計算且つ結合できる。Viがi番目の規則に対して算出される値である場合、快適性測度Vcは、これら寄与度の関数Eとして構成される。
Vc=E(Vlf, Vlc, Vgn, Vnt, Vdc, Vni, Vcv, Vch, Vca, Vcl, ... ,Vcsz)
結合関数Eは、寄与度の加重平均と同様に単純であるが、いかに他のものがよくても、好ましくないいずれかの寄与要素が快適性を阻害する可能性があるので、線形結合は好ましくない。別の方法として、以下の式を使用する。
c=[Σwi(d+Vi-p-1/p−d
i因数は、各規則の相対的重要度を特定する重みであり、これらは合計して1にならなければならない。指数pは、1つの悪い値に多くの好ましい値を圧倒させ得る非線形性を導入する。pの値が大きくなるほど、この効果は大きくなる。定数dは、0に近い正の数であり、ゼロ除算を防止する。
他の結合関数もまた、可能である。例えば、寄与要素の積を利用することができる。寄与度の重みが要求される場合、これは(重み値の異なるセットを用いる)累乗法によって実行できる。
c=ΠVi wi'
選択された規則のセットが快適性の測度の構成方法を示していることに留意すべきである。快適性に役立つ他の因数が存在し、より洗練された快適性の定量化にもちろん含まれ得る。本明細書において提供される、文書快適性を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。文書快適性を決定するための他の方法、例えば、快適感に関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は快適性レベルを決定する特定の方法だけでなく、文書快適性レベル及び文書品質を評価する背景において、個々の測度の組み合わせを用いるより広範囲の概念をも対象にする。
図82に示すように、測度の組み合わせは、文書の快適性を評価する際に有益である。
さらに具体的には、図82に示すように、快適性は、フォント形式の制限、色の制限、グループ別番号、整然性、判読性、非威圧性、慣習性、色の調和、色の適合度、輝度一貫性、及び/又はサイズ一貫性の組み合わせであると考えられる。図82において、定量化された快適値は、快適性量子化器又は結合回路60を用いて、フォント形式の制限、色の制限、グループ別番号、整然性、判読性、非威圧性、慣習性、色の調和、色の適合度、輝度一貫性、及び/又はサイズ一貫性を結合することによって導出される。
この図には快適性定量化プロセス用の回路が示されているが、このプロセスは、マイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行できることにもまた、留意すべきである。定量化は、特定の回路に限定されず、後述の方法論を実行できるソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本発明の好ましい実施の形態において、フォントは、異なる効果を得るように選択できる多くの特性を有する。フォント・ファミリーは、形式的なものからくだけたもの、軽いものから堅いもの、現代的なものから慣用的なものまで、文書に異なる感覚を付与するように選択できる。フォントサイズは、コスト及び可読性に影響を与える可能性がある。ボールド(太字)などのフォント重みは、重要性を伝達でき、イタリックなどのフォント形式は、それが特別であることを示すことができる。抹消又は下線などのフォント変形は、更なる意味を付加できる。
しかしながら、単一の文書に、異なるフォント形式が多すぎる場合、その結果は不安定になる。このような「脅迫状」的(種々の書体から成る)文書は、読者に不快感をもたらすことから、悪いスタイルと考えられている。観察者の快適性に寄与するものと考えられる第1の要因は、フォント形式の数の制限である。フォント仕様(ファミリー、サイズ、重み、スタイル又は変形)における変化は、新しい形式をもたらす。文書は、検査することができ、個々のフォント形式の数Nfをカウントすることができる。これは、以下の式によって、0近傍(多くのフォント形式の場合)から1(フォント形式が1つにすぎない場合)までの範囲内の数に変換できる。
lt=1/MAXIMUM(1,Nf)
しかしながら、より洗練された測度が可能である。例えば、フォントが互いにどの程度相違しているかを測度の一部として含むことができる。これは、文書に出現するフォント形式のすべてのリストFを最初に構築することによって実行できる。そして、リスト中のすべてのフォント形式を他のすべてのフォント形式と比較し、それらの相違の測度を累算することができる。異なるサイズのフォントに関して、この測度をサイズ差の関数(その絶対値など)にすることができる。フォント重みに関して、測度を重み差の関数に加算することができる。重みは、小さな選択肢のセットに、通常限定されているので、表FW[weight(f1),weight(f2)]は、重み差関数を記述するために使用することができる。ファミリースタイル及び変形の差による寄与は、表において取得することもでき、あるいは、単一の定数量afは、これらの特性に何か相違が生じる場合はいつでも加算することができる。すべてのフォント形式を他のすべてのフォント形式と比較することにより、結果としてフォントの数を自乗した程度に累算した差となる。第1のより単純な測度とさらに調和すると、フォント数での除算が可能である。この別の測度を計算するための擬似コードは、以下の通りである。
fd=1
for f1 from 1 to Nf
for f2 from f1 to Nf
fd=fd+|size(f1)-size(f2)|+Fw[weight(f1), weight(f2)]
if family(f1) differs from family(f2)
or style(f1) differs from style(f2)
or variant(f1) differs from variant(f2)
then fd=fd+af
end of f2 loop
end of f1 loop
fd=fd/Nf
Vlt=1/(bf+fd)
すなわち、
fd=1
for f1 (1〜Nf)
for f2 (f1〜Nf)
fd=fd+|size(f1)-size(f2)|+Fw[weight(f1), weight(f2)]
if family(f1)がfamily(f2)と異なる
or style(f1)がstyle(f2)と異なる
or variant(f1)がvariant(f2)と異なる
then fd=fd+af
f2についてのループ終了
f1についてのループ終了
fd=fd/Nf
Vlt=1/(bf+fd)
上記コードの最終行において、bfは、フォント差が増加するにつれてどの程度速く測度が減少するかを制御する小さい正の数である。
一つの更に可能な測度の拡張が考えられる。フォント差が、異なるパラグラフ上に分散される場合よりも、個々のフォント形式が同じパラグラフ内で混合される場合に、より大きな効果をもたらすことになるので、パラグラフごとにフォント形式の数をカウントし、文書のパラグラフにわたってこれを平均化することができる。この最終的に累積された差の測度fdは、反転して形式Vltにする前に平均的なパラグラフ単位のフォントによってスケーリングできる。
本明細書において提供される、文書快適性レベルに対するフォント形式の制限からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。フォント形式の制限からの寄与度を決定するための他の方法、例えば、快適性に関する感覚に関するフォント形式の数に対して測定した人的反応の関数は、本発明の範囲内で考慮すべきである。すなわち、本発明は、フォント形式の制限の寄与度を決定する特定の方法だけでなく、文書快適性レベル及び文書品質を評価する背景において、フォント形式の制限の測度を用いるより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、ただ単にフォントが多すぎるのは、好ましくないスタイルであると考えられ、色が多すぎる場合も同様である。多数の色を使用した文書は、けばけばしいものと考えられる。観察者は、色の意味を理解しようと試み、多数の色はこれを困難且つ不快な作業にする。多数の色は、目を疲れさせることになる。この効果の単純な測度は、文書内に見られる異なる色の数の計数である。これは、文書内を進行し、色を識別し、それらをリスト(又はツリー・テーブルやハッシュ・テーブルなどの他のデータ構造)内に保存することによって、決定できる。各色に出会うと、それは、以前に見たかどうかを判断するために、リスト内に既にある色と比較できる。新しい色である場合、それはリストに加えられる。文書が処理された後に、リスト内のエントリーの数が、色の総数Ncを与えるようにカウントすることができる。これは、以下の式によって、(多色に対する)0近傍から(単色のみに対する)1までの範囲内の数に変換できる。
lc=1/MAXIMUM(1,Nc)
上記のスキームは、グラフィックスにおいて一般に使用されるような一定且つ均一な色に対し機能するが、カラー・スイープ、又は、画像に見られる膨大な数の色の操作方法に対応しない。カラー・スイープでは、リスト・エントリーを、スイープの第1の色及び最終の色のみに制限することができる。絵画的な画像に関しては、それらを完全に無視したり、サブサンプリングによって画像から幾つかの色を抽出したり、あるいはまた、色空間における画像値のクラスター分析によって幾つかの色を抽出することができる。
色がすでにリスト内にあるかどうかの検査は、厳密な適合である必要はない。色空間におけるそれらの間の距離を計算し、その距離をしきい値と比較することによって、色を比較することができる。距離がしきい値よりも小さい場合、それらの色は、適合するのに十分類似したものと考えることができ、新しい色のリスト入力は必要ない。
快適性は、色の数と同様、色の選択によって決まることがある。文書の色を二つ一組(ペアワイズ式)で比較し、それらの適合性の測度を累積することもできる。累積する単純な値は、色空間における各色の距離であるが、快適性に及ぼす影響のより良い測度は、対になった色の不調和となる。色をペアワイズで比較することが、色の数の自乗として値を累積するので、色の数と線形に変化する測度を得るように、文書内の色の数で総数を割ることができる。
すべての色が目を均等に疲れさせるものではなく、より洗練された測度は、これを考慮に入れることができる。彩度の強い色は、中性色よりも影響が大きい。不快さの寄与を増加させるのに使用できる適切な彩度値を計算するために幾つか可能な方法がある。これらは、注目性のもとで彩度に関する上記論議において述べられている。
リスト内の各色に対し、全色の不快さ測度に対する寄与を付加できる。この寄与は、彩度の関数となることができる。例えば、彩度ciを有するi番目の色では、寄与はac+ciであり、acは別の色を単に有するという効果を表わす定数値であり、ciは、色の彩度による更なる不快さである。
dc=ac Nc+Σci
ここで、dcは、色の不快さの測度である。
各色で描画される文書の全領域を把握し、不快さの計算の拡大における彩度及び領域の両方の関数を含むこともまた可能である。ここで理解することは、大きな着色領域が小さな領域の効果よりも強いことである。
不快さの測度を、0乃至1の間で変化する色測度の制限に変換するために使用できる式を以下に示す。
lc=1/(bc+dc)
ここで、bcは、小さい正の定数である。
本明細書において提供される、文書快適性レベルに対する色の制限からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。色の制限から寄与度を決定するための他の方法、例えば、快適性に関する感覚に関連して色の数に対する測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、色の制限の寄与度を決定する特定の方法だけでなく、文書快適性レベル及び文書品質を評価する背景において色の測度の制限を用いるより広範囲な概念をも対象にする。
本発明の好ましい実施の形態において、人々は、他と較べてあるグループサイズに対しもっと快適性を感じている。グループは、要素が多過ぎたり、あるいは、少な過ぎたりしてもいけないし、奇数であることが偶数よりも好ましい。グループの最良のサイズは、3個の要素である。グループ数の快適性の単純式は、以下の通りである。
Gc=1/(eg+ag(1−MOD2(eg)))
ここで、egは、グループ内の要素の数であり、agは、偶数の要素の付加的不快さを与える定数であり、MOD2は、引数が偶数である場合に0を、奇数の場合に1を付与する関数である。
文書全体に対し、すべてのグループにわたってグループ数快適性値を平均化するある方法を必要とする。例えば、文書内にNgグループがあり、i番目のグループの快適性値がGciである場合、すべてのグループにおける単純平均は、以下にようになる。
gn=ΣGci/Ng
更に複雑な平均化スキームが可能である。例えば、文書の論理構造ツリーの階層(ハイアラキー)内のグループの配置に応じてグループ数快適性の効果を重みづけできる。
本明細書において提供される、文書快適性レベルに対するグループ数からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。グループ数からの寄与を決定するための他の方法、例えば、快適性の感覚に関するグループメンバの数に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、グループ数の寄与度を決定する特定の方法だけでなく、文書快適性レベル及び文書品質を評価する背景において、グループサイズの測度を用いるより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、人々が、混乱したものよりも整然とした文書のほうがより快適性を感じることは、一般的である。寄与する要因の組み合わせとして整然性を定量化できる。多くの場合、文書を混乱した状態にする要因を識別し、かかる要因の逆数を使用することは容易である。整然性の測度の例は、テキストの整然性、境界及び背景の存在、位置合わせ、及び/又は規則性に基づいて提示される。整然性は、更なる要因を用いることが可能であることを推定する。構成要素の整然性の測度を結合する際に、混乱性の原因は、(全体的快適性に対して論じられたように)全体的な整然性を破壊することになると仮定する。
同様の結合式が使用できる。
nt=[Σwi(d+Vi-p-1/p−d
ここで、Viは、テキストの整然性、境界/背景、位置合わせ及び規則性に対するセットVtn、Vbb、Val及びVrgから採用される。重みwi、及びパラメータp及びdは、快適性を計算する際に使用されたものとは異なることがある。
本明細書で提供される、文書の整然性を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。文書の整然性を決定するための他の方法、例えば、整然性の感覚に関する異なる文書特性に対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、整然性レベルを決定する特定の方法だけでなく、文書の整然性、快適性レベル、及び文書品質を評価する背景において、個々の測度の組み合わせを用いるより広範囲の概念をも対象にする。
図83に示されるような、測度の組み合わせは、文書の整然性を評価するのに有益である。
さらに具体的には、図83に示されるように、整然性は、テキストの整然性、境界及び背景の存在、位置合わせ、及び/又は規則性の組み合わせであると考えられる。図83において、定量化された整然性の値は、整然性量子化器又は結合回路61を用いて、テキストの整然性、境界及び背景の存在、位置合わせ、及び/又は規則性を組み合わせることによって導出される。
この図には、整然性定量化プロセス用の回路が示されるが、このプロセスは、マイクロプロセッサ及び/又はファームウェアによってソフトウェアにおいて実行できることに留意すべきである。定量化は、特定の回路に限定されず、後述される方法論を実行できるソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
本発明の好ましい実施の形態において、要因が整然性にどのように寄与できるかという例は、テキストの整然性を考慮する。テキストの整然性は、一部のフォントの変異体及びスタイル(例えば、アンダーラインが引かれたテキストや、イタリックなど)を使用することによって阻害される可能性がある。引用のあるテキストは、引用のないテキストよりも整然性が低いと考えられている。テキストを検査し、すべての単語、スペース、及び句読点を考慮しながら文書内を進行することができる。単語(及び句読点)に対して、使用されたフォント(f)に基づいて整然性の値を決定する。フォントの(非)整然性あるいは混乱した状態を推定する際に、フォントファミリー、スタイル、及び変異体を考慮する。これらの特性は個々に考慮でき、ルックアップ・テーブル(Tf、Ts、及びTv)は、各特性ごとの混乱状態の効果を保存するように使用することができる。全体的な混乱状態の測度は、フォント選択の効果を収集できる。
mt=mt+Tf[family(f)]
+Ts[style(f)]
+Tv[variant(f)]
句読点については、引用符を探し、引用に対する特別の寄与度を付加する。一般に、文字コードcに基づいて寄与度を付加することができ、テーブルTcは寄与度の量を保存できる。これは、句読点と同様、スペース、文字、及び数に適用できる。
mt=mt+Tc[c]
フォント及び文字からの寄与度は、文字に対する全体的な混乱状態の寄与度が1を超えないように選択できる。
テキストの整然性に対する平均値を得るために、各文字ごとに混乱度の値(i番目の文字に対するmti)を合計し、文字の総数Nchで割る。テキストの整然性は、混乱度の逆数である。
tn=1−Σmti/Nch
図84は、より整然性の高い文書の例を示している。図85は、整然性の低い文書の例を示している。
本発明において提供される、文書の整然性及び快適性レベルに対しテキストの整然性からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。テキストの整然性からの寄与度を決定するための他の方法、例えば、整然性の感覚に関する異なるテキストスタイルに対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、テキスト整然性の寄与度を決定する特定の方法だけでなく、文書の整然性レベル、文書快適性レベル、及び文書品質を評価する背景において、テキスト整然性の測度を用いるより広範囲の概念をも対象にするようなものである。
本発明の好ましい実施の形態において、境界及び背景の使用は、文書の構造を理解するのに役立つことができ、文書の興味に付加することができるが、これらの付加がないものほど整然性はない。文書は、境界及び/又は背景に対し幾つかの契機を提示する。これらは、各ページ上で見られたり、あるいは、コラム、セクション、テーブルや図面に対しても見出だすことができる。境界又は背景に対する各契機を考慮して文書内を進行する。こうしたそれぞれの契機において、境界又は背景が実際に存在するかどうかについて検査する。境界が存在する場合、混乱度の測度mbbに量vbdを加算する。背景が存在する場合、量vbkをmbbに加算する。さらに、遭遇した契機Nbの数をカウントする。境界及び背景からの整然性の寄与度は、これらの平均混乱度の逆数である。
bb=1−mbb/Nb
本明細書において提供される、文書整然性及び快適性レベルに対する境界及び背景からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。境界及び背景からの寄与度を決定するための他の方法、例えば、整然性の感覚及び快適性に関する異なる境界及び背景のそれぞれのスタイルに対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、境界及び背景の寄与度を決定する特定の方法だけでなく、文書の整然性レベル、文書の快適性レベル、及び文書品質を評価する背景において、境界及び背景の各測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、整然性に対する重要な寄与度は、文書の構成要素が位置合わせされ、規則正しく配置されているという印象である。これらの要因は、文書の美観に関する議論に述べられている。記載された技術を用いて、文書の位置合わせ及び規則性に対する測度Val及びVrgを計算することができる。整然性に対するこれらの寄与度に対する重み係数が、美観に対する寄与度に使用される係数とは異なる傾向があることに留意すべきである。
本明細書において提供される、文書の整然性及び快適性レベルに対する位置合わせ及び規則性からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。位置合わせ及び規則性からの寄与度を決定するための他の方法、例えば、整然性の感覚及び快適性に関する異なる程度の位置合わせ及び規則性に対して測定した人的反応の関数は、本発明の範囲内であると考えるべきである。すなわち、本発明が、位置合わせ及び規則性の寄与度を決定する特定の方法だけでなく、文書整然性レベル、文書快適性レベル、及び文書品質を評価する背景において、位置合わせ又は規則性の測度を用いるより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、一部のテキストでは、他のものと比べて、解読し、理解するための作業をより必要とする。イタリック体で印刷されたテキスト、あるいは、標準でないフォント変異体を使用するテキストは、読みにくい。薄い色の背景上での薄い色のテキスト、あるいは、濃い色の背景上での濃い色のテキストは、解読する努力を要する。この作業は、読者を疲れさせ、文書を使用することを不快なものにしている。文書の平均判読性Vdcを推定するための方法は、文書がいかに良く伝達されるかに関する論議において上記に述べられている。
本明細書において提供される、文書快適性レベルに対するテキスト判読性からの寄与度を評価するための特定の方法は、例示であり、本発明の範囲を限定するように考えるべきではない。テキスト判読性からの寄与度を決定するための他の方法、例えば、判読性と、快適感に関する異なるテキストスタイルに対して測定した人的反応の関数は、本発明の範囲内であると考慮すべきである。すなわち、本発明は、テキスト判読性の寄与度を決定する特定の方法だけでなく、文書快適性レベルと文書品質を評価する背景において、テキスト判読性の測度を使用するより広範囲の概念をも対象にする。
本発明の好ましい実施の形態において、一部の文書構成は、読者を威圧するように働くことがある。これらの要素が存在する程度を注意することによって、威圧性の測度を構成することができる。威圧性は、快適性に反するので、威圧性係数の逆数は、快適性の推定に対し寄与することになる。威圧性のある要素には、余白が少量であること、情報密度が高いこと、可読性が低いこと、テキストがボールド体であること、画像部分が少量であること、ラインが使用されていること、及び/又は、技術的レベルが高いこと、が挙げられる。これら要素の多くは、IRS形式から熟知されている。
非威圧性測度は、威圧する要素の逆数を結合することによって、実際に計算される。文書の非威圧性要素に対する種々の寄与度の要素を結合するために、単純加重平均が使用されるが、より複雑な結合スキームも可能である。
in=Σwii
ここで、wiは、重みであり、Viは、要素の上記リストに対応する、非威圧性構成要素の値Vws、Vil、Vlg、Vdc、Vnb、Vpf、Vnl、Vltである。
図86に示すような、測度の組み合わせは、文書の威圧性を評価する際に有益である。
さらに具体的には、図86に示すような威圧性は、余白が少量であること、情報密度が高いこと、可読性が低いこと、テキストがボールド体であること、画像部分が少量であること、ラインが使用されていること、及び/又は技術的レベルが高いこと、の組み合わせであると考えられる。図86において、定量化された威圧性の値は、威圧性量子化器又は結合回路62を使用して、余白が少量であること、情報密度が高いこと、可読性が低いこと、テキストがボールド体であること、画像部分が少量であること、ラインが使用されていること、及び/又は技術的レベルが高いこと、を結合することによって導出される。
この図には、威圧性定量化プロセス用の回路が示されるが、このプロセスがマイクロプロセッサ及び/又はファームウェアによってソフトウェアで実行することもできることに留意すべきである。定量化は、特定の回路に限定されず、後述される方法論を実行できる、ソフトウェア及び/又はハードウェアの任意の組み合わせであってよい。
図87は威圧的な文書の一例である。
文書がいかに威圧的か又は威圧的でないかの測度を評価するための、ここに提示された特定の方法は例示的なものであり、範囲を限定するものとみなされるべきではない。文書の威圧度レベルを決定するための他の方法、例えば威圧感について種々の文書特性に対する測定された人間の反応の機能も本発明の範囲内とされるべきであり、したがって、本発明は、威圧レベルを認定するための特定の方法にだけではなく、文書威圧レベル、文書快適レベル及び文書品質を評価することに関連して個々の度合いの組み合わせを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、多くの余白を有する「開いた」("open")文書は、コンテンツの詰まった文書ほどには威圧的ではない。余白部分を評価する方法が、文書がいかに良く伝達するかについての論述で説明された。
非余白面積は、コンテンツ・オブジェクトの面積を合計することによって推定される。全オブジェクト面積は全文書面積Adによって概算できる。Vws=(Ad−ΣAi)/Ad
文書威圧レベル及び快適レベルに対する余白の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものと考えられるべきではない。余白の寄与を認定するための他の方法、例えば威圧感について種々の余白の大きさに対する測定された人間の反応の機能も本発明の範囲内とされるべきであり、したがって、本発明は余白の効果を認定する特定の方法にだけではなく、文書威圧レベル、文書快適レベル及び文書品質を評価するのに関連して余白度合いを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、密に詰まった情報は威圧的であり、したがって情報デンシテイ(information density)の逆数が非威圧度に寄与しうる。このような情報ライトネス測度(information lightness measure)については、文書の注目度特性についての論述で説明された。
文書威圧レベル及び快適レベルに対する情報ライトネス又はデンシテイの寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。情報デンシテイの寄与を認定するための他の方法、例えば威圧感について種々の情報量及び面積に対する測定された人間の反応の機能も、本発明の範囲内とされるべきであり、したがって、本発明は情報ライトネス又はデンシテイの寄与を認定する特定の方法にだけではなく、文書威圧レベル、文書快適レベル及び文書品質を評価することに関連して情報デンシテイの度合いを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、読み難い文書は威圧的であり、したがって可読性が非威圧性に寄与するものである。可読性を評価する方法については、文書の伝達力についての論述で説明された。
文書の威圧レベル及び快適レベルに対するテキストの可読性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。可読性の寄与を認定するための他の方法、例えば読み難さ及び威圧感に関して種々のテキスト特性に対する測定された人間の反応の機能も本発明の範囲内とされるべきであり、したがって、本発明は可読性の寄与を認定する特定の方法だけではなく、文書威圧レベル、文書快適レベル及び文書品質を評価するのに関連して可読性の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、ボールド(bold)又はヘビイ・ウエイト(heavy weight)のテキストを使用すると威圧的になる。非威圧度が望まれるので、テキスト疎度の度合い(軽いテキスト重さに関連した高い値)を有していたいであろう。このような度合いを認定する方法は簡単である。文書中を辿り、テキストを調べて、どのようなフォントが使われているかを知る。フォントfのウエイトに対するライトネス値tlは、tl=Tl[weight(f)]である。
tliが第i番目の文字のライトネス値であると、ライトネス値を加算しかつ文字の総数Nchで割り算することによって、平均ライトネス(ノン・ボールドネス)値を得ることができる。すなわち、
Vnb = Σtli/Nch
他の手法は、ボールド又はヘビイ・テキストの面積を集めて、それを文書の総面積Adで割り算し、そして反転する。すなわち、
Vnb = 1−Ab/Ad
文書威圧レベル及び快適レベルに対するボールド・テキストの寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。ボールド・テキストの寄与を認定する他の方法、例えば、威圧感及び文書快適レベルに関して種々のボールド・テキスト量に対する測定された人間の反応の機能も本発明の範囲内とされるものであり、したがって、本発明はボールド・テキストの寄与を認定する特定の方法にだけではなく、文書威圧レベル、文書快適レベル及び文書品質を評価するのに関連してボールド・テキスト度合いを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、縦線、特に高いコントラストを有する太い縦線の存在が威圧的となりうる。縦線の効果を数量化する方法は、まず文書中を辿って、縦線を見つけ出すことである。これには、境界線や、幅と高さの比が閾値より小さい長方形の一部分である縦線が含まれる。見出された各線について、それの面積Alにそれの輝度対比clを掛け算する。
ウエイト付けされた全ての面積を加算し、そして文書の面積Adで割り算すると、0と1の間の値が得られる。縦線に割り当てられた面積は通常は小さいから、この式は効果を過少評価しているが、それを分数乗(fractional power)すると、それの力を高めることができる。非威圧寄与を得るためには、結果を反転させることが必要である。すなわち、
Vnl = 1−(Σcli Ali / Ad)1/p
文書威圧レベル及び快適レベルに対する縦線の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。線の寄与を認定するための他の方法、例えば、威圧感及び文書快適レベルに関して種々の線の量及びスタイルに対する測定された人間の反応の機能も本発明の範囲内とされるべきであり、したがって、本発明は縦線の寄与を認定する特定の方法にだけではなく、文書威圧レベル、文書快適レベル及び文書品質を評価することに関連して線の度合いを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、高度に技術的な題材は威圧的である。技術的レベルの測度としては、可読性、数字の存在、画像の存在していないなどのオブジェクトが含まれる。技術的レベルの測度の一例の定義については、文書がいかに良く伝達するかについての論述で説明された。技術的レベルVtlは、非威圧演算で使用できる非技術的レベルの測度に対して反転すればよい。すなわち、
Vnt = 1−Vtl
文書威圧レベル及び快適レベルに対する技術的レベルの寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を制限するものではない。技術的レベルの寄与を認定するための他の方法、例えば、技術的レベル、威圧感、文書快適レベルに関して種々の文書コンテンツに対する測定された人間の反応の機能も本発明の範囲内とされるものであり、したがって、本発明は技術的レベルの寄与を認定する特定の方法にだけでなく、文書威圧レベル、文書快適レベル及び文書品質を評価することに関連して技術的レベルの測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、人々は文書のスタイルについてある種の期待を有する。人々が馴染んだ慣例が存在する。このような慣例に破ることは、ある種の利益(注目を集めるというような)を生むが、犠牲(使い易さを低下させることのような)を伴う。慣例に背くことは、少しの不快さを生ずるのが殆ど常である。
慣例とは新規性の逆として定義される。新規性の測度については、文書がいかに良く関心を保持するかについての論述で説明された。
文書快適レベルに対する文書慣例の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。慣例の寄与を認定するための他の方法、例えば、慣例及び快適感に関して種々の文書スタイルに対する測定された人間の反応の機能も、本発明の範囲内とされるものであり、したがって、本発明は慣例の寄与を認定する特定の方法にだけではく、文書快適レベル及び文書品質を評価することに関連して慣例の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、カラーのある種の組み合わせは、互いに調和的にフィットするが、他の組み合わせは調和しない。衝突又は調和しないカラーは目を疲れさせて不快感を生じさせるが、調和したカラーは見る人を落ち着かせることができる。カラー調和は、文書の注目度についての論述で説明されたカラー不調和Vdの逆として定義される。したがって、カラー調和は、Vch = 1−Vdである。
文書快適レベルに対するカラー調和の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。カラー調和の寄与を認定するための他の方法、例えば、カラー調和及び快適感に関して種々の文書カラー組み合わせに対する測定された人間の反応の機能も本発明の範囲内とされ、したがって、本発明は、カラー調和の寄与を認定する特定の方法にだけではなく、文書快適レベル及び文書品質を評価することに関連してカラー調和度合いを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、期待されることをの他の態様はカラー選択が適切であることである。文書のデザイン・ルールでは、大きい背景領域は非飽和カラーを使用すべきであり、小さい前景オブジェクトは飽和カラーを使用すべきである。各オブジェクトの面積にそれの飽和度を掛け算することによって、カラー不適切度の測度を得ることができる。実際には、結果を0〜1の範囲に制限するために、面積は全文書面積Adの一部分として測定されるべきである。高い飽和度(不適切な)を有する大きい面積からは大きい結果が得られる。文書全体の平均値では、全てのオブジェクトからの値を合成しなければならず、面積による飽和の単純なウエイト付けをすれば、これが実際には適切であるかもしれない場合には、多くの小さい飽和した前景オブジェクトから不適切なカラー使用の測度を得ることができるであろう。より良好な方策は、面積の一部分をべき乗することである。これが小さい物体の影響をさらに軽減する。これによって、Vca = 1−Σci (Ai /Ad)pのように見えるカラー適切化策が得られる。ただし、pは1より大きい値である。
文書快適レベルに対するカラー適切性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。カラー適切性の寄与を認定するための他の方法、例えば、カラー適切性及び快適感に関して種々のオブジェクトカラーに対する測定された人間の反応の機能も本発明の範囲内とされ、したがって、本発明は、カラー適切性を認定する特定の方法にだけではなく、文書快適レベル及び文書品質を評価することに関連してカラー適切性方策を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、輝度の一貫性についてのルールは、コンテンツ要素の1つのグループでは、先ず暗い要素が来て、それより明るい要素が次に来るべきであると規定している。しかし、文書の論理的構造は通常、各ブランチ・ノードが1つのグループを表すツリーであることに注目されたい。したがって、1つのグループのメンバーは、他のグループであることが多い。コンテンツ要素は、単一のカラー及び輝度を有する単純なオブジェクトではないかも知れない。輝度一貫性についてのルールはまだ適用され得るが、使用される輝度は、サブツリー・グループ・メンバーの平均輝度でなければならない。
オブジェクトの平均輝度を決定するためには、オブジェクトの輝度Lf、背景の輝度Lb、前景カラーを有する面積Af及びオブジェクトの境界面積Aoを得る。平均輝度Lavは、Lav = (Lf Af + Lb (Ao−Af))/Aoとなる。
1つのグループのオブジェクトに対する平均輝度は、それのメンバーの平均輝度をそれらの面積でウエイト付けしたものの和に背景の寄与をプラスしたものである。Agがそのグループの境界面積、Laviが第i番目のグループ・メンバーの平均輝度、そしてAiがそのメンバーの面積であるとすると、そのグループの平均輝度Lavgは、
Lavg = Σlavi Ai + Lb(Ag−ΣAi)/Agとなる。
1つのグループに対する輝度の一貫性についての測度を見出すためには、そのグループのメンバー中を歩進して、各メンバーの平均輝度を見出す。その輝度を前のメンバーの輝度と比較し、新しい輝度が古い輝度よりも暗い場合には、差を収集する。これが実際に非一貫性の測度を与えるので、逆関数を用いてそれを0と1の間の範囲の一貫性値に変換することができる。この方法は下記の疑似コードによって示される。
incon = 0
odllum = AverageLuminance(groupMember(1))
for i = 2 to number of group member
{ newlum = AverageLuminance(groupMember(i))
if newlum<oldlum
then incon = incon + oldlum−newlum
oldlum = newlum
}end of loop
Vclg = acl/(acl + incon)
ここで、Vclgは、そのグループの輝度の一貫性値であり、aclは小さい正の一定値である。
上記の方法はコンテンツ・ツリーにおける各ノードに対する測度の計算のし方を示しているが、ツリー全体の集約値を得る方法については言っていない。これを行うための1つの方法は、すべてのツリー・ノード値のウエイト付けされた平均を生成することである。この場合、ウエイトはツリーの深さの関数である。結合された値を負のべき乗にして、悪い一貫性値が多くの良好値のインパクトを有するようにすることができる。これは次のように要約できる。
Vcl = ((Σwi (dcl + Vcli)-p)/Σwi )-1/p−dcl
ただし、和はコンテンツ・ツリーにおけるずべてのグループ・ノードについてであり、wiはノード深さ、Vcliはそのノードの輝度の一貫性、dclは小さな正の定数、そしてpは1のような正の値である。
図88は一貫性輝度の例である。図89は非一貫性輝度の例である。
文書快適レベルに対する輝度の一貫性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。輝度の一貫性の寄与を認定するための他の方法、例えば、輝度の一貫性及び快適感に関して種々のオブジェクト・輝度値及び順序付け(ordering)に対する測定された人間の反応の機能も、本発明の範囲内とされ、したがって、本発明は、輝度の一貫性の寄与を認定する特定の方法にだけでなく、文書快適レベル及び文書品質を評価することに関連して輝度一貫性測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施例では、サイズの一貫性に対するデザイン・ルールは、1つのグループのコンテンツ要素に対するものであり、大きい要素が最初に来て、それより小さい要素がそれに続くことになる。そのサイズを前のメンバーのサイズと比較し、新しいサイズが古いサイズより大きい場合には、差を収集する。これが実際に非一貫性の測度を与え、逆関数を用いて、それを0と1の間における一貫性値に変換することができる。この方法は、下記の疑似コードによって示される。
incon = 0
odlsize = BoundingSize(groupMember(1))
for i= 2 to number of group members
{ newsize = BoundingSize (groupMember(i))
if newsize >oldsize
then incon = incon + newsize−oldsize
oldsize = newsize
}end of loop
Vcsg = acs/(ac + incon)
ここで、Vscgはグループに対するサイズ一貫性値であり、acsは小さい正の一定値である。
グループのメンバーを検討して、サイズ比較から、ある特定のメンバー(ヘッデイングのような)を排除したい場合がありうる。
上記の方法は、コンテンツ・ツリーにおける各ノードに対する測度の計算のし方を示しているが、ツリー全体の集約値の計算のし方については言っていない。これを行う1つの方法は、すべてのツリー・ノード値のウエイト付けされた平均値を生成することである。ただし、ウエイトはツリーの深さの関数である。結合されている値を負のべき乗して、悪い一貫性値が多くの良い値のインパクトを有するようにすることができる。これは、
Vcs = ((Σwi (dcs + Vcsi )-p )/Σwi )-1/p−dcs
のように要約することができる。ただし、和はコンテンツ・ツリーのすべてのグループ・ノードについてであり、wiはノード深さ、Vcsiはノードのサイズ一貫性、dcsは小さい正の定数、そしてpは1のような正の値である。
図90は一貫性のサイズの例である。図91は非一貫性のサイズの例である。
文書快適レベルに対するサイズ一貫性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。サイズの一貫性の寄与を認定するための他の方法、例えば、サイズの一貫性及び快適性に関して異なるオブジェクト・サイズ及びオーダーリング(orderings)に対する測定された人間の反応の機能も、本発明の範囲内とされ、したがって、本発明は、サイズ一貫性の寄与を認定する特定の方法にだけではなく、文書快適レベル及び文書品質を評価することに関連して、サイズ一貫性の測度を利用する、それよりはるかに広い概念にも関するものである。
利便性
本発明の好ましい実施形態では、文書品質に寄与する他の文書特性は、利便性レベル又は文書が感知される使い易さである。文書利便性レベルを定量化するための方法について次に説明する。他の特性と同様に、利便性はより単純な特性又は要因の組み合わせとして計算される。コンポーネント要因のどれかに反すると、非利便性を生じて、文書レイアウトの全体的な利便性を破壊するおそれがある。コンポーネント要因は、一貫性、可読性、障害対応(disability proof)、ナビゲーションの容易性(ease of navigation)、前進の容易性(ease of progression)、検索可能性(searchability)、位置付け性(lacatability)、視映可能部分(viewable fraction)、単一ウインドウ・デイスプレイ(single window display)及び/又は伝送及び処理時間(transmission and processing time)を含みうる。
各要因は0と1の間にある値を生成すように定義され、0は低い又は悪い利便性値を意味し、1は高い又は良い利便性値を意味する。これは、(及び多分他のこの種のルール)、は全体的な利便性測度を生成するように計算されかつ組み合わせられる。Viが第I番目のルールに対して計算された値であるとすると、利便性値Vcvはこれらの寄与の関数Eとして形成される。
Vcv = E(Vcns, Vlg, Vdp, Ven, Vep, Vsh, Vlo, Vvf, Vsw, ….Vtm)
組み合わせ関数Eは、寄与のウエイト付けされた平均値と同様に単純になりうるが、悪い寄与因子がると、他がどんなに良くても、利便性を壊すおそればあるから、線形組み合わせは好ましくない。他の方法は、
Vcv = [Σwi (d + Vi)-p]-1/p−d
を用いることである。wi係数は、各ルールの相対的重要性を特定するウエイトであるから、それらの和は1にならなければならない。指数pは、1つの悪い値に多くの良い値を圧倒させうる非直線性を導入する。pが大きければ大きいほど、この効果は大きくなる。定数dは1に近い正の数であり、0による割り算がなされないように監視する。
他の組み合わせ関数も可能である。例えば、寄与の積をとることができる。寄与のウエイト付けが望ましい場合には、これは累乗法によって累乗法によって行うことができる(ウエイト付けは、上述したものとは異なっている)。
Vcv =ПVi wi'
図92に示されているような測度の組み合わせは、文書の利便性を評価するのに有用である。
さらに具体的には、利便性は、図92に示されているように、一貫性、可読性、障害対応、ナビゲーションの容易性、前進の容易性、検索機能、位置付け性、視映可能部分、単一ウインドウ・デイスプレイ、及び/又は伝送及び処理時間の組み合わせと考えられる。図92においては、利便性定量化器又は結合器回路70を使って、一貫性、可読性、障害対応、ナビゲーションの容易性、前進の容易性、検索可機能、位置付け性、視映可能部分、単一ウインドウ・デイスプレイ、及び/又は伝送及び処理時間を組み合わせることにより、定量化された利便性値が得られる。
図は利便性定量化処理のための回路を示しており、この処理はマイクロプロセッサ及び/又はファームウエアによりソフトウエアでも実行されうることが分かる。この定量化は、特定の回路に限定されるものではなく、下記の技法を実行できるソフトウエア及び/又はハードウエアの任意の組み合わせによっても行うことができる。
選択されたルールの組は、利便性測度がどのようにして構成できるかを示していることに注目されたい。使い易さに寄与する他の要因が存在しており、それらの要因は、利便性についてのさらに精巧な数量化に確かに含まれうる。文書利便性を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。
文書利便性を認定するための他の方法、例えば、利便性の感覚に関して種々の文書特性に対する測定された人間の反応の機能も本発明の範囲内とされ、したがって、本発明は、利便性レベルを認定する特定の方法にだけだはなく、文書利便性レベル及び文書品質を評価することに関連して個々の測度の組み合わせを利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、グラフィック・デザインに、多くの一貫性ルールがある。一貫性は、使用するのをより容易にする文書の内部モデルを構築するのを助長する。一貫性に対する寄与ルール又は要因の幾つかと、それらの要因がどのようにして結合されて全体の一貫性測度となされ得るかについて、ここで説明する。例示の一貫性測度は、位置順序、輝度、サイズ、及び/又はスタイルを含むであろう。これらの要因に対する測度を計算するための方法については説明したので、ここでは詳細については繰り返さない。
コンポーネント一貫性測度を組み合わせる場合には、非一貫性の発生源があれば、全体の一貫性を破壊するものとする。使用できる組み合わせの式は、
Vnt = [Σwi (d + Vi)-p]-1/p−d
である。ただし、Viは、Vcp、Vcl、Vcsz、Vcstの組から取り出されたものである。ウエイトwiは、異なる測度の相対的な重要性を示している。パラメータpは1又はそれより大きい数であり、dは0より若干大きい値である。
図94に示されている測度の組み合わせが、文書の一貫性を評価するのに有用である。
さらに具体的には、図94に示された一貫性は、位置順序、輝度、サイズ、及び/又はスタイルの組み合わせと考えられる。図94では、一貫性定量化器又は組み合わせ回路72を用いて、位置順序、輝度、サイズ及び/又はスタイルを組み合わせることにより、定量化された一貫性測度が得られる。
図は一貫性定量化処理のための回路を示しており、この処理はマイクロプロセッサ及び/又はファームウエアによってソフトウエアで実行することもできることが分かる。この定量化は、特定の回路に限定されるものではなく、下記の技法を実施できるソフトウエア及び/又はハードウエアの任意の組み合わせによっても行うことができる。
文書の一貫性の測度を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。文書一貫性レベルを認定すための他の方法、例えば、一貫性の感覚に関して種々の文書特性に対する測定された人間の反応の機能も本発明の範囲内であるとされ、したがって、本発明は一貫性レベルを認定する特定の方法にだけではなく、文書一貫性レベル、文書利便性レベル及び文書品質を評価することに関連して個々の測度の組み合わせを用いる、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、位置順序に対しては、実際に2つの測度、すなわち走査一貫性及び/又は順序一貫性が存在しており、これらは両方とも、文書がいかに良く伝達するかを数量化することについての論述において説明された。論理順序とレイアウト位置との間に一貫性のあるモデルを実現するために、コンテンツ・オブジェクトのレイアウト配置は、これら2つのルールのうちの1つに従わなければならない。しかし、レイアウトは、両方のモデルに同時に従う必要はない。したがって、走査一貫性Vcs及び順序の一貫性Vcoを組み合わせて全体的な位置の一貫性Vcpとしなければならない。これを行う簡単な方法は、Vcp = MAXIMUM(Vcs, Vco)である。
さらに精巧な他の手法は、
p = dcp −(((dcp−Vcs)-p + (dcp−Vco)-p)/2)-1/p
である。ただし、dcpは1より若干大きい定数であり、pは1又はそれより大きい数である。
図93に示されている測度の組み合わせは、文書の位置の一貫性を評価するのに有用である。
さらに具体的には、図93に示されている位置一貫性は、走査一貫性及び/又は順序一貫性の組み合わせであると考えられる。図94では、定量化された位置一貫性値が、位置一貫性定量化器又はコンバイナ回路71を用いて走査一貫性及び/又は順序一貫性を組み合わせることによって得られる。
図は位置一貫性定量化処理のための回路を示しており、この処理はマイクロプロセッサ及び/又はファームウエアによってソフトウエアでも実行されうることが分かる。この定量化は、特定の回路に限定されるものではなく、下記の技法を実行できる任意のソウトウエア及び/ハードウエアの任意の組み合わせによっても実行できる。
文書一貫性レベル及び利便性レベルに対する位置の一貫性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。位置の一貫性を寄与を認定する他の方法、例えば、一貫性の感覚及び文書一貫性レベルに関するコンテンツ・オブジェクトの種々の位置決めに対する測定された人間の反応の機能も、本発明の範囲内であるとされ、したがって、本発明は、位置の一貫性の寄与を認定する特定の方法にだけでなく、文書一貫性レベル、文書利便性レベル及び文書品質を評価することに関連して位置の一貫性測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、輝度の一貫性の測度Vclを計算するための方法が、文書快適性についての上記論述で説明された。この着想は、1つのグループにおいて暗いオブジェクトが明るいオブジェクトに先行しなければならないというものである。
文書一貫性レベル及び利便性レベルに対する輝度の一貫性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。輝度の一貫性の寄与を認定するための他の方法、例えば、一貫性についての感覚及び文書利便性レベルに関するコンテンツ・オブジェクトの種々の輝度設定及び順序付けに対する測定された人間の反応の機能も、本発明の範囲内とされるものであり、したがって、本発明は、輝度の一貫性の寄与を認定する特定の方法にだけではなく、文書一貫性レベル、文書利便性レベル及び文書品質を評価することに関連して輝度の一貫性の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、サイズの一貫性の測度Vcszを計算するための方法も、文書快適性についての上記の論議で説明された。この着想は、1つのグループにおいて大きいオブジェクトが小さいオブジェクトに先行しなければならないということである。
文書一貫性レベル及び利便性レベルに対するサイズの一貫性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定るすものではない。サイズの一貫性の寄与を認定するための他の方法、例えば、一貫性についての感覚及び文書利便性レベルに関するコンテンツ・オブジェクトの種々のサイズ及び順序付けに対する測定された人間の反応の機能も、本発明の範囲内とされるべきであり、したがって、本発明は、サイズの一貫性の寄与を認定する特定の方法にだけではなく、文書一貫性レベル、文書利便性レベル及び文書品質を評価することに関連してサイズの一貫性の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、スタイルの一貫性の測度Vcstを計算するための方法が、グループの使い易さについての論述で説明された。この着想は、コンテンツ構造内の同様の位置にけるオブジェクトはが整合したスタイルを有していなければならないということである。
文書一貫性レベル及び利便性レベルに対するスタイルの一貫性の起用を評価するための特定の方法は、例示であり、範囲を限定するものではない。スタイルの一貫性の寄与を認定するための他の方法、例えば、一貫性についての感覚及び文書利便性レベルに関して種々のスタイル及びコンテンツ・オブジェクトの順序付けに対する測定された人間の反応も、本発明の範囲内とされるものであり、したがって、本発明は、スタイルの一貫性の寄与を認定する特定の方法にだけではなく、文書一貫性レベル、文書利便性レベル、及び文書品質を評価することに関連してスタイルの一貫性の測度を利用する、それよりはるかに広い概念にも関する。
本発明の好ましい実施形態では、読むのが難しい文書は使うのが難しいことが多い。可読性の測度Vlgは、文書の伝達性に対する寄与因子として定義された。それは利便性と伝達性とに寄与するが、ウエイトは異なる。つまり、伝達性は全体として、利便性にたいする寄与因子として用いられるべきであると主張することができるであろう。これは除外されないが、ここでの例は、利便性に対して特定の影響を及ぼす伝達性のコンポーネントのうちの幾つかを含むにすぎないであろう。それらのコンポーネントについて個別に検討すると、伝達性の寄与に対して用いられるウエイトとは異なるウエイトを、利便性への寄与時に、それらのコンポーネントに与えることができる。
文書利便性レベルに対する可読性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。可読性の寄与を認定するための他の方法、例えば、可読性及び利便性についての感覚に関する種々のテキストの特徴に対する測定された人間の反応の機能も、本発明の範囲内とされるものであり、したがって、本発明は、可読性の寄与を認定する特定の方法にだけではなく、文書利便性レベル及び文書品質を評価することに関連して可読性の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、一般に、障害対応(disability proof)とは、文書がいかに良くハンデイキャップのある人たち役立つことができるかを言う。例えば、テキストだけの文書は目の見えない人に読んで聞かせることができるが、画像のある文書はコンテンツを伝えるのがはるかに難しくなるであろう。障害対応策に対する寄与因子の他の例は、文書がいかに良く伝達するかについての論述で定義された赤緑色弱配慮特性(red-green friendliness property)である。この方策の背後にある思想は、赤緑色弱配慮性(red-green friendly)であるためには前景カラーと背景カラーとの間に輝度・コントラストか青・黄コントラストが存在しなければならないということである。このコントラストがないと、色盲の人が前景オブジェクトを背景と識別するのが困難であろう。この方策は、単純な障害対応関数Vdpの一例として用いられるであろう。他のハンデイキャップのための付加的な関数が確かに可能であり、それらを組み合わせて、さらに精巧な方策とすることができるであろう。
文書利便性レベルに対する障害補償特性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。障害補償の寄与を認定するための他の方法、例えば、障害補償及び感覚的利便性に関して種々の文書特性に対する測定された人間の反応の機能も、本発明の範囲内とされ、したがって、本発明は、障害補償寄与を認定する特定の方法にだけではく、文書利便性レベルおよび文書品質を評価することに関連して障害補償対策を用いる、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、ナビゲーションの容易性Ven及び進行の容易性Vepを評価するための方法も、文書がいあかに良く伝達するかについての論述で説明された。それらは利便性ならびに伝達可能性に寄与し、事実、伝達可能性方策としてよりも、利便性方策としてより重要である(より大きいウエイトを有する)。これらの特性の計算の背後にある思想は、識別可能性、グループ・アイデンテイテイ、空間的コヒーレンス、リスト・ブレット、ヘッデイング、内部リンク、アラインメント、その他のような寄与特徴を評価しかつ組み合わせることである。
ナビゲーションの容易性又は進行の容易性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。ナビゲーションの容易性又は進行の容易性の寄与の寄与を認定するための他の方法、例えば、ナビゲーションの容易性又は進行の容易性及び感覚的利便性に関して種々の文書特性に対する測定された人間の反応の機能も、本発明の範囲内とされるものであり、したがって、本発明は、ナビゲーションの容易性又は進行の容易性の寄与を認定する特定の方法にだけでなく、文書利便性レベル及び文書品質を評価することに関連してナビゲーションの容易性又は進行の容易性測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、他の2つの関連した概念は、検索可能性Vsh及び位置付け可能性Vloである。位置付け可能性は、文書オブジェクトを見つけるのがいかに容易であるかの測度である(他方、ナビゲーションの容易性は文書ロケーションを見つけるのがいかに容易かである)。検索可能性は、文書オブジェクトを見つけるのに助けになる文書特徴の存在を探す大まかな測度である。これらの測度は、コンテンツ・グループの使い易さについての論述で説明された。
文書の利便性レベルに対する検索可能性又は位置付け可能性の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。検索可能性又は位置付け可能性の寄与を認定するたの他の方法、例えば、検索可能性又は位置付け可能性及び感覚的利便性に関して種々の文書特性に対する測定された人間の反応の機能も、本発明の範囲内とされるものであり、したがって、本発明は、検索可能性又は位置決め可能性の寄与を認定する特定方法にだけではなく、文書の利便性レベル及び文書の品質を評価することに関連して検索可能性又は位置付け可能性の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、文書は壊れて各ページになった場合には、幾つかのコンテツ・グループを2ページ以上にわたって広げてもよい。文書がワークステーションで表示される場合には、コンテンツ・グループによっては全体がデイスプレイ・ウインドウ内に完全に入らないかも知れない。このように論理グループをユニットとして見ることができないことが妨げになるおそれがあり、文書の利便性測度を低下させることになる。
ワークステーションで表示されるグループに対する視映可能な部分を評価するためには、まず境界サイズ(そのグループの幅及び高さ(wg, hg))を見出す。次に、典型的なデイスプレイ・ウインドウのサイズ(wp, hp)を見出す。この視映可能な幅及び高さが、グループ及びウインドウ寸法の最小値である。
wv = MINIMUM(wg, wp)
hv = MINIMUM(hg, hp)
そのグループに対するデイスプレイの単一性の測度は、目に見える面積とグループの面積との比で与えられる。すなわち、
U = (wv hv)/(wg hg)
グループが何ページかにわたって分割された場合には、まず各ページにおけるグループ要素の面積(例えばページpではAgp)を見出すことによって測度を構成することができる。次に、最大面積を見出して、それを全グループ面積で割る。すなわち、
U = MAXP(Agp)/ΣAgp
これは、文書内の任意の特定グループに対する測度を与えるが、その文書の視映可能な部分の全ての測度を得るためには、これらのグループ測度をどうにかして組み合わせなければならない。文書の論理ツリー構造内のグループのレベルは違いを生ずることを認識されたい。ツリーの底に近い低レベルのグループよりも、高レベルのグループのほうが一体として見られることの期待または必要は少ないであろう。まず、グループをそれらのツリー・レベルによってソートして、各レベルに対する単純な平均値(すなわちUav L)を見出す。次に、そのレベルの関数によってウエイト付けされたレベルに対する平均値を組み合わせる。すなわち、
Vvf = Σw(L) Uav L/Σw(L)
ウエイト付け関数w(L)は、レベルが上がるに伴って、定数aに対してw(L) = aLのように増加する。
文書の利便性レベルに対する視映可能な部分の寄与を認定するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。視映可能な部分の寄与を認定するための他の方法、例えば、感覚的利便性に関して文書の種々の視映可能な程度に対する測定された人間の反応の機能も、本発明の範囲内とされ、したがって、本発明は、視映可能な部分の寄与を認定する特定の方法にだけではなく、文書の利便性レベル及び文書の品質を評価することに関連して視映可能な部分の測度を利用する、それよりはるかに広い概念にも関するものである。
本発明の好ましい実施形態では、視映可能な部分の測度は、文書のコンポーネントが全体として見えるかどうかについてのある表示を与えるが、単一のウインドウ又はページで文書全体が見えることには特別な利点がある。この測度を生成するためには単純な計算を用いることができる。それは視映可能な部分に対するものと同じであり、文書全体の面積を使用するだけである。文書の幅と高さがwd, hdであるとし、デイスプレイ又はページの幅と高さがwp, hpであるとして、計算する。
wv = MINIMUM(wd, wp)
hv = MINIMUM(hd, hp)
単一のウインドウ・デイスプレイ測度をVswd = (wv hv)/(wd hd)に設定する。
図95は文書のページ100に関連した電子ウインドウ150の生成を示している。電子ウインドウ150は、ページ上を又は文書中をナビゲーションするためのナビゲーション・ボタンを具備している。この電子ウインドウ150は、本発明によって解析されるべき文書の面積を画定するため、ならびに本発明によって測定されかつ定量化されるべきクラス及びサブパラメータを画定するために用いることができる。
文書から文書への利便性レベルに対する単一のウインドウ・デイスプレイの寄与を評価するための特定の方法は、例示であり、範囲を限定するものではない。単一のウインドウ・デイスプレイの寄与を認定する他の方法、例えば、感覚的利便性に関して単一のウインドウ又はページで表示できる又はできない文書に対する測定された人間の反応の機能も、本発明の範囲内とされるものであり、したがって、本発明は、単一のウインドウ・デイスプレイの寄与を認定する特定の方法にだけではなく、文書の利便性レベル及び文書の品質を評価することに関連して単一のウインドウ・デイスプレイ測度を利用する、それよりさらに広い概念にも関するものである。
本発明の好ましい実施形態では、文書を取得又は処理している時に生ずる面倒又は不便の1つは、機械がその文書をダウンロード又は表示している間、待たなければならなりことである。伝送時間は文書ファイルのサイズと通信チャンネルの帯域幅との積である。処理時間は文書が含んでいるオブジェクトのタイプと行われている処理のタイプとにも依存しうるが、概算が、ファイル・サイズと処理速度係数の積として形成されうる。したがって、これらの時間費用の概略的な指標としてファイル・サイズを用いることができる。ファイル・サイズSを0と1の間の値に変換するためには、Vtm = at/(at + S)という式を使うことができる。ただし、atは、ほぼ典型的な文書ファイル・サイズである定数である。
文書の利便性レベルに対する伝送時間又は処理時間の寄与を評価するための、ここに提示された特定の方法は、例示であり、範囲を限定するものではない。伝送時間又は処理時間の寄与を認定する他の方法も本発明の範囲内とされるものであり、したがって、本発明は、伝送時間又は処理時間の」寄与を認定する特定の方法にだけでなく、文書の利便性レベル及び文書の品質を評価することに関連して時間測度(time measures)を利用する、それより広い概念にも関するものである。
経済性
本発明の好ましい実施態様では、文書の品質を判定しうる他の1つの次元は、要するコストによるものである。印刷文書の場合には、必要な材料(用紙及びインク)のコストがある。文書を印刷ために要する努力(労力と印刷時間)のコストもある。材料のコストは電子デイスプレイで見ている文書には該当しないが、文書を伝送したり格納したりする費用がある。また、文書が伝送されている間、あるいは表示のために処理されている間、見る人が待っていて費やす時間のコストもある。これらのコストの多くは、文書のサイズ(伝送及び処理時間)に依存する。しかし、他の特性も影響する。例えば、フォントのサイズは印刷に必要とれる用紙の量に影響しうるし、カラーの存在がインクのコストに影響しうる。
本発明の概念による、ドキュメントの品質を定量化可能に測定するための構成レイアウトを示すブロック図である。 本発明の概念による、ドキュメントの品質を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、ドキュメントの美観を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、視覚バランスの例を示す図である。 本発明の概念による、視覚バランスの例を示す図である。 本発明の概念による、視覚バランスの例を示す図である。 本発明の概念による、視覚バランスの例を示す図である。 本発明の概念による、視覚バランスを定量化可能に測定することの例を示す図である。 本発明の概念による、視覚バランスを定量化可能に測定することの例を示す図である。 本発明の概念による、視覚バランスを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、1ページ全体でのコンテンツオブジェクトの不均一分布の例を示す図である。 本発明の概念による、1ページ全体でのコンテンツオブジェクトの不均一分布の例を示す図である。 本発明の概念による、余白部分の例を示す図である。 本発明の概念による、余白部分の例を示す図である。 本発明の概念による、余白部分の例を示す図である。 本発明の概念による、トラップされた余白の例を示す図である。 本発明の概念による、トラップされた余白を定量化可能に測定することの例を示す図である。 本発明の概念による、トラップされた余白を定量化可能に測定することの例を示す図である。 本発明の概念による、トラップされた余白を定量化可能に測定することの例を示す図である。 本発明の概念による、トラップされた余白を定量化可能に測定することの例を示す図である。 本発明の概念による、トラップされた余白を画定することの例を示す図である。 本発明の概念による、位置合わせの例を示す図である。 本発明の概念による、位置合わせの例を示す図である。 本発明の概念による、位置合わせの例を示す図である。 本発明の概念による、左端に対する位置合わせを定量化可能に測定してグラフで表すことの例を示す図である。 本発明の概念による、ドキュメントの位置合わせを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、ドキュメントの規則性の例を示す図である。 本発明の概念による、ドキュメントの規則性の例を示す図である。 本発明の概念による、ドキュメントの規則性の例を示す図である。 本発明の概念による、ドキュメントの規則性の例を示す図である。 本発明の概念による、ページの安全性の例を示す図である。 本発明の概念による、ページの比率の例を示す図である。 本発明の概念による、分離性の例を示す図である。 本発明の概念による、グループ同一性の例を示す図である。 本発明の概念による、グループの使いやすさを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、効果的分離を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、分離の例を示す図である。 本発明の概念による、分離の例を示す図である。 本発明の概念による、分離の例を示す図である。 本発明の概念による、分離の例を示す図である。 本発明の概念による、分離の例を示す図である。 本発明の概念による、効果的識別性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、総合識別性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、識別性の例を示す図である。 本発明の概念による、識別性の例を示す図である。 本発明の概念による、識別性の例を示す図である。 本発明の概念による、直接検出性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、メンバー検出性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、検出性の例を示す図である。 本発明の概念による、検出性の例を示す図である。 本発明の概念による、総合検出性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、グループ同一性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、コヒーレンスの例を示す図である。 本発明の概念による、コヒーレンスの例を示す図である。 本発明の概念による、グループ境界領域の例を示す図である。 本発明の概念による、スタイルの例を示す図である。 本発明の概念による、スタイルの例を示す図である。 本発明の概念による、注目性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、色域の例を示す図である。 本発明の概念による、色相角の例を示す図である。 本発明の概念による、面白さを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、多様性の例を示す図である。 本発明の概念による、変化率の例を示す図である。 本発明の概念による、グラフィックの割合の例を示す図である。 本発明の概念による、伝達性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、可読性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、判読性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、行の引き返しの例を示す図である。 本発明の概念による、行間隔の例を示す図である。 本発明の概念による、行揃えの例を示す図である。 本発明の概念による、行揃えの例を示す図である。 本発明の概念による、行揃えの例を示す図である。 本発明の概念による、行揃えの例を示す図である。 本発明の概念による、技術的レベルを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、画像バランスの例を示す図である。 本発明の概念による、画像バランスの例を示す図である。 本発明の概念による、画像バランスの例を示す図である。 本発明の概念による、読み進みやすさを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、走査一貫性の例を示す図である。 本発明の概念による、序列一貫性の例を示す図である。 本発明の概念による、ナビゲーションしやすさを定量化可能に測定するための概念回路を示す図である。 本発明の概念による、快適性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、整然性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、整然性の例を示す図である。 本発明の概念による、整然性の例を示す図である。 本発明の概念による、威圧性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、威圧性の例を示す図である。 本発明の概念による、輝度の例を示す図である。 本発明の概念による、輝度の例を示す図である。 本発明の概念による、サイズの例を示す図である。 本発明の概念による、サイズの例を示す図である。 本発明の概念による、利便性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、位置一貫性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、一貫性を定量化可能に測定するための概念回路を示す図である。 本発明の概念による、ドキュメントの様々な品質特性を定量化可能に測定するための画定可能ウィンドウを示す図である。 色相差の関数としての色の不調和を示す図である。
符号の説明
100 ドキュメント
110 オブジェクト

Claims (1)

  1. 上限値及び下限値で定まる所定の範囲内の値の入力を受け付けることにより、文書に対する人の興味に影響を与えるものとして予め定められた文書に関する複数の第1の特性の値を取得する第1の取得手段と、
    前記複数の第1の特性の値を用いて計算することにより計算結果が前記興味の値を表すものとして予め定められかつ前記取得された複数の第1の特性の値の内の1つが前記所定範囲の上限値に近い値の場合に該興味の値が前記上限値に近づくように調和平均又は幾何平均を表す関係式を変形して定められた関数と、前記第1の取得手段により取得された前記複数の第1の特性の値と、に基づいて、前記興味の値を計算する興味値計算手段と、
    前記所定の範囲内の値の入力を受け付けることにより、文書の美観に影響を与えるものとして予め定められた文書に関する複数の第2の特性の値を取得する第2の取得手段と、
    前記複数の第2の特性の値を用いて計算することにより計算結果が前記文書の美観の値を表すものとして予め定められかつ前記取得された複数の第2の特性の値の内の1つが前記所定範囲の下限値に近い値の場合に該美観の値が前記下限値に近づくように調和平均又は幾何平均を表す関係式を変形して定められた関数と、前記第2の取得手段により取得された前記複数の第2の特性の値と、に基づいて、前記美観の値を計算する美観値計算手段と、
    前記興味の値及び前記文書の美観の値を用いて計算することにより計算結果が文書の品質の値を表すものとして予め定められかつ前記興味の値及び前記文書の美観の値の内の1つが前記所定範囲の下限値に近い値の場合に該文書の品質の値が前記下限値に近づくように調和平均又は幾何平均を表す関係式を変形して定められた関数と、前記興味値計算手段により計算された前記興味の値及び前記美観値計算手段により計算された前記美観の値と、に基づいて、文書の品質の値を計算する文書品質値計算手段と、
    を備えた文書品質値計算装置。
JP2004224612A 2003-07-30 2004-07-30 文書品質値計算装置 Expired - Fee Related JP4558404B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US49104303P 2003-07-30 2003-07-30
US49104203P 2003-07-30 2003-07-30

Publications (2)

Publication Number Publication Date
JP2005050357A JP2005050357A (ja) 2005-02-24
JP4558404B2 true JP4558404B2 (ja) 2010-10-06

Family

ID=33544748

Family Applications (7)

Application Number Title Priority Date Filing Date
JP2004224612A Expired - Fee Related JP4558404B2 (ja) 2003-07-30 2004-07-30 文書品質値計算装置
JP2004224609A Active JP4619721B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224608A Active JP4619720B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224607A Active JP4619719B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224610A Active JP4624026B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224611A Active JP4624027B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224606A Expired - Fee Related JP4558403B2 (ja) 2003-07-30 2004-07-30 文書品質値計算装置

Family Applications After (6)

Application Number Title Priority Date Filing Date
JP2004224609A Active JP4619721B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224608A Active JP4619720B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224607A Active JP4619719B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224610A Active JP4624026B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224611A Active JP4624027B2 (ja) 2003-07-30 2004-07-30 ドキュメントの品質の測度を定量化する方法
JP2004224606A Expired - Fee Related JP4558403B2 (ja) 2003-07-30 2004-07-30 文書品質値計算装置

Country Status (3)

Country Link
US (19) US7035439B2 (ja)
EP (7) EP1503336B1 (ja)
JP (7) JP4558404B2 (ja)

Families Citing this family (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
WO2000048407A1 (en) 1999-02-11 2000-08-17 British Telecommunications Public Limited Company Analysis of video signal quality
US7272258B2 (en) * 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
EP1453006A1 (en) * 2003-02-28 2004-09-01 Océ-Technologies B.V. Converted digital colour image with improved colour distinction for colour-blinds
US7035439B2 (en) * 2003-07-30 2006-04-25 Xerox Corporation System and method for measuring and quantizing document quality
US7171618B2 (en) * 2003-07-30 2007-01-30 Xerox Corporation Multi-versioned documents and method for creation and use thereof
US7391885B2 (en) 2003-07-30 2008-06-24 Xerox Corporation Method for determining overall effectiveness of a document
US8056013B2 (en) 2005-05-13 2011-11-08 Hewlett-Packard Development Company, L.P. Method for arranging graphic assemblies
US7555730B2 (en) 2005-05-12 2009-06-30 Hewlett-Packard Development Company, L.P. Method for arranging graphic assemblies
US8065627B2 (en) 2003-09-30 2011-11-22 Hewlett-Packard Development Company, L.P. Single pass automatic photo album page layout
US7743322B2 (en) 2003-09-30 2010-06-22 Hewlett-Packard Development Company, L.P. Automatic photo album page layout
KR100587333B1 (ko) * 2003-11-07 2006-06-08 엘지전자 주식회사 색약자의 시각특성을 고려한 영상 디스플레이의색보정방법 및 장치
US7890406B2 (en) * 2004-05-13 2011-02-15 Markov Processes International System and method for visualization of results of multi-criteria financial optimizations
US9235655B2 (en) * 2004-05-21 2016-01-12 Hewlett-Packard Development Company, L.P. Task-based design evaluation
GB2416614A (en) 2004-07-27 2006-02-01 Hewlett Packard Development Co Document creation
US7747947B2 (en) 2004-07-27 2010-06-29 Hewlett-Packard Development Company, L.P. Document creation system and related methods
GB2422704A (en) * 2005-01-31 2006-08-02 Hewlett Packard Development Co Document creation
EP1774478A1 (en) 2004-07-27 2007-04-18 Hewlett-Packard Development Company, L.P. Document creation system and related methods
US8145640B2 (en) * 2004-08-11 2012-03-27 Allan Williams System and method for patent evaluation and visualization of the results thereof
US8161049B2 (en) * 2004-08-11 2012-04-17 Allan Williams System and method for patent evaluation using artificial intelligence
US8145639B2 (en) * 2004-08-11 2012-03-27 Allan Williams System and methods for patent evaluation
US20060036453A1 (en) * 2004-08-11 2006-02-16 Allan Williams Bias compensated method and system for patent evaluation
GB2418280A (en) 2004-09-18 2006-03-22 Hewlett Packard Development Co Document creation system
US7656543B2 (en) 2004-11-12 2010-02-02 Hewlett-Packard Development Company, L.P. Albuming images
US7451140B2 (en) * 2005-01-11 2008-11-11 Xerox Corporation System and method for proofing individual documents of variable information document runs using document quality measurements
US7760372B2 (en) 2005-01-11 2010-07-20 Xerox Corporation Method for automated document selection
US8161377B2 (en) 2005-03-01 2012-04-17 Hewlett-Packard Development Company, L.P. Arranging images on pages of an album
US7693304B2 (en) * 2005-05-12 2010-04-06 Hewlett-Packard Development Company, L.P. Method and system for image quality calculation
US7760956B2 (en) 2005-05-12 2010-07-20 Hewlett-Packard Development Company, L.P. System and method for producing a page using frames of a video stream
US9020955B2 (en) * 2005-05-12 2015-04-28 Hewlett-Packard Development Company, L.P. Compositional balance driven content retrieval
US8718381B2 (en) 2006-07-31 2014-05-06 Hewlett-Packard Development Company, L.P. Method for selecting an image for insertion into a document
US7644356B2 (en) 2005-06-10 2010-01-05 Hewlett-Packard Development Company, L.P. Constraint-based albuming of graphic elements
US7623711B2 (en) * 2005-06-30 2009-11-24 Ricoh Co., Ltd. White space graphs and trees for content-adaptive scaling of document images
US8176414B1 (en) * 2005-09-30 2012-05-08 Google Inc. Document division method and system
GB2431758A (en) * 2005-10-27 2007-05-02 Hewlett Packard Development Co Grouping of information items on a page
EP1785847B1 (en) * 2005-10-27 2015-11-18 Accenture Global Services Limited Display apparatus for automatically visualizing an application landscape
US7761789B2 (en) 2006-01-13 2010-07-20 Ricoh Company, Ltd. Methods for computing a navigation path
US8683314B2 (en) * 2006-01-13 2014-03-25 Ricoh Co., Ltd. Tree pruning of icon trees via subtree selection using tree functionals
US7836397B2 (en) * 2006-02-01 2010-11-16 Xerox Corporation Automatic layout criterion selection
US8091017B2 (en) * 2006-07-25 2012-01-03 Paxson Dana W Method and apparatus for electronic literary macramé component referencing
US8689134B2 (en) 2006-02-24 2014-04-01 Dana W. Paxson Apparatus and method for display navigation
US7810021B2 (en) * 2006-02-24 2010-10-05 Paxson Dana W Apparatus and method for creating literary macramés
US7788579B2 (en) * 2006-03-06 2010-08-31 Ricoh Co., Ltd. Automated document layout design
JP4984606B2 (ja) * 2006-04-03 2012-07-25 富士ゼロックス株式会社 デザイン制作支援装置及びデザイン制作支援プログラム
JP4802825B2 (ja) * 2006-04-04 2011-10-26 富士ゼロックス株式会社 デザイン制作支援装置及びデザイン制作支援プログラム
JP4940734B2 (ja) * 2006-04-04 2012-05-30 富士ゼロックス株式会社 デザイン制作支援装置及びデザイン制作支援プログラム
CA2658912A1 (fr) * 2006-07-25 2008-01-31 Andromaque Prepresse (Societe A Responsabilite Limitee) Procede et systeme de production et/ou de conversion automatique a partir de contenus heterogenes d'au moins une mise en page permettant d'atteindre la lecture la plus rapide avecune memorisation maximale
JP2008058664A (ja) * 2006-08-31 2008-03-13 Furukawa Electric Co Ltd:The 光ファイバおよび光ファイバテープならびに光インターコネクションシステム
JP4215792B2 (ja) * 2006-09-22 2009-01-28 株式会社東芝 会議支援装置、会議支援方法および会議支援プログラム
US8738456B2 (en) * 2006-11-14 2014-05-27 Xerox Corporation Electronic shopper catalog
US20080154713A1 (en) * 2006-12-20 2008-06-26 Robert Roy Buckley On-demand and point-of-sale personalized product-related information
JP4254873B2 (ja) * 2007-02-16 2009-04-15 ソニー株式会社 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
US20110179344A1 (en) * 2007-02-26 2011-07-21 Paxson Dana W Knowledge transfer tool: an apparatus and method for knowledge transfer
US8584042B2 (en) 2007-03-21 2013-11-12 Ricoh Co., Ltd. Methods for scanning, printing, and copying multimedia thumbnails
US8812969B2 (en) * 2007-03-21 2014-08-19 Ricoh Co., Ltd. Methods for authoring and interacting with multimedia representations of documents
US20080235564A1 (en) * 2007-03-21 2008-09-25 Ricoh Co., Ltd. Methods for converting electronic content descriptions
US8583637B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Coarse-to-fine navigation through paginated documents retrieved by a text search engine
US7933904B2 (en) * 2007-04-10 2011-04-26 Nelson Cliff File search engine and computerized method of tagging files with vectors
US8479091B2 (en) * 2007-04-30 2013-07-02 Xerox Corporation Automated assembly of a complex document based on production constraints
US8276064B2 (en) * 2007-05-07 2012-09-25 International Business Machines Corporation Method and system for effective schema generation via programmatic analysis
US7917518B2 (en) 2007-07-20 2011-03-29 Hewlett-Packard Development Company, L.P. Compositional balance and color driven content retrieval
JP4945383B2 (ja) * 2007-09-07 2012-06-06 株式会社日立ハイテクノロジーズ 仕様書内容検査方法および仕様書内容検査システム
IL186924A0 (en) * 2007-10-25 2008-02-09 Deutsche Telekom Ag A method of content adaptation for electronic displays
US8549008B1 (en) * 2007-11-13 2013-10-01 Google Inc. Determining section information of a digital volume
US8154778B2 (en) * 2007-11-15 2012-04-10 Sharp Laboratories Of America, Inc Systems and methods for color correction processing and notification for digital image data generated from a document image
US8136034B2 (en) * 2007-12-18 2012-03-13 Aaron Stanton System and method for analyzing and categorizing text
AU2007254598B2 (en) * 2007-12-20 2011-03-24 Canon Kabushiki Kaisha Map-based aesthetic evaluation of document layouts
US8326029B1 (en) 2008-03-21 2012-12-04 Hewlett-Packard Development Company, L.P. Background color driven content retrieval
US20090263173A1 (en) * 2008-04-18 2009-10-22 Xerox Corporation Methods and systems for generating dynamic order documents
JP5083053B2 (ja) * 2008-06-09 2012-11-28 岩崎電気株式会社 目立ち画像生成装置、及び目立ち画像生成プログラム
US20090319927A1 (en) * 2008-06-21 2009-12-24 Microsoft Corporation Checking document rules and presenting contextual results
JP5043769B2 (ja) * 2008-07-11 2012-10-10 キヤノン株式会社 文書レイアウト編集装置、文書レイアウト編集方法、及びコンピュータプログラム
US8365062B2 (en) * 2008-11-02 2013-01-29 Observepoint, Inc. Auditing a website with page scanning and rendering techniques
US8132095B2 (en) * 2008-11-02 2012-03-06 Observepoint Llc Auditing a website with page scanning and rendering techniques
US8589790B2 (en) * 2008-11-02 2013-11-19 Observepoint Llc Rule-based validation of websites
US9152292B2 (en) 2009-02-05 2015-10-06 Hewlett-Packard Development Company, L.P. Image collage authoring
US8291314B2 (en) * 2009-04-23 2012-10-16 Hewlett-Packard Development Company, L.P. Arranging graphic objects on a page
US8161384B2 (en) 2009-04-23 2012-04-17 Hewlett-Packard Development Company, L.P. Arranging graphic objects on a page with text
US8271871B2 (en) * 2009-04-30 2012-09-18 Xerox Corporation Automated method for alignment of document objects
US9400769B2 (en) * 2009-08-06 2016-07-26 Hewlett-Packard Development Company, L.P. Document layout system
ES2713873T3 (es) 2010-04-16 2019-05-24 Nuevolution As Complejos bifuncionales y métodos para hacer y utilizar tales complejos
US8473842B2 (en) 2010-05-12 2013-06-25 Microsoft Corporation Contour based flow layout
CN102906785B (zh) * 2010-05-20 2016-01-20 日本电气株式会社 颜色安排检查设备以及数据处理方法
JP5466133B2 (ja) * 2010-10-26 2014-04-09 日本電信電話株式会社 画像付文書検索装置及び画像付文書検索プログラム
US20120109945A1 (en) * 2010-10-29 2012-05-03 Emilia Maria Lapko Method and system of improving navigation within a set of electronic documents
US8891874B1 (en) 2010-11-05 2014-11-18 The Boeing Company Legibility analysis of text in an electronic document
US8805095B2 (en) 2010-12-03 2014-08-12 International Business Machines Corporation Analysing character strings
JP5709518B2 (ja) * 2010-12-28 2015-04-30 キヤノン株式会社 文書編集装置、文章編集方法、及びプログラム
JP5733617B2 (ja) * 2011-04-27 2015-06-10 いすゞ自動車株式会社 可読性評価方法、可読性評価装置及び可読性評価プログラム
CN103688291B (zh) * 2011-07-26 2016-07-06 日本电气株式会社 屏幕检查设备、屏幕检查方法
US8977956B2 (en) * 2012-01-13 2015-03-10 Hewlett-Packard Development Company, L.P. Document aesthetics evaluation
US10789412B2 (en) * 2012-02-20 2020-09-29 Wix.Com Ltd. System and method for extended dynamic layout
KR101413988B1 (ko) * 2012-04-25 2014-07-01 (주)이스트소프트 문서의 이산분리시스템 및 방법
US9595298B2 (en) 2012-07-18 2017-03-14 Microsoft Technology Licensing, Llc Transforming data to create layouts
US20140055495A1 (en) * 2012-08-22 2014-02-27 Lg Cns Co., Ltd. Responsive user interface engine for display devices
US9442912B1 (en) * 2012-09-26 2016-09-13 Google Inc. Estimating the number of content items to fill an online space before distributing the content items to the online space
US9330072B1 (en) 2012-09-26 2016-05-03 Google Inc. Serving content for a space based on a probabilistic distribution
EP2735303A1 (en) * 2012-11-23 2014-05-28 Pilosciences Hair growth compositions and methods
JP6103918B2 (ja) * 2012-12-18 2017-03-29 キヤノン株式会社 画像処理装置および画像処理方法
US9460056B2 (en) * 2013-01-22 2016-10-04 Xerox Corporation Dynamic image layout for personalized packages
US9626517B2 (en) * 2013-01-23 2017-04-18 Seagate Technology Llc Non-deterministic encryption
US9275115B2 (en) 2013-07-16 2016-03-01 International Business Machines Corporation Correlating corpus/corpora value from answered questions
JP5882273B2 (ja) * 2013-08-30 2016-03-09 京セラドキュメントソリューションズ株式会社 資料評価プログラムおよび資料評価装置
JP5882272B2 (ja) 2013-08-30 2016-03-09 京セラドキュメントソリューションズ株式会社 資料評価プログラムおよび資料評価装置
US10274389B2 (en) 2013-08-30 2019-04-30 Kyocera Document Solutions Inc. Storage medium, material evaluating apparatus, and material evaluating method
WO2015149307A1 (en) 2014-04-02 2015-10-08 Google Inc. Systems and methods for optimizing content layout using behavior metrics
US9754207B2 (en) 2014-07-28 2017-09-05 International Business Machines Corporation Corpus quality analysis
US9626768B2 (en) 2014-09-30 2017-04-18 Microsoft Technology Licensing, Llc Optimizing a visual perspective of media
US10282069B2 (en) 2014-09-30 2019-05-07 Microsoft Technology Licensing, Llc Dynamic presentation of suggested content
US20180005539A1 (en) * 2015-01-20 2018-01-04 Hewlett-Packard Development Company, L.P. Custom educational documents
US10719220B2 (en) * 2015-03-31 2020-07-21 Autodesk, Inc. Dynamic scrolling
JP6033369B2 (ja) * 2015-06-24 2016-11-30 キヤノン株式会社 情報処理装置、情報処理方法、ならびにそのプログラムおよび記憶媒体
EP3355113B1 (en) * 2015-09-24 2020-08-12 LG Innotek Co., Ltd. Camera module
US10380228B2 (en) 2017-02-10 2019-08-13 Microsoft Technology Licensing, Llc Output generation based on semantic expressions
US10803044B1 (en) 2017-03-07 2020-10-13 The United States Of America, As Represented By The Secretary Of The Navy Technical data flexibility index
CN108733672B (zh) * 2017-04-14 2023-01-24 腾讯科技(深圳)有限公司 实现网络信息质量评估的方法和系统
US10719702B2 (en) * 2017-11-08 2020-07-21 International Business Machines Corporation Evaluating image-text consistency without reference
US10439971B1 (en) * 2017-11-27 2019-10-08 Amazon Technologies, Inc. System for detecting erroneous communications
US10671798B2 (en) * 2018-02-01 2020-06-02 Google Llc Digital component backdrop rendering
JP6982217B2 (ja) 2018-05-14 2021-12-17 シャープ株式会社 2枚レンズ光学系、ビーム・コンバイニング・モジュール、プロジェクター、及び2枚レンズ光学系の組み立て方法
US11144717B2 (en) * 2018-09-26 2021-10-12 Adobe Inc. Automatic generation of document layouts
JP7213662B2 (ja) 2018-11-09 2023-01-27 キヤノン株式会社 画像処理装置、画像処理方法
CN109889815A (zh) * 2019-01-30 2019-06-14 上海上湖信息技术有限公司 摄像头成像质量检测方法、装置以及计算机存储介质
US11687796B2 (en) 2019-04-17 2023-06-27 International Business Machines Corporation Document type-specific quality model
US11017171B2 (en) 2019-06-06 2021-05-25 International Business Machines Corporation Relevancy as an indicator for determining document quality
US11354361B2 (en) 2019-07-11 2022-06-07 International Business Machines Corporation Document discrepancy determination and mitigation
CN112131842B (zh) * 2020-08-27 2022-02-08 云动时代科技股份有限公司 一种文档设计方法及系统
CN112131841A (zh) * 2020-08-27 2020-12-25 北京云动智效网络科技有限公司 一种文档质量评估方法及系统
US11409822B2 (en) * 2020-09-15 2022-08-09 Alygne Alignment of values and opinions between two distinct entities
US11853688B2 (en) * 2022-03-04 2023-12-26 Adobe Inc. Automatic detection and removal of typesetting errors in electronic documents
US11956400B2 (en) * 2022-08-30 2024-04-09 Capital One Services, Llc Systems and methods for measuring document legibility

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5424945A (en) * 1993-08-31 1995-06-13 Xerox Corporation System for evaluating a psychological effect of a document
JP2001202522A (ja) * 1999-12-14 2001-07-27 Eastman Kodak Co 消費者画像の強調及び魅力の自動評価方法

Family Cites Families (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3174851A (en) * 1961-12-01 1965-03-23 William J Buehler Nickel-base alloys
US3351463A (en) * 1965-08-20 1967-11-07 Alexander G Rozner High strength nickel-base alloys
US3876864A (en) * 1973-12-11 1975-04-08 Diebold Inc Teller-assisted currency dispenser system
US4462701A (en) * 1982-05-11 1984-07-31 International Business Machines Corporation Printing system wherein justification determination is shared between a host processor and a printer
US4580040A (en) * 1983-10-03 1986-04-01 Ncr Corporation Teller-assisted, customer-operated ATM check cashing system
US4617457A (en) * 1983-12-19 1986-10-14 Ncr Corporation Teller-assisted, customer-operated ATM document cashing system
US4845636A (en) * 1986-10-17 1989-07-04 Walker Mark E Remote transaction system
JPH01189762A (ja) * 1988-01-25 1989-07-28 Fujitsu Ltd 文書分かりやすさ評価方式
DE3834737A1 (de) * 1988-10-12 1990-04-19 Bayer Ag Carrier fuer das faerben von polyestermaterialien
US5018207A (en) * 1989-09-18 1991-05-21 Jack Purdum Apparatus for objectively grading centering condition of a stamp
US5220501A (en) * 1989-12-08 1993-06-15 Online Resources, Ltd. Method and system for remote delivery of retail banking services
US5354295A (en) * 1990-03-13 1994-10-11 Target Therapeutics, Inc. In an endovascular electrolytically detachable wire and tip for the formation of thrombus in arteries, veins, aneurysms, vascular malformations and arteriovenous fistulas
US5122136A (en) * 1990-03-13 1992-06-16 The Regents Of The University Of California Endovascular electrolytically detachable guidewire tip for the electroformation of thrombus in arteries, veins, aneurysms, vascular malformations and arteriovenous fistulas
US5098440A (en) * 1990-08-14 1992-03-24 Cordis Corporation Object retrieval method and apparatus
US5064428A (en) * 1990-09-18 1991-11-12 Cook Incorporated Medical retrieval basket
US5367219A (en) * 1991-11-18 1994-11-22 U.S. Philips Corporation Electric reflector lamp for use with IEC standard
US5234437A (en) * 1991-12-12 1993-08-10 Target Therapeutics, Inc. Detachable pusher-vasoocclusion coil assembly with threaded coupling
US5425138A (en) * 1991-12-26 1995-06-13 Casio Computer Co., Ltd. Apparatus and method for automatically editing documents including text data and table data with ruled lines
DE4231703C2 (de) * 1992-09-22 1996-01-11 Siemens Ag Mikroprozessor mit CPU und EEPROM
US5690666A (en) * 1992-11-18 1997-11-25 Target Therapeutics, Inc. Ultrasoft embolism coils and process for using them
US5796409A (en) * 1993-04-06 1998-08-18 Ecole Polytechnique Federale De Lausanne Method for producing contrast-controlled grayscale characters
US5485183A (en) * 1993-06-30 1996-01-16 Dataproducts Corporation Interlaced dot-on-dot printing
US5666250A (en) * 1993-11-23 1997-09-09 Seagate Technology, Inc. Thin film magnetic heads with thin nickel underlayers
EP0667594A3 (en) 1994-02-14 1995-08-23 International Business Machines Corporation Image quality analysis method and apparatus
US5522819A (en) * 1994-05-12 1996-06-04 Target Therapeutics, Inc. Dual coil medical retrieval device
EP0692767B1 (en) * 1994-07-13 2003-10-08 Canon Kabushiki Kaisha Image processing apparatus and method
AUPM722194A0 (en) * 1994-08-02 1994-08-25 Ani Corporation Limited, The Bearer plate
US5987171A (en) * 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
US5600732A (en) * 1994-12-08 1997-02-04 Banctec, Inc. Document image analysis method
JPH08180037A (ja) * 1994-12-26 1996-07-12 Hitachi Ltd プレゼンテーション資料作成支援システム
JPH08180673A (ja) * 1994-12-27 1996-07-12 Nec Corp 強誘電体メモリセル及びそのアクセス装置
US6085177A (en) * 1995-01-11 2000-07-04 Civic-Ddi, Llc Systems for accessing the internet and geo-defined data and associated methods
US5657246A (en) * 1995-03-07 1997-08-12 Vtel Corporation Method and apparatus for a video conference user interface
US5604341A (en) * 1995-03-13 1997-02-18 At&T Global Information Solutions Company ATM as video conferencing station
JPH08255063A (ja) * 1995-03-16 1996-10-01 Sony Corp レイアウト評価装置、レイアウト装置および表示装置
US5687201A (en) * 1995-03-21 1997-11-11 Standard Microsystems Corporation Phase-locked-loop with linear combination of charge pump and current controlled oscillator
US5774579A (en) * 1995-08-11 1998-06-30 Canon Kabushiki Kaisha Block selection system in which overlapping blocks are decomposed
US5963641A (en) 1995-09-12 1999-10-05 Markzware, Inc. Device and method for examining, verifying, correcting and approving electronic documents prior to printing, transmission or recording
US5600114A (en) * 1995-09-21 1997-02-04 Facilities Engineering And Design Consultants, Inc. Remote unmanned banking center
US5784487A (en) * 1996-05-23 1998-07-21 Xerox Corporation System for document layout analysis
US5695398A (en) * 1996-06-21 1997-12-09 Deere & Company Foldable loading auger
US5686250A (en) * 1996-07-31 1997-11-11 Case Western Reserve University Antibodies to LGE2 -protein antigens
SE508972C2 (sv) * 1996-08-28 1998-11-23 Ralip International Ab Förfarande för kvalitetssäkring vid scanning/kopiering av bilder/dokument samt anordning för genomförande av förfarandet
JPH1079866A (ja) * 1996-09-04 1998-03-24 Canon Inc 画像処理装置及び方法
US5933816A (en) * 1996-10-31 1999-08-03 Citicorp Development Center, Inc. System and method for delivering financial services
US6539361B1 (en) * 1996-11-27 2003-03-25 Die{grave over (b)}old, Incorporated Automated banking machine system using plural communication formats
US7138511B1 (en) * 1997-01-28 2006-11-21 The Regents Of The University Of California Nucleic acids, kits and methods for the diagnosis, prognosis and treatment of glaucoma and related disorders
US5814064A (en) * 1997-03-06 1998-09-29 Scimed Life Systems, Inc. Distal protection device
US6073119A (en) * 1997-09-04 2000-06-06 Citicorp Development Center, Inc. Method and system for banking institution interactive center
US6066149A (en) * 1997-09-30 2000-05-23 Target Therapeutics, Inc. Mechanical clot treatment device with distal filter
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
JP4170441B2 (ja) * 1997-11-28 2008-10-22 富士通株式会社 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
JP3601658B2 (ja) * 1997-12-19 2004-12-15 富士通株式会社 文字列抽出装置及びパターン抽出装置
EP0926587A1 (en) * 1997-12-23 1999-06-30 Canon Research Centre France S.A. Method and device for controlling data processing
US6275600B1 (en) * 1998-03-09 2001-08-14 I.Data International, Inc. Measuring image characteristics of output from a digital printer
US5944728A (en) * 1998-04-23 1999-08-31 Boston Scientific Corporation Surgical retrieval basket with the ability to capture and release material
US6349290B1 (en) * 1998-06-30 2002-02-19 Citibank, N.A. Automated system and method for customized and personalized presentation of products and services of a financial institution
US6795580B1 (en) 1998-09-10 2004-09-21 Tektronix, Inc. Picture quality measurement using blockiness
US6223983B1 (en) * 1999-02-19 2001-05-01 National City Bank Interactive point access financial and information system
ES2311670T3 (es) * 1999-08-27 2009-02-16 Ev3 Inc. Filtro vascular deslizante.
JP4046465B2 (ja) * 1999-09-17 2008-02-13 株式会社リコー 画像処理装置、画像処理方法、及び画像処理システム
US6704039B2 (en) * 1999-10-16 2004-03-09 Martin Rangel Pena Method and system for computer-aided telecommunication and financial transactions
JP3482923B2 (ja) * 1999-10-28 2004-01-06 セイコーエプソン株式会社 自動構図決定装置
US6571000B1 (en) * 1999-11-29 2003-05-27 Xerox Corporation Image processing algorithm for characterization of uniformity of printed images
FR2801997A1 (fr) * 1999-12-02 2001-06-08 Itesoft Technologie adaptative d'analyse automatique de document
DE10008545A1 (de) * 2000-02-24 2001-08-30 Bosch Gmbh Robert Monolithisch integriertes Halbleiterbauelement
US6748097B1 (en) 2000-06-23 2004-06-08 Eastman Kodak Company Method for varying the number, size, and magnification of photographic prints based on image emphasis and appeal
US6725303B1 (en) * 2000-08-31 2004-04-20 At&T Corp. Method and apparatus for establishing a personalized connection with a network
US7035429B2 (en) * 2000-11-10 2006-04-25 Anoto Ip Lic Handelsbolag Method and device for addressing mail items
US20020084293A1 (en) * 2001-01-02 2002-07-04 Liad Weighing And Control Systems Ltd. System for feeding portions of material to an injection molding machine
US6825844B2 (en) * 2001-01-16 2004-11-30 Microsoft Corp System and method for optimizing a graphics intensive software program for the user's graphics hardware
US6901169B2 (en) * 2001-02-01 2005-05-31 At & T Corp. Method and system for classifying image elements
US6553949B1 (en) * 2001-03-05 2003-04-29 Ford Global Technologies, Inc. Engine knock prevention system and method
JP2002263199A (ja) * 2001-03-06 2002-09-17 Yoshiyasu Ito イオントフォレーシス用デバイス
JP2002289385A (ja) * 2001-03-23 2002-10-04 Harison Toshiba Lighting Corp 放電灯駆動装置
US6645223B2 (en) * 2001-04-30 2003-11-11 Advanced Cardiovascular Systems, Inc. Deployment and recovery control systems for embolic protection devices
US20020188314A1 (en) * 2001-06-07 2002-12-12 Microvena Corporation Radiopaque distal embolic protection device
US6551341B2 (en) * 2001-06-14 2003-04-22 Advanced Cardiovascular Systems, Inc. Devices configured from strain hardened Ni Ti tubing
JP4147754B2 (ja) * 2001-07-13 2008-09-10 セイコーエプソン株式会社 画像評価方法および画像評価システムならびに画像評価処理プログラム
US20030023555A1 (en) * 2001-07-26 2003-01-30 Cashworks, Inc. Method and system for providing financial services
US7050636B2 (en) * 2001-12-07 2006-05-23 Eastman Kodak Company Method and system for improving an image characteristic based on image content
US20030212637A1 (en) * 2002-05-09 2003-11-13 Turner Michael B. Automated method and system for enrollment
US7254270B2 (en) * 2002-07-09 2007-08-07 Hewlett-Packard Development Company, L.P. System and method for bounding and classifying regions within a graphical image
JP2004109690A (ja) * 2002-09-19 2004-04-08 Canon Inc カメラシステムおよびカメラ
US7130491B2 (en) * 2003-03-14 2006-10-31 Hewlett-Packard Development Company, L.P. System and method for interpolating a color image
US7035439B2 (en) * 2003-07-30 2006-04-25 Xerox Corporation System and method for measuring and quantizing document quality

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5424945A (en) * 1993-08-31 1995-06-13 Xerox Corporation System for evaluating a psychological effect of a document
JP2001202522A (ja) * 1999-12-14 2001-07-27 Eastman Kodak Co 消費者画像の強調及び魅力の自動評価方法

Also Published As

Publication number Publication date
JP2005050354A (ja) 2005-02-24
US20070041619A1 (en) 2007-02-22
US20050028098A1 (en) 2005-02-03
US7024022B2 (en) 2006-04-04
EP1503341A2 (en) 2005-02-02
US7092551B2 (en) 2006-08-15
JP4624026B2 (ja) 2011-02-02
US20060039585A1 (en) 2006-02-23
US20050028097A1 (en) 2005-02-03
EP1503339A2 (en) 2005-02-02
EP1503340B1 (en) 2012-06-13
US7277560B2 (en) 2007-10-02
JP2005050355A (ja) 2005-02-24
US7130450B2 (en) 2006-10-31
EP1503340A2 (en) 2005-02-02
EP1503336A3 (en) 2005-12-21
US20050028099A1 (en) 2005-02-03
JP4619720B2 (ja) 2011-01-26
US20070036394A1 (en) 2007-02-15
JP2005050351A (ja) 2005-02-24
US20060029258A1 (en) 2006-02-09
EP1503337A2 (en) 2005-02-02
EP1503342A3 (en) 2005-12-21
JP2005050352A (ja) 2005-02-24
US20060029259A1 (en) 2006-02-09
EP1503338A2 (en) 2005-02-02
US7260245B2 (en) 2007-08-21
US20050028074A1 (en) 2005-02-03
US7269276B2 (en) 2007-09-11
US20070036393A1 (en) 2007-02-15
US7035438B2 (en) 2006-04-25
JP2005050353A (ja) 2005-02-24
US7035439B2 (en) 2006-04-25
US7116802B2 (en) 2006-10-03
EP1503341A3 (en) 2005-12-21
EP1503341B1 (en) 2012-07-04
EP1503336B1 (en) 2012-06-13
US20070041617A1 (en) 2007-02-22
US20050028075A1 (en) 2005-02-03
EP1503338B1 (en) 2012-06-13
EP1503339B1 (en) 2012-06-13
US7308116B2 (en) 2007-12-11
US7092552B2 (en) 2006-08-15
JP2005050357A (ja) 2005-02-24
EP1503339A3 (en) 2005-12-21
US7283648B2 (en) 2007-10-16
US20070036392A1 (en) 2007-02-15
EP1503342A2 (en) 2005-02-02
US20060029260A1 (en) 2006-02-09
US20070036390A1 (en) 2007-02-15
EP1503338A3 (en) 2005-12-21
US7280675B2 (en) 2007-10-09
JP4619721B2 (ja) 2011-01-26
JP4624027B2 (ja) 2011-02-02
EP1503342B1 (en) 2012-06-13
US7095877B2 (en) 2006-08-22
EP1503336A2 (en) 2005-02-02
JP4558403B2 (ja) 2010-10-06
US20050028076A1 (en) 2005-02-03
EP1503337A3 (en) 2005-12-21
US20070036391A1 (en) 2007-02-15
EP1503337B1 (en) 2012-06-13
EP1503340A3 (en) 2005-12-21
JP4619719B2 (ja) 2011-01-26
US7130451B2 (en) 2006-10-31
US20070041618A1 (en) 2007-02-22
US7305107B2 (en) 2007-12-04
US7136511B2 (en) 2006-11-14
JP2005050356A (ja) 2005-02-24
US20050028096A1 (en) 2005-02-03
US7072495B2 (en) 2006-07-04
US7266222B2 (en) 2007-09-04

Similar Documents

Publication Publication Date Title
JP4558404B2 (ja) 文書品質値計算装置
US7451140B2 (en) System and method for proofing individual documents of variable information document runs using document quality measurements

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090918

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100407

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100721

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4558404

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees