JP2024511893A

JP2024511893A - 言語学的に駆動される自動化されたテキスト・フォーマット設定

Info

Publication number: JP2024511893A
Application number: JP2023562214A
Authority: JP
Inventors: ダイク、ジュリーエイ．ヴァン; ゴーマン、マイケル; ラセック、マーク
Original assignee: Cascade Reading inc
Current assignee: Cascade Reading inc
Priority date: 2021-04-09
Filing date: 2022-04-08
Publication date: 2024-03-15
Also published as: MX2023011943A; BR112023020706A2; KR20230165344A; US20220335203A1; DE112022002081T5; AU2022255037A1; US20230351090A1; US11734491B2; CN117561516A; CA3214349A1; WO2022217087A1; AU2022255037B2; US11170154B1; IL307467A

Abstract

言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステムおよび技法が本明細書に記述される。入力テキストの言語構造を表すデータは、構成要素、依存関係、および同一指示関係をそれだけに限定されないが含む、自然言語処理（ＮＬＰ）サービスから受け取られ得る。入力テキストのテキスト・モデルは、言語コンポーネントおよび言語関係を使用して構築され得る。カスケード・ルールがテキスト・モデルに適用されて、カスケードされたテキスト・データ構造が生成され得る。カスケードされたデータは、電話、タブレット、ラップトップ、モニタ、ＶＲ／ＡＲデバイスを含む様々な媒体で表示され得る。カスケードされたデータが二画面フォーマットで提示されて、より正確で効率的な読解と、母国語および外国語の文法構造を教えることがより容易になることと、読むことに関連する障害の改善のためのツールとが促進され得る。

Description

本明細書において記述されている実施形態は、全般的には、理論言語学から導き出された大規模自然言語処理（ＮＬＰ）技術によって駆動される、マシンによって自動化されたテキスト処理に関する。いくつかの実施形態においては、より具体的には、読解を改善するという目的のために、カスケードされたテキストを産出するための構成要素および依存関係の解析に関する。

標準的なテキスト・フォーマット設定は、言語をブロックで提示することを伴い、基本的な句読点と、パラグラフを示す改行またはインデントとを超えるフォーマット設定をほとんど伴わない。本明細書において記述されている代替のテキスト・フォーマットは、言語関係が強調されるようにテキストを提示して、理解プロセスのためのサポートを提供し、これは、正確さを高めること、または読解時間を低減することが可能である。

カスケードされたテキスト・フォーマット設定を提供する。

カスケードされたテキスト・フォーマット設定は、読者が文法構造および関連したコンテンツを識別するのを手助けするという目的のために従来のブロック形状のテキストをカスケード・パターンへと変形する。テキスト・カスケードは、文の構文を見えるようにする。構文単位が、文の基礎的要素である。自然言語を解析する場合には、読者の心は、文をより小さな単位の文字列へと単に「大まかに切り分ける」よりも多くのことを行わなければならない。むしろ読者の心は、フレーズどうしの間における依存関係を特定して、それぞれのフレーズが、そのフレーズを含むさらに大きなフレーズにどのように関連しているかを認識する必要がある。カスケードされたテキスト・フォーマットは、読者が文内のこれらの関係を識別するのを手助けする。言語単位を他の単位の中に埋め込むプロセスを通じて文を構築する人間の心の能力は、言語が無数の意味を表すことを可能にする。したがって、カスケードされた解析パターンは、読者が、ある特定のフレーズを見ているときに、そのフレーズがその前後のフレーズにどのように関連しているかにすぐに気づくことを可能にするように意図されている。

図面（必ずしも原寸に比例して描かれているとは限らない）においては、同様の数字どうしが、別々の図における同様のコンポーネントどうしを記述する場合がある。別々の文字の添え字を有する同様の数字どうしが、同様のコンポーネントどうしの別々のインスタンスを表す場合がある。図面は、本文書において論じられている様々な実施形態を、限定としてではなく例として一般的に示している。

一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために使用されることになる構成要素を定義する解析木の例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析およびカスケードされたテキスト出力の一例のブロック図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析およびカスケードされたテキスト出力の一例のブロック図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたテキスト出力の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、指示的にリンクされているフレーズどうしを識別するように拡張されているカスケードされたテキスト出力の一例を示す図。一実施形態による、コンスティテュエンシおよび依存関係パーサによって特定された文法情報に基づいて複数の従属セグメントへとセグメント化されているテキスト部分を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定を介してそれぞれのセグメントに関して指定されている階層配置を伴って表示されているテキスト部分を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための環境およびシステムの一例のブロック図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケード・フォーマットへの言語学的修正を受け取るための環境の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、文どうしにわたる同一指示追跡のためのシステムの一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステムの一例のためのデータフロー図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにマシン学習分類子を使用してテキストをカスケードするための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにテキストをカスケードするようにマシン学習分類子をトレーニングするための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたフォーマットで文を表示するためのテキスト変形の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、自然言語処理を使用するカスケードされたテキスト用にタグ付けされたハイパーテキスト・マークアップ言語（ＨＴＭＬ）コードのための解析構造の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用して、取り込まれた画像から、カスケードされたテキストを生成することの一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用して、取り込まれた画像から、カスケードされたテキストを生成するための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用してアイウェア・デバイスにおいてテキストを第１の表示フォーマットから第２の表示フォーマットへ変換することの一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用してアイウェア・デバイスにおいてテキストを第１の表示フォーマットから第２の表示フォーマットへ変換するための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにテキストが著される際に自然言語処理を使用するカスケードされたテキストを生成することの一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのユーザおよび発行者のプリファレンス管理のためのアーキテクチャの一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのパーソナライゼーションのための方法の一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのデュアル表示の例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために第１の言語での入力テキストを第２の言語でのカスケードされた出力へ翻訳するためのシステムの一例を示す図。一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。１つまたは複数の実施形態が実装されることが可能であるマシンの一例を示すブロック図。

本明細書において論じられているシステムおよび方法は、言語理論から導き出された言語分析を利用して、カスケードを特定する。そのような分析は、自動化された自然言語処理（ＮＬＰ）における最先端技術であり、これは、本明細書において論じられているシステムおよび方法が、ＮＬＰ技術（これ以降、ＮＬＰサービス）から提供される入力を活用することを可能にする。

本明細書において論じられているシステムおよび方法は、ＮＬＰサービス（たとえば、コンスティテュエンシ・パーサ、依存関係パーサ、同一指示パーサなど）を使用して、入ってくるテキストを解析して、その基礎となる言語特性を強調表示する表示にする。カスケード・ルールを含む表示ルールが、次いでこれらの表示に適用されて、言語関係を読者にとってさらに見えるようにする。

言語構成要素は、文における特定の機能を満たす語または語のグループである。たとえば、「ＪｏｈｎｂｅｌｉｅｖｅｄＸ（ジョンはＸを信じた）」という文において、Ｘは、単一の語（「Ｍａｒｙ（メアリー）」）もしくは（「ｆａｃｔｓ（事実）」）によって、またはフレーズ（「ｔｈｅｇｉｒｌ（その少女）」）もしくは（「ｔｈｅｇｉｒｌｓｗｉｔｈｃｕｒｌｓ（巻き毛の少女たち）」）もしくは（「ｔｈｅｇｉｒｌｗｈｏｓｈｏｕｔｅｄｌｏｕｄｌｙ（大声で叫んだ少女）」）によって、または完全な節（「ｔｈｅｓｔｏｒｙｗａｓｔｒｕｅ．（その話は本当だった。）」）によって置換されることが可能である。このケースにおいては、これらのすべては、「Ｊｏｈｎｂｅｌｉｅｖｅｄ（ジョンは信じた）」の直接の目的語の役割を満たす構成要素である。特に、構成要素は、完全性という特性を有する。「ｔｈｅｓｔｏｒｙｗａｓ（その物語は、～だった）」は、文法単位として独立することが可能ではないので、構成要素ではない。同様に、「ｔｈｅｇｉｒｌｗｈｏ（～である少女）」または「ｔｈｅ（その）」は、構成要素ではない。加えて、構成要素は、その他の構成要素内に埋め込まれる場合がある。たとえば、「ｔｈｅｇｉｒｌｓｗｉｔｈｃｕｒｌｓ（巻き毛の少女たち）」というフレーズは、構成要素であるが、「ｔｈｅｇｉｒｌｓ（少女たち）」および「ｗｉｔｈｃｕｒｌｓ（巻き毛の）」も、構成要素である。しかしながら、「ｇｉｒｌｓｗｉｔｈ（～の状態の少女たち）」というフレーズは、文法単位として独立することが可能ではないので、構成要素ではない。その結果として、「ｇｉｒｌｓｗｉｔｈ（～の状態の少女たち）」は、いずれの文法機能も満たすことが可能ではなく、その一方で「ｔｈｅｇｉｒｌｓ（少女たち）」または「ｗｉｔｈｃｕｒｌｓ（巻き毛の）」という構成要素フレーズは両方とも、文における必要な文法機能を満たすのに適格である。品詞は、語の構文機能（たとえば、名詞、動詞、前置詞など）のカテゴリである。単一の語の機能について記述する品詞とは異なり、コンスティテュエンシは、文における特定の文法的役割（たとえば、主語、直接目的語など）を満たすために単位として機能する語のセットを叙述する。したがって、「コンスティテュエンシ」という概念は、文内で語のグループどうしがどのように関連しているかに関するさらに多くの情報を提供する。

本明細書において論じられているシステムおよび方法は、構成要素のカスケーディングを実施し、そのカスケーディングにおいては、様々なレベルのインデントを特定するルールのセットに従って構成要素が表示される。ルールは、コンスティテュエンシ・パーサおよび依存関係パーサからの情報に共同で基づく。コンスティテュエンシ・パーサは、フレーズ構造の理論（たとえば、Ｘバー理論）を使用して、今しがた記述されたように構成要素を識別するＮＬＰサービスである。依存関係パーサは、文におけるそれぞれの語に関するラベル付けされている構文依存関係を提供して、その語（およびその語が率いている構成要素）によって保持されている構文機能について記述するＮＬＰサービスである。構文依存関係のセットは、言語間で一貫した構文注釈標準を提供することを目的とする普遍依存関係イニシアチブ（ＵＤ，ｈｔｔｐ：／／ｕｎｉｖｅｒｓａｌｄｅｐｅｎｄｅｎｃｉｅｓ．ｏｒｇ）によって列挙されている。英語以外にも、構文分析は、中国語（簡体字）、中国語（繁体字）、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、およびスペイン語を限定ではなく例として含む様々なさらなる言語をサポートすることが可能である。

テキスト・カスケーディングのプロセスを実施することを通じて、本明細書において論じられているシステムおよび方法は、テキストにおける基礎となる言語構造に対する視覚的な手がかりを提供する。これらの手がかりは、教訓的な機能を果たし、これらの手がかりを利用して、より正確かつ効率的な読解、文法構造を教示する際のさらに高い容易さ、および読解関連障害の矯正のためのツールを促進する多くの実施形態が提示される。

一例においては、カスケードは、解析オペレーションから入手されたコンスティテュエンシおよび依存関係データに基づいて改行およびインデントを使用して形成される。優先順位が、完全に１行の上に残っている構成要素に置かれるか、またはデバイスの表示制限が単一の行での表示を妨げ得る状況においては連続単位として示されるようにカスケード・ルールが適用される。これは、言語機能において語のどのグループどうしが一緒に役割を果たすかの容易な識別を促進し、それによって構成要素は、より容易に識別されることが可能である。正確な言語理解は、テキストにおいて提示されているエンティティどうしまたは概念どうしの間における関係を識別する能力を必要とする。これにとっての必要条件は、構成要素（すなわち、個別の文法機能を果たすテキストの単位）を解析する能力である。理解力に乏しい人は、読取りおよび口頭での産出の両方の間に、構成要素を定義する構文境界を識別するのにかなりの困難を有しているということを証拠が示唆している（たとえば、ブリーンら（Ｂｒｅｅｎｅｔａｌ．）、２００６年；ミラー（Ｍｉｌｌｅｒ）およびシュヴァーネンフリューゲル（Ｓｃｈｗａｎｅｎｆｌｕｇｅｌ）、２００８年）。その上、境界認識は、解説的なテキスト（すなわち、教科書、新聞など）において見受けられる種類の複雑な構文構造にとって特に重要である。これらの事実は、テキストにおける構文境界を識別する能力が読解にとって特に重要であるということ、およびこれらの境界を知らせる方法が、悪戦苦闘している読者にとって重要な助けとしての役割を果たすことが可能であるということを示唆している。しかしながら、標準的なテキスト提示方法（すなわち、テキストを左揃えのブロックで提示すること）は、言語構成要素を明示的に識別せず、またはそうするプロセスをサポートするためのいかなる手段も提供しない。本明細書において論じられているシステムおよび方法は、改行（たとえば、キャリッジ・リターン、ライン・フィードなど）、インデント、色での強調表示、イタリック、アンダーライン等などの視覚的な手がかりを介して構文上の境界および依存関係を明示的に知らせる手段を提示する。

図１は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために使用されることになる構成要素を定義する解析木１００の例を示している。言語理論は、言語構成要素（フレーズとも呼ばれる）と、それらの言語構成要素の間における関係を表すためのフォーマリズムとのための確立された診断テストを提供する。これらのテストは、限定ではなく例として、ｉ）ｄｏ－ｓｏ／ｏｎｅ置換、ｉｉ）等位構造、ｉｉｉ）話題化、ｉｖ）省略、ｖ）分裂文形成／擬似分裂文形成、ｖｉ）受身化、ｖｉｉ）ｗｈ前置、およびｖｉｉｉ）右枝節点繰り上げ、ｉｘ）代名詞置換、およびｘ）質問応答、ｘｉ）脱落、およびｘｉｉ）副詞的侵入を含む。

Ｘ’理論（「Ｘバー理論」と発音される）として知られている有力な理論は、フレーズがどのように作成されるかについて記述している（チョムスキー（Ｃｈｏｍｓｋｙ）、１９７０年；ジャッケンドフ（Ｊａｃｋｅｎｄｏｆｆ）、１９７７年）。この理論は、特定の品詞（たとえば、名詞、動詞など）どうしにわたって抽象化を行い、ＸＰまたはＸフレーズとして記述されるすべてのタイプのフレーズ（たとえば、Ｘ＝名詞の場合には、それは名詞フレーズであり、Ｘ＝動詞の場合には、それは動詞フレーズである、といった具合である）が、３つの一般的な２項枝分かれ書き換えルールを介して作成されると主張している。第１にフレーズ（「ＸＰ）が、任意の順序での、任意選択の「指定子」と、必要とされる「Ｘバー」とから構成される。第２にＸバーが、任意選択で、Ｘバーと、Ｘバーを修飾することを認められている任意のタイプの付加詞とから構成されることが可能である。第３にＸバーは、フレーズの必須の主要部（たとえば、任意の品詞の語）と、任意選択で、任意の線形順序で生じる、その主要部によって認められている任意の数の補語フレーズとから構成される。

これらのルールは、指定子とＸバーとが、および主要部と補語とが姉妹関係にあり、ＸＰが階層における最高の位置にあって、Ｘ’を支配し、そしてＸ’がＸを支配するように解析木１００を作成するために使用されることが可能である。たとえば、「ｓａｗｔｈｅｇｉｒｌ（少女を見た）」という動詞フレーズは、Ｖ主要部とＮＰ補語とを伴うＶＰとして表されることが可能であり、そしてそのＮＰ補語は、指定子の位置に「ｔｈｅ」を伴うＮ’として表され、そのＮ’は、解析木１０５において示されているようにＮ主要部からの投射として表される。文１１０「ｓａｗｔｈｅｇｉｒｌｗｉｔｈｔｈｅｃｕｒｌｓ（巻き毛の少女を見た）」におけるように、（前置詞フレーズのような）その他の付加詞フレーズがＮＰのＮ’フレーズに対してさらに付加されることが可能であるということに留意されたい。同様に、解析木１１０において示されているように、「ｒｅｃｅｎｔｌｙ（最近）」という副詞など、指定子フレーズがＶ’に対して付加されることが可能である。指定子のインスタンスは、図１においては簡略化されているが、これらも、ＸＰフレーズであるものと理解される。

本明細書で論じられているシステムおよび方法は、これらのフレーズ構造ルールを利用して、構成要素キューイングの２部構成プロセスの第１部を規定する。第１部では、表示のために文をより小さいピースにどのように分割するかを規定する。すなわち、文は、語がその支配的なＸＰフレーズから切り離されないように構成要素ピースに分断される（たとえば、図６Ａに示されるように、図１１の要素１１１０、図１２の要素１２０５など）。たとえば、「ｗｉｔｈ」と「ｃｕｒｌ」の間の分断は、「ｃｕｒｌ」が「ｗｉｔｈ」を先頭とするＰＰに支配されているので、起きることがない。同様に、「ｔｈｅ」が「ｇｉｒｌ」とは別の行に現れることはない。その理由は、これらが両方とも、「ｇｉｒｌ」を先頭とするＮＰに支配されているからである。したがって、カスケード・ジェネレータの目的のために、セグメントが、提示ライン上に一緒にとどまることになる、ＸＰに支配されたフレーズと定義される。「ｓａｗ」と「ｔｈｅ」の間の分断は、「ｔｈｅ」が「ｓａｗ」とは別のＸＰフレーズに支配されているので、起こり得る（すなわち、「ｓａｗ」はＶＰに支配され、「ｔｈｅ」はＮＰに支配されている）。同様に、「ｇｉｒｌ」と「ｗｉｔｈ」の間の分断が、「ｗｉｔｈ」がＰＰに支配され、「ｇｉｒｌ」がＮＰに支配されているので、起こり得る。改行が、ＸＰの存在するところで行われる。その理由は、これが新しい構成要素を特徴付けるからである。行の長さがＸＰの間で改行するにはあまりに短い場合、改行がＸのレベルで、構成要素の継続を示す付随する視覚的フォーマット（括弧、フラッシュ・インデント、色コーディング、イタリック体マッチングなどを、これらに限定されないが含む）を用いて行われる。

第１部の例示的な実施形態では、構成要素を区切るための代表的な言語として、他のフレーズ構造理論（たとえば、ベア・フレーズ構造など）を利用することがある。本明細書で論じられているシステムおよび方法のいくつかの態様は、改行が構成要素境界で起こること、および構成要素境界が、確立された言語診断テスト（置換、移動、分裂文形成、質問など）に基づいて確立されることである。構成要素境界は、特有のフレーズ構造表現にかかわらず一定である。

例示的な実施形態では、カスケード・ジェネレータで使用するための構成要素を提供するのに自動化された構成要素パーサが使用されるが、カスケード・ジェネレータは、１つの自動化されたパーサの使用に、または何か特定の自動化されたパーサに依存しない。このパーサは、ＮＬＰサービスとして表示される（たとえば、図１０で論じられているＮＬＰサービス１０２０のコンスティテュエンシ・パーサ１０２５など）。様々な解析技術およびサービスが、カスケード・ジェネレータによって次に処理される構成要素を識別するのに使用され得ることを理解されたい。

構成要素カスケーディング・オペレーションの第２部は、言語構造の手がかりを提供するためのインデント・スキームを指定する（たとえば、図６Ｂなどに示されているように）。これらの手がかりは、自動化された依存関係パーサからの出力に基づいており、このパーサは各語の、他の各語に対する特有の言語機能を指定する（たとえば、図１１の要素１１１５または図１２の要素１２１０などに示されるように）。この機能は、カスケードの水平変位（インデント）を決定するために使用される。手がかりは、カスケード内の構成要素フレーズの水平変位（インデント）によって表され得るので、インデントされているのは所定の行のフレーズになる。カスケードは、フレーズ境界、改行、および水平変位を含む全結果を指す。

依存関係解析機能だけでは言語構成要素を識別することができない。これは、依存関係パーサが言語機能を構成要素ではなく語に割り当てるからである。言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステムは、言語モデル（図１０の１０５０）を作成し、このモデルは、完全な構成要素を、その構成要素の先頭に関連付けられた特有の依存関係とリンクする（たとえば、図６Ａ）。たとえば、構成要素ＸＰの先頭はＸである。すなわち、名詞句（ＮＰ）の先頭は名詞（Ｎ）であり、前置詞句（ＰＰ）の先頭は前置詞（Ｐ）である。コア・アーギュメントおよび非コア従属語の先頭と関連付けられた依存関係は、改行および水平変位をトリガするために使用される。依存関係パーサ６２５（たとえば、図１０に記述されている依存関係パーサ１０３５など）は、テキスト中の語の依存関係を提供する依存関係出力６３５（たとえば、図１０に記述されている依存関係データ１０４０など）を生成する。コア・アーギュメントおよび非コア従属セレクタ６４０は、コンスティテュエンシ・パーサ６２０（たとえば、図１０に記述されているコンスティテュエンシ・パーサ１０２５など）からのコンスティテュエンシ出力６３０（たとえば、図１０に記述されているコンスティテュエンシ・データ１０３０など）と、依存関係出力６３５とを受け取り、構成要素に関連する依存関係を選択して言語構造６１５（たとえば、図１０に記述されているモデル１０５０など）を生成する。その結果、言語学的に駆動される自動化されたテキスト・フォーマット設定のシステムは、コンスティテュエンシ情報と依存関係情報の両方を要求する。

代替実施形態が、依存関係パーサだけを含み得るが、言語構成要素を定義する追加のルール（たとえば、フレーズ構造ルール）もまた要求する。このようなルールは、計算的に実施されたパーサを含まなくてもよいが、構成要素を記述する言語理論に基づくルールの任意の集まりを含み得る。これは、キーワード（たとえば、前置詞）、従属節マーカ（すなわち、ｔｈａｔ、ｗｈｉｃｈ、ｗｈｏ）、節接続詞（すなわち、ｅｉｔｈｅｒ、ｂｕｔ、ａｎｄ）、およびフレーズ構造の他の単一語インジケータに基づいて構成要素を識別するためのヒューリスティックを、これだけに限定されないが含む。

構成要素カスケーディング・オペレーションの例示的な実施形態は、文中の構成要素および依存関係の特徴付けに基づいており、加えて、同一指示、感情分析、名前付きエンティティ認識、およびトピック追跡をこれらに限定されないが例として含む、列挙されたＮＬＰ－Ｓｅｒｖｉｃｅｓによって提供されるその他の言語的特徴に基づいている。カスケーディングに加えて、これらのパーサからの出力は、認知的手がかりを提供してユーザの認知負荷を軽減するようにテキストをハイライト、色分け、アンダーライン、付随する音声情報などによって修飾するために使用され得る。

例としてカスケーディングが使用されているが、本明細書で論じられているシステムおよび方法は、テキストに関与するときの認知負荷の軽減をユーザにもたらす、様々な目に見える出力、可聴出力、および蝕知できる出力に適用可能である。別の例示的な実施形態では、ユーザが認知負荷を軽減するためのキューイングを実現する他のフォーマット設定が使用され得る。例示的な実施形態では、キューイングは、コンスティテュエンシ・データおよび依存関係データなどの解析出力を使用して、色、イタリック体を使用すること、ビデオ出力、振動出力、音声出力（たとえば、トーンなど）を提供することなどの、テキスト・フォーマット設定および／または強調の修飾によって達成されることが可能である。

図２は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析２０５およびカスケードされたテキスト出力２１０の一例のブロック図を示す。

依存関係パーサは、言語機能を指定するための様々なラベリング規約または依存関係セットを採用することができる。本明細書で論じられているシステムおよび方法は、構文、意味、または韻律に基づくものを含めて、語間の言語機能を指定するための任意の依存関係セットの使用を組み込む。例示的な実施形態では、言語間で有効な依存関係セットを開発するための協同オープンソース国際プロジェクトである、ＵｎｉｖｅｒｓａｌＤｅｐｅｎｄｅｎｃｙ（ＵＤ）イニシアチブからの依存関係セットが採用される。関係のセットは、ｈｔｔｐｓ：／／ｕｎｉｖｅｒｓａｌｄｅｐｅｎｄｅｎｃｉｅｓ．ｏｒｇ／ｕ／ｄｅｐ／ｉｎｄｅｘ．ｈｔｍｌで入手可能である。

ＵＤ依存関係セットは、名詞句および節のコア・アーギュメントと、非コア従属語（すなわち、斜格アーギュメント、副詞節、関係詞節）および名詞修飾語（すなわち、形容詞、名詞属性、節修飾語）を含む、その他のタイプの従属語とに分割される。構成要素カスケーディングのプロセスでは、コア・アーギュメントおよび非コア従属語が、その先頭の下で強制的にインデントされるべきであると規定する。このインデントは、文の中のコア関係に視覚的な手がかりを与える。したがって、直接目的語または間接目的語（依存関係解析２０５において「ｏｂｊ」または「ｉｏｂｊ」とラベル標示）は、カスケードされた出力２１０に示されているように、それらが修飾する動詞（多くの場合、「ｒｏｏｔ」とラベル標示）の下でインデントされる。一例では、名詞句の従属語もまた、その先頭の下でインデントされることがある。これらは、名詞修飾語および形容詞修飾語（すなわち、所有格形の語句、縮小関係詞節、数値修飾語、および同格句）の様々なセットを含む。カスケードされたテキスト出力２１０は、依存関係解析２０５に基づくインデントを含む。インデントの量は、後述のように、システム・プリファレンスで指定され得る。例示的な実施形態では、従属名詞句は、行の長さまたは構成要素のタイプに応じて、可能な限り改行を最小限にするという目標で、個々別々に取り扱われる。異なるインデント量が任意選択で、異なる従属語タイプに対して、それらを視覚的に区別するために適用されてよい。

図３は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析３０５およびカスケードされたテキスト出力３１０の一例のブロック図を示す。

インデント・ルールが構成要素に適用される。構成要素が他の構成要素（たとえば、関係詞節、補文）の中に埋め込まれる場合、インデント解除ルールが、カスケードされた出力３１０に示されるように、構成要素の完了を知らせるために適用される。インデント解除の結果、水平変位が、埋め込まれたフレーズの先頭の位置に復元される。これは、埋め込みの構造、および各動詞とそのアーギュメントの間の関係についての明確な手がかりをもたらす、カスケード・パターンを生成する。カスケードされたテキスト出力３１０は、カスケード・ジェネレータで指定されたカスケード・ルールによる依存関係解析３０５に基づくインデントを含む。追加の処理が、表示制限のあるデバイスに表示されるカスケードされた出力に追加の手がかりを提供するために、使用され得る。たとえば、追加の文字または他の信号が、構成要素が追加の行に折り返すことを示すために、挿入され得る。これらの場合、水平変位は、折り返された構成要素に対して一貫したままである（たとえば、構成要素が位置４０で始まる場合、折り返されたセグメントも位置４０で始まり、それが継続であることを示すための視覚的なマーキング（たとえば、括弧、網掛けなど）を持つ）。

図４は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたテキスト出力４００の一例を示す。水平位置は、関連付けられるべき構成要素を示す。たとえば、動詞「ｌｅｆｔ」の位置付けは、カスケード４０５に示されているように、その主語が「ｔｈｅｊａｎｉｔｏｒ」である（たとえば「ｔｈｅｐｒｉｎｃｉｐａｌ」ではない）ことを示している。同様に、フレーズ「ｅｖｅｒｙｎｉｇｈｔ」の位置付けは、それが、たとえば「ｎｏｔｉｃｅｄ」ではなく、動詞「ｃｌｅａｎｅｄ」に伴っていることを示している。図４に示されている縦線は説明のためのものであり、テキスト出力の一部ではないことに留意されたい。

水平変位が同様に、カスケード４１０に示されるように、行列節に対して最初の節をインデントすることによって、事前配置された従属節を知らせるために使用される。この技法は、文の中心情報、および最初の節の従属状態に関する明確な手がかりをもたらす。

別の例示的実施形態では、カスケーディング・プロセスは、依存関係パーサによって与えられる特有の構文依存関係を参照することなく、Ｘバー理論解析からの指定子位置および補語位置を用いてインデントを決定する。これは、指定子および補語の位置自体が文の構成要素間の一般的な依存関係を指定していることを活用している。しかし、２つのタイプの依存関係（たとえば、指定詞および補語など）に限定された実施形態では、文内の言語構造をキューイングするために利用可能な情報はより限定される。

別の例示的実施形態では、カスケーディング・プロセスは、関連するインデント量を含む、ユーザから供給され得る特定の依存関係のリストに応じてインデントを決定する。たとえば、ユーザは、直接目的語は４スペースでインデントされるが間接目的語は２スペースしかインデントされないことを好むことがある。１つの実施形態では、これらのユーザ指定は、特定の文法関係を総合授業計画の一部として強調することを望むことがある教師または個人教師によって行われる。このような指定は、個々別々に、または依存関係タイプのカテゴリに対して行われ得る。たとえば、ユーザは、コア・アーギュメントが、非コア修飾語よりも多くインデントされるべきであることを指定することができる。構成要素カスケーディング・オペレーションは、構成要素が依存関係タイプに基づいてインデントされるかどうかを決定し、ユーザ・プリファレンスは、どれだけのインデントがフォーマット設定に反映されるかを決定することに留意されたい。ユーザ・プリファレンスは、加えて、フォントタイプ、フォント・サイズ、フォント色、行長さなどの、カスケードの表示属性に影響を及ぼし得る。

例示的実施形態では、カスケードは、表示デバイスの制約に適合するように自動的に調整する。たとえば、コンピュータ画面は、タブレットまたは電話の表示よりも長い行長を許容することができる。行の長さが、ＸＰ間の改行を許容するにはあまりに短い場合、改行がＸ’レベルで行われ、追加の水平変位がない。したがって、水平変位に関連する視覚的手がかりは、新たな言語依存関係の開始を知らせるために確保される。追加のキューイング（たとえば、括弧、フォント・スタイル、色）が、構成要素の容易な識別を維持するために追加されてよい。

図５は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、指示的にリンクされているフレーズどうしを識別するように拡張されているカスケードされたテキスト出力の一例５００を示す。構成要素カスケーディング・オペレーションは、構成要素間の構文関係および意味関係についてカスケードを定義する。例示的実施形態では、テキストを参照語および先行詞に解析する別のＮＬＰサービスが、言語論的に駆動される自動化されたテキスト・フォーマット設定を、参照キューイングを含むように拡張するために使用され、それにより、視覚的手がかり（たとえば、色など）が、語または構成要素間の参照関係（たとえば、図８に示される）を識別するようになる。これは、代名詞参照語（図８でアンダーラインで示されている）と同じフォント特性を持つ先行詞を提示することを伴う。参照キューイングは、図５および図８のものなどの文において、カスケード５０５に示される「ｏｃｃｕｐｉｅｄｈｅｒｓｅｌｆ（自分自身を占有した）」人物が「ｔｈｅｐｅｒｆｏｒｍｅｒ（演奏者）」であるか「ｔｈｅｓｏｌｏｉｓｔ（ソリスト）」であるかに関する混乱を防止するのに役立つ。構成要素レベルでの参照キューイングの例（たとえば、フレーズ「ｍｅａｓｕｒｅｔｈｅｒｏｏｍ（部屋を測定する）」全体が「ｉｔ（それ）」の先行詞である）が、カスケード５１０に示されている。参照キューイング・オペレーションが、限定ではなく例として、ＳｔａｎｆｏｒｄＣｏｒｅＮＬＰまたはＡｌｌｅｎＮＬＰなどの、自動化された同一指示解決パーサ（ＮＬＰサービス）の出力に基づいて、実施される。同一指示解決は、テキスト中の同じエンティティを指し示す表現を見つける。この情報は、カスケード・ジェネレータへの入力として機能する言語モデルに組み込まれる。同一指示情報はまた、訓練された言語技術者によって産出されるような、手動コード化ルールまたはフォーマット設定によって、または非ルールベースの確率的推論エンジンによる自動化された処理によって表示され得る。

同一指示手がかりを示すためのカスケードの増大が、限定ではなく例として、構成要素または依存関係に基づくもの以外の言語特性がカスケード中でどのように知らされ得るかを示す。たとえば、同一指示パーサは、テキスト中の様々な言語関係を示す分析を産出する代替のＮＬＰサービスに置き換えられてよい。例は、名前付きエンティティ認識、感情分析、意味役割ラベリング、テキスト含意、トピック追跡、韻律分析を、これらに限定されないが含む。これらは、ルールベースの、または確率的な推論システムとして実施され得る。これらのＮＬＰサービスの出力は、言語関係を強調するようにしてカスケードの表示特性を修飾するために使用されることが可能な情報をもたらす。これらの修飾は、文内または文間で行われてよく、読者または学習者が読むときに一貫性を維持するのを助ける手がかりとして役立つ。

本明細書に記述されているように、カスケードされたテキスト表示を生成するためのシステムおよび方法の様々な実施形態が提供される。図６Ａに示された実施形態６００では、テキスト部分６０５は、ＮＬＰサービス６１０からの出力に基づくテキスト部分６０５から決定された文法情報に基づいて、複数の従属セグメントにセグメント化される。これらのそれぞれは、コンスティテュエンシ・パーサ６２０によって定義された完全な構成要素であり、構成要素の先頭と関連付けられている依存関係パーサ６２５によって決定された依存関係役割を有する。１つの実施形態では、構成要素は、その最大射影（ＸＰ）によって識別され、その射影（Ｘ）の先頭と関連付けられた依存関係に割り当てられる。たとえば、構成要素「ｔｈｅｐｒｉｎｃｉｐａｌ（校長）」は、それと関連付けられた２つの依存関係（ｄｅｔおよびｎｓｕｂｊ）を有するが、完全なＮＰ構成要素は、カスケード・ジェネレータによる解釈のために、ｎｓｕｂｊとして割り当てられる。

図６Ｂは、一実施形態による、カスケード・ジェネレータ６３５によって提供された、言語学的に駆動される自動化されたテキスト・フォーマット設定によってそれぞれのセグメントに関して指定されている階層的な位置に応じて、カスケード６３０内のインデントを含むテキスト部分６０５を示す。

図７は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための環境７００およびシステム７０５の一例のブロック図である。図７は、図１～図５、図６Ａ、および図６Ｂに示された特徴を提示し得る。環境は、クラウドベースの配信システム（または他のコンピューティング・プラットフォーム（たとえば、仮想コンピューティング・インフラストラクチャ、ｓｏｆｔｗａｒｅ－ａｓ－ａ－ｓｅｒｖｉｃｅ（ＳａａＳ）、モノのインターネット（ＩｏＴ）ネットワークなど））であってよいシステム７０５を含み得る。システムは、システム７０５をホストするクラウド・サービス・プロバイダのコンピューティング容量およびストレージ容量などのインフラストラクチャ・サービスを提供する、様々なバックエンド・システム７１０の中に分散していてよい。システム７０５は、（たとえば、有線ネットワーク、無線ネットワーク、セルラ・ネットワーク、共有バスなどを介して）ネットワーク７２０（たとえば、インターネット、プライベート・ネットワーク、パブリック・ネットワークなど）に通信可能に結合され得る。エンドユーザ・コンピューティング・デバイス７１５は、ネットワークに通信可能に接続されてよく、システム７０５への接続を確立することができる。エンドユーザデバイスは、ウェブ・ブラウザ、ダウンロード・アプリケーション、オンデマンド・アプリケーションなどを介してシステム７０５と通信することができる。一例では、システムのコンポーネントは、システム７０５の特徴へのオフラインアクセスを提供するインストール・アプリケーションを介した、エンドユーザ・コンピューティング・デバイス７１５への配信のために用意され得る。

システム７０５は、エンドユーザ・コンピューティング・デバイス７１５を介して直接オンライン接続を提供することができ、パッケージサービスのセットをエンドユーザ・コンピューティング・デバイス７１５のエンドユーザ・アプリケーションに配信することができ、このエンドユーザ・コンピューティング・デバイス７１５は、インターネット接続なしでオフライン動作し、また、インターネットを通じてクラウドサービス（または他のコンピューティング・プラットフォーム）に（たとえば、プラグインなどによって）接続する、エンドユーザ・アプリケーションとのハイブリッドとして動作する。ハイブリッド・モードは、ユーザが接続性にかかわらずカスケード・フォーマットで読み出すことを可能にするが、システム７０５を改善するためのデータをなお提供する。エンドユーザ・アプリケーションは、いくつかの形で配布され得る。たとえば、ブラウザ・プラグインおよび拡張は、ユーザが、カスケーディング・フォーマットを使用してウェブ上およびアプリケーションで読むテキストのフォーマット設定を変更することを可能にすることができる。別の例では、エンドユーザ・アプリケーションがメニュー・バー、クリップ・ボード、またはテキスト・エディタに統合されることがあり、それにより、ユーザがマウスまたはホットキーを使用してテキストを強調表示するとウィンドウが、カスケード・フォーマットを使用してレンダリングされた、選択されたテキストとともに提示され得る。別の例では、エンドユーザ・アプリケーションは、入力ソースとしてＰＤＦファイルを入力することができるとともにユーザに対する表示のためのカスケード・フォーマットを出力することができる、ポータブル・ドキュメント・ファイル（ＰＤＦ）リーダであってもよい。さらに別の例では、エンドユーザ・アプリケーションは、拡張画像エンハンスメントであってもよく、これは、カメラからのライブ・ビューを変換するとともに、光学式文字認識（ＯＣＲ）を、リアルタイムで画像をテキストに変換してレイアウトをカスケード・フォーマットでレンダリングするために適用する。バージョン管理サービス７５５は、アプリケーション・バージョンを追跡することができ、また、エンドユーザ・コンピューティング・デバイス７１５上で実行されるアプリケーションに提供されるポータブル・コンポーネントを、インターネットに接続されているときに定期的に更新することができる。

例示的実施形態によれば、エンドユーザ・コンピューティング・デバイス７１５はＯＣＲ機能を含み、これはユーザが、（たとえば、自分の携帯電話の）カメラでテキストの画像を取り込み、それを（たとえば、図１８に示されるように）カスケード・フォーマット設定されたテキストに即座に変換することを可能にする。一実施形態によれば、エンドユーザ・コンピューティング・デバイス７１５は、スマートグラス、スマート・コンタクトレンズなどのユーザ着用デバイスを含むか装着しており、ユーザに見られたテキストの入力は、理解の向上のために、カスケードされたフォーマットに変換される。このようにして、テキストは、ユーザのパーソナル視覚デバイスによってリアルタイムで変換され得る。別の例示的実施形態によれば、エンドユーザ・コンピューティング・デバイス７１５は、カスケード・フォーマットの拡張ビデオ（ＡＶ）、拡張現実（ＡＲ）、および仮想現実（ＶＲ）を提供し、カスケード・フォーマット設定の適用が、ユーザがテキストをカスケード・フォーマットで見ることを可能にするためのＡＶヘッドセットおよびＶＲヘッドセットと、眼鏡と、コンタクトレンズまたは移植可能レンズとを含む、ユーザ着用視覚表示デバイス内で完了され得る。

本明細書で論じられているシステムおよび方法は、テキストを処理してカスケード・フォーマット設定に変換することによってテキストがデバイス上でレンダリングされる、様々な環境に適用可能である。画面へのテキストの表示は、レンダリングに関する命令を必要とし、カスケード命令セットは、コマンド・シーケンスに挿入され得る。これは、あるドキュメント・タイプ（たとえば、ＰＤＦなど）と、レンダリング・エンジンが埋め込まれているシステムとに適用されることがあり、この場合、レンダリング・エンジンへの呼び出しがインターセプトされ、カスケードされたフォーマット設定命令が挿入され得る。一例では、ユーザは、（たとえば、メニュー上、製品ラベル上などの）コンテンツにアクセスするための、バーコード、クイック・レスポンス（ＱＲ）コード、または他の機構をスキャンすることができ、そのコンテンツは、カスケードされたフォーマットで返され得る。

システム７０５は、様々なサービス・コンポーネントを含むことができ、これらのコンポーネントは、カスケード・ジェネレータ７２５、自然言語処理（ＮＬＰ）サービス７３０、マシン学習サービス７３５、分析性サービス７４０、ユーザ・プロファイル・サービス７４５、アクセス制御サービス７５０、およびバージョン制御サービス７５５を含む、バックエンド・システム７１０の様々なコンピューティング・デバイス上で全体的または部分的に実行されることが可能である。カスケード・ジェネレータ７２５、ＮＬＰサービス７３０、マシン学習サービス７３５、分析性サービス７４０、ユーザ・プロファイル・サービス７４５、アクセス制御サービス７５０、およびバージョン制御サービス７５５は、外部システムとの間で、および他のサービスとの間でデータを入出力できるアプリケーション・プログラミング・インターフェース（ＡＰＩ）命令を含む、命令を含み得る。

システム７０５は、様々なモードで動作することができる。すなわち、エンドユーザ（たとえば、読者など）が、カスケードされたテキストを生成するためのオフライン・コンポーネントのコピーを有するローカル・クライアントを使用して、テキストをローカル・クライアント上で変換し、エンドユーザは、テキストをシステム７０５へ送出して標準テキストを、カスケードされたテキストに変換することができ、発行者が、テキストをシステム７０５へ送出してテキストを、カスケードされたフォーマットに変換することができ、発行者は、システム７０５のオフライン・コンポーネント・セットを使用して、そのテキストをカスケード・フォーマットに変換することができ、また発行者は、システム７０５を使用して、従来のブロック・フォーマット設定またはカスケードされたフォーマット設定でテキストを発行することができる。

カスケード・ジェネレータ７２５は、テキスト入力を受け取り、テキストをＮＬＰサービス７３０パーサへ送って言語データを生成することができる。言語データは、限定ではなく例として、品詞、語レンマ、構成要素解析木、離散構成要素のチャート、名前付きエンティティのリスト、依存関係グラフ、依存関係のリスト、リンクされた同一指示表、リンクされたトピック・リスト、名前付きエンティティのリスト、感情分析の出力、意味役割ラベル、含意参照信頼度統計を含み得る。したがって、所与のテキストについて、言語解析は、それぞれのトークンについての豊富な言語情報のセットを含む語の内訳を返すことができる。この情報は、別々の文または別々の段落において現れる語または構成要素の間の関係のリストを含み得る。

カスケード・ジェネレータ７２５は、コンスティテュエンシ・データおよび依存関係データを使用して作成されたマシン学習サービス７３５によって生成された言語モデルに対し、カスケード・フォーマット設定ルールおよびアルゴリズムを適用して確率的カスケード出力を生成することができる。

図８は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケード・フォーマットへの言語的修正を受信するための環境８００の一例を示す。ユーザ・インターフェース８０５およびプラグイン８１０は、図１Ａ、図１Ｂ、および図２～図７に記述されている特徴を提供することができる。ユーザ・インターフェース８０５およびプラグイン８１０は、図７に記述されているシステム７０５に接続することができる。システム７０５は、テキストを解析してテキスト中の関連する用語を特定できる、同一指示パーサ８１０を含み得る。たとえば、ユーザ・インターフェース８０５に表示されているカスケードされた文中の「Ｔｈｅｐｅｒｆｏｒｍｅｒ（演奏者）」は、文の他の部分では代名詞によって指し示され得る。「Ｔｈｅｐｅｒｆｏｒｍｅｒ（演奏者）」および「ｈｅｒｓｅｌｆ（彼女自身）」は、これらが同じエンティティを指し示していることを示すために、強調表示されることが可能である（たとえば、アンダーラインが引かれる、色で強調表示される、他のテキストと対照的な色で表示される、イタリック体にされるなど）。一例では、同一指示パーサ８１０は、テキスト中の言語関係を示す分析を産出する代替のＮＬＰサービスに置き換えられてよい。ユーザが特徴をオンまたはオフできるようにする、モード選択ボタン８１５が設けられることが可能である。たとえば、カスケード・モードが有効になっているときに、テキストがカスケード・フォーマットで表示されることが可能であり、同一指示追跡が有効になっているときに、関連用語が強調表示されることが可能であるなどである。

図９は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、文どうしにわたる同一指示追跡のためのシステム９００の一例を示す。例９００は、図１～図５、図６Ａ、図６Ｂ、および図７～図８に記述されている特徴を提供することができる。

システム９００は、クラウドベースの配信システム７０５を含むことができ、この配信システムは、同一指示パーサ９１０、コンスティテュエンシ・パーサ９１５、依存関係パーサ９２０、およびトピック・トラッカ９２５を含み得る。同一指示パーサ９１０、コンスティテュエンシ・パーサ９１５、依存関係パーサ９２０、およびトピック・トラッカ９２５は、テキストの特定のピースの間の関係のインジケーションを提供することができる。これらのシステムは、カスケード・ジェネレータ（たとえば、図７に記述されているカスケード・ジェネレータ７２５など）と連携して働いて、カスケードされたテキストを、視覚的な手がかりによって（たとえば、色などを使用して）示されるトピックおよび代名詞指示語とともにユーザ・インターフェース９０５に対して出力することができる。

図１０は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステム１０００のデータフロー図を示す。システム１０００は、図１～図５、図６Ａ、図６Ｂ、および図９に記述されている特徴を提供することができる。

ユーザは、テキストを含む入力１００５を提供することができる。一例では、テキストは、入力されたテキスト、ＯＣＲ処理を使用して取り込まれたテキスト、アプリケーションまたはブラウザ・プラグインを介して取り込まれたテキスト、ハイパーテキスト・マークアップ言語（ＨＴＭＬ）などとして提供され得る。テキストはまた、フォント・サイズまたはフォント・スタイルが強調された見出しを含む図、表、グラフ、写真および視覚的に強調されたテキストを含む、視覚的コンテンツを含み得る。入力はまた、たとえば、ユーザがテキスト文字列「Ｔｈｅｐａｔｉｅｎｔｗｈｏｔｈｅｇｉｒｌｌｉｋｅｄｗａｓｃｏｍｉｎｇｔｏｄａｙ．（その女の子が好きだった患者が今日来ることになっていた。）」をタイプ入力できるように、ユーザから直接来ることもある。入力プロセッサ１０１０は、テキスト・コンテンツを、フォーマット設定および特殊文字を除去し、段落の場合には、テキストを個々の文に分割するように処理することができる。

処理されたテキストを含む処理された入力１０１５は、入力プロセッサ１０１０によってＮＬＰサービス１０２０のセットへ送られ得る。一実施形態によれば、２つの主要なＮＬＰサービスは、コンスティテュエンシ・パーサ１０２５および依存関係パーサ１０３５である。文の構成要素は、文の言語学的に定義された部分であり、語、句または節と一致し得る。構成要素は、階層的に編成され、フレーズ構造ルールによって（たとえば、図１などに示されるように）定義される。コンスティテュエンシ・パーサ１０２５は、入力テキストを処理し、解析木（たとえば、コンスティテュエンシ・パース）、離散構成要素のチャート、品詞、語レンマおよびメタデータを含むコンスティテュエンシ・データ１０３０を生成し、データ処理部１０４５へ送ることができる。

たとえば、コンスティテュエンシ・パース１０２５は、テーブル１に示されるように「Ｔｈｅｐａｔｉｅｎｔｗｈｏｔｈｅｇｉｒｌｌｉｋｅｄｗａｓｃｏｍｉｎｇｔｏｄａｙ．」のコンスティテュエンシ・データ１０３０を生成することができる。

処理されたテキストを含む、処理された入力１０１５は、入力プロセッサによってＮＬＰサービス１０２０の依存関係パーサ１０３５へ送られ得る。依存関係パーサ１０３５は、入力テキストを処理できるとともに語間の依存関係についてのデータを提供する依存関係データ１０４０を生成し、データ処理器１０４５へ送ることができる。依存関係データ１０４０は、付加的な階層埋め込み（たとえば図３）、トークン、依存関係ラベル、およびメタデータとともにルート・ノートの下に埋め込まれた従属子を記述する、解析木または有向グラフを含み得る。たとえば、依存関係パーサ１０３５は、テーブル３に示されるように「Ｔｈｅｐａｔｉｅｎｔｗｈｏｔｈｅｇｉｒｌｌｉｋｅｄｗａｓｃｏｍｉｎｇｔｏｄａｙ．」の依存関係データ１０４０を生成することができる。

別の例では、依存関係解析部１０３５は、テーブル２に示されるように「Ｔｈｅｐａｔｉｅｎｔｗｈｏｔｈｅｇｉｒｌｌｉｋｅｄｗａｓｃｏｍｉｎｇｔｏｄａｙ．」の依存関係データ１０４０を生成することができる。

データ・プロセッサ１０４５は、コンスティテュエンシ・データ１０３０および依存関係データ１０４０と、他の任意のＮＬＰサービスからの情報とを用いて、モデル１０５０を生成することができる。モデル１０５０は、品詞、語レンマ、構成要素解析木、離散構成要素のチャート、名前付きエンティティのリスト、依存関係グラフ、依存関係のリスト、リンクされた同一指示テーブル、リンクされたトピック・リスト、感情分析の出力、意味役割ラベル、含意参照信頼度統計を含み得る。

一例では、データ・プロセッサ１０４５は、テーブル４に示されるように「Ｔｈｅｐａｔｉｅｎｔｗｈｏｔｈｅｇｉｒｌｌｉｋｅｄｗａｓｃｏｍｉｎｇｔｏｄａｙ．」のモデル１０５０を生成することができる。

モデル１０５０は、カスケード・ジェネレータ１０５５によって処理され得る。カスケード・ジェネレータ１０５５は、カスケード・ルールをモデル１０５０に対して適用してカスケード出力１０６０を生成することができる。カスケード・ルールは、解析出力における特有の構成要素または依存関係の検出に基づいた実行のためにトリガされるオペレーションである。カスケード・ルールによって実行されるオペレーションは、改行が出力に挿入されるべきかどうかと、テキストの行のインデントレベルと、ユーザのための手がかりを作成する他の出力生成オペレーションとを決定することを含み得る。一例では、カスケード・ルールは、表示デバイスに表示されるテキスト出力のインデントおよび改行の配置を識別するデータを含む、テキスト・モデルを生成するために使用され得る。カスケード・ジェネレータ１０５５は、カスケードされたテキストおよびメタデータを、カスケードされた出力１０６０中で返すことができる。たとえば、カスケード・ジェネレータ１０５５は、「ｔｈｅｐａｔｉｅｎｔｗｈｏｔｈｅｇｉｒｌｌｉｋｅｄｗａｓｃｏｍｉｎｇ．」という文に対して、テーブル５に示されるようなカスケード・ルールを使用して、カスケードされた出力１０６０を生成することができる。

別の例では、カスケード・ジェネレータ１０５５は、テーブル６に示されるカスケード・ルールを使用して、カスケードされた出力１０６０を生成することができる。

カスケードされたテキストのその他の例がテーブル７に示されている。

図１１は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法１１００の一例を示す。方法１１００は、図１～図５、図６Ａ、図６Ｂ、図７、および図１０に記述されている特徴を提供することができる。

オペレーション１１０５で、テキスト部分がインターフェースから取得され得る。一例では、インターフェースは、物理的キーボード、ソフトキーボード、テキスト音声ディクテーション・インターフェース、ネットワーク・インターフェース、またはディスク・コントローラ・インターフェースであってよい。一例では、テキスト部分は、リッチ・テキスト、プレーン・テキスト、ハイパーテキスト・マークアップ言語、拡張可能マークアップ言語、または情報交換用米国標準コードのグループから選択された、一般的なフォーマットの一連のテキストであってよい。

オペレーション１１１０で、テキスト部分は複数の従属セグメントにセグメント化され得る。セグメンテーションは、コンスティテュエンシ・パーサおよび依存関係パーサを使用して、テキスト部分の評価に基づくことができる。一例では、コンスティテュエンシ・パーサは、依存関係パーサによって識別された特定の依存関係役割を保持する完全なセグメントを識別する。

オペレーション１１１５で、複数の従属セグメントは、それぞれのセグメントの階層的な位置を記述するキューイング・ルールに従って符号化され得る。一例では、テキスト部分のテキスト・モデルが、コンスティテュエンシ・パーサおよび依存関係パーサの出力と、さらに他のＮＬＰサービスとを使用して構築されることが可能であり、カスケード・ルールがテキスト・モデルに適用されて、符号化されたセグメントが生成され得る。一例では、テキスト・モデルは、品詞、レンマ、コンスティテュエンシ・チャート、解析木、およびテキスト中のそれぞれの語の依存関係リストを含むデータ構造とすることができる。符号化されたセグメントは、テキストと、従属セグメントの階層的な位置を定義するメタデータを含み得る。一例では、従属セグメントは文からのセグメントであり得る。一例では、階層的な位置は、ユーザ・インターフェースにおける、符号化されたセグメントの、従属セグメントの別の１つに対するオフセットに対応し得る。一例では、符号化されたセグメントは、改行データおよびインデント・データを含み得る。一例では、テキスト部分のセグメンテーションは、テキスト部分を別のテキスト部分に付け加えること、テキスト部分のインデントを修正すること、またはテキスト部分の前に改行を挿入することを含み得る。

オペレーション１１２０で、符号化された複数の従属セグメントが、ユーザ・プリファレンスに応じてユーザ・インターフェースに表示され得る。一例では、従属セグメントは、ＪａｖａＳｃｒｉｐｔ（登録商標）ＯｂｊｅｃｔＮｏｔａｔｉｏｎ、拡張可能マークアップ言語、または情報交換用米国標準コードを使用して符号化され得る。一例では、従属セグメントを符号化することは、いくつかの文の従属セグメントを連結してテキスト・コンポジションを作成することを含み得る。一例では、結合された文は、ファイルに書き込まれること、クラウド・プロトコルを介して伝達されること、または出力デバイスに直接表示されることが可能である。

一例では、符号化されたセグメントが受け取られ得る。符号化されたセグメントが解析されて、それぞれのテキストと、符号化されたセグメントの階層的な位置とが取り出され、その位置に応じて、テキストが表示されることが可能である。一例では、テキストの表示は、位置に応じて、テキストの一部分のオフセットの修正と、テキストの一部分の文字高さの調整とを含むことができる。一例では、オフセットは、左から右への言語では左から、右から左への言語では右からとすることができる。

一例では、テキストの表示は、位置に応じて、インデントの付け加え、修正、および改行の修正を、言語構造に基づくテキストの位置配置に影響を及ぼすことなく含み得る。
図１２は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法１２００の一例を示す。方法１２００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１１に記述されている特徴を提供することができる。

オペレーション１２０５で、入力文の１つまたは複数の構成要素を表すデータは、コンスティテュエンシ・パーサ（たとえば、図１０に記述されているコンスティテュエンシ・パーサ１０２５など）から受け取られてよい。１つまたは複数の構成要素を表すデータは、コンスティテュエンシ・パーサを使用して入力文を評価することに基づいて生成されることが可能である。一例では、コンスティテュエンシ・パーサは、文の構成要素を識別することができる。一例では、構成要素は、階層構造内で単一ユニットとして機能する語または語のグループであり得る。

オペレーション１２１０で、入力文の語間の関係を表すデータが、依存関係パーサ（たとえば、図１０に記述されている依存関係パーサ１０３５など）から受け取られ得る。この関係は、文構造に基づいていてよく、依存関係パーサを使用して入力文を評価することに基づいて導き出され得る。一例では、依存関係は、１対１の対応とすることができ、それにより、入力文の１つの要素に対して、その要素に対応する入力文の構造内に正確に１つのノードがあることになる。

オペレーション１２１５で、テキスト・モデルは、（図６Ａなどに示された）構成要素および依存関係を使用して構築されることが可能である（たとえば、図１０に記述されている入力プロセッサ１０１５などによって）。一例では、テキスト・モデルは、限定ではなく例として、同一指示情報、感情追跡、名前付きエンティティ・リスト、トピック追跡、確率的推論評価、韻律輪郭、および意味分析を含む、追加のＮＬＰサービスによって産出された言語特徴によってさらに精緻化されることが可能である。

オペレーション１２２０で、カスケード・ルールは、（たとえば、図１０に記述されているカスケード・ジェネレータ１０５５などによって）テキスト・モデルに対して適用されて、カスケードされたテキスト・データ構造を生成することができる。一例では、カスケードされたテキスト・データ構造は、テキストと、テキストの表示パラメータを指定するメタデータとを備える。一例では、カスケード・テキスト・データ構造は、スキーマ（たとえば、ＸＭＬスキーマなど）に従って編成されたファイル（たとえば、拡張可能マークアップ言語（ＸＭＬ）ファイルなど）を備える。一例では、スキーマは、ファイル内のコンポーネントおよびコンポーネントの配置についての仕様を備える。一例では、テキスト・モデルは、入力文に含まれる語の構成要素および依存関係を記述するデータ構造とすることができる。一例では、テキスト・モデルは、テキストの解析木、品詞、トークン、構成要素チャート、および依存関係を含むデータ構造とすることができる。一例では、カスケード・ルールは、構成要素および依存関係に対応して定義された改行およびインデントを作成する、フォーマット作成ルールを備える。

一例では、カスケードされたテキストと関連付けられているメタデータが生成され得る。別の例では、カスケードされたテキストは、表示デバイスに表示するための改行およびインデントを含む、フォーマット設定されたテキスト・セグメントのセットを備える。いくつかの例では、テキストの入力文は、ユーザによって指定されたソースから受け取られてよい。

段落または文の集まりの例では、テキストは、それがコンスティテュエンシ・パーサまたは依存関係パーサに提供される前にテキストを文のリストに分割するように処理されることが可能である。それぞれの文は、コンスティテュエンシ・パーサ１２０５および依存関係パーサ１２１０によって個別に処理されてよい。一例では、方法１２００は、テキスト中のそれぞれの文に対して適用される。たとえば、文は、それぞれが別々にカスケードされて、しかしユーザ・プリファレンスに応じて、順次に表示されてよい。いくつかの例では、文は、インデント以外の視覚的な手がかり（たとえば、背景陰影、専用のマーカなど）によって、段落にグループ分けされてもよい。

図１３は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法１３００の一例を示す。方法１３００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１２に記述されている特徴を提供することができる。

テキストのモデルは、テキストを解析することによって取得された依存関係データおよびコンスティテュエンシ・データから（たとえば、図１０に記述されている入力プロセッサ１０１５などによって）構築され得る（たとえば、オペレーション１３０５で）。カスケード・データ構造は、テキストのモデルに対して（たとえば、図１０に記述されているカスケード・ジェネレータ１０５５などによって）適用されるカスケード・ルールに従って生成されてよい（たとえば、オペレーション１３１０で）。テキストの文は、カスケードされたテキスト・データ構造に応じて表示され得る（たとえば、オペレーション１３１５で）。データ構造は、テキストの水平配置および垂直配置を表示のために指定することができる。

図１４は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにマシン学習分類子を使用してテキストをカスケードするための方法１４００の一例を示す。方法１４００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１３に記述されている特徴を提供することができる。

オペレーション１４０５で、テキスト部分がインターフェースから取得される。たとえば、テキストは、入力デバイスを介してユーザによって入力されてよく、また、ローカルまたはリモートのテキスト・ソース（たとえば、ファイル、発行者データ・ソースなど）などから取得されてよい。オペレーション１４１０で、テキスト部分は、言語エンコーディングを取得するために、ＮＬＰサービス（たとえば、図７に記述されているＮＬＰサービス７３０など）を通して処理される。たとえば、テキストは、限定ではなく例として、コンスティテュエンシ・パーサ、依存関係パーサ、同一指示パーサなどを含み得る様々なパーサを使用して解析されて、構成要素、依存関係、同一指示などが識別され得る。オペレーション１４１５で、マシン学習（ＭＬ）分類子が言語エンコーディングに対して適用されてカスケードが決定される（たとえば、図７に記述されているカスケード・ジェネレータ７２５などによって）。たとえば、マシン学習分類子は、パーサによって識別された情報（たとえば、パーサによって識別された言語情報とともに符号化されたテキストの一部分など）を用いて、テキストの一部分をフォーマット設定（たとえば、改行、インデントなど）のために分類することができる。オペレーション１４２０で、カスケードは、ユーザ・プリファレンスに応じてユーザ・インターフェースに表示される。たとえば、カスケードは、コンピューティング・デバイス（たとえば、スタンドアロン・コンピュータ、モバイル・デバイス、タブレットなど）の画面に、アプリケーション・ウィンドウ、ウェブ・ブラウザ、テキスト・エディタなどで表示され得る。

図１５は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにテキストをカスケードするようにマシン学習分類子をトレーニングするための方法１５００の一例を示す。方法１５００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１４に記述されている特徴を提供することができる。

図７に示されたマシン学習サービス７３５などのマシン学習サービスは、人間の労力によって手作業で定義された、またはカスケード・ジェネレータ（たとえば、図１０で論じられているカスケード・ジェネレータ１０５５など）によって定義されたロジックおよびルールを使用することの別法として、出力（たとえば、図１０に記述されている出力１０６０など）をカスケードするためにカスケードの例を用いてトレーニングされる。

オペレーション１５０５で、カスケードされたテキストのコーパスが取得され得る。コーパスは、トレーニング・セットとテスト・セットに分離される。オペレーション１５１０で、コーパスはサブセットに分割され得る。たとえば、コーパスの大部分がトレーニング用に、残りの部分が検証用に指定される。オペレーション１５１５で、確率的マシン学習法（たとえば、再帰的特徴量削減を用いるサポート・ベクター・マシンなど）が適用されて、サブセットの一部分（たとえば、トレーニング・セットなど）のパターン分類子のセットが生成され得る。交差検証手順が実行されて、テスト・セット内の文のカスケードされていない例に対してパターン分類子を適用することによって、パターン分類子のセットが評価される。オペレーション１５２０で、パターン分類子のセットが、サブセットの残りの部分におけるカスケードされたテキストのコーパスの、カスケードされていないバージョンに適用されて、カスケードされたテキストの新たなセットが生成され得る。分類子セットによって生成されたカスケードの妥当性が、既知のカスケードに関して評価され得る。オペレーション１５２５で、カスケードされたテキストの新しいセットの妥当性は、精度、感度、および特異度に応じて、テスト・セットの既知のカスケードに対して評価され得る。たとえば、構成要素および依存関係がマークされているカスケードされたテキストのコーパスは、トレーニング・セットとして機能して分類子機能が産出され、この機能は、（トレーニング・セット中にない）特定の新規文の適切なカスケードをその言語属性に基づいて生成するために使用され得る。限定ではなく例として、分類が、再帰的特徴量削減を用いる線形カーネル・サポート・ベクター・マシンを使用して実行され得る（ＳＶＭ－ＲＦＥ；グヨン（Ｇｕｙｏｎ）ら、２００２年）。ＳＶＭ分類アルゴリズム（バプニク（Ｖａｐｎｉｋ）、１９９５年、１９９９年）は、幅広い適用例において使用されており、他の方法よりも良い精度を産出している（たとえば、アスリ（Ａｓｒｉ）ら、２０１６年、ファング（Ｈｕａｎｇ）ら、２００２年、ブラック（Ｂｌａｃｋ）ら、２０１５年）。ＳＶＭは、高次元特徴空間における２つのクラス間の最適な分離点（超平面）を識別することによって、超平面まわりのマージン幅が最大化されるように、また、誤分類誤差が最小化されるように、データをクラス（たとえば、カスケード・パターン）に分割する。超平面に最も近いケースはサポート・ベクトルと呼ばれ、これらはクラスを区別するための重要な識別子としての役割を果たす。交差検証（ＣＶ）手法が、分類モデルの汎化可能性を評価するために利用される（たとえば、アーロット（Ａｒｌｏｔ）およびセリッセ（Ｃｅｌｉｓｓｅ）、２０１０年、ジェームス（Ｊａｍｅｓ）、ウィッテン（Ｗｉｔｔｅｎ）、ヘイスティー（Ｈａｓｔｉｅ）およびチブシラニ（Ｔｉｂｓｈｉｒａｎｉ）、２０１３年）。これは、データをサブセットまたはフォールドに分割することを含み（１０個が、１０－ｆｏｌｄＣＶと呼ばれる規約に従って使用される）、９個が分類子の学習に使用され、差し出しセットが結果の分類子を検証するために使用される。

交差検証は、マルチレベルの手法を用いて我々の分類子の汎化可能性を、ｉ）ケース（文）、ｉｉ）特徴（たとえば、構文カテゴリまたは依存関係）、およびｉｉｉ）チューニングパラメータ（最適化）にわたって検証するために実行される。この方法は、オーバーフィッティングを防ぐとともに、分類子の複数の態様を同時に評価するために同じＣＶサブセットを使用することから生じ得る偏った分類精度の推定を回避する。それぞれのＣＶ手順の結果は、特殊性＝ＴＮ／（ＴＮ＋ＦＰ）、感度＝ＴＰ／（ＴＰ＋ＦＮ）、および精度＝（感度＋特殊性）／２の尺度を使用して評価され、ここで、ＴＮは真の負の数、ＦＰは偽の正の数、ＴＰは真の正の数、ＦＮは偽の負の数である。

様々なマシン学習技法が、ラベル付けされたデータまたはラベル付けされていないデータを使用してキュー挿入ポイントおよびキュー・フォーマット設定を認識するように分類子をトレーニングするために、使用され得ると理解されてよい。ラベル付けされたデータを観察し、そのデータから学習すること、またはトレーニング・カスケード・コーパスの位置構造に基づく固有のコーディングから学習することに一致しているマシン学習技法が、分類子のトレーニングを容易にするために使用されてよい。したがって、ＳＶＭが、トレーニング・プロセスにさらに情報を与えるための例として使用されているが、同様の機能を持つ代替のマシン学習技法も使用されてよいことを理解されたい。

このプロセスは、代替手段によって生成されたトレーニング・セットを用いて適用することができ、カスケード・ジェネレータには依存しない。たとえば、手作業でコード化されたトレーニングデータなどが、カスケードされたテキストを生成するようにＭＬモデルをトレーニングするために使用されてよい。

一例では、本明細書で言及されているＮＬＰサービスは、テキスト解析のためにＲＮＮを使用できる、事前にトレーニングされたＡＩモデル（たとえば、ＡＭＡＺＯＮ（登録商標）コンプリヘンドまたはスタンフォードパーサ（ＣｏｍｐｒｅｈｅｎｄｏｒＳｔａｎｆｏｒｄＰａｒｓｅｒ）（ｈｔｔｐｓ：／／ｎｌｐ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｓｏｆｔｗａｒｅ／ｌｅｘ－ｐａｒｓｅｒ．ｓｈｔｍｌ）、ＧＯＯＧＬＥ（登録商標）自然言語（ＮａｔｕｒａｌＬａｎｇｕａｇｅ）、またはＭＩＣＲＯＳＯＦＴ（登録商標）テキスト分析性（ＴｅｘｔＡｎａｌｙｔｉｃｓ）、アレンＮＬＰ（ＡｌｌｅｎＮＬＰ）、スタンザ（Ｓｔａｎｚａ）など）を使用することができる。より大量のデータが与えられると、ＲＮＮは、マッピングをフリー・テキスト入力から学習して、フリー・テキスト中に存在し得る予測エンティティ、キー・フレーズ、品詞、構成要素チャート、または依存関係などの出力を作成することができる。一例では、追加のマシン学習モデルが、キー・フレーズ・フォーマット・ルール、品詞フォーマット・ルール、エンティティ・フォーマット・ルール対、コンスティテュエンシ・データ、依存関係データなどをトレーニングデータとして使用してトレーニングされて、将来の解析オペレーションで使用され得る様々な品詞、キー・フレーズ、エンティティ、構成要素、依存関係などを識別するように学習することができる。別の例では、ユーザ・プリファレンスおよび品詞、キー・フレーズ、エンティティ対、コンスティテュエンシ、依存関係などが使用されて、マシン学習モデルが、様々な品詞、キー・フレーズ、およびエンティティに基づいてユーザ・プリファレンスを識別するようにトレーニングされ得る。様々なマシン学習モデルは、選択された出力に所与の入力が関連している統計的尤度に基づいて、出力を提供することができる。たとえば、様々な閾値層を含むリカレント・ニューラル・ネットワークが、出力をフィルタリングして出力選択の精度を高めるためのモデルを生成するのに使用されてよい。

カスケードされた出力は、様々な媒体でユーザに対して提示されてよい。たとえば、元のテキストとカスケードされたテキストとの横並び表示が、表示デバイスに表示されてよく、元のテキストが、カスケードされた出力で置換または修飾されてよい。

一例では、マシン学習が、カスケードされたテキストのコーパスを評価して、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケード・パターン分類子を学習するために使用され得る。パターン分類子は、カスケード・ルールのスタイルに応じて、テキスト・セグメントに含有される言語属性を知らせる実際の視覚的手がかり（たとえば、カスケーディング、インデント、改行、色など）を指定する。一例では、分類子は、テキスト・セグメントの語、品詞、構成要素グループ、または依存関係ラベルを評価し、カスケード・トレーニング・セット中に存在する視覚的手がかりと一致するフォーマット設定構造を産出することができる。一例では、分類子は、トレーニング・セット中のカスケードの形状および表示特性を直接評価し、トレーニング・セット中に存在する視覚的手がかりと一致するフォーマット設定構造を産出することができる。

図１６は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたフォーマットでテキストの文を表示するためのテキスト変形１６００の一例を示す。テキスト変換１６００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１５に記述されている機能を提供することができる。ブラウザ・ウィンドウ１６０５は、システム１６０５に接続されているプラグイン１６１０と、カスケード・モードがオフのときのカスケード・モード・ボタン１６１５とを含むことができ、標準テキスト１６２０は、ユーザがウェブサイトのテキストを閲覧するときに表示され得る。カスケード・モードがオンのとき、テキストは、カスケード・フォーマット１６２５でフォーマット設定され、表示され得る。

図１７は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、カスケードされたテキスト用にタグ付けされたハイパーテキスト・マークアップ言語（ＨＴＭＬ）コードの一例１７００を示す。例１７００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１６に記述されている特徴を提供することができる。ソース・テキスト１７０５は、テキスト・モデル１０５０（たとえば、品詞、キー・フレーズ、コンスティテュエンシ・データ、依存関係データなど）を産出するように、図７に記述されているＮＬＰサービス７３０によって処理され得る。この例は、ソース・テキスト１７０５をＨＴＭＬコードとして示しているが、テキストは、ＡＳＣＩＩ形式、ＸＭＬ形式、または他の様々な機械可読形式であってよい。図７に記述されているカスケード・ジェネレータ７２５は、テキスト・モデル１０５０に基づいてテキストに挿入された改行（たとえば、ＨＴＭＬコードで＜／ｂｒ＞タグなどのような）、およびインデント（たとえば、ｔｅｘｔ－ｉｎｄｅｎｔ：ｔａｇｉｎＨＴＭＬなどを使用して）を示す、タグ付き出力テキスト１７１５をレンダリングすることができる。

カスケード・ジェネレータ７２５は、構成要素および依存関係、または他の言語データに関して本明細書に記述されているような複数の機能について、いくつかの呼び出しをＮＬＰサービス７３０に対して行うことができる。１つの実施形態では、これらのそれぞれが、別個の呼び出し／機能であり、組み合わされたときに、カスケードされたテキストを生成するために使用されるべきタグのセットを提供する。
他の実施形態
図７の記述に戻ると、１つの例示的実施形態によれば、キー・フレーズ、構成要素、依存関係などが、ＮＬＰサービス７３０によって確率的に、計算言語学を使用して決定され得る。カスケード・ジェネレータ７２５によって生成されたカスケーディング・テキストは、読解を改善することができる。一例示的実施形態によれば、文中の「誰が」「いつ」「どこで」「何を」の情報を記述する構成要素は、改行および／またはインデントによって分離されて、カスケードされたテキスト・フォーマットが達成される。カスケード・ジェネレータ７２５は、依存関係などにリンクされている構成要素を使用して、文の「誰が」「いつ」「どこで」「何を」を決定する。たとえば、カスケード・ジェネレータ７２５によって挿入されるインデントは、ＮＬＰサービス７３０によって通知された文コンスティテュエンシ階層に基づいている。

カスケード・フォーマット設定の継続的改善は、マシン学習サービス７３５によるマシン学習技法を含む人工知能を使うことによって、達成され得る。マシン学習サービス７３５との間の入力／出力は、能動的および受動的に処理され得る。たとえば、マシン学習サービス７３５は、２人のユーザが、人物Ａと人物Ｂの間でわずかに異なるカスケード・フォーマットで同じ資料を読んでいる可能性がある例において、能動的マシン学習手法のもとで動作することができる。ユーザによる資料の読解は、評価によって追跡されることが可能であり、マシン学習サービス７３５は、カスケード・ジェネレータ７２５によって使用されて経時的に表示特性を修正できる出力を生成することができる。この手法は、システム７０５が、規模および使用法によって改善することを可能にする。マシン学習サービス７３５は、受動モードで動作して、読む行動のような属性を明示的な評価なしで測定することができる。たとえば、分析性サービス７４０は、読者理解度を示す出力を生成するのに（単独で、および組み合わされたときに）使用されてよいデータを、ユーザが評価を受けなくても収集することができる。カスケード・フォーマット設定を改良するために評価され得るデータの一部は、限定ではなく例として、テキストの所与の部分を読むのに費やされた時間と（たとえば、読むのに費やされた時間が短いほど、理解度がより高いことなどを示し得る）、同じコンテンツの異なるカスケード・フォーマット間で視線の動きの効率を評価してマシン学習入力を提供するカメラ（たとえば、埋め込みカメラ、外部カメラなど）を使用する視線追跡と、個人的な修飾の程度をユーザ・プリファレンス（たとえば、より多くの間隔、文節の長さ、フォント、キー・フレーズまたは品詞の色の強調、構成要素、従属語など）について評価するためのユーザ修飾とであり得る。

分析性サービス７４０は、読解の尺度、システムに対する修飾（たとえば、スクロール速度、間隔、フラグメント長さ、ダーク・モード、キー・フレーズ強調表示など）に反映されたユーザ・プリファレンスなどを含むユーザ分析性をログに記録し、保存することができる。修飾は、様々な修飾がどのようにして理解パーフォーマンスになるかを決定するために、様々なカスケード・フォーマットについて評価されることが可能であり、デフォルト表示フォーマットを改善するための入力としてマシン学習サービス７３５に供給され得る。ユーザ・プロファイル・サービス７４５は、プライバシーおよびプライバシー・コンプライアンス（たとえば、ＨＩＰＰＡコンプライアンスなど）のための匿名化された識別子を含むユーザ・プロファイル・データを保存し、パーフォーマンス・メトリクスおよび進捗を追跡することができる。たとえば、ユーザによって継続的に行われる表示パラメータに対する修飾は、分析性サービス７４０からの入力に基づいてマシン学習サービス７３５によって学習されることが可能であり、ユーザ固有の表示特性を生成するために使用され得る。アクセス制御サービス７５０は、頻度、使用時間、およびテキスト属性（たとえば、フィクション、ノンフィクション、著者、研究、詩など）についてのメトリクスを含む、保存されたコンテンツへのアクセスを提供することができる。別のパーソナライゼーションによれば、ユーザは、テキスト色、フォント、フォント・サイズなどの表示パラメータをパーソナライズすることができる。

一例では、読書スコアがユーザのために開発され得る。学生の年齢および学年に基づき得るスコアリング行列が作成されることが可能であり、このスコアリング行列は、指定されたコンテンツを学生が読むことと、次いで、関連する学生の理解との結果（たとえば、読解スコア（ＲＣＳ）など）であり得る。ＲＣＳ手法は、同様の集団間の相対的なスコアリング・メトリクスを確立するという点で、成績平均点（ＧＰＡ）に類似している。このメトリクスは、カスケード・フォーマット設定を使用するユーザによる、テキストの消費の評価に基づくことができる。たとえば、評価が経時的に追跡されて（能動的または受動的に）、ユーザによるテキストの理解の速度および効率が決定され得る。理解の速度とともに増加するスコアが、ユーザについて計算され得る。読書評価を実行する前に受け取られた入力が、ユーザのベースライン割当量を生成するために使用されてよい。

認知トレーニング・ライブラリが、カスケード・フォーマット設定を使用して開発され得る。たとえば、書籍、雑誌および論文などの様々な出版コンテンツが、カスケーディング・フォーマットを使用して翻訳されることが可能であり、ユーザが、理解力および保持力を高めるために自分の脳をトレーニングする目的で、ライブラリにアクセスすることが可能にされ得る。テストおよびクイズが、ユーザの理解のパーフォーマンスを評価するために使用されて、認知力改善の明白な証拠がユーザに提供されることが可能である。

カスケード・フォーマット設定が、様々な言語を処理するために適用されてよい。ＮＬＰサービスが、他の言語テキストの言語的特徴を提供するために使用されてよく、ルールが作成され、ＮＬＰ出力（たとえば、スペイン語テキストなど）に対して適用され、それに応じて外国語テキストがカスケードされることが可能である。言語改作物に加えて、改作物が他の言語の構文に基づいて作られることもあり、したがって、異なる言語のカスケードされたテキストは、言語固有の構文上のバリエーションを考慮するために、異なるフォーマット設定ルールを使用して、異なるフォーマットでカスケードすることができる。コンスティテュエンシおよび依存関係のＮＬＰサービスは、複数の言語で利用可能である。カスケード・ルールが世界共通の依存関係セットに基づいているので、カスケード・ルールは他の言語に移る可能性が高いが、出力は異なって見えることがある（たとえば、いくつかの言語では左から右、上から下ではなく、右から左に読むなど）。一部には、異なる種類の改行を必要とし得る、異なる長さの語がある（たとえば、膠着語は、形態素を付け加えることによって文法を追加する結果、非常に長い語になるなど）。言語に適応している表示特性が適用されるが、本明細書で論じられている構成要素キューイングのプロセスは一定のままである。

一例では、口語が、カスケード・フォーマット設定されたテキストの視覚表示と組み合わされ得る。人がカスケーディング・テキストを読んでいるときに、同じテキストを読んでいるサウンドトラックもまた、個々の読者の速度に合わせて制御可能な速度で再生されるように、音声が統合され得る。たとえば、テキストからスピーチへの変換が、音声／スピーチ出力をリアルタイムかつ読むペースで提供するために使用されてよく、理解度が評価されてよく、また、テキストからスピーチへの変換出力の速度が、音声とユーザの読みとの同期を保持するために変更されてよい（たとえば、スピードアップ、スローダウン、一時停止、再開など）。カスケードには、読者が改行と関連付けられた韻律的な手がかりを視覚的に認識できるようにして、スピーチが伴うことが可能である。この演繹的なシステムは、ユーザ自身の音読がこの韻律を模倣するようにユーザを指導するのに使用され得る。これは、構文構造についての知識の増大をサポートする。

図１８は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために取り込まれた画像から、カスケードされたテキストを生成することの一例１８００を示す。例１８００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１７に記述されている特徴を提供することができる。撮像デバイス１８０５は、テキスト１８１０を含む画像を取り込むことができる。画像は、テキスト１８１０を画像から（たとえば、光学式文字認識などによって）抽出するように処理され得る。テキスト１８１０は、システム１０００によって評価されて、テキスト中の（たとえば、コンスティテュエンシ、依存関係などに基づく）テキスト・モデルが識別され得る。カスケード・フォーマット設定ルールが、システム１０００によって割り当てられた言語属性に基づいてテキスト１８１０に適用されてよい。テキスト１８１０は、カスケード・フォーマット設定ルールによって、カスケードされた出力テキストに変換され、ユーザによる消費のために表示されることが可能である。

図１９は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために取り込まれた画像から、カスケードされたテキストを生成するための方法１９００の一例を示す。方法１９００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１８に記述されている特徴を提供することができる。オペレーション１９０５で、テキストの画像が撮像デバイスの視野内に取り込まれ得る。オペレーション１９１０で、テキストが画像内で認識されて、機械可読テキスト文字列が生成され得る。オペレーション１９１５で、機械可読テキスト文字列がＮＬＰサービスによって、言語属性（たとえば、品詞、レンマ、コンスティテュエンシ・データ、依存関係データ、同一指示データ、感情分析、トピック追跡、確率的推論、および韻律構造など）を識別するように処理されて、テキスト・モデル（たとえば、図１０の要素１０５０で示される）が生成され得る。オペレーション１９２０で、テキスト・モデルを用いて適用されたルールに基づく改行およびインデントを含む、テキスト・カスケードが生成され得る。一例では、テキスト文字列はテキストの文を含むことがあり、改行およびインデントがその文に対して適用され得る。一例では、テキスト文字列は、視覚的な手がかり（たとえば、背景色、明示的なマーカなど）によって段落にグループ分けされた複数の文を含み得る。

図２０は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用して、アイウェア・デバイスにおいてテキストを第１の表示フォーマットから第２の表示フォーマットへ変換することの一例２０００を示す。例２０００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１９に記述されている特徴を提供することができる。ユーザ２００５が、撮像デバイス２０１０を含むスマートグラスを装着していることがあってよい。撮像デバイス２０１０は、テキスト２０１５を含む画像を取り込むことができる。画像は、テキスト２０１５を画像から（たとえば、光学式文字認識などによって）抽出するように処理され得る。テキスト２０１５は、システム７０５によって評価されて、テキスト中の言語属性（たとえば、品詞、キー・フレーズ、コンスティテュエンシ・データ、依存関係データなど）が識別され得る（たとえば、図１０に記述されているモデル１０５０などを形成するために）。カスケード・フォーマット設定ルールは、クラウドベースの配信システム７０５によって識別された言語属性（たとえば、図１０に記述されているモデル１０５０など）を使用して、テキスト２０１５に適用されてよい。テキスト２０１５は、カスケードされた出力テキスト２０２０に変換され、撮像デバイス２０１０を含むスマートグラスの表示デバイス上に、ユーザによる消費のために表示されることが可能である。

図２１は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにアイウェア・デバイスにおいてテキストを第１の表示フォーマットから第２の表示フォーマットへ変換するための方法２１００の一例を示す。方法２１００は、図１～図５、図６Ａ、図６Ｂ、および図７～図２０に記述されている特徴を提供することができる。オペレーション２１０５で、テキストの画像が、アイウェア・デバイスの撮像コンポーネントの視野内で取り込まれ、またはテキスト入力の別のソースから取り込まれ得る。一例では、アイウェア・デバイスは、テキストがファイルとして保存またはダウンロードされるメモリを有することができ、テキストが無線で獲得され、次いで変換されるなどの無線機能を有することができる。オペレーション２１１０で、テキストは画像内で認識されて、機械可読テキスト文字列が生成され得る。オペレーション２１１５で、機械可読テキスト文字列がＮＬＰサービス１０２０によって、言語属性（たとえば、品詞、レンマ、コンスティテュエンシ・データ、依存関係データ、同一指示データ、感情分析、トピック追跡、確率的推論、および韻律構造など）を識別するように処理されて、テキスト・モデル（たとえば、図１０に記述されているモデル１０５０）が生成され得る。オペレーション２１２０で、テキスト・モデル１０５０を用いて適用されたルールに基づく改行およびインデントを含む、テキスト・カスケードが生成され得る。一例では、テキスト文字列はテキストの文を含むことがあり、改行およびインデントがその文に対して適用され得る。一例では、テキスト文字列は、視覚的な手がかり（たとえば、背景色、明示的なマーカなど）によって段落にグループ分けされた複数の文を含むことがある。オペレーション２１２５で、テキスト・カスケードは、アイウェア・デバイスのディスプレイ・コンポーネントを介してユーザに表示され得る。

図２２は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにカスケードされたテキストを生成することの一例２２００を示す。例２２００は、図１～図５、図６Ａ、図６Ｂ、および図７～図２１に記述されている機能を提供することができる。テキスト・オーサリング・ツール２２０５は、ユーザから（たとえば、キーボード、音声コマンドなどによって）テキスト入力２２１０を受け取ることができる。テキスト入力２２１０が受け取られると、それは、テキスト入力２２１０の言語属性（たとえば、品詞データ、コンスティテュエンシ・データ、依存関係データなど）が識別されるように、（オンライン接続、ローカルで利用可能なコンポーネントなどを介して）システム７０５によって処理される。一例では、システム７０５（またはシステム７０５のコンポーネント）は、リモート・コンピューティング・プラットフォーム上で実行されてよく、または、テキスト・オーサリング・ツール２２０５が実行されているデバイス上で実行されてよい。カスケード・フォーマット設定ルールは、入力テキスト２２１０で識別された言語属性を使用して、入力テキスト２２１０に対して適用されてよい。表示された出力テキスト２２１５は、テキストが入力される際にリアルタイムのカスケード・フォーマットをユーザに提供するために、ユーザがテキストを入力する際に、カスケードされた出力テキストとして表示され得る。

図２３は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのユーザおよび発行者のプリファレンス管理のためのアーキテクチャ２３００の一例を示す。アーキテクチャ２３００は、図１～図５、図６Ａ、図６Ｂ、および図７～図１９に記述されている特徴を提供することができる。ユーザ・インターフェース２３０５およびプラグイン２３１０は、図７に記述されているようにシステム７０５に接続し得る。システム７０５は、ユーザおよび発行者がシステム７０５によってテキストを発行および消費するために登録することを可能にする、ユーザ・レジストリ２３１０を含み得る。ユーザ・レジストリは、カスケードされたテキストを見るときに適用されるべき表示プリファレンスを含む、ユーザおよび発行者のプロファイルを維持することができる。ユーザ・プリファレンスは、カスケードされたテキストの形成を変更しないが、テキスト色、フォント・サイズ、行間隔などのユーザまたは発行者定義の表示修飾を提供することができる。ユーザが編集モードをオンまたはオフにすることを可能にする、カスケード・モード・ボタン２３１５が設けられ得る。テキストはカスケード・フォーマットで表示されてよく、カスケード編集モードが有効になっているとき、カスケード表示特性に対する変更は、追跡されることが可能であり、また、ユーザ用のパーソナライズされたカスケード表示特性を生成するために評価されることが可能である。追跡された変更は、ユーザ・プリファレンスを経時的に学習するために使用され得る、プロファイルに保存されたフィードバック情報として使用されることが可能である。フィードバックはまた、コンテンツ表示特性に対するプリファレンスを示すユーザまたは発行者によって提供される、直接入力であってもよい。

一例では、発行者は、ユーザ・レジストリ２３１０によって登録することができ、公開コンテンツをシステム７０５のユーザによる消費のために提供することができる。発行者データ２３２０は、システム７０５に入力され得る、書籍、雑誌、マニュアル、試験などを含むコンテンツを含むことができる。言語属性（たとえば、品詞、コンスティテュエンシ・データ、依存関係データ、同一指示リンクなど）は、発行者データ２３２０中の文ごとにＮＬＰサービスによって識別されることが可能であり、ＮＬＰサービスは、語または語の組み合わせを、名前付きエンティティ、品詞、コンスティテュエンシ関係を有すること、依存関係を有すること、同一指示、およびトピック・リンクなどとして分類する。言語分析を含む発行者データ２３２０は、システム７０５によって受け取られることが可能である。

発行者データ２３２０の識別された言語属性は、改行、インデント、およびその他のフォーマット設定要素を挿入するためのルールを含み得るカスケード・フォーマット設定ルールのセットに対して、評価されることが可能である。カスケード・フォーマット設定ルールは、テキスト中で識別されたクラスまたは品詞、キー・フレーズ、構成要素または依存関係のタイプなどによってトリガされ得る。カスケードされた発行者データは、発行者へ返されて発行者データ２３２０に含まれてよく、また、ユーザ・インターフェース２３０５を介してユーザによって消費されてよい。

追加のフォーマット設定が、さらなる手がかりをユーザに対して提供するために用いられることがある。たとえば、構成要素構造の強調表示が、読むことの認知負荷を低減させるために行われ得る。これは、本明細書で論じられているシステムおよび方法が、読む作業を簡単にするシステムを提供することを可能にする。色、アンダーライン、強調表示などによってテキストを修飾することを含む様々な修飾が、ユーザの認知負荷の低減を助けるために適用され得る。

図２４は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのパーソナライゼーションのための方法２４００の一例を示す。方法２４００は、図１～図５、図６Ａ、図６Ｂ、および図７～図２３に記述されている特徴を提供することができる。本明細書で論じられているシステムおよび方法は、個人に固有のパーソナライズされたアルゴリズムを開発するのに使用されることが可能である。テキスト情報を処理する人々の方法は異なっており、人ごとに最適化されているパーソナル・リーディング・アルゴリズム（ＰＲＡ）が作成され得る。テキストがカスケード・フォーマットで表示されることが可能であり、カスケード編集モードが有効にされると、カスケード・フォーマット設定された出力の表示特性に対する変更は、追跡されることが可能であり、また、病状、認知機能、学習障害を認識するために、および／またはユーザに対してパーソナライズされたカスケード・フォーマット・ルールを生成するために、分析されることが可能である。様々な属性を微調整し、理解および読みやすさを評価することによって、表示特性をカスタマイズするために使用される、パーソナライズされた設定が開発され得る。これは、ユーザのリーディング・プリファレンスに合うようにユーザによってなされる表示特性のパラメータ変更によって、作成され得る。追跡されることが可能な特性を表示するためのユーザ調整は、インデントの量の修正、主要な構成要素の強調表示または色付け、スクロール速度などを含み得る。カスケード・ロジックは言語情報に基づいたままであるが、ユーザのプロファイルを使用して、強調表示すること、イタリック化すること、カラー化すること、間隔を増やすこと、改行を追加することなどが、カスケードされたテキストの表示特性において可能である。

２つの眼鏡処方箋の間の相違のように、異なる目は情報をわずかに異なるように処理し、その結果、２人のユーザで表示特性が異なることになり得る。認知多様性（たとえば、人々がテキストに直面し処理する異なる方法）はまた、個人間で、またはたとえば、ＡＤＨＤ、失読症、自閉症などの同様の認知プロファイルを共有するグループ間で、表示特性を最適化することによって対処されることも可能である。

たとえば、読者属性に基づいて提示パラメータを修飾するリーディング・プロファイルが、（単独で、または組み合わせて）作成されることが可能である。文脈プロファイルが、ユーザ入力によって、またはコンピュータ自動化された評価を通じて、特有の病状および認知症状（たとえば、失読症、注意欠陥・多動性障害（ＡＤＨＤ）、注意欠陥障害（ＡＤＤ）など）、自閉症、母国語（たとえば、中国語を母国語とする人は、スペイン語を母国語とする人とは異なるフォーマットから恩恵を受けることがあるなど）、読まれているコンテンツの性質（たとえば、フィクション、ノンフィクション、ニュース、詩など）、または画面モード（たとえば、電話、タブレット、ノートパソコン、モニタ、ＡＲ／ＶＲデバイスなど）などについて、知らされ得る。カスケード出力の表示特性最適化はまた、傷害および障害に対処するための診断および治療様式で使用され得る。脳震盪または外傷性脳損傷（ＴＢＩ）を患っている人々の重要な症状は、眼球運動および視線追跡の変化である。１つの例として、アスリートが、サイドライン上で、目の前で水平に動かされている指を追跡するように求められているのが見られることがある。読むことが、脳震盪を起こした脳に対して重い負担をかける。ＴＢＩを患っている人々は、脳を休ませ回復させるために、頻繁に休憩を取る必要がある。軍隊および多くのスポーツでは、参加者は、将来の傷害を評価するために、ベースラインの認知テストを行うことが求められる。一例では、本明細書で論じられているシステムおよび技法は、拡張現実ヘッドセット／眼鏡と組み合わせて使用されて、理解レベル・ベースラインを、参加者用のカスケードされたテキストと調整された表示特性とを用いて測定することができる。このベースラインは、理解評価およびユーザ報告の快適さ／緊張に加えて、視線追跡情報を含み得る。

そのベースラインが確立された後、視線追跡および理解が、カスケードと、ベースライン設定からの表示特性の変更が緩和を提供する度合いとを使用して、測定され得る。たとえば、ベースライン測定が、参加者が３文字インデントで読んでＸの理解レベルのスコアであった場合に、ＴＢＩ後に参加者がその同じ測定でどうなるかと、強調されたインデント、色などで修飾された表示によって参加者がどれだけよくなり得るかとが、決定され得る。負傷した参加者をサポートするために必要な表示特性変更は、参加者の診断および治療計画に対する情報を提供し得る。一例では、ユーザは、自分自身の個人的なパラメータおよび出力フォーマット（たとえば、長さ、間隔、強調表示、インデント、改行など）、フォント、色、サイズ、背景色を設定することができる。

オペレーション２４０５で、コンテンツ（たとえば、テキスト、画像など）は、テキスト文を含むクラウド接続されたソースから取得され得る。オペレーション２４１０で、個人のレジストリと、個人用のパーソナライズされたテキスト・フォーマット・パラメータとが維持され得る。一例では、テキスト・フォーマット設定パラメータは、個人用にパーソナライズされた、カスケードされたテキスト表示フォーマットを生成するためのルールを含み得る。オペレーション２４１５で、個人用のパーソナライズされたテキスト・フォーマット・パラメータに基づいたユーザ指定の属性付きカスケードの表示を可能にする、表示制御命令が生成され得る。たとえば、テキストの文が、レジストリからの個人と関連付けられた発行元から受け取られてよく、また、表示制御命令が、クライアント・デバイス上で文の表示を制御するために生成されてよい。オペレーション２４２０で、カスケードは、ユーザ指定の属性を適用して、表示デバイス上のカスケード出力の表示特性を修飾することによって表示され得る。表示制御命令は、個人用のパーソナライズされたテキスト・フォーマット・パラメータを使用することができ、命令は、個人用にパーソナライズされた、カスケードされたフォーマットで文章の表示を可能にし得る。一例では、クラウド接続されたソースはブラウザ・アプリケーションであってよく、このブラウザ・アプリケーションは、テキストの文をテキスト処理エンジンに供給することができる。

図２５は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力（たとえば、表示されたテキストのユーザ修飾など）に基づいてカスケードされたテキストのデュアル表示の例２５００を示す。例２５００は、図１～図５、図６Ａ、図６Ｂ、および図７～図２４に記述されている特徴を提供することができる。テキストは、ユーザ・インターフェース２５０５を介して受け取られ得る。テキスト２５１０は、パース構造（たとえば、品詞、コンスティテュエンシ・データ、依存関係データなど）を識別するようにシステム７０５によって処理され得る。テキスト２５１０（たとえば、カスケードされていない、原語、カスケードされているなど）、またはソース・テキストは、ユーザ・インターフェース２５０５の第１のウィンドウ内に表示されてよい。ブロック・テキストが一例として使用されているが、生テキストは、タイトル、見出し、図キャプションなどを含む、ｈｔｍｌ強調を有し得る。修飾されたテキスト２５１５は、ユーザ・インターフェース２５０５の第２のウィンドウ内に表示され得る。修飾されたテキスト２５１５は、カスケード・フォーマット設定されている、翻訳されている、ユーザ・プリファレンスを含み得る別のカスケード・フォーマットでフォーマット設定されている、などのテキストであってよい。一例では、修飾されたテキスト２５１５は、識別された言語属性を使用して適用されたカスケード・フォーマット設定ルールによる改行およびインデントを使用して、カスケード・フォーマットで提示されることが可能である。修飾されたテキスト２５１５は、ユーザがテキスト２５１０の構造を識別することができるように、品詞、コンスティテュエンシ・データ、依存関係データなどが強調表示されて（たとえば、アンダーライン付きで、太字にされて、色付けされて、網掛けされてなど）、提示されることが可能である。

したがって、ソース・テキストとカスケード・フォーマット設定されたテキストとの並列表示が、２つの画面または分割画面によって並列提示で提示され得る。たとえば、元のソース・テキストが一方の画面に表示されてよく、カスケード・テキストが第２の画面に並列で表示され、同期することができ、したがって、ユーザがどちらかの表示でスクロールしたときに、これらの画面は同期したままであることができる。これは、構文、キー・フレーズ、品詞、コンスティテュエンシ・データ、依存関係データなどを強調表示するために、または、テキストの基礎となる構造を表示するテキストＸ－ＲＡＹに似ている「強調された理解ビュー」を提示するために、教育目的で使用されることが可能である。たとえば、構成要素、同一指示情報、およびキー・フレーズが、太字にされたりされなかったり、動詞が色付けされたり、太字にされたりするなどして、基礎となる言語特性が強調表示されることが可能である。

図２６は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために第１の言語２６１０の入力テキストを第２の言語２６１５のカスケードされた出力へ翻訳するためのシステムの一例２６００を示す。翻訳エンジン２６２０は、第１の言語の入力２６１０を受け取り、その入力を第２の言語に翻訳することができる。翻訳エンジンは、入力と第２の言語２６１５のカスケードされた出力とを表示しているユーザ・インターフェース２６０５を見るために使用されるデバイス上で、ローカルに実行されていてよく、ウェブサービス、クラウドベースのサービス、リモートサーバーなどから、リモートで実行されていてよい。翻訳エンジン２６２０は、入力テキストに対して実行されたときにそのテキストを入力言語から第２の言語に変換する、翻訳ロジックを含むことができる。

翻訳エンジン２６２０からの出力は、上述のように、カスケードされた第２の言語の出力２６１５が産出されるように、クラウドベースのシステム７０５によって処理され得る。たとえば、カスケード・フォーマット設定された節が、画面の一方のウィンドウ内に表示されてよく、別の言語の節の翻訳が、カスケードされたフォーマットで画面の第２のウィンドウ内に提示されてよい。別の例では、ブロック・テキストが、デュアル表示の一方の側に表示され、カスケード・フォーマット設定されたテキストが他方の側に表示され得る。さらに別の例では、ブロックおよびカスケードでスクロールする分割画面が提供され、および／または言語が、画面の別々の側に、またはデュアル表示構成の別々のディスプレイに表示され得る。二画面は、難しい節の理解を助けるためにユーザが他方のビューを参照することを可能にし得る。

図２７は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法２７００の一例を示す。方法２７００は、図１～図５、図６Ａ、図６Ｂ、および図７～図２６に記述されている特徴を提供することができる。

オペレーション２７０５で、テキスト入力が入力デバイスから受け取られ得る。オペレーション２７１０で、入力テキストが、自然言語処理サービスのコンスティテュエンシ・オペレーションおよび依存関係解析オペレーションからの識別された言語関係を伝達するための手がかりを使用して、フォーマット設定され得る。

オペレーション２７１５で、カスケード・ルールが適用されて、テキスト入力の構成要素の配置について表示出力の連続単位としての優先順位が付けられ得る。カスケード・ルールは、自動化された依存関係パーサから出力された情報に基づいて、構成要素のうちの一構成要素の水平変位を決定することができ、また、その構成要素を他の構成要素とともに水平位置付けに基づいてグループ分けして依存関係を強調することができる。インデント解除が、コンスティテュエンシ・グループの完了を示し得る。一例では、カスケード・ルールはさらに、依存関係と構成要素とをリンクするルールを使用して、入力テキストのコア・アーギュメントおよび非コア従属語を識別することができる。これらのルールは、コア・アーギュメントおよび非コア従属語を入力テキストの言語フレーズの先頭の下にインデントすることができる。

オペレーション２７２０で、インデントおよびライン・フィードを含む出力が、カスケード・ルールの適用に基づいて生成され得る。一例では、出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む、自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強され得る。

オペレーション２７２５で、出力は、出力デバイスのディスプレイに表示され得る。一例では、匿名化された使用状況データまたはユーザ指定のプリファレンスが受け取られてよく、また、匿名化された使用状況データまたはユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルが、生成されてよい。一例では、出力が、カスタム表示プロファイルの出力表示特性を使用して調整され得る。この表示特性は、出力の表示特徴を出力の形状の修飾なしで修飾することができる。一例では、出力は、電話、タブレット、ラップトップ、モニタ、仮想現実デバイス、または拡張現実デバイスにおける表示のために生成され得る。一例では、出力は、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成され得る。

図２８は、本明細書で論じられている技法（たとえば、方法論）のうちのいずれか１つまたは複数が実行され得る例示的マシン２８００のブロック図を示す。代替実施形態では、マシン２８００は、スタンドアロン・デバイスとして動作することができ、または他のマシンと接続（たとえば、ネットワーク接続）されることが可能である。ネットワーク化された配備では、マシン２８００は、サーバ・クライアント・ネットワーク環境において、サーバ・マシン、クライアント・マシン、またはその両方の能力で動作することができる。一例では、マシン２８００は、ピア・ツー・ピア（Ｐ２Ｐ）（または他の分散）ネットワーク環境において、ピア・マシンとして動作することができる。マシン２８００は、パーソナル・コンピュータ（ＰＣ）、タブレットＰＣ、セットトップ・ボックス（ＳＴＢ）、パーソナル・デジタル・アシスタント（ＰＤＡ）、携帯電話、ウェブ・アプライアンス、ネットワーク・ルータ、スイッチもしくはブリッジ、またはそのマシンによって取られるべきアクションを指定する命令（順次またはその他）を実行することが可能な任意のマシンであってよい。さらに、単一のマシンだけが示されているが、「マシン」という用語は、クラウドコンピューティング、サービスとしてのソフトウェア（ＳａａＳ）、他のコンピュータクラスタ構成などの、本明細書で論じられている方法論のうちのいずれか１つまたは複数を実行するために、命令の一セット（または複数のセット）を個々にまたは共同で実行するマシンの任意の集まりもまた含むと解釈されるものである。

本明細書に記述されている例は、ロジックもしくはいくつかのコンポーネント、または機構を含み得るか、またはこれらによって動作し得る。回路セットは、ハードウェア（たとえば、簡単な回路、ゲート、ロジックなど）を含む有形エンティティにおいて実施された回路の集まりである。回路セット帰属関係は、時間、および基礎となるハードウェア多様性に対して適応性があり得る。回路セットは、動作時に、指定されたオペレーションを単独または組み合わせで実行することができる部材を含む。一例では、回路セットのハードウェアは、特定の動作を行うように不変に設計され得る（たとえば、ハードワイヤード）。一例では、回路セットのハードウェアは、特有の動作の命令を符号化するために物理的に修正された（たとえば、不変質量粒子の磁気的、電気的に移動可能な配置など）コンピュータ可読媒体を含む、可変に接続された物理的コンポーネント（たとえば、実行ユニット、トランジスタ、単純回路など）を含み得る。物理的コンポーネントを接続する際、ハードウェア構成要素の基礎となる電気的特性は、たとえば絶縁体から導体へ、またはその逆へと変更される。命令は、埋め込まれたハードウェア（たとえば、実行ユニットまたはローディング機構）が、動作時に特有のオペレーションの一部分を行うために、可変接続によって回路セットの部材をハードウェア中に作成することを可能にする。したがって、コンピュータ可読媒体は、デバイスが動作しているときに、回路セット部材の他のコンポーネントに通信可能に結合される。一例では、物理的コンポーネントのいずれかが、複数の回路セットの複数の部材に使用されることが可能である。たとえば、オペレーション中に、実行ユニットは、ある時点において第１の回路セットの第１の回路で使用され、別の時点において、第１の回路セットの第２の回路によって、または第２の回路セットの第３の回路によって再使用されることが可能である。

マシン（たとえば、コンピュータ・システム）２８００は、ハードウェア・プロセッサ２８０２（たとえば、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、ハードウェア・プロセッサ・コア、またはこれらの任意の組み合わせ）、メイン・メモリ２８０４、およびスタティック・メモリ２８０６を含むことができ、その一部または全部は、インターリンク（たとえば、バス）２８０８を介して互いに通信することができる。マシン２８００は、ディスプレイ・ユニット２８１０、英数字入力デバイス２８１２（たとえば、キーボード）、およびユーザ・インターフェース（ＵＩ）ナビゲーション・デバイス２８１４（たとえば、マウス）をさらに含み得る。一例では、ディスプレイ・ユニット２８１０、入力デバイス２８１２およびＵＩナビゲーション・デバイス２８１４は、タッチ・スクリーン・ディスプレイであってよい。マシン２８００は、加えて、ストレージ・デバイス（たとえば、ドライブ・ユニット）２８１６と、信号生成デバイス２８１８（たとえば、スピーカ）と、ネットワーク・インターフェース・デバイス２８２０と、全地球測位システム（ＧＰＳ）センサ、コンパス、加速度計、または他のセンサなどの、１つまたは複数のセンサ２８２１とを含み得る。マシン２８００は、１つまたは複数の周辺デバイス（たとえば、プリンタ、カードリーダなど）と通信またはその制御をするための、シリアル（たとえば、ユニバーサル・シリアル・バス（ＵＳＢ）、パラレル、または他の有線もしくは無線（たとえば、赤外線（ＩＲ）、近距離無線通信（ＮＦＣ）など）接続などの、出力コントローラ２８２８を含み得る。

ストレージ・デバイス２８１６は、本明細書に記述されている技法または機能のいずれか１つまたは複数を具現化する、またはそれらによって利用される、データ構造または命令２８２４（たとえば、ソフトウェア）の１つまたは複数のセットが記憶されている機械可読媒体２８２２を含み得る。命令２８２４はまた、マシン２８００によるそれの実行中に、完全または少なくとも部分的に、メイン・メモリ２８０４内に、スタティック・メモリ２８０６内に、またはハードウェア・プロセッサ２８０２内に、存在し得る。一例では、ハードウェア・プロセッサ２８０２、メイン・メモリ２８０４、スタティック・メモリ２８０６、またはストレージ・デバイス２８１６のうちの１つまたは任意の組み合わせが、機械可読媒体を構成し得る。

機械可読媒体２８２２は単一の媒体として示されているが、「機械可読媒体」という用語は、１つまたは複数の命令２８２４を保存するように構成された単一の媒体または複数の媒体（たとえば、集中もしくは分散データベース、および／または関連するキャッシュおよびサーバ）を含み得る。

「機械可読媒体」という用語は、マシン２８００によって実行するための、かつ、マシン２８００に本開示の技法のいずれか１つ以上を実行させる、命令を記憶、符号化、または保持することが可能である、またはそのような命令によって使用される、もしくはそのような命令と関連付けられたデータ構造を保存、符号化、または保持することが可能である、任意の媒体を含み得る。非限定的な機械可読媒体例は、固体メモリ、ならびに光学媒体および磁気媒体を含み得る。一例では、機械可読媒体は、一時的な伝搬信号（たとえば、非一時的な機械可読記憶媒体）を除外することがある。非一時的な機械可読記憶媒体の具体的な例は、半導体メモリデバイス（たとえば、電気的プログラマブル読取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ））およびフラッシュ・メモリ・デバイスなどの不揮発性メモリ；内蔵ハードディスクおよびリムーバブル・ディスクなどの磁気ディスク；光磁気ディスク；ならびにＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスクを含み得る。

命令２８２４はさらに、いくつかの転送プロトコル（たとえば、フレーム・リレー、インターネット・プロトコル（ＩＰ）、伝送制御プロトコル（ＴＣＰ）、ユーザ・データグラム・プロトコル（ＵＤＰ）、ハイパーテキスト転送プロトコル（ＨＴＴＰ）など）のうちのいずれか１つを利用するネットワーク・インターフェース・デバイス２８２０を介する伝送媒体を使用して、通信ネットワーク２８２６を通じて送信または受信され得る。例示的通信ネットワークは、ローカル・エリア・ネットワーク（ＬＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、パケット・データ・ネットワーク（たとえば、インターネット）、携帯電話ネットワーク（たとえば、セルラ・ネットワーク）、従来の普通の電話（ＰＯＴＳ）ネットワーク、および無線データ・ネットワーク（たとえば、Ｗｉ－Ｆｉ（登録商標）、ＬｏＲａ（登録商標）／ＬｏＲａＷＡＮ（登録商標）ＬＰＷＡＮ規格などで知られるＩＥＥＥ８０２．１１規格ファミリ）、ＩＥＥＥ８０２．１５．４規格ファミリ、ピア・ツー・ピア（Ｐ２Ｐ）ネットワーク、以下を含む４Ｇおよび５Ｇ無線通信用の第３世代パートナーシップ・プロジェクト（３ＧＰＰ（登録商標））規格：３ＧＰＰロングターム・エボリューション（ＬＴＥ）規格ファミリ、３ＧＰＰＬＴＥアドバンスド規格ファミリ、３ＧＰＰＬＴＥアドバンスド・プロ規格ファミリ、３ＧＰＰ新無線（ＮＲ）規格ファミリ、などをとりわけ含み得る。一例では、ネットワークインターフェースデバイス２８２０は、通信ネットワーク２８２６と接続するための１つまたは複数の物理的ジャック（たとえば、イーサネット（登録商標）・ジャック、同軸ジャック、または電話ジャック）、または１つもしくは複数のアンテナを含み得る。一例では、ネットワーク・インターフェース・デバイス２８２０は、単入力多出力（ＳＩＭＯ）技法、多入力多出力（ＭＩＭＯ）技法、または多入力単出力（ＭＩＳＯ）技法のうちの少なくとも１つを使用して無線で通信するための複数のアンテナを含み得る。「伝送媒体」という用語は、マシン２８００によって実行するための命令を保存、符号化、または保持することが可能な任意の無形の媒体を含むと解釈されるものであり、デジタルもしくはアナログ通信信号、またはそのようなソフトウェアの通信を容易にするための他の無形の媒体を含む。
追加の注釈
上記の詳細な記述は、詳細な記述の一部を形成する添付の図面の参照を含む。図面は、実践され得る特有の実施形態を例示的に示している。これらの実施形態は、本明細書では「例」とも呼ばれる。このような例は、図示または記述されたものに加えて、要素を含み得る。しかし、本発明者らは、図示または記述された要素のみが提供される例も企図している。さらに、本発明者らは、特定の例（またはその１つもしくは複数の態様）に関して、または本明細書に図示または記述された他の例（またはその１つもしくは複数の態様）に関して、図示または記述されたそれらの要素（またはその１つもしくは複数の態様）の任意の組み合わせまたは順列を使用する例も企図している。

本明細書で言及されるすべての刊行物、特許、および特許文書は、参照により個別に組み込まれるものとして、その全体で本明細書に援用する。本明細書と、そのように援用されたそれらの文書との間で矛盾する用法がある場合、援用された文献の用法は、本明細書の用法を補足するものとみなされるべきであり、妥協できない矛盾については、本明細書の用法が支配する。

本明細書では、特許文献で一般的であるように、「１つの（ａ）」または「１つの（ａｎ）」という用語は、「少なくとも１つ」または「１つまたは複数」のいかなる他の事例または用法とも無関係に、１つまたは複数を含むものとして使用される。本明細書では、「または（ｏｒ）」という用語は、特にことわらない限り、「ＡまたはＢ」が、「ＢではなくＡである」、「ＡではなくＢである」、「ＡおよびＢ」を含むように、非排他的な「または」を指すものとして使用される。添付の特許請求の範囲では、「含む（ｉｎｃｌｕｄｉｎｇ）」および「ここで（ｉｎｗｈｉｃｈ）」という用語は、「備える（ｃｏｍｐｒｉｓｉｎｇ）」および「ここで（ｗｈｅｒｅｉｎ）」というそれぞれの用語の平易な英語の同義語として使用されている。また、以下の特許請求の範囲では、用語の「含む（ｉｎｃｌｕｄｉｎｇ）」および「備える（ｃｏｍｐｒｉｓｉｎｇ）」は制限がなく、すなわち、特許請求の範囲でこのような用語の後に列挙された要素に加えて諸要素を含むシステム、デバイス、物品、または処理は、やはりその特許請求の範囲内に入るとみなされる。さらに、以下の特許請求の範囲において、「第１」、「第２」、および「第３」などの用語は、単なる標識として使用されており、その対象物に数値的な要件を課すものではない。

上の記述は例示的なものであり、限定的なものではない。たとえば、上述の例（またはその１つもしくは複数の態様）は、互いに組み合わせて使用され得る。他の実施形態は、上の記述を検討することにより、当業者などによって使用され得る。要約書は、読者が技法開示の特質を迅速に確認できるようにするものであり、それが特許請求の範囲または意味を解釈または限定するためには使用されないものと理解して提出されている。また、上の詳細な記述では、開示を簡素化するために様々な特徴がひとまとめにされていることがある。このことは、特許請求されていない開示された特徴が、いずれの請求項にも必須であると解釈されるべきではない。むしろ、発明の主題は、ある特定の開示された実施形態のすべての特徴とは言えないところにあり得る。したがって、以下の特許請求の範囲は、本明細書では発明を実施するための形態に組み込まれ、各請求項が別個の実施形態としてそれ自体で存立している。実施形態の範囲は、添付の特許請求の範囲を、そのような特許請求の範囲の権利がある等価物の全範囲とともに参照して決定されるべきである。

Claims

入力テキストから言語的手がかりを含むテキストの表示を生成するためのシステムであって、
少なくとも１つのプロセッサと、
命令を含むメモリとを備え、前記命令は、前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが、
前記テキスト入力を入力デバイスから受け取るオペレーションと、
自然言語処理サービスのコンスティテュエンシ解析オペレーションおよび依存関係解析オペレーションからの識別された言語関係を伝達するための手がかりを使用して、入力テキストをフォーマット設定するオペレーションと、
カスケード・ルールを適用して、前記テキスト入力の構成要素の配置について表示出力の連続単位としての優先順位を付けるオペレーションとを実行し、前記カスケード・ルールが、
自動化された依存関係パーサから出力された情報に基づいて、前記構成要素のうちの一構成要素の水平変位を決定するための命令と、
前記構成要素を他の構成要素とともに水平位置付けに基づいてグループ分けして依存関係を強調するための命令とを備え、インデント解除が、コンスティテュエンシ・グループの完了を示し、前記少なくとも１つのプロセッサがさらに、
前記カスケード・ルールの適用に基づいて、インデントおよびライン・フィードを含む出力を生成するオペレーションと、
前記出力を出力デバイスのディスプレイに表示するオペレーションとを実行する、システム。
前記カスケード・ルールは、さらに
従属語とそれを含有する前記構成要素とをリンクするルールを使用して、前記入力テキストのコア・アーギュメントおよび非コア従属語を識別するための命令と、
前記コア・アーギュメントおよび前記非コア従属語を、前記入力テキストの言語フレーズの先頭の下にインデントするための命令とをさらに備える、請求項１に記載のシステム。
前記出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む前記自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強される、請求項１に記載のシステム。
前記メモリが命令をさらに備え、この命令は、前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが、
匿名化された使用状況データまたはユーザ指定のプリファレンスを受け取るオペレーションと、
前記匿名化された使用状況データまたは前記ユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルを生成するオペレーションとを実行する、請求項１に記載のシステム。
前記メモリが命令をさらに備え、この命令は、前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが、
前記カスタム表示プロファイルの前記出力表示特性を使用して前記出力を調整するオペレーションを実行し、前記表示特性が、前記出力の表示特徴を前記出力の形状の修飾なしで修飾する、請求項４に記載のシステム。
前記出力が、電話、タブレット、ラップトップ、モニタ、仮想現実デバイス、または拡張現実デバイスにおける表示のために生成される、請求項１に記載のシステム。
前記出力が、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成される、請求項１に記載のシステム。
入力テキストから言語的手がかりを含むテキストの表示を生成するための方法であって、
前記テキスト入力を入力デバイスから受け取る工程と、
自然言語処理サービスのコンスティテュエンシ解析オペレーションおよび依存関係解析オペレーションからの識別された言語関係を伝達するための手がかりを使用して、入力テキストをフォーマット設定する工程と、
カスケード・ルールを適用して、前記テキスト入力の構成要素の配置について表示出力の連続単位としての優先順位を付ける工程とを備え、前記カスケード・ルールが、
自動化された依存関係パーサから出力された情報に基づいて、前記構成要素のうちの一構成要素の水平変位を決定するための命令と、
前記構成要素を他の構成要素とともに水平位置付けに基づいてグループ分けして依存関係を強調するための命令とを備え、インデント解除が、コンスティテュエンシ・グループの完了を示し、さらに、
前記カスケード・ルールの適用に基づいて、インデントおよびライン・フィードを含む出力を生成する工程と、
前記出力を出力デバイスのディスプレイに表示する工程とを備える、方法。
前記カスケード・ルールが、
従属語とそれを含有する前記構成要素とをリンクするルールを使用して、前記入力テキストのコア・アーギュメントおよび非コア従属語を識別する工程と、
前記コア・アーギュメントおよび前記非コア従属語を、前記入力テキストの言語フレーズの先頭の下にインデントする工程とをさらに備える、請求項８に記載の方法。
前記出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む前記自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強される、請求項８に記載の方法。
匿名化された使用状況データまたはユーザ指定のプリファレンスを受け取る工程と、
前記匿名化された使用状況データまたは前記ユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルを生成する工程とをさらに備える、請求項８に記載の方法。
前記カスタム表示プロファイルの前記出力表示特性を使用して前記出力を調整する工程をさらに備え、前記表示特性が、前記出力の表示特徴を前記出力の形状の修飾なしで修飾する、請求項１１に記載の方法。
前記出力が、電話、タブレット、ラップトップ、モニタ、仮想現実デバイス、または拡張現実デバイスにおける表示のために生成される、請求項８に記載の方法。
前記出力が、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成される、請求項８に記載の方法。
入力テキストから言語的手がかりを含むテキストの表示を生成するための命令を含む、少なくとも１つの非一時的な機械可読媒体であって、この命令は、前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが、
前記テキスト入力を入力デバイスから受け取るオペレーションと、
自然言語処理サービスのコンスティテュエンシ解析オペレーションおよび依存関係解析オペレーションからの識別された言語関係を伝達するための手がかりを使用して、入力テキストをフォーマット設定するオペレーションと、
カスケード・ルールを適用して、前記テキスト入力の構成要素の配置について表示出力の連続単位としての優先順位を付けるオペレーションとを実行し、前記カスケード・ルールが、
自動化された依存関係パーサから出力された情報に基づいて、前記構成要素のうちの一構成要素の水平変位を決定するための命令と、
前記構成要素を他の構成要素とともに水平位置付けに基づいてグループ分けして依存関係を強調するための命令とを備え、インデント解除が、コンスティテュエンシ・グループの完了を示し、前記少なくとも１つのプロセッサがさらに、
前記カスケード・ルールの適用に基づいて、インデントおよびライン・フィードを含む出力を生成するオペレーションと、
前記出力を出力デバイスのディスプレイに表示するオペレーションとを実行する、少なくとも１つの非一時的な機械可読媒体。
前記カスケード・ルールは、さらに
従属語とそれを含有する前記構成要素とをリンクするルールを使用して、前記入力テキストのコア・アーギュメントおよび非コア従属語を識別するための命令と、
前記コア・アーギュメントおよび前記非コア従属語を、前記入力テキストの言語フレーズの先頭の下にインデントするための命令とをさらに備える、請求項１５に記載の少なくとも１つの非一時的な機械可読媒体。
前記出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む前記自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強される、請求項１５に記載の少なくとも１つの非一時的な機械可読媒体。
命令をさらに備え、この命令は、前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが、
匿名化された使用状況データまたはユーザ指定のプリファレンスを受け取るオペレーションと、
前記匿名化された使用状況データまたは前記ユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルを生成するオペレーションとを実行する、請求項１５に記載の少なくとも１つの非一時的な機械可読媒体。
命令をさらに備え、この命令は、前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサが、
前記カスタム表示プロファイルの前記出力表示特性を使用して前記出力を調整するオペレーションを実行し、前記表示特性が、前記出力の表示特徴を前記出力の形状の修飾なしで修飾する、請求項１８に記載の少なくとも１つの非一時的な機械可読媒体。
前記出力が、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成される、請求項１５に記載の少なくとも１つの非一時的な機械可読媒体。