JP5365209B2

JP5365209B2 - セグメント化及びキーフレーズを利用してモバイル機器でのドキュメントナビゲーションをサポートする方法、プログラム及びデバイス

Info

Publication number: JP5365209B2
Application number: JP2009007260A
Authority: JP
Inventors: カータースコット; チェンフランシーン; アール．チィーウパトリック
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2008-01-28
Filing date: 2009-01-16
Publication date: 2013-12-11
Anticipated expiration: 2029-01-16
Also published as: JP2009176298A; US8601393B2; US20090193337A1

Description

本発明は、情報ディスプレイに情報を表示することに関し、より詳しくは、ユーザによる閲覧に便利な形式でドキュメントを表現する（ｒｅｎｄｅｒ）よう小型ディスプレイでのドキュメントナビゲーションをセグメント化及びキーフレーズを利用してサポートする方法、プログラム及びデバイスに関する。

携帯電話やＰＤＡなどのウルトラ・ポータブル・ハンドヘルド・デバイスにはサイズ上の制限があり、情報閲覧のために利用可能な画面領域のサイズが制限される。このため、ユーザがこのようなデバイスを利用してテキスト形式の情報を読むことは困難である。当業界では上記問題の各種解決方法が開発されている。

小型画面上でドキュメントやウェブページを閲覧するための方法が数多く提案されている。例えば、非特許文献１では、戻り（ｒｅｔｕｒｎｅｄ）ドキュメント上の検索語のフォントサイズを自動的に拡大することによりウェブ検索を強化する。上記著者はモバイル機器での使用を意図して当該システムを設計していないが、携帯電話のウェブブラウザ上で実施可能である。しかし、記載された方法は、セグメント化された領域のテキストサマリーを利用しない。多数の異なる視覚化及び相互作用技術を提示したり非ウェブドキュメント全体のキーフレーズを視覚化するメカニズムを提供したりせずに、単純に元の位置でフォントサイズを拡大させる方法である。

非特許文献２では、判読可能なサイズの選択されたテキスト及び選択された画像からなる、余白を最小限としたレイアウトを生成することにより、ドキュメントページの縮小ビューであるＳｍａｒｔＮａｉｌ（スマートネイル）を作成する。一般的に、作成された縮小ビューではオリジナルドキュメントのレイアウトは変更される。この研究の目標は、ＰＤＡなどの小型ディスプレイ用の判読可能なサムネイルを作成することにある。しかし、記載されたシステムでは、異なるセクションとオリジナルテキストの間で索引付けは行われない。

非特許文献３に記載されたシステムは、ウェブページ上の重要なセグメントをパンする（ｐａｎ）アニメーションを自動的に作成する。記載された方法は、図のキャプションの他に、ドキュメントテキスト用キーフレーズを含む音声キューを更に含む。しかし、この方法はマニュアルによる相互作用を強化せず、音声に依存する。音声は利用不可能あるいは不適当である場合がある。

非特許文献４において、ｉＬｉａｄ（イリアッド）（登録商標）ドキュメントリーダーはニュース記事のタイトル及び第１センテンスをドキュメント全体の上にオーバレイ表示するよう動作する。

非特許文献５では、クエリ用語のセットのクエリ結果に対応するタイルの行を含む。各タイルはテキストセグメントを表し、行の長さがドキュメントの長さを表す。用語頻度は、タイルがグラフィック表示全体に出現する際のタイルの階調及びタイルによる用語分布によって示される。

非特許文献６では、パン及びズーム可能なインタフェースでドキュメントコレクションを表示する。しかし、このシステムは、キーフレーズではなく共同活動と関係するファイルをクラスタリングするものであり、ディスプレイはモバイル用インタフェース向けに設計されていない。更に、非特許文献７では、戻りドキュメントを平面のリストと対応するドキュメントの類似性に応じて位置決めされる球体のクラスタと共に提示するサーチエンジンである。

ウドルフ（Ｗｏｏｄｒｕｆｆ）等、「ウェブページ検索のためのサムネイルの利用（ＵｓｉｎｇｔｈｕｍｂｎａｉｌｓｔｏｓｅａｒｃｈｔｈｅＷｅｂＰａｇｅｓ）」、エーシーエムシーエイチアイ（ＡＣＭＣＨＩ）、２００１年、１９８〜２０５ページバークナー（Ｂｅｒｋｎｅｒ）等、「サムネイルに依存する画像及びディスプレイ（ＩｍａｇｅａｎｄＤｉｓｐｌａｙＤｅｐｅｎｄｅｎｔＴｈｕｍｂｎａｉｌｓ）」、エスピーアイイー（ＳＰＩＥ）、２００４年、５３〜６５ページエロール（Ｅｒｏｌ）等、「ドキュメント用マルチメディアサムネイル（ＭｕｌｔｉｍｅｄｉａＴｈｕｍｂｎａｉｌｓｆｏｒＤｏｃｕｍｅｎｔｓ）」、エーシーエムマルチメディア（ＡＣＭＭｕｌｔｉｍｅｄｉａ）、２００６年、２３１〜２４０ページエム．フード（Ｍ．Ｈｏｏｄ）、「デジタル・デリバランス？（ＤｉｇｉｔａｌＤｅｌｉｖｅｒａｎｃｅ?）」、イー・ニュースペーパー（Ｅ−Ｎｅｗｓｐａｐｅｒｓ）の記事、アイイーイーイースペクトル（ＩＥＥＥＳｐｅｃｔｒｕｍ）、２００７年２月ハースト（Ｈｅａｒｓｔ）、「タイルバー：フルテキスト情報アクセスにおける用語分布情報の視覚化（ＴｉｌｅＢａｒｓ：ＶｉｓｕａｌｉｚａｔｉｏｎｏｆＴｅｒｍＤｉｓｔｒｉｂｕｔｉｏｎＩｎｆｏｒｍａｔｉｏｎｉｎＦｕｌｌＴｅｘｔＩｎｆｏｒｍａｔｉｏｎＡｃｃｅｓｓ）」、エーシーエムシーエイチアイ（ＡＣＭＣＨＩ）、１９９５年、５９〜６６ページラテンバリー及びキャニー（ＲａｔｔｅｎｂｕｒｙａｎｄＣａｎｎｙ）「ＣＡＡＤシステム：自動的なタスク支援システム（ＣＡＡＤｓｙｓｔｅｍ：ＡｎＡｕｔｏｍａｔｉｃＴａｓｋＳｕｐｐｏｒｔＳｙｓｔｅｍ）」、エーシーエムシーエイチアイ（ＡＣＭＣＨＩ）、２００７年、６８７〜６９６ページロース（Ｌｅｕｓｋｉ）、「ライトハウス：関連情報への道を示す（Ｌｉｇｈｔｈｏｕｓｅ：ｓｈｏｗｉｎｇｔｈｅｗａｙｔｏｒｅｌｅｖａｎｔｉｎｆｏｒｍａｔｉｏｎ）」、アイイーイーイー情報視覚化会議００年（ＩＥＥＥＩｎｆｏＶｉｓ ’００）、２０００年、１２５〜１３０ページ

前述の進歩がなされたものの、当業界の従来の方法では、ユーザによる閲覧に便利な形式でドキュメントをレンダリングするための小型ディスプレイの効率的な利用を促進する能力が不十分である。

本発明の方法は、小型情報ディスプレイにドキュメントを表示する従来技術に関連する上記及び他の問題の１つ以上を実質上除去する方法及びシステムを提供する。

請求項１に記載の発明は、処理手段は、コンピュータ処理可能な形式のドキュメントデータにより再現されるドキュメントの複数のセグメントを識別し、前記処理手段は、前記識別されたセグメントに含まれるテキストから少なくとも１つのキーフレーズを決定し、前記決定された少なくとも１つのキーフレーズを少なくとも１つの対応するセグメントと関連付けて記憶手段に記憶し、表示手段は、前記決定された少なくとも１つのキーフレーズをディスプレイに表示し、入力手段は、ユーザからの入力を受信し、前記表示手段は、前記少なくとも１つのキーフレーズを選択する前記ユーザからの入力に応じて、前記ドキュメントを示すアイコン上に、選択された前記キーフレーズを含むセグメントをハイライトして前記ディスプレイに表示し、前記表示手段は、さらに、ハイライトして表示された何れかの前記セグメントを選択する前記ユーザからの入力に応じて、選択された前記セグメントをズームインして表示する。

請求項２に記載の発明は、コンピュータに、コンピュータ処理可能な形式のドキュメントデータにより再現されるドキュメントの複数のセグメントを識別し、前記識別されたセグメントに含まれるテキストから少なくとも１つのキーフレーズを決定し、前記決定された少なくとも１つのキーフレーズを各識別されたセグメントと関連付けて記憶手段に記憶し、前記決定された少なくとも１つのキーフレーズをディスプレイに表示し、ユーザからの入力を感知し、前記少なくとも１つのキーフレーズを選択する前記ユーザからの入力に応じて、前記ドキュメントを示すアイコン上に、選択された前記キーフレーズを含むセグメントをハイライトして前記ディスプレイに表示し、ハイライトして表示された何れかの前記セグメントを選択する前記ユーザからの入力に応じて、選択された前記セグメントをズームインして表示することを実行させる。

請求項１０に記載の発明は、ディスプレイを含む表示手段と、入力を感知する感知手段と、情報を記憶する記憶手段と、前記入力を処理し、コンピュータ処理可能な形式のドキュメントデータにより再現されるドキュメントに対応する少なくとも１つのキーフレーズを決定し、前記ドキュメントの複数のセグメントを識別し、前記決定された少なくとも１つのキーフレーズを各識別されたセグメントと関連付けて前記記憶手段に記憶させ、前記識別されたセグメントをハイライト、ズーム、又はナビゲートするために表示制御手段に指示を送る処理手段と、前記送られた指示を処理し、前記ディスプレイに表示するための視覚的表示を生成する表示制御手段と、を含むデバイスであって、前記表示制御手段は、前記少なくとも１つのキーフレーズを選択する前記ユーザからの入力に応じて、前記ドキュメントを示すアイコン上に、選択された前記キーフレーズを含むセグメントをハイライトして前記ディスプレイに表示すると共に、ハイライトして表示された何れかの前記セグメントを選択する前記ユーザからの入力に応じて、選択された前記セグメントをズームインして表示する。

発明概念の一実施形態に従ったマルチドキュメントビューを示す図である。発明概念の一実施形態に従ったドキュメントオーバービューをキーフレーズ選択リストと共に示す図である。発明概念の一実施形態に従ったページオーバービューを示す図である。発明概念の一実施形態に従ったリフロー（左）ビュー及びズーム（右）ビューを示す図である。発明概念の一実施形態に従った他のキーフレーズ選択リストを示す図である。本発明のシステムを実施可能なコンピュータプラットフォームの例示的実施形態を示す図である。本発明をコンピュータプラットフォームと関連付ける方法を示す例示的機能図である。

本発明に関する更なる態様は、一部は以下の説明で記載され、一部は説明から明白となり、あるいは本発明を実施することで理解される。本発明の態様は、以下の詳細な説明及び添付の特許請求の範囲において特に指摘された要素、及び各種要素と態様の組合せにより実現され達成される。

なお、前述の説明及び以下の説明はいずれも例示及び説明の目的で行われ、いかなる方法によっても特許請求された発明又は出願を制限することを意図していない。

明細書に組み込まれ、明細書の一部を構成する添付図面は、本発明の実施形態を例示し、説明と共に本発明の技術の原理を説明し図示する。

以下の詳細な説明では添付図面が参照される。図面においては同一の機能要素は同様の参照番号で示される。前述した添付図面は、本発明の原理にかなう特定の実施形態及び実施を例示するものであり、本発明を制限するものではない。これらの実施は、当業者が本発明を実行することを可能とすべく仔細に記述される。なお、他の実施も利用可能であり、本発明の範囲及び精神から逸脱することなく各種要素の構造変更及び／又は代替を実施可能である。従って、以下の詳細な説明は本発明を制限するものとして解釈されるべきではない。また、記載される本発明の各種実施形態は、汎用コンピュータ上で実行されるソフトウェア、専用のハードウェア、あるいはソフトウェアとハードウェアの組合せとして実施可能である。

携帯電話やＰＤＡなどの小型画面上でドキュメントの関心のあるセクションを閲覧し識別することは困難である。本発明の一実施形態は、ユーザがドキュメントの一部を読む際にドキュメントのコンテキストに気付きやすくすると同時にドキュメントの関心のあるセクションに容易に移動するためにキーフレーズを利用する方法を提供する。

技術的詳細
ドキュメントを処理し視覚化を作成するために、テキストのセクション又はセグメントが最初に識別される。この実施では、これらのセクションは一般的にパラグラフ又は図のキャプションに対応する。あるいは、セクションは副見出しの下のテキストなど、より大雑把なものであってもよい。次に、１つ以上のキーフレーズが各テキストセクションと関連付けられる。次いで、キーフレーズ及び識別されたセクションは、視覚化及びドキュメントとの対話のためにインタフェースによって利用される。

テキストセクション識別
入力ドキュメントは、スキャンされた紙のドキュメントや電子ドキュメントの、画像化されたページのセットであってもよい。入力ドキュメントがイメージ化されたページである場合、ドキュメントに対しレイアウト分析及びＯＣＲが最初に実施される。これは、別体の構成要素、又はＮｕａｎｃｅ社（ｈｔｔｐ：／／ｗｗｗ．ｎｕａｎｃｅ．ｃｏｍ）又はＡＢＢＹＹ社（ｈｔｔｐ：／／ｗｗｗ．ａｂｂｙｙ．ｃｏｍ）より市販される精巧なＯＣＲシステムによって実施してもよい。これらのシステムはスキャンされたドキュメントをＰＤＦドキュメントに変換する。

ＰＤＦドキュメントなど、何らかのマークアップを有する電子ドキュメントの場合、テキストのセクションがタグから直接識別できる。あるいはタグがセクション情報を含まない場合、セクションは行間隔、フォント高さ及びインデントに基づく経験則を利用して識別できる。例えば、現在の行が新しいセクションの始まりであることを示すインデントが左端になされていない限り、行間隔及びフォント高さが同一のテキスト領域は同一セクションに存在すると考えられる。１対の行の間隔が大きければ新しいセクションの始まりを示している。

キーフレーズの発見
キーフレーズを識別する方法は多数存在し、そのいずれも利用できる（ターネイ（Ｔｕｒｎｅｙ）、１９９７年）。簡単な方法はテキストの品詞（ＰＯＳ（ｐａｒｔ−ｏｆ−ｓｐｅｅｃｈ））にタグを付け、次に名詞句に対応するＰＯＳタグシーケンスを識別する方法である（ターネイ（Ｔｕｒｎｅｙ）、１９９７年）。別の方法は、「ストップワード」間の言葉のシーケンス、又は非内容語を識別する（チェン（Ｃｈｅｎ）、１９９５年）。

ドキュメントが多数のセクションを有し、各セクションを代表すべくキーフレーズが選択されている場合、テキスト中で既に識別された前のキーワード又はキーフレーズを考慮し、キーフレーズとして選択されていない用語に重み付けを行う方法が存在する。カーボネル及びゴールドシュタイン（ＣａｒｂｏｎｅｌｌａｎｄＧｏｌｄｓｔｅｉｎ）（１９９８年）は、クエリに対するドキュメントの類似性と事前に選択されたドキュメントに対するドキュメントの類似性との重み付き組合せを利用してドキュメントをランク分けするためにＭＭＲ（ＭａｘｉｍａｌＭａｒｇｉｎａｌＲｅｌｅｖａｎｃｅ）を利用することを提案した。Ｂｒａｎｔｓ（ブランツ）ら（２００４年）は、自己相互情報量（ＰｏｉｎｔｗｉｓｅＭｕｔｕａｌＩｎｆｏｒｍａｔｉｏｎ）などのセグメントの特徴付け及び差別化の統計的手段を利用する、インタラクティブなトピックベースの要約のためのキーワード及びキーフレーズの選択を提案する。

キーフレーズを識別する本発明の方法の実施形態は、候補キーフレーズとしてストップワード間の言葉のシーケンスを識別する。テキストの各セクションについては、候補のキーフレーズが取得され（ｓｃｏｒｅｄ）、Ｎ個のベストキーフレーズが選択される。Ｎは予め指定され、アプリケーションで利用可能な画面スペース量に依存してもよい。

ベストキーフレーズの選択に当たり、最大エントロピーモデルと類似する特徴の重み付き組合せが利用される。キーフレーズは、他のセクションについて選択されるキーフレーズを考慮し、セクション毎に見出される。選択は全ての組合せに対し最適化されてもよいが、簡潔を期すためにテキストセクションに指示し、テキストセクション毎に一度に１セクションずつキーフレーズを選択する。特徴はテキストベースであり、以下を含む。

１．ｔｆ_sec：現在のセクションにおける用語の出現回数
２．ｔｆ_doc：ドキュメントにおける用語の出現回数

３．ｄｆ_Eng：英語コーパス中で用語が少なくとも１回出現するドキュメント数
ＢｅｒｋｅｌｅｙａｎｄＳｔａｎｆｏｒｄＤｉｇｉｔａｌＬｉｂｒａｒｉｅｓｐｒｏｊｅｃｔ（バークレー及びスタンフォードデジタルライブラリプロジェクト）からのリストを利用した。このリストはｆｔｐ：//ｅｌｉｂ．ｃｓ．ｂｅｒｋｅｌｅｙ．ｅｄｕ/ｏｕｔｇｏｉｎｇ/ｄｏｃｆｒｅｑ/で利用可能であったが、現在はオンラインでは利用できない。尚、使用言語に応じた言語コーパスを用いることで各言語にも適用できることは明らかであろう。例えば日本語を対象とする場合には日本語コーパスを使用し、ｄｆ_Jpn：日本語コーパス中で用語が少なくとも１回出現するドキュメント数に置き換えればよい。

４．ｄｆ_sec：ドキュメント中の用語が少なくとも１回出現するセクション数
５．ｋ：候補キーフレーズがキーフレーズとして事前に選択された回数
６．ｔ：キーフレーズ中のトークン数
７．ｌ：パラグラフにおける用語の最初の言及位置
用語の重み付き組合せは下記式で与えられる。

式中、λ_iは特徴に加えられた重み、ｆ_i（）はドキュメントｄのセクションｓ_mにおけるキーフレーズ候補ｋ_jに関する特徴ｉの値である。キーフレーズの選択に当たって、他の手法との組合せ又はランク分けモデルも利用できる。例えば、セクション毎にキーフレーズでラベル付けされた訓練データが利用可能である場合、最大エントロピーモデルなどのより強力なモデルが代わりに利用できる（バーガー（Ｂｅｒｇｅｒ）ら、１９９６年）。

いったん各キーフレーズが取得されると、キーフレーズが相互に対してランク分けされ、各セクションのベストキーフレーズが選択される。このアプリケーションでは画面スペースが制限されていること、及びフォントサイズを判読可能なものとしたいことから、ベストキーフレーズのみを選択し、フレーズ中の単語の最大数を２に制限している。この方法はキーフレーズ選択の一例である。キーフレーズ毎に特定される最大数の用語を有するキーフレーズを選択し、キーフレーズをランク分けすることを可能とする任意の方法が利用できる。

インタフェース
システムは多数の異なる視覚化及び相互作用技術をサポートする。

図１は発明概念の一実施形態に従ったマルチドキュメントビューを示す。コレクションオーバービュー画面１００では、コレクション中のドキュメントのセットを最も適切に記述するキーワードがインタフェース１０１に分散配置される。各ドキュメントはスクエア１０２により示される。スクエアの位置は、対応するドキュメント中における表示されたキーワードの出現回数により決定される。例えば、図１のスクエア１０５で表されるドキュメントは、「ｌｏｒｅｍ」よりも「ｉｐｓｕｍ」に接近して位置し、「ｄｏｌｏｒ」や「ｓｉｔａｍｅｔ」には近くない。このことは、ドキュメント中で用語「ｉｐｓｕｍ」が「ｌｏｒｅｍ」よりも多く出現し、用語「ｄｏｌｏｒ」及び「ｓｉｔａｍｅｔ」は当該ドキュメントには出現しないことを示している。スクエアサイズは対応するドキュメントの現在表示されているビューにおけるキーフレーズの出現回数の和を利用して決定される（従って、小さいスクエアが、現在表示されているビューにおいてキーフレーズによって代表されないファイルサイズの大きいドキュメントを示していることもある）。キーフレーズがユーザインタフェースを通じて選択されると、そのキーフレーズ（この場合「ｉｐｓｕｍ」）が少なくとも１回出現するドキュメントの全てのスクエア（１０２、１０３等）がハイライトされる。多数のキーフレーズが選択されている場合、各選択されたキーワード（この場合「ｉｐｓｕｍ」及び「ｌｏｒｅｍ」）の少なくとも１つが出現するドキュメントのスクエアのみ（１０４）がハイライトされる。この方法はパンアンドズーム（ｐａｎ−ａｎｄ−ｚｏｏｍ）インタラクティブ技術及び３Ｄ視覚化技術と組合せるなどして、表示されるキーフレーズのより大きいセットに拡張可能である。

図２は、ドキュメントオーバービューをキーフレーズ選択リストと共に示す。ドキュメントオーバービュー画面２００と、その下部にキーフレーズ２０１が選択ウィンドウに出現する。ユーザが選択リスト２０２をスクロールすると、それらのキーフレーズに対応するドキュメントのセグメント（２０３）がハイライトされる。例示的な図では、選択されたキーフレーズ「ＧｌｏｂａｌＰｒｏｊｅｃｔ」に対応するセグメントが左上及び左下のページでハイライトされる。ユーザは、例えば上下キーを利用したり、画面中でペンを上下にドラッグしたり、あるいはタッチパネルなどを利用したりすることで、選択リスト中の異なるキーフレーズ間をナビゲートできる。また、あるキーフレーズに関して、ユーザはハイライトされた異なるセグメント間をナビゲートできる。ハイライトされたセグメントが選択されると、当該セグメントに輪郭が表示される。ここでは、左上のページのセグメントがハイライトされる。例えばセンターボタン（携帯電話の中央のキー）を押下したり、ハイライトされた領域をペンなどでタップしたりすることによってユーザが入力を行うと、インタフェースはハイライトされた適切なセグメント上でズームインする。

図３はページオーバービューを図示する。ページオーバービュー画面３００では、全てのキーフレーズが各セグメント３０１上にオーバレイ表示される。更に、キーフレーズは、各キーフレーズ３０２に隣接して示されるキーパッド上の数字にマッピングされてもよい。ユーザがペンでキーフレーズをタップし、あるいは対応する番号を入力すると、インタフェースは適切なセグメント上でズームインする。ここで、ユーザがキー「３」を押下した場合、アプリケーションは当該セグメントへズームインする。

図４はリフロー（ｒｅｆｌｏｗ）ビュー（左）及びズームビュー（右）を示す。ズーム画像４０１及びテキストリフロー画面４００上で、ユーザは選択ウィンドウ４０２におけるページのキーフレーズ間をナビゲートできる。ユーザが選択リストをスクロールすると、これらのキーフレーズに対応するドキュメントのセグメントがオーバービュー視覚化４０３においてハイライト表示される。ユーザは、上下キーを利用したり、画面中でペンを上下にドラッグしたりすることにより選択リスト中の異なるキーフレーズ間をナビゲートし、またセンターボタンを押下したり、ハイライト表示されたキーフレーズ４０４を選択したりすることにより、キーフレーズを選択する。ユーザがキーフレーズを選択すると、アプリケーションは適切なセグメント４０５へズームインする。

図５は他のキーフレーズ選択リストを示す。別の実施形態では、選択ウィンドウ中のキーフレーズは、キーフレーズに隣接する小さいグラフィックアイコン（５００）と共に示される。この技術は、ＳｍａｌｌＭｕｌｔｉｐｌｅｓ（スモールマルチプル）（Ｔｕｆｔｅ（タフティ）、１９９０年）として知られている有効な情報視覚化設計原理に従う。グラフィックアイコンは、当該ページのキーフレーズの各インスタンスの空間的位置、あるいは現在のページにおける当該キーフレーズが出現するセグメントに対応するハイライト表示された領域（５０３）を有するドキュメントページを表す。更にこの実施形態では、選択リスト上部に設けられる水平ペイン５０１に、ハイライト表示されたキーフレーズが出現する全ページをドキュメントの位置でハイライト表示する。またボックスで、ユーザが現在閲覧しているページを、現在選択されているキーフレーズ５０２と同様にハイライト表示する。小さいグラフィックアイコンにより、読み手はハイライト表示された位置によって各キーフレーズに関する意味的な情報（例えば、キーフレーズはタイトルの一部である）を推測することが可能となる。これらのグラフィックアイコンを見ればキーフレーズの分布を読みとることができる。ハイライト表示は、セグメント中に、又は水平ペインに関してはページ中にキーフレーズが出現する回数を示すべく色又は強度によって更に表現してもよい。

例示的コンピュータプラットフォーム
図６は、本発明の方法の一実施形態を実施可能なコンピュータ／サーバシステム６００の一実施形態を示すブロック図である。システム６００は、コンピュータ／サーバプラットフォーム６０１、周辺機器６０２及びネットワークリソース６０３を含む。

コンピュータプラットフォーム６０１は、コンピュータプラットフォーム６０１の各部間で情報を通信するためのデータバス６０４又は他の通信機構を含んでいてもよい。また、情報を処理し、他の計算タスク又は制御タスクを実行すべくバス６０４と接続されたプロセッサ６０５を含んでいてもよい。コンピュータプラットフォーム６０１は、各種情報のほか、プロセッサ６０５によって実行される指示を記憶するためにバス６０４に接続されたランダムアクセスメモリ（ＲＡＭ）又は他の動的記憶装置デバイスなどの揮発性記憶装置６０６を更に含む。揮発性記憶装置６０６は、更にプロセッサ６０５による指示の実行の際に一時変数又は他の中間情報を記憶すべく利用できる。コンピュータプラットフォーム６０１は、基本入出力システム（ＢＩＯＳ）などの静的情報及びプロセッサ６０５への指示、及び各種システム構成パラメータを記憶すべくバス６０４に接続された読み出し専用メモリ（ＲＯＭ又はＥＰＲＯＭ）６０７又は他の静的記憶装置を更に含む。磁気ディスク、光ディスク又はソリッドステートフラッシュメモリデバイスなどの持続性記憶装置６０８が設けられ、情報及び指示を記憶すべくバス６０４に接続される。

コンピュータプラットフォーム６０１は、システム管理者又はコンピュータプラットフォーム６０１のユーザに情報を表示するためのブラウン管（ＣＲＴ）、プラズマディスプレイ又は液晶ディスプレイ（ＬＣＤ）などのディスプレイ（表示手段）６０９にバス６０４を介して接続されてもよい。英数字及び他のキーを含む入力デバイス６１０が、プロセッサ６０５に情報及びコマンド選択を伝えるべくバス６０４に接続される。別のタイプのユーザ入力デバイスは、プロセッサ６０４に方向に関する情報及びコマンド選択を伝え、及びディスプレイ６０９上のカーソル移動を制御するためのマウス、トラックボール又はカーソル方向キーなどのカーソル制御デバイス６１１である。一般的に、この入力デバイスは第一軸（例えばｘ）及び第二軸（例えばｙ）の２つの軸において２つの自由度を有し、これによりデバイスは平面上の位置を特定できる。

外部記憶装置６１２は、コンピュータプラットフォーム６０１に追加記憶容量又はリムーバブル記憶容量を提供すべくバス６０４を介してコンピュータプラットフォーム６０１に接続されてもよい。コンピュータシステム６００の一実施形態において、他のコンピュータシステムをとの間でデータの交換を容易とすべく外部リムーバブル記憶装置６１２が利用されてもよい。

本発明は、本願明細書中に記載された技術を実施するためのコンピュータシステム６００の使用に関する。実施形態では、本発明のシステムはコンピュータプラットフォーム６０１などのマシン上に存在してもよい。本発明の一実施形態によれば、本願明細書中に記載された技術は、揮発性メモリ６０６に含まれる１つ以上の指示の１つ以上のシーケンスを実行するプロセッサ６０５に応答してコンピュータシステム６００により実行される。このような指示は、持続性記憶装置６０８など別のコンピュータ可読媒体から揮発性メモリ６０６に読み込まれてもよい。揮発性メモリ６０６に含まれる指示シーケンスが実行されると、プロセッサ６０５は本願明細書中に記載されたプロセスステップを実行する。他の実施例では、ハードワイヤード回路が、本発明を実施するためのソフトウェア指示に替えて、あるいはソフトウェア指示と組み合わされて利用されてもよい。従って、本発明の実施形態はハードウェア回路とソフトウェアの任意の特定の組合せに制限されない。

本願明細書中で用いられる用語「コンピュータ可読媒体」は、実行させるための指示をプロセッサ６０５に提供することに関与する任意の媒体を指す。コンピュータ可読媒体は機械可読媒体の一例であり、本願明細書中に記載された任意の方法及び／又は技術を実施するための指示を有してもよい。このような媒体は多くの形式を取ることができ、不揮発性媒体及び揮発性媒体が含まれるがこれらに限定されない。例えば、不揮発性媒体は記憶装置６０８などの光学ディスク又は磁気ディスクを含む。揮発性媒体は揮発性記憶装置６０６などのダイナミックメモリを含む。

コンピュータ可読媒体の一般的な形式として、例えば、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ又は任意の他の磁気媒体、ＣＤ−ＲＯＭ、任意の他の光学媒体、せん孔カード、紙テープ、穴のパターンを有する任意の他の物理的媒体、ＲＡＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＦＬＡＳＨ−ＥＰＲＯＭ、フラッシュドライブ、メモリーカード、他のメモリチップ又はカートリッジ、後述する搬送波、あるいはコンピュータが読み出し可能な任意の他の媒体が挙げられる。

各種形式のコンピュータ可読媒体は、実行させるための１つ以上の指示の１つ以上のシーケンスをプロセッサ７０５に伝えることに関与してもよい。例えば、指示は、最初に遠隔コンピュータから磁気ディスク上で搬送されてもよい。あるいは、遠隔コンピュータは自らのダイナミックメモリに指示をロードし、モデムを利用して、電話線を通じて指示を送ることが可能である。コンピュータシステム６００のローカルモデムは、電話線を通じてデータを受け取り、データを赤外線信号に変換すべく赤外線トランスミッタを利用してもよい。赤外線検知器は、赤外線信号で搬送されるデータを受け取ることができ、適切な回路によりデータをデータバス６０４に配置できる。データはバス６０４により揮発性記憶装置６０６に搬送され、プロセッサ６０５が揮発性記憶装置６０６から指示を検索し実行する。揮発性メモリ６０６によって受け取られた指示は、プロセッサ６０５により実行される前又は後に必要に応じて持続性記憶装置６０８に記憶されてもよい。更に、指示は当該技術でよく知られている各種ネットワークデータ通信プロトコルを利用して、インターネットを通じてコンピュータプラットフォーム６０１へダウンロードされてもよい。

コンピュータプラットフォーム６０１は、データバス６０４に接続されたネットワークインタフェースカード６１３などの通信インタフェースを更に含む。通信インタフェース６１３は、ローカルネットワーク６１５に接続されるネットワークリンク６１４に接続する２方向のデータ通信を提供する。例えば、通信インタフェース６１３は、対応するタイプの電話線にデータ通信接続を提供するデジタル総合通信サービス綱（ＩＳＤＮ）カード又はモデムであってもよい。別の例として、通信インタフェース６１３は、互換性をもつＬＡＮにデータ通信接続を提供するローカルエリアネットワークインタフェースカード（ＬＡＮＮＩＣ）であってもよい。また、ネットワークの実施のために、よく知られている８０２．１１ａ、８０２．１１ｂ、８０２．１１ｇ及びブルートゥースなどのワイヤレスリンクが利用できる。このような実施のいずれにおいても、通信インタフェース６１３は、各種タイプの情報を表すデジタルデータストリームを搬送する電気信号、電磁気信号、あるいは光学信号を送受信する。

ネットワークリンク６１３は一般的に１つ以上のネットワークを介して他のネットワークリソースにデータ通信を提供する。例えば、ネットワークリンク６１４は、ローカルネットワーク６１５を介してホストコンピュータ６１６又はネットワークストレージ／サーバ６１７に接続を提供してもよい。更に又はあるいはネットワークリンク６１３は、ゲートウェイ／ファイアウォール６１７を介してインターネットなどのワイドエリアネットワーク又はグローバルネットワーク６１８へ接続してもよい。従って、コンピュータプラットフォーム６０１は、遠隔ネットワークストレージ／サーバ６１９などのインターネット６１８上の任意の場所に位置するネットワークリソースにアクセスできる。他方、コンピュータプラットフォーム６０１は、ローカルエリアネットワーク６１５及び／又はインターネット６１８上の任意の場所に位置するクライアントによってアクセス可能である。ネットワーククライアント６２０及び６２１はプラットフォーム６０１と同様のコンピュータプラットフォームに基づいて実施されてもよい。

ローカルネットワーク６１５及びインターネット６１８はいずれも、デジタルデータストリームを搬送する電気信号、電磁気信号又は光学信号を利用する。コンピュータプラットフォーム６０１との間でデジタルデータを搬送する、各種ネットワークを通じた信号、及びネットワークリンク６１４上の信号及び通信インタフェース６１３を通じた信号は、情報を搬送する搬送波の例示的形式である。

コンピュータプラットフォーム６０１は、インターネット６１８及びＬＡＮ６１５を含む各種ネットワーク、ネットワークリンク６１４及び通信インタフェース６１３を通じてメッセージを送り、プログラムコードを含むデータを受け取ることが可能である。インターネットの例では、システム６０１がネットワークサーバとして機能する場合、システム６０１はインターネット６１８、ゲートウェイ／ファイアウォール６１７、ローカルエリアネットワーク６１５及び通信インタフェース６１３を通じて、クライアント６２０及び／又は６２１上で実行されるアプリケーションプログラムのための要求されたコード又はデータを送信してもよい。同様に、システム６０１は他のネットワークリソースからコードを受け取ってもよい。

受け取られたコードは、受け取られたときにプロセッサ６０５によって実行されてもよく、及び／又は持続性記憶装置６０８又は揮発性記憶装置６０６の各々あるいは他の不揮発性記憶装置に記憶され、後で実行されてもよい。このように、コンピュータシステム６０１はアプリケーションコードを搬送波の形で取得してもよい。

図７は、本発明をコンピュータプラットフォームと関連付ける方法を示す例示的機能図である。

本発明の一例示的実施形態がドキュメントナビゲーションのためにセグメント化及びキーフレーズ要約を利用する方法の一例、利用される例示的コンピュータプラットフォーム、及び本発明がコンピュータプラットフォームと関連する方法の一例が提示されている。ここで、図はコレクションオーバービュー画面の実施形態を示す。ディスプレイ（表示手段）７００から入力が行われると、感知手段７０１は入力を感知し、処理手段に送る。次いで、この情報は、情報を処理し、ユーザがディスプレイを通じて入力したコマンドを解釈する処理手段７０２へ送られる。処理手段は情報を処理するためにＲＡＭ／ＲＯＭ７０６及びＣＰＵ７０５を利用してもよい。例えば、ユーザ入力がキーワード「ｉｐｓｕｍ」に対応するドキュメントの全てのスクエアをハイライト表示させるコマンドである場合、処理手段はこれらの指示を処理し、表示制御手段７０３に送る。表示制御手段７０３は、当該キーワードが少なくとも１回出現するドキュメントの全てのスクエアをハイライト表示する。同様に、ユーザ入力が、多数のキーワードに対応するドキュメントの全てのスクエアをハイライト表示させるコマンドである場合、これらの多数のキーワードを有するドキュメントのスクエアのみがハイライト表示される。更に、本発明の他の実施形態は、この例示的コンピュータプラットフォームを通じて可能である。更に、コンピュータプラットフォームは触覚的相互作用によりコマンドを受け取ることに制限されず、前述した他の入出力デバイス７０４が、処理手段へのコマンドの入力のためにコンピュータプラットフォームに取り付けられてもよい。

処理手段７０２は、認識手段８０１とドキュメント処理手段８０２とを有してもよい。認識手段８０１は、ドキュメントのテキストの品詞（ＰＯＳ）にタグを付け、名詞句に対応するＰＯＳタグシーケンスを識別することにより、キーフレーズを決定する。ドキュメント処理手段８０２は、ドキュメントと関連付けられたタグを利用してドキュメントの複数のセグメントを識別する。ドキュメントの複数のセグメントを識別するために、行間隔、フォント高さ又はインデントに基づくヒューリスティックを利用してもよい。ドキュメントに対してレイアウト分析を実行したり又は光学式文字認識（ＯＣＲ）を利用してもよい。また、ドキュメントの複数のセグメントを識別するための処理指示がＲＡＭ／ＲＯＭ７０６等の記憶手段に記憶され、処理手段は、記憶手段から処理指示を取り出して処理してもよい。

最後に、本願明細書中に記載されたプロセス及び技術は任意の特定の装置に関連したものではなく、構成要素の任意の適切な組合せによっても実行できることを理解されたい。更に、本願明細書中に記載された教示に従い、各種タイプの汎用デバイスを利用してもよい。本願明細書中に記載された方法ステップを実行するための専用装置を構築することは更に有利である。本発明は特定の例に関して記載されたが、これらはあくまで例であり本発明を制限するものではない。当業者は、ハードウェア、ソフトウェア及びファームウェアの様々に異なる組合せが本発明の実施に適することを認識する。例えば、記載されたソフトウェアは、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、シェル、ＰＨＰ、Ｊａｖａ（登録商標）など、各種プログラミング言語又はスクリプト記述言語で実施可能である。

更に、本発明の他の実施は、本願明細書中に示された本発明の仕様及び実施を考察することで当業者には明白になる。記載された実施形態の各種態様及び／又は構成要素は、本発明の情報ディスプレイ及びナビゲーションシステムにおいて単独で又は任意の組合せで利用できる。仕様及び例はあくまで例として解釈されるものであり、本発明の正確な範囲及び精神は以下の特許請求の範囲に示される。

Claims

処理手段は、コンピュータ処理可能な形式のドキュメントデータにより再現されるドキュメントの複数のセグメントを識別し、
前記処理手段は、前記識別されたセグメントに含まれるテキストから少なくとも１つのキーフレーズを決定し、前記決定された少なくとも１つのキーフレーズを少なくとも１つの対応するセグメントと関連付けて記憶手段に記憶し、
表示手段は、前記決定された少なくとも１つのキーフレーズをディスプレイに表示し、
入力手段は、ユーザからの入力を受信し、
前記表示手段は、前記少なくとも１つのキーフレーズを選択する前記ユーザからの入力に応じて、前記ドキュメントを示すアイコン上に、選択された前記キーフレーズを含むセグメントをハイライトして前記ディスプレイに表示し、
前記表示手段は、さらに、ハイライトして表示された何れかの前記セグメントを選択する前記ユーザからの入力に応じて、選択された前記セグメントをズームインして表示する、
ことを含む方法。
コンピュータに、
コンピュータ処理可能な形式のドキュメントデータにより再現されるドキュメントの複数のセグメントを識別し、
前記識別されたセグメントに含まれるテキストから少なくとも１つのキーフレーズを決定し、前記決定された少なくとも１つのキーフレーズを各識別されたセグメントと関連付けて記憶手段に記憶し、
前記決定された少なくとも１つのキーフレーズをディスプレイに表示し、
ユーザからの入力を感知し、
前記少なくとも１つのキーフレーズを選択する前記ユーザからの入力に応じて、前記ドキュメントを示すアイコン上に、選択された前記キーフレーズを含むセグメントをハイライトして前記ディスプレイに表示し、
ハイライトして表示された何れかの前記セグメントを選択する前記ユーザからの入力に応じて、選択された前記セグメントをズームインして表示する
ことを実行させるためのプログラム。
前記ドキュメントの前記複数のセグメントは、前記ドキュメントに対して実行されるレイアウト分析又は光学式文字認識（ＯＣＲ）を利用して識別される請求項２記載のプログラム。
前記ドキュメントデータは前記ドキュメントと関連付けられた少なくとも１つのタグを含み、前記ドキュメントの前記複数のセグメントは、前記タグを利用して識別される請求項２記載のプログラム。
前記少なくとも１つのキーフレーズは、前記ドキュメントのテキストの品詞（ＰＯＳ）にタグを付け、名詞句に対応するＰＯＳタグシーケンスを識別することにより決定される請求項２記載のプログラム。
表示の際、前記決定された少なくとも１つのキーフレーズを、前記ディスプレイの前記ドキュメントの前記対応する識別されたセグメントにオーバレイ表示する請求項２記載のプログラム。
前記少なくとも１つのキーフレーズは、
所与のセクションにおける用語の出現回数、
ドキュメントにおける用語の出現回数、
コーパスにおける、用語が少なくとも１回出現するドキュメント数、
ドキュメントにおける、用語が少なくとも１回出現するセクション数、
候補キーフレーズがキーフレーズとして事前に選択された回数、
キーフレーズ中のトークン数、
パラグラフ中で用語が最初に言及された位置、
のうち少なくとも１つに基づく統計的方法を利用して決定される、請求項２記載のプログラム。
前記キーフレーズに対応するセグメントには、前記キーフレーズが出現する請求項２記載のプログラム。
ドキュメントの対応するページに対する各セグメントの位置を表すために、ドキュメントを表すバー上のセグメントを、前記ディスプレイでハイライト表示する請求項８記載のプログラム。
ディスプレイを含む表示手段と、
入力を感知する感知手段と、
情報を記憶する記憶手段と、
前記入力を処理し、コンピュータ処理可能な形式のドキュメントデータにより再現されるドキュメントに対応する少なくとも１つのキーフレーズを決定し、前記ドキュメントの複数のセグメントを識別し、前記決定された少なくとも１つのキーフレーズを各識別されたセグメントと関連付けて前記記憶手段に記憶させ、前記識別されたセグメントをハイライト、ズーム、又はナビゲートするために表示制御手段に指示を送る処理手段と、
前記送られた指示を処理し、前記ディスプレイに表示するための視覚的表示を生成する表示制御手段と、
を含むデバイスであって、
前記表示制御手段は、前記少なくとも１つのキーフレーズを選択する前記ユーザからの入力に応じて、前記ドキュメントを示すアイコン上に、選択された前記キーフレーズを含むセグメントをハイライトして前記ディスプレイに表示すると共に、ハイライトして表示された何れかの前記セグメントを選択する前記ユーザからの入力に応じて、選択された前記セグメントをズームインして表示する
デバイス。
前記感知手段は、ユーザによる少なくとも１つのキーフレーズの選択の入力を受け取ることを更に含み、
前記処理手段は、前記ドキュメントの前記対応するセグメントを前記ディスプレイに表示するよう前記表示制御手段に指示を送ることを更に含む、
請求項１０記載のデバイス。
前記処理手段は、前記決定された少なくとも１つのキーフレーズを前記ディスプレイ上で、ドキュメントの対応する識別されたセグメントへオーバレイ表示するための指示を前記表示制御手段に送ることを更に含む請求項１１記載のデバイス。
前記処理手段は、前記ドキュメントのテキストの品詞（ＰＯＳ）にタグを付け、名詞句に対応するＰＯＳタグシーケンスを識別することにより、前記少なくとも１つのキーフレーズを決定する認識手段を更に含む請求項１０記載のデバイス。
前記記憶手段には、前記ドキュメントの前記複数のセグメントを識別するための処理指示が記憶され、
前記処理手段は、前記記憶手段から前記処理指示を取り出して処理する、請求項１０記載のデバイス。
前記処理手段は、ドキュメントと関連付けられた少なくとも１つのタグを利用して前記ドキュメントの前記複数のセグメントを識別するドキュメント処理手段を更に含む請求項１０記載のデバイス。
前記処理手段は、ドキュメントに対して実行されるレイアウト分析又は光学式文字認識（ＯＣＲ）を利用して、前記ドキュメントの前記複数のセグメントを識別するドキュメント処理手段を更に含む請求項１０記載のデバイス。
前記処理手段は、
所与のセクションにおける用語の出現回数、
ドキュメントにおける用語の出現回数、
コーパスにおける、用語が少なくとも１回出現するドキュメント数、
ドキュメントにおける、用語が少なくとも１回出現するセクション数、
候補キーフレーズがキーフレーズとして事前に選択された回数、
キーフレーズ中のトークン数、
パラグラフ中で用語が最初に言及された位置、
に基づく統計的方法を利用して少なくとも１つのキーフレーズを決定する、請求項１０記載のデバイス。