JP6972743B2 - オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法、コンピュータに実装された方法、プログラム、及びコンピュータ化システム - Google Patents

オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法、コンピュータに実装された方法、プログラム、及びコンピュータ化システム Download PDF

Info

Publication number
JP6972743B2
JP6972743B2 JP2017148507A JP2017148507A JP6972743B2 JP 6972743 B2 JP6972743 B2 JP 6972743B2 JP 2017148507 A JP2017148507 A JP 2017148507A JP 2017148507 A JP2017148507 A JP 2017148507A JP 6972743 B2 JP6972743 B2 JP 6972743B2
Authority
JP
Japan
Prior art keywords
document
user
excerpt
computer
actions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017148507A
Other languages
English (en)
Other versions
JP2018073387A (ja
Inventor
ドゥヌ ローラン
カーター スコット
クーパー マシュー
メロー ジェニファー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2018073387A publication Critical patent/JP2018073387A/ja
Application granted granted Critical
Publication of JP6972743B2 publication Critical patent/JP6972743B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04812Interaction techniques based on cursor appearance or behaviour, e.g. being affected by the presence of displayed objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Description

開示される実施形態は、一般に、コンピュータネットワークを使用する人々の間の遠隔対話に関し、より詳細には、オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法に関する。
以前の作業は、2つの別個の比喩:文章中心または会話中心を使用して、文書コラボレーションに取り組んでいた。会話中心手法の場合、会話は文書の外で行われ、通常、ユーザは添付書類として文書を電子メールし、会話は、当業者によく知られている電子メールまたはSlackなどのチャットアプリケーションにより外で行われ、ここで、ユーザは文書をリンクすることができるが、会話は依然文書の外で行われる。この手法の利点は、会話が様々な文書を持ち込むことができることである。しかしながら、ユーザは、会話の中に文書上で行うコメントを持ち込む手段をもたない。ユーザは、このPPTの「スライド4の黒丸3に同意しない」などの言及を行わざるを得ない。したがって、そのような通信はフォローすることが困難である。1つの反例は、現在見られているウェブページの外に存在するチャットウィンドウの中で、ウェブページの部分にユーザが言及を埋め込むことを可能にする、当業者によく知られているKifi1である。
他方、文書中心手法は、チャットボックスと同様に、当業者によく知られているWord、Google Docs内で達成されているように、ならびに、両方とも同様に当業者によく知られているQuipおよびGoogle Docs内で実施されているように、コメントの形態で、1つの文書の中に会話を埋め込む。富士ゼロックスパロアルト研究所から入手可能なStickyChatsや、非特許文献1に記載されたAnchored Conversationsなどのいくつかのよく知られているツールでは、Word文書の特定の場所に会話チャットボックスをユーザがピン止めすることを可能にする。文書中心手法は一度に1つの文書に焦点を合わせるので、Word、Excel、抜粋コード、画像などの多くの文書および文書タイプが実際の作業中に頻繁に使用される、現代のワークフローを十分にサポートしない。
加えて、ビデオ会議上で直示言及をサポートすることは、人々が対面していない場合に自分達の会話を足止めすることを支援する重要な方法である。非特許文献2において詳細に記載されているように、遠隔助勢に関する1つの研究は、物体や位置を指し示す指示がすべての遠隔命令のうちの75%に及ぶことを示している。また、視線の利用によって、ユーザの意図に基づく合図を暗示しているので、注目領域について、より豊富な情報を追加することが可能となる(たとえば、非特許文献3を参照)。遠隔助勢の状況におけるポインティングと視線追跡を比較する最近の実験は、(単独でのこれらの合図のうちのただ1つに比べて)ポインティングと視線の情報の両方を使うことで、パフォーマンスや実在するものに対する感知の点で最良であることがわかっている(非特許文献4を参照)。
Elizabeth F.Churchill、Jonathan Trevor、Sara Bly、Les Nelson、およびDavor Cubranic、2000年、Anchored conversations:chatting in the context of a document Susan R.Fussell、Leslie D.Setlock、Jie Yang、Jiazhi Ou、Elizabeth Mauer、およびAdam DI Kramer、2004年、Gestures over video streams to support remote collaboration on physical tasks.Human−Computer Interaction 19、3:273−309 Deepak AkkilおよびPoika Isokoski、2016年、Gaze Augmentation in Egocentric Video Improves Awareness of Intention、1573−1584 K.Gupta、G.Lee、およびM.Billinghurst、2016年、Do You See What I See? The Effect of Gaze Tracking、IEEE Transactions on Visualization and Computer Graphics PP、99:1−1
本明細書に記載された一つの実施形態は、ネットワークを通じた会話ストリーム内での文書位置の着目領域の把握が可能なコミュニケ―ションの方法を提供する。
本明細書に記載された発明概念の一態様によれば、コンピュータに実装された方法が提供され、方法は中央処理装置およびメモリを搭載するコンピュータ化システム内で実施され、コンピュータに実装された方法は、文書に関連するユーザの1つまたは複数のアクションを検出し、文書のコンテンツを解析し、文書のレイアウトを解析し、文書に関連するユーザの検出した1つまたは複数のアクション、解析した文書コンテンツ、および解析した文書レイアウトに基づいて、再生可能な文書ページの抜粋を自動的に生成し、自動的に生成した再生可能な文書ページの抜粋を文書に関連付けられた会話ストリームに挿入することを含む。
1つまたは複数の実施形態では、検出したユーザアクションは、文書の少なくとも一部分の上のユーザによるマウスポインタのホバリングである。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによるテキスト入力である。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによる音声コメントである。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによる注視である。
1つまたは複数の実施形態では、文書に関連付けられた会話ストリームは、チャットウィンドウ内に表示される。
1つまたは複数の実施形態では、自動的に生成した再生可能な文書ページの抜粋は、意味的にリンクされたユーザのアクションに対応する文書の2つ以上の部分を備える複合抜粋である。
1つまたは複数の実施形態では、方法は、文書の別個のビューワを開かずに会話ストリームの中で、自動的に生成した再生可能な文書ページの抜粋を表示および再生することを更に含む。
1つまたは複数の実施形態では、方法は、文書用の別個のビューワを開かずに会話ストリームの中で、自動的に生成した再生可能な文書ページの抜粋にユーザが応答することを可能にすることを更に含む。
1つまたは複数の実施形態では、方法は、自動的に生成された再生可能な文書ページの抜粋と、文書に関連するユーザの対応する検出された1つまたは複数のアクションとを一緒にグループ化することを更に含む。
1つまたは複数の実施形態では、方法は、ユーザが文書のビューワに焦点を合わせるとき、関連する抜粋をフィルタリングし、ユーザの対応する1つまたは複数のアクションを検出することを更に含む。
1つまたは複数の実施形態では、文書の同じページ領域の上の複数のユーザからのアクションは、複数のユーザのアクションを備える単一の抜粋をもたらす重ね合わせを使用してグループ化される。
1つまたは複数の実施形態では、検出したユーザアクションは、文書の少なくとも一部分の上のユーザによるポインタの動きであり、ポインタの動きが、低いサンプリングレートで取得されると、ポインタの動きは円滑化され、その円滑化は、構成要素または文書の文書オブジェクトモデルに関連付けられた基となるテキストに基づいて、偽テキストカーソルを挿入することを含む。
本明細書に記載された発明概念の別の態様によれば、1組のコンピュータ実行可能命令を具現化する非一時的コンピュータ可読媒体が提供され、コンピュータ実行可能命令は、中央処理装置およびメモリを搭載するコンピュータ化システムと連携して実行されると、文書に関連するユーザの1つまたは複数のアクションを検出し、文書のコンテンツを解析し、文書のレイアウトを解析し、文書に関連するユーザの検出した1つまたは複数のアクション、解析した文書コンテンツ、および解析した文書レイアウトに基づいて、再生可能な文書ページの抜粋を自動的に生成し、自動的に生成した再生可能な文書ページの抜粋を文書に関連付けられた会話ストリームに挿入することを含む方法をコンピュータ化システムに実施させる。
1つまたは複数の実施形態では、検出したユーザアクションは、文書の少なくとも一部分の上のユーザによるマウスポインタのホバリングである。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによるテキスト入力である。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによる音声コメントである。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによる注視である。
1つまたは複数の実施形態では、文書に関連付けられた会話ストリームは、チャットウィンドウ内に表示される。
1つまたは複数の実施形態では、自動的に生成した再生可能な文書ページの抜粋は、意味的にリンクされたユーザのアクションに対応する文書の2つ以上の部分を備える複合抜粋である。
1つまたは複数の実施形態では、方法は、文書の別個のビューワを開かずに会話ストリームの中で、自動的に生成した再生可能な文書ページの抜粋を表示および再生することを更に含む。
1つまたは複数の実施形態では、方法は、文書用の別個のビューワを開かずに会話ストリームの中で、自動的に生成した再生可能な文書ページの抜粋にユーザが応答することを可能にすることを更に含む。
1つまたは複数の実施形態では、方法は、自動的に生成した再生可能な文書ページの抜粋と、文書に関連するユーザの対応する検出した1つまたは複数のアクションとを一緒にグループ化することを更に含む。
1つまたは複数の実施形態では、方法は、ユーザが文書のビューワに焦点を合わせるとき、関連する抜粋をフィルタリングし、ユーザの対応する1つまたは複数のアクションを検出することを更に含む。
1つまたは複数の実施形態では、文書の同じページ領域の上の複数のユーザからのアクションは、複数のユーザのアクションを備える単一の抜粋をもたらす重ね合わせを使用してグループ化される。
1つまたは複数の実施形態では、検出したユーザアクションは、文書の少なくとも一部分の上のユーザによるポインタの動きであり、ポインタの動きが、低いサンプリングレートで取得されると、ポインタの動きは円滑化され、その円滑化は、構成要素または文書の文書オブジェクトモデルに関連付けられた基となるテキストに基づいて、偽テキストカーソルを挿入することを含む。
本明細書に記載された発明概念のまた別の態様によれば、中央処理装置およびメモリを搭載するコンピュータ化システムが提供され、メモリは、文書に関連するユーザの1つまたは複数のアクションを検出し、文書のコンテンツを解析し、文書のレイアウトを解析し、文書に関連するユーザの検出した1つまたは複数のアクション、解析した文書コンテンツ、および解析した文書レイアウトに基づいて、再生可能な文書ページの抜粋を自動的に生成し、自動的に生成した再生可能な文書ページの抜粋を文書に関連付けられた会話ストリームに挿入することを含む方法をコンピュータ化システムに実施させる1組のコンピュータ可読命令を記憶する。
1つまたは複数の実施形態では、検出したユーザアクションは、文書の少なくとも一部分の上のユーザによるマウスポインタのホバリングである。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによるテキスト入力である。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによる音声コメントである。
1つまたは複数の実施形態では、検出したユーザアクションは、文書に関連するユーザによる注視である。
1つまたは複数の実施形態では、文書に関連付けられた会話ストリームは、チャットウィンドウ内に表示される。
1つまたは複数の実施形態では、自動的に生成した再生可能な文書ページの抜粋は、意味的にリンクされたユーザのアクションに対応する文書の2つ以上の部分を備える複合抜粋である。
1つまたは複数の実施形態では、方法は、文書の別個のビューワを開かずに会話ストリームの中で、自動的に生成した再生可能な文書ページの抜粋を表示および再生することを更に含む。
1つまたは複数の実施形態では、方法は、文書用の別個のビューワを開かずに会話ストリームの中で、自動的に生成された再生可能な文書ページの抜粋にユーザが応答することを可能にすることを更に含む。
1つまたは複数の実施形態では、方法は、自動的に生成した再生可能な文書ページの抜粋と、文書に関連するユーザの対応する検出した1つまたは複数のアクションとを一緒にグループ化することを更に含む。
1つまたは複数の実施形態では、方法は、ユーザが文書のビューワに焦点を合わせるとき、関連する抜粋をフィルタリングし、ユーザの対応する1つまたは複数のアクションを検出することを更に含む。
1つまたは複数の実施形態では、文書の同じページ領域の上の複数のユーザからのアクションは、複数のユーザのアクションを備える単一の抜粋をもたらす重ね合わせを使用してグループ化される。
1つまたは複数の実施形態では、検出したユーザアクションは、文書の少なくとも一部分の上のユーザによるポインタの動きであり、ポインタの動きが、低いサンプリングレートで取得されると、ポインタの動きは円滑化され、その円滑化は、基となるテキスト連結された構成要素または文書の文書オブジェクトモデルに基づいて、偽テキストカーソルを挿入することを含む。
本明細書に記載された発明概念の別の態様によれば、コンピュータに、a.文書に関連するユーザの1つまたは複数のアクションを検出し、b.前記文書のコンテンツを解析し、c.前記文書のレイアウトを解析し、d.前記文書に関連する前記ユーザの前記検出した1つまたは複数のアクション、前記解析した前記コンテンツ、および前記解析した前記レイアウトに基づいて、再生可能な文書ページの抜粋を自動的に生成し、e.前記自動的に生成した再生可能な文書ページの抜粋を、前記文書に関連付けられた会話ストリームに挿入することを含む処理を実行させるためのプログラムが提供される。
本発明に関係するさらなる態様は、以下の説明において部分的に記載され、部分的にその説明から明らかであり、または本発明の実践によって知られる場合がある。本発明の態様は、要素および様々な要素の組合せ、ならびに以下の発明を実施するための形態および添付の特許請求の範囲において特に指摘される態様により、実現および達成される場合がある。
上記の説明と以下の説明の両方は例示的および説明的であるにすぎず、何であれ、いかなる方式においても、特許請求される発明またはその適用例を限定するものではないことを理解されたい。
本明細書に組み込まれ、その一部を構成する添付図面は、本発明の実施形態を例示し、説明とともに発明概念の原理を説明し例示する働きをする。
本明細書に記載された一つの実施形態は、ネットワークを通じた会話ストリーム内での文書位置の着目領域の把握が可能なコミュニケ―ションの方法を提供する。
チャットウィンドウに挿入される1つまたは複数のページおよび文書とのユーザの対話に対応する3つの抜粋を示す図である。 記載された新規の手法の一実施形態により、ユーザのアクションに基づいてどのように抜粋が作成されるか、どのように抜粋が挿入されるか、およびどのようにユーザが抜粋と対話することができるかを説明する、3つの例示的なフローチャートを示す図である。 システムが2つのページ内で3つの抜粋を見つけたとき、(レイアウト解析の結果)1つがタイトルに対応し、2番目がレイアウトを使用して導入部の下の段落にカチッとはまり、ならびにコンテンツ解析を使用して文の最後にクロップし、3番目の抜粋が図1にカチッとはまる状況を示す図である。 図3に示されたように検出された3つの抜粋がチャットウィンドウに挿入され、ユーザがそれらをインラインで再生してコメントを見聞きし、ならびに自分自身のコメントを追加することを可能にする、例示的な実施形態を示す図である。 システムが複数のユーザアクションを同じ抜粋上に折りたたみ、下にクリック可能なタイムラインを示し、その抜粋にリンクされた各アクションの再生を可能にする、例示的な実施形態を示す図である。 実際のSlackチャットセッションから、チャットウィンドウ内の共有文書を参照するテキストメッセージを検出することを示す図である。 ユーザが複数の文書タイプとシームレスに対話することを可能にするためのコンピュータ化システムの例示的な実施形態を示す図である。
以下の発明を実施するための形態では、添付図面に対して参照が行われ、添付の図面では、同一の機能要素は同様の数字を用いて指定される。前述の添付図面は、限定としてではなく例示として、本発明の原理と一致する特定の実施形態および実装形態を示す。これらの実施形態は、当業者が本発明を実践することを可能にするために十分詳細に記載され、本発明の範囲および趣旨から逸脱することなく、他の実装形態を利用してもよく、様々な要素の構造的な変更および/または置換を行ってもよいことを理解されたい。したがって、以下の発明を実施するための形態は、限定的な意味で解釈されるべきではない。加えて、本発明の様々な実施形態は、汎用コンピュータ上で稼動するソフトウェアの形態で、専用ハードウェアの形態で、またはソフトウェアとハードウェアの組合せで実装される場合がある。
従来技術に関連付けられた上記その他の問題に対処するために、本明細書に記載された1つまたは複数の実施形態は、ユーザが複数の文書タイプと途切れなく対話することができるシステムおよび方法を実装する。本明細書で使用される文書という用語は、限定はしないが、紙(物理的な)文書、電子文書、テキスト文書、画像、写真、図面、レンダリング、または任意の他のタイプのコンテンツを含む、当技術分野で知られている任意のタイプの文書を指す。したがって、本明細書に記載された実施形態は、いかなる特定のタイプの文書またはそのコンテンツにも限定されない。本発明の実施形態を例示するために本明細書で使用される任意の特定の文書タイプは、例示的にすぎず、何であれ、いかなる方式においても、本発明を限定しないと考えられるべきである。
1つまたは複数の実施形態では、ユーザの対話は自動的に検出され、通常のテキストメッセージとともに会話ストリームに追加される。具体的には、ユーザが1つまたは複数の文書ページと対話するときにシステムによって検出された1組のアクション(マウス、テキスト、音声、注視、およびスクロール入力イベント)を仮定すると、記載されたシステムは、以下の多様な手法(例えば、以下の(1)〜(3)に示す手法)を使用してアクションを意味のある抜粋の中に集める。
(1)動きの重要度を計算するために、マウスの位置、(滞在時間を含む)速度が使用される。
(2)抜粋のクロップボックスを知的に拡張するために、基となるコンテンツ(たとえば、コラム、図)が使用される。
(3)不規則なカーソルの動きと伝達を意図するカーソルの動きとをさらに区別するために、(遠隔会議セッション中のウェブカメラを介して利用可能なときの視線などの)ユーザの注意およびユーザの音声が利用される。
1つまたは複数の実施形態では、これらの信号を使用して、記載された新規のアルゴリズムは、文書ページの対応する部分をマルチメディアの抜粋に知的にクロップする。各々の取得されたマルチメディアの抜粋は、最適なユーザのチャットアプリケーションに挿入される。記載されたシステムの1つの例示的な実施形態は、図1に示されたように、クリック可能な画像として遠隔会議ツールのカスタムチャットウィンドウ部分を提供する。具体的には、図1は、チャットウィンドウ100に挿入された、1つまたは複数のページおよび文書とのユーザの対話に対応する3つの抜粋101、102、および103を示す。一実施形態では、上述の抜粋101、102、および103が挿入されると、誰でも抜粋を再生することができる。たとえば、図1は、再生されるべきマウスアクションが存在することを示す円によって示されたように、抜粋101、102、および103とのユーザ対話を示す。示された例では、そのチャットに関与しているいかなるユーザも、他のユーザの上述のマウス対話に応答することができる。加えて、チャットメッセージ104、105、および106によって示されたように、誰でも(その文書を開く必要なしに)インラインで抜粋に応答することもできる、図1参照。
1つまたは複数の実施形態では、チャットウィンドウ100内で、ユーザは、任意の抜粋101、102、または103をクリックし、その文書ページを開く必要なしに、チャットウィンドウ100の中のインラインで、再生されるそのアクションを見ることができる。1つまたは複数の実施形態では、ユーザは、自分のマウス、キーボード、および音声を記録することにより、この抜粋上に新しいアクションを作成することもでき、このようにして、チャットウィンドウ100の中に挿入される新しい抜粋を作成する。文書対話は、従来のテキストベースのメッセージのような最上級の市民になる。
追加または代替として、ユーザは、限定はしないが、マウスアクション、強調、インクストローク、ならびに音声コメントを含む再生可能なアクションとともに、文書自体を開いてフルビューを見ることを選ぶことが可能である。当業者なら諒解されるように、ユーザが文書に焦点を合わせるとき、対応する関連したチャット抜粋101、102、および103、ならびにメッセージ104、105、および106を見ることが自然である。したがって、システムは、文書(図示せず)の次に位置するチャットウィンドウ100を自動的にフィルタリングし、場合によっては読まれている文書ページとリストを同期することにより、それらを提示する。言い換えれば、記載された新規の技法は、文書ビューワにページ4が示されているときはいつでも、「スライド4に私は同意しない」などの通常のテキストメッセージをシステムが文脈上扱うことを可能にする。
[インテリジェントな抜粋作成について]
[動機付け]
図2は、記載された新規の手法の一実施形態により、ユーザのアクションに基づいてどのように抜粋が作成されるか、どのように抜粋が挿入されるか、およびどのようにユーザが抜粋と対話することができるかを説明する、3つの例示的なフローチャート200、220、および240を示す。具体的には、フローチャート200のステップ201において、文書アクションの開始が検出される(図2参照)。ステップ202において、システムは、ユーザによって作成されたコメントの録音を開始する。ステップ203において、システムは、マウスカーソルまたは他のポインタの位置の記録を開始する。ステップ204において、システムは、文書レイアウトを検出する。ステップ205において、システムは、ポインタアクションの基となるコンテンツを検出する。ステップ206において、システムは、ユーザによる文書アクションの終了を検出する。ステップ207において、ポインタアクション領域が集められる。ステップ208において、得られたクラスタは、ユーザの注視および注意の手段によって重み付けされる。ステップ209において、システムは、上位にあるクラスタを使用して抜粋を作成する。ステップ210において、システムは、記録されたポインタ(たとえば、マウスカーソル)のアクションが、低いサンプリングレートで取得されると、それらの円滑化を実施する。ステップ211において、システムは、ポインタアクションおよび対応するオーディオをそれぞれの抜粋にリンクする。ステップ212において、システムは、静止した抜粋及び動画の抜粋を生成する。最後に、ステップ213において、システムは、生成された静止した抜粋又は動画の抜粋をチャットウィンドウに挿入する。
フローチャート220を参照すると、ステップ221において、ユーザは、抜粋の上でマウスカーソルをホバリングする。ステップ222において、ユーザ応答が自動的に記録される。ステップ223において、ユーザ応答が単一のビューにグループ化される。
最後に、フローチャート240を参照すると、ユーザは、文書ビュー内で抜粋を開く(ステップ241参照)。ステップ242において、チャットは、関係する抜粋を自動的にフィルタリングする。
一実施形態では、記載されたシステムは、マウスの位置を収集し、文書レイアウト解析を使用することで文書ページの上のアクションの空間的拡張を特定する。ユーザのアクションのインテリジェントな分割(セグメント化)が行われないと、システムは、文書ページ全体を潜在的に包含する抜粋を作成することになる。代わりに、一実施形態では、システムは、文書ページ上の意味のある領域を切り取り、それらを会話ストリームに挿入するために、それらを見つけようとする。これは、基となる文書コンテンツならびにユーザの対話の両方の自動理解を統合することを必要とする。クロッピングは、元の文書ページを見る必要なしにチャットの中の抜粋のコンテンツをユーザが読むことも可能にする。
[レイアウト解析]
1つの例示的な実施形態は、Nagy、G.、Seth、S.、Viswanathan、M.:A prototype document image analysis system for technical journals、Computer 7(1992年)10−22に記載されたXYカットアルゴリズムを使用して、テキストボックス、テキストライン、段落、およびコラムを検出する。一実施形態では、このアルゴリズムは、当業者によく知られているJava(登録商標)script内に実装される。図、表、およびグラフは、バイナリ化された画像からテキストボックスを取り除き、ラインを見つけることによって検出される(現在、ラインによって結びつけられていないか、またはラインを含んでいない表および数式は検出されないが、最新技術の方法を適用することができる)。他のクラスタリングおよびグループ化の技法は、たとえば、「SYSTEMS AND METHODS FOR CONTENT ANALYSIS TO SUPPORT NAVIGATION AND ANNOTATION IN EXPOSITORY VIDEOS」と題する米国特許出願公開第US2014−0245152A1号に記載されているように、従来のテキスト文書以外のコンテンツに使用することもできる。所与のテキスト群(たとえば、コラム)では、一実施形態は、そのテキスト群内の平均ラインのXよりも大きい開始Xを有するように検出される、ラインの字下げを検出すると、そのテキスト群をサブ段落にさらに分割する。
[コンテンツ解析]
当業者なら諒解されるように、テキストエディタ内で示されるソースコードなどのいくつかの文書は、それらのレイアウトに多くの多様性を含まない場合がある。この状況では、記載されたシステムの一実施形態は、両方とも当業者によく知られている、文書オブジェクトモデル(DOM)または光学式文字認識(OCR)を使用して取得される、テキストコンテンツに基づいて抜粋クロップ領域を決定するために、コンテンツ解析も実施する。たとえば、ユーザがテキストエディタ内のソースコードを共有しており、Java(登録商標)script関数の上にそのテキストカーソルを移動させる場合、システムは、ページの他の部分を切り取って、この関数名の上下に抜粋を自動的にクロップする。ワードプロセッシング文書では、システムは、文または段落の始めおよび終わりに抜粋をクロップすることができる。このコンテンツベースのクロッピングは、純粋なレイアウトベースの手法が失敗する場合、ユーザがテキストの長いコラムの上で身振りをするとき、下記に記載されたセグメント化アルゴリズムにおいて使用される。
[セグメント化アルゴリズム]
一実施形態では、文書−マウス対話データは、いつでも文書上のマウスカーソルの位置を示すタイムスタンプ付きの(X,Y,t)トリプルの長い経路からなる。長いテキスト群をサブ長方形に分割するライン字下げ検出を含む、上述されたレイアウト解析を使用して、
−1)システムの一実施形態は、セグメント(X1,Y1)(X2,Y2)が、検出されたレイアウトの要素を横切るときはいつでも、経路を分割(セグメント化)する。たとえば、ユーザが、文書のコラム1の中のテキスト段落からカーソルをコラム2に移動させる場合、システムの一実施形態は経路を2つのサブ経路に分割する。
−2)システムの一実施形態は、残りの経路をサブ経路に分割するように、コンテンツベースの解析をさらに考慮する。コンテンツベースの解析は文の位置を与える。たとえば、ユーザが同じ段落の上だが2つの別個の文の上でジェスチャをした場合、システムの一実施形態は、段落経路を2つ以上のサブ経路に分割することができる。
−3)場合によっては、ユーザは、レイアウトオブジェクト(たとえば、同じ文、同じグラフ)の2つの別個の部分の上でジェスチャをした可能性がある。この要素のサイズが、チャットウィンドウに挿入されたときに読むのに十分小さい場合、分割はここで停止する。そうでない場合、システムの一実施形態は、連続する(X,Y,t)トリプルが空間および時間的に十分遠く離れているとき、残りの経路をさらに分割する:ユーザが何かを説明するとき、それらは、通常、説明を必要とする次の領域に移動する前のしばらくの間停止する。
1つまたは複数の実施形態では、記載されたセグメンタは、含まれるマウス経路情報とともに、文書抜粋のリスト:長方形の境界ボックスのリストを生成する。
[視線の使用]
利用可能な場合、1つまたは複数の実施形態では、分割(セグメント化)は視線の位置経路に適用することができる。前に取得された抜粋は、視線抜粋と統合(マージ)される。たとえば、マウス経路のみが存在している既存の抜粋に新しい経路を追加することが可能である。これらの位置にマウス経路が見つからなかったので前に検出されなかった新しい抜粋を追加することも可能である。
1つまたは複数の実施形態では、視線はマウス位置に対する事前フィルタリングステップとして使用することもでき、速いマウスの動きに注視が利用できない場合、セグメント化アルゴリズムが適用される前に、この部分はカーソル経路から取り除かれ、これにより、ユーザがその目標位置を見ることなく邪魔にならない所にカーソルを移動させるときなどに、システムが伝達ではないカーソルの動きを除去することが可能になる。
[オーディオを使用して抜粋の時間領域を確立する]
当業者なら諒解されるように、ユーザは、通常、自分のカーソルを停止した後でも話し続け、カーソルを動かす前に話し始めることもできる。したがって、一実施形態では、システムは、音声検出を使用して、その抜粋にリンクされたオーディオソースを時間的に切り取る。1つの例示的な実施形態は、当技術分野でよく知られているhark.js2を使用して、クライアント側の実装形態を利用する。
[いくつかの抜粋を統合(マージ)し直す]
1つまたは複数の実施形態では、遠く離れすぎているページ上の2つ以上の領域にアクションが及ぶとき、セグメンタはそれらを分割する。たとえば、ステップ3において、ユーザは、文の一部の上で、次いで、同じ文であるが2D空間では遠く離れている文の中で再び円を描く可能性がある。場合によっては、システムは、視覚的インジケータ、たとえば破線によって分離された単一の抜粋を作成することにより、これら2つの抜粋を統合し直すことができる。この技法により、アクションが文書ページの大きい面を包含するときでも、抜粋の挿入が可能になる。
図3は、システムが2つのページ304および305内で3つの抜粋301、302、および303を見つけたとき、(レイアウト解析の結果)1つ(301)がタイトルに対応し、2番目(302)がレイアウトを使用して導入部の下の段落にカチッとはまり、ならびにコンテンツ解析を使用して文の最後にクロップし、3番目(303)の抜粋が図1にカチッとはまる状況を示す。
[チャットウィンドウに再生可能な抜粋を挿入する]
1つまたは複数の実施形態では、クロップ領域を使用して、システムは、その文書ページの静止した抜粋を生成し、それをチャットウィンドウ100に挿入する。サードパーティのチャットシステムと統合することを支援するために、一実施形態では、マウス/音声アクションが付随する抜粋の動画のGIFまたはビデオを代わりに挿入することができる。1つの例示的な実施形態では、ユーザは、挿入された抜粋の上でユーザがクリックするときに起こることを制御し、次いで、ユーザは、Java(登録商標)scriptとCSS動画の組合せを使用して再生された抜粋を見る。
図4は、図3に示されたように検出された3つの抜粋401、402、および403がチャットウィンドウ400に挿入され、ユーザがそれらをインラインで再生してコメントを見聞きし、ならびに自分自身のコメントを追加することを可能にする、例示的な実施形態を示す。ここで、ユーザはまた、それぞれの抜粋401、402、および403の下で、テキストメッセージ404、405,および406を使用して話している。明らかに、テキストメッセージ404、405,および406は、コンテンツを参照しており、システムがそれらを対応する抜粋にリンクし、ユーザが後で文書に焦点を合わせる場合のみ、それらを表示することを可能にする。図4に示された例では、チャットウィンドウ400は、当業者によく知られているMixMeet会議ツールの中に生成される。
[インラインでの新しい抜粋の作成]
1つまたは複数の実施形態では、抜粋は、インラインで再生されるべきチャット会話に挿入される。しかし、一実施形態では、システムはまた、ユーザが単に抜粋の上に自分のカーソルを移動し、話し始めることにより、抜粋に「応答する」ことを可能にする。これにより、チャットウィンドウの中に新しい抜粋が作成される。作成は、ユーザが抜粋の中でクリックし、自分のカーソルをドラッグすると開始する。カーソルが抜粋の境界のうちの1つに達すると、抜粋は、その位置のまわりのページの残りを見せるように広がる。ユーザが抜粋をドラッグせずに抜粋の上でホバリングすると同じことが起こり、インテリジェントなクロップがあまりインテリジェントでなかった場合のページ領域の多くをその人が探索することを可能にする。
1つまたは複数の実施形態では、複数のユーザが同じ抜粋の上でアクションを加えると、システムはユーザごとに新しい抜粋を作成する。ユーザの好みに応じて、システムは、それらを同じ抜粋の上に折りたたみ、下にクリック可能なタイムラインを表示することもでき、図5に示されたように、その抜粋にリンクされた各アクションの再生を可能にする。具体的には、図5に示された実施形態では、2人のユーザが同じ抜粋501の上に、抜粋501の下のタイムライン部分502、503、および504からなるクリック可能なタイムラインによって表される3つのコメントを残している。ユーザが、抜粋501の下のタイムラインの異なる部分502、503、および504をクリックすると、異なるユーザコメント(たとえば、コメント505)がチャットウィンドウ500内に表示される。一実施形態では、各タイムライン部分の色は、コメントを残したユーザの識別情報に対応する。
[関係する抜粋およびテキストメッセージの検出およびグループ化]
1つまたは複数の実施形態では、ユーザが抜粋を開いてフルビューで文章を見ることを選ぶ(図2に示されたフローチャート240のステップ241)と、文書ビューワは、対応するページまでスクロールし、その抜粋を再生する。1つまたは複数の実施形態では、上述の文書ビューワは、チャットウィンドウとは別のウィンドウ内で開かれる。1つまたは複数の実施形態では、システムはまた、チャットウィンドウを自動的にフィルタリングして、関係する抜粋およびテキストメッセージのみを表示する(図2のフローチャート240のステップ242参照)。3人の同僚の間の実際のチャットからのいくつかの例が図6に示される。具体的には、図6は、実際のSlackチャットセッションから、チャットウィンドウ601および602内の共有文書を参照するテキストメッセージを検出することを示す。
1つまたは複数の実施形態では、記載されたシステムは、以下の(A)〜(D)に示す場合、テキストメッセージが所与の抜粋に関係すると判断する。
(A)抜粋がチャットウィンドウに追加されるか、または表示だけされた後にテキストが作成された。
(B)テキストが、番号(図6に示されたチャットウィンドウ601内の「スライド10」、「スライド11」、「スライド13」、「スライド18」)を有するページ/スライド/段落の明示的な言及を含み、その番号が文書内のページの数よりも小さい。
(C)テキストが抜粋または完全文書内に見えるコンテンツを含む。たとえば、図6に示されたチャットウィンドウ602では、instead of ”Advantageous to...” => ”Useful for interviewing people who are faraway”が文章内に現れるコンテンツである。
(D)テキストメッセージが、抜粋にリンクされているようにユーザによって明示的にマークされた:一実施形態では、ユーザは抜粋の上に個々のメッセージをドラッグして、会話ストリームを整頓することができる。
1つまたは複数の実施形態では、テキストメッセージが所与の抜粋にリンクされているように検出されると、記載されたシステムは、それらを表す単一の仮想メッセージにそれらを折りたたむ(図2に示されたフローチャート220のステップ223参照)。たとえば、図6に示されたチャット601では、システムは、3つのテキストメッセージ601、602、および603を「スライド10、11、13、18に対する3つのコメント」を読む1つのテキストメッセージに折りたたむ。ユーザは、折りたたまれたメッセージを開いて元のメッセージを読むことができる。代替として、ユーザは、文書のフルビューを開くときに対応するスライドのコンテキスト内でそれらを見ることもできる。
[物理的な文書について]
記載された実施形態は、物理的な文書の上に対話を埋め込むためにも有用である。たとえば、最新技術のホワイトボードキャプチャシステムは、ユーザによって描かれたストロークをカメラによって取り込まれたように取り上げることができる。一方、本明細書に記載された実施形態は、ホワイトボードの抜粋を見つけ、それらをチャットウィンドウの中に挿入することが可能である。チャットは、しばしばバックチャネルとして使用され、配列された同僚ならびに遠隔参加者をサポートする。ホワイトボードからの動的で再生可能な抜粋をチャット会話の中に挿入することは、作成されるコンテンツをアーカイブすることとそのまわりで会話することの両方に自然な方法をすべて与える。
別のシナリオでは、1人または複数のユーザは、印刷されたページの上で対話することができ、システムの一実施形態は、ユーザの手およびペンまたは視線のアクションを取り上げて、同じアルゴリズムを適用する。一実施形態では、印刷されたページ、またはタッチスクリーンタブレットもしくは電話などのデジタル面の上の手および指の位置を収集するために3Dカメラが使用される。一方、本明細書に記載されたセグメンタは、デジタル文書について上述されたように、この位置データを使用し、抜粋を生成することができる。生成された抜粋は、実質的に同様に、上述されたようにチャットウィンドウに挿入される。
[例示的なコンピュータプラットフォームについて]
図7は、ユーザが複数の文書タイプとシームレスに対話することを可能にするためのコンピュータ化システム700の例示的な実施形態を示す。1つまたは複数の実施形態では、コンピュータ化システム700は、当業者によく知られているデスクトップコンピュータのフォームファクタ内に実装される場合がある。代替の実施形態では、コンピュータ化システム700は、ラップトップコンピュータもしくはノートブックコンピュータ、またはスマートフォンもしくはタブレットコンピュータなどの任意の他のモバイルコンピューティングデバイスに基づいて、実装される場合がある。
コンピュータ化システム700は、コンピュータ化システム700の様々なハードウェア構成要素にわたって、かつそれらの間で情報を通信するためのデータバス704または他の相互接続もしくは通信機構と、情報を処理し、他の計算タスクおよび制御タスクを実施するための、データバス704と電気的に結合された中央処理装置(CPUまたは単にプロセッサ)701とを含む場合がある。コンピュータ化システム700は、様々な情報ならびにプロセッサ701によって実行されるべき命令を記憶するための、データバス704に結合された、ランダムアクセスメモリ(RAM)または他のダイナミックストレージデバイスなどのメモリ712も含む。メモリ712には、磁気ディスク、光ディスク、半導体フラッシュメモリデバイス、または他の不揮発性半導体ストレージデバイスなどの、永続的ストレージデバイスも含まれ得る。
1つまたは複数の実施形態では、メモリ712は、プロセッサ701による命令の実行中に一時的な変数または他の中間情報を記憶するために使用される場合もある。場合によっては、コンピュータ化システム700は、コンピュータ化システム700の動作に必要なファームウェア、基本入出力システム(BIOS)、ならびにコンピュータ化システム700の様々な構成パラメータなどの、プロセッサ701用の固定された情報および命令を記憶するための、データバス704に結合された、読取り専用メモリ(ROMもしくはEPROM)702または他のスタティックストレージデバイスをさらに含む場合がある。
1つまたは複数の実施形態では、コンピュータ化システム700は、上述されたチャットウィンドウおよび文書ビューウィンドウを表示するユーザインターフェースなどの、コンピュータ化システム700のユーザに様々な情報を表示するための、同様にデータバス704に電気的に結合される場合がある、ディスプレイデバイス711を搭載する場合がある。代替の実施形態では、ディスプレイデバイス711は、グラフィックスコントローラおよび/またはグラフィックスプロセッサ(図示せず)に関連付けられる場合がある。ディスプレイデバイス711は、たとえば、両方とも当業者によく知られている、薄膜トランジスタ(TFT)技術または有機発光ダイオード(OLED)技術を使用して製造された液晶ディスプレイ(LCD)として実装される場合がある。様々な実施形態では、ディスプレイデバイス711は、コンピュータ化システム700の残りの構成要素とともに、同じ汎用筐体に搭載される場合がある。代替の実施形態では、ディスプレイデバイス711は、テーブルまたはデスクの表面などの、そのような筐体の外部に配置される場合がある。1つまたは複数の実施形態では、コンピュータ化システム700は、1つまたは複数の抜粋に関連付けられたユーザフィードバックのオーディオを取り込み、録音されたオーディオ情報をメモリ712に記憶するように構成された、マイクロフォンなどのオーディオキャプチャデバイス703をさらに搭載する場合がある。
1つまたは複数の実施形態では、コンピュータ化システム700は、当業者によく知られているように、データバス704に電気的に接続され、抜粋とのユーザの対話のオーディオ成分であり得る、MPEG−3ファイルなどの様々なオーディオファイル、またはMPEG−4ファイルなどの様々なビデオファイルのオーディオトラックを再生するように構成された、オーディオ再生デバイス725をさらに搭載する場合がある。この目的を達成するために、コンピュータ化システム700は、ウェーブプロセッサもしくはサウンドプロセッサまたは同様のデバイス(図示せず)を搭載する場合もある。
1つまたは複数の実施形態では、コンピュータ化システム700は、記載された抜粋のうちの1つまたは複数と対話するために、プロセッサ701に指示情報およびコマンド選択を伝え、ディスプレイ711上のカーソルの動きを制御するための、マウス、トラックボール、タッチパッド、またはカーソル指示キーなどの、マウス/ポインティングデバイス710などの、1つまたは複数の入力デバイスを搭載する場合がある。この入力デバイスは、通常、デバイスが平面内の位置を指定することを可能にする2つの軸、第1の軸(たとえば、x)および第2の軸(たとえば、y)における2つの自由度を有する。
コンピュータ化システム700は、本明細書に記載されたユーザ−文書対話のビデオを含む、様々な物体の静止画像およびビデオを取得するためのカメラ726、ならびにキーボード706をさらに搭載する場合があり、それらのすべては、限定はしないが、画像およびビデオ、ならびに(ジェスチャを含む)ユーザコマンドを含む情報をプロセッサ701に伝えるためのデータバス704に結合される場合がある。
1つまたは複数の実施形態では、コンピュータ化システム700は、データバス704に結合されたネットワークインターフェース705などの通信インターフェースをさらに含む場合がある。ネットワークインターフェース705は、WIFIインターフェース707、セルラーネットワーク(GSM(登録商標)もしくはCDMA)アダプタ708、および/またはローカルエリアネットワーク(LAN)アダプタ709のうちの少なくとも1つを使用して、コンピュータ化システム700とインターネット724との間の接続を確立するように構成される場合がある。ネットワークインターフェース705は、コンピュータ化システム700とインターネット724との間の双方向データ通信を可能にするように構成される場合がある。WIFIアダプタ707は、当業者によく知られている802.11a、802.11b、802.11g、および/または802.11nのプロトコル、ならびにBluetooth(登録商標)プロトコルに従って動作する場合がある。コンピュータ化システム700のLANアダプタ709は、たとえば、インターネットサービスプロバイダのハードウェア(図示せず)を使用してインターネット724とインターフェースされる、対応するタイプの電話線へのデータ通信接続を実現するために、統合サービスデジタルネットワーク(ISDN)カードまたはモデムを使用して実装される場合がある。別の例として、LANアダプタ709は、互換性があるLANおよびインターネット724へのデータ通信接続を実現する、ローカルエリアネットワークインターフェースカード(LAN NIC)であり得る。例示的な実装形態では、WIFIアダプタ707、セルラーネットワーク(GSM(登録商標)もしくはCDMA)アダプタ708、および/またはLANアダプタ709は、様々なタイプの情報を表すデジタルデータストリームを搬送する電気信号または電磁信号を送受信する。
1つまたは複数の実施形態では、インターネット724は、通常、1つまたは複数のサブネットワークを介する他のネットワークリソースへのデータ通信を実現する。このようにして、コンピュータ化システム700は、リモートメディアサーバ、ウェブサーバ、他のコンテンツサーバ、ならびに他のネットワークデータストレージリソースなどの、インターネット724上のどこかに位置する様々なネットワークリソースにアクセスすることが可能である。1つまたは複数の実施形態では、コンピュータ化システム700は、ネットワークインターフェース705によりインターネット724を含む様々なネットワークを介して、アプリケーションプログラムコードを含む、メッセージ、メディア、および他のデータを送受信するように構成される。インターネットの例では、コンピュータ化システム700がネットワーククライアントとして働くとき、コンピュータ化システム700は、コンピュータ化システム700上で実行されるアプリケーションプログラム用のコードまたはデータを要求する場合がある。同様に、コンピュータ化システム700は、他のネットワークリソースに様々なデータまたはコンピュータコードを送る場合がある。
1つまたは複数の実施形態では、本明細書に記載された機能は、プロセッサ701がメモリ712に含まれる1つまたは複数の命令の1つまたは複数のシーケンスを実行することに応答して、コンピュータ化システム700によって実施される。そのような命令は、別のコンピュータ可読媒体からメモリ712に読み込まれる場合がある。メモリ712に含まれる命令のシーケンスの実行は、本明細書に記載された様々なプロセスステップをプロセッサ701に実施させる。代替の実施形態では、本発明の実施形態を実施するために、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて、ハードワイヤード回路が使用される場合がある。したがって、本発明の記載された実施形態は、ハードウェア回路および/またはソフトウェアのいかなる特定の組合せにも限定されない。
本明細書で使用される「コンピュータ可読媒体」という用語は、実行のためにプロセッサ701に命令を供給することに関与する任意の媒体を指す。コンピュータ可読媒体は、本明細書に記載された方法および/または技法のうちのいずれかを実施するための命令を搬送する場合がある機械可読媒体の一例にすぎない。そのような媒体は、限定はしないが、不揮発性媒体および揮発性媒体を含む、多くの形態をとる場合がある。
非一時的コンピュータ可読媒体の一般的な形態には、たとえば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、もしくは任意の他の磁気媒体、CD−ROM、任意の他の光媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理媒体、RAM、PROM、EPROM、FLASH−EPROM、フラッシュドライブ、メモリカード、任意の他のメモリチップもしくはメモリカートリッジ、またはコンピュータが読むことができる任意の他の媒体が含まれる。様々な形態のコンピュータ可読媒体は、実行のためにプロセッサ701に1つまたは複数の命令の1つまたは複数のシーケンスを搬送することに関与する場合がある。たとえば、命令は、最初に、リモートコンピュータからの磁気ディスク上で搬送される場合がある。代替として、リモートコンピュータは、そのダイナミックメモリに命令をロードし、インターネット724を介してその命令を送ることができる。具体的には、コンピュータ命令は、当技術分野でよく知られている様々なネットワークデータ通信プロトコルを使用して、インターネット724を介して上述のリモートコンピュータからコンピュータ化システム700のメモリ712にダウンロードされる場合がある。
1つまたは複数の実施形態では、コンピュータ化システム700のメモリ712は、以下のソフトウェアプログラム、アプリケーション、またはモジュールのうちのいずれかを記憶する場合がある。
1.基本システムサービスを実施し、コンピュータ化システム700の様々なハードウェア構成要素を管理するためのオペレーティングシステム(OS)713。オペレーティングシステム713の例示的な実施形態は当業者によく知られており、任意の現在知られているか、または後に開発されるモバイルオペレーティングシステムを含む場合がある。
2.アプリケーション714は、たとえば、コンピュータ化システム700のプロセッサ701によって実行される1組のソフトウェアアプリケーションを含む場合があり、それらは、ディスプレイデバイス711にグラフィカルユーザインターフェースを表示すること、または上述されたように様々なタイプの文書またはそれらの部分とのユーザ対話を記録することなどの、いくつかのあらかじめ決定された機能をコンピュータ化システム700に実施させる。1つまたは複数の実施形態では、アプリケーション714は、ユーザが複数の文書タイプとシームレスに会話することを可能にするための発明性があるアプリケーション715を含む場合がある。
3.データストレージ721は、たとえば、オーディオコメント、マウスポインタの位置、および/または文書を参照するチャットメッセージなどの、ユーザ−文書対話に関連付けられた様々な情報を記憶するためのデータ構造およびテーブル722を記憶する場合がある。加えて、データストレージ721は、ユーザ対話において使用され得る文書または他のメディアファイル723のうちの1つまたは複数を記憶する場合がある。
1つまたは複数の実施形態では、ユーザが複数の文書タイプと途切れなく対話することを可能にするための発明性があるアプリケーション715は、たとえば、図1、図4、および図5に示された1つまたは複数のユーザインターフェースを生成するように構成されたユーザインターフェース生成モジュール716を搭載する。加えて、オーディオキャプチャデバイス703およびカメラ726を使用してビデオストリームおよびオーディオストリームを取り込むためのビデオおよびオーディオキャプチャモジュール717が提供される場合がある。さらに加えて、上記に詳細に記載された機能を有する、レイアウト解析モジュール718、コンテンツ解析モジュール719、および分割(セグメント化)モジュール720が提供される場合がある。
最後に、本明細書に記載されたプロセスおよび技法は、いかなる特定の装置にも本質的に関係せず、構成要素の任意の適切な組合せによって実装される場合があることを理解されたい。さらに、様々なタイプの汎用デバイスは、本明細書に記載された教示に従って使用される場合がある。本明細書に記載された方法ステップを実施する専用装置を構築することが有利であると分かる場合もある。本発明は、あらゆる点で限定的ではなく例示的なものである特定の例に関して記載された。本発明を実践するためにハードウェア、ソフトウェア、およびファームウェアの多くの様々な組合せが適切であることを当業者なら諒解されよう。たとえば、記載されたソフトウェアは、アセンブラ、C/C++、Objective−C、perl、shell、PHP、Java(登録商標)、ならびに任意の現在知られているか、または後に開発されるプログラミング言語もしくはスクリプト言語などの、多種多様なプログラミング言語またはスクリプト言語で実装される場合がある。
その上、本明細書に記載された発明の明細書および実践の考慮から、本発明の他の実装形態が当業者には明らかになる。記載された実施形態の様々な態様および/または構成要素は、ユーザが複数の文書タイプと途切れなく対話することを可能にするための様々なシステムおよび方法において、単独でまたは任意の組合せで使用される場合がある。明細書および例は例示的にすぎないと考えられ、本発明の真の範囲および趣旨は以下の特許請求の範囲によって示されることが意図されている。
100 チャットウィンドウ
101,102,103 抜粋
104,105,106 チャットメッセージ

Claims (20)

  1. 中央処理装置およびメモリを備えるコンピュータ化システムにおいて実施される、コンピュータに実装された方法であって、
    a.文書に対するユーザの1つまたは複数のアクションを検出し、
    b.前記文書のコンテンツを解析し、
    c.前記文書のレイアウトを解析し、
    d.前記文書に関連する前記ユーザの前記検出した1つまたは複数のアクション、前記解析した前記コンテンツ、および前記解析した前記レイアウトに基づいて、前記文書のある領域からの抜粋であって前記ユーザの前記アクションが付随する静止画又は動画で表現された再生可能な抜粋を自動的に生成し、
    e.前記自動的に生成した再生可能な抜粋を、前記文書に関連付けられた会話ストリームに挿入することを含む、コンピュータに実装された方法。
  2. 前記検出した前記アクションが、前記文書の少なくとも一部分の上の前記ユーザによるマウスポインタのホバリングである、請求項1に記載のコンピュータに実装された方法。
  3. 前記検出した前記アクションが、前記文書に関連する前記ユーザによるテキスト入力である、請求項1に記載のコンピュータに実装された方法。
  4. 前記検出した前記アクションが、前記文書に関連する前記ユーザによる音声コメントである、請求項1に記載のコンピュータに実装された方法。
  5. 前記検出した前記アクションが、前記文書に関連する前記ユーザによる注視である、請求項1に記載のコンピュータに実装された方法。
  6. 前記文書に関連付けられた会話ストリームがチャットウィンドウ内に表示される、請求項1に記載のコンピュータに実装された方法。
  7. 前記自動的に生成した再生可能な抜粋が、意味的にリンクされた前記ユーザのアクションに対応する前記文書の2つ以上の部分を備える複合抜粋である、請求項1に記載のコンピュータに実装された方法。
  8. 前記文書の別個のビューワを開かずに前記会話ストリームの中で、前記自動的に生成した再生可能な抜粋を表示および再生することを更に含む、請求項1に記載のコンピュータに実装された方法。
  9. 前記文書用の別個のビューワを開かずに前記会話ストリームの中で、前記自動的に生成した再生可能な抜粋に前記ユーザが応答することを可能にすることを更に含む、請求項1に記載のコンピュータに実装された方法。
  10. 前記自動的に生成した再生可能な抜粋と、前記文書に関連する前記ユーザの、対応する検出した1つまたは複数のアクションと、を一緒にグループ化することを更に含む、請求項1に記載のコンピュータに実装された方法。
  11. 前記ユーザが前記文書のビューワに焦点を合わせるとき、関連する抜粋をフィルタリングし、
    ユーザの対応する1つまたは複数のアクションを検出することを更に含む、請求項1に記載のコンピュータに実装された方法。
  12. 単一の抜粋に対する複数のユーザからの複数のアクションがグループ化され、前記単一の抜粋上に折りたたまれている、請求項1に記載のコンピュータに実装された方法。
  13. 前記検出したアクションが、前記文書の少なくとも一部分の上の前記ユーザによるポインタの動きであり、前記ポインタの動きが、低いサンプリングレートで取得されると、前記ポインタの動きが円滑化されている、請求項1に記載のコンピュータに実装された方法。
  14. コンピュータに、
    a.文書に対するユーザの1つまたは複数のアクションを検出し、
    b.前記文書のコンテンツを解析し、
    c.前記文書のレイアウトを解析し、
    d.前記文書に関連する前記ユーザの前記検出した1つまたは複数のアクション、前記解析した前記コンテンツ、および前記解析した前記レイアウトに基づいて、前記文書のある領域からの抜粋であって前記ユーザの前記アクションが付随する静止画又は動画で表現された再生可能な抜粋を自動的に生成し、
    e.前記自動的に生成した再生可能な抜粋を、前記文書に関連付けられた会話ストリームに挿入することを含む処理を実行させるためのプログラム。
  15. 前記検出した前記アクションが、前記文書の少なくとも一部分の上の前記ユーザによるマウスポインタのホバリングである、請求項14に記載のプログラム。
  16. 前記検出した前記アクションが、前記文書に関連する前記ユーザによるテキスト入力である、請求項14に記載のプログラム。
  17. 前記検出した前記アクションが、前記文書に関連する前記ユーザによる音声コメントである、請求項14に記載のプログラム。
  18. 前記検出した前記アクションが、前記文書に関連する前記ユーザによる注視である、請求項14に記載のプログラム。
  19. 前記文書に関連付けられた会話ストリームがチャットウィンドウ内に表示される、請求項14に記載のプログラム。
  20. 中央処理装置およびメモリを備えるコンピュータ化システムであって、
    前記メモリが、
    a.文書に対するユーザの1つまたは複数のアクションを検出し、
    b.前記文書のコンテンツを解析し、
    c.前記文書のレイアウトを解析し、
    d.前記文書に関連する前記ユーザの前記検出した1つまたは複数のアクション、前記解析した前記コンテンツ、および前記解析した前記レイアウトに基づいて、前記文書のある領域からの抜粋であって前記ユーザの前記アクションが付随する静止画又は動画で表現された再生可能な抜粋を自動的に生成し、
    e.前記自動的に生成した再生可能な抜粋を、前記文書に関連付けられた会話ストリームに挿入することを含む方法を前記コンピュータ化システムに実施させる1組のコンピュータ可読命令を記憶する、コンピュータ化システム。
JP2017148507A 2016-10-31 2017-07-31 オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法、コンピュータに実装された方法、プログラム、及びコンピュータ化システム Active JP6972743B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/339,910 US11087068B2 (en) 2016-10-31 2016-10-31 Systems and methods for bringing document interactions into the online conversation stream
US15/339,910 2016-10-31

Publications (2)

Publication Number Publication Date
JP2018073387A JP2018073387A (ja) 2018-05-10
JP6972743B2 true JP6972743B2 (ja) 2021-11-24

Family

ID=62019872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017148507A Active JP6972743B2 (ja) 2016-10-31 2017-07-31 オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法、コンピュータに実装された方法、プログラム、及びコンピュータ化システム

Country Status (2)

Country Link
US (1) US11087068B2 (ja)
JP (1) JP6972743B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160344677A1 (en) 2015-05-22 2016-11-24 Microsoft Technology Licensing, Llc Unified messaging platform for providing interactive semantic objects
US10216709B2 (en) 2015-05-22 2019-02-26 Microsoft Technology Licensing, Llc Unified messaging platform and interface for providing inline replies
US10528227B2 (en) 2017-04-18 2020-01-07 Fuji Xerox Co., Ltd. Systems and methods for linking attachments to chat messages
EP3642733A4 (en) * 2017-07-31 2020-07-22 Beijing Didi Infinity Technology and Development Co., Ltd. SYSTEM AND PROCESS FOR SEGMENTING A SENTENCE
US10530718B2 (en) * 2017-07-31 2020-01-07 Fuji Xerox Co., Ltd. Conversational enterprise document editing
US10891430B2 (en) * 2018-02-02 2021-01-12 Fuji Xerox Co., Ltd. Semi-automated methods for translating structured document content to chat-based interaction
USD959459S1 (en) * 2018-02-21 2022-08-02 Early Warning Services, Llc Display screen portion with graphical user interface
JP7302200B2 (ja) 2019-02-26 2023-07-04 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110752984B (zh) * 2019-10-24 2021-10-15 北京字节跳动网络技术有限公司 一种显示在线文档的方法、装置、电子设备及存储介质
US11223663B1 (en) * 2020-07-01 2022-01-11 Adobe Inc. Providing personalized chat communications within portable document format documents
CN118036574A (zh) * 2020-10-22 2024-05-14 腾讯科技(深圳)有限公司 互动消息显示方法、装置、计算机设备及存储介质
US11546278B2 (en) 2021-04-15 2023-01-03 Microsoft Technology Licensing, Llc Automated notification of content update providing live representation of content inline through host service endpoint(s)
US11336703B1 (en) * 2021-04-15 2022-05-17 Microsoft Technology Licensing, Llc Automated notification of content update providing live representation of content inline through host service endpoint(s)
JP2023027467A (ja) 2021-08-17 2023-03-02 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム、およびプログラム
CN117519526A (zh) * 2021-11-17 2024-02-06 北京字跳网络技术有限公司 信息交互方法、装置、电子设备和存储介质
CN115457113B (zh) * 2022-09-03 2023-05-23 北京津发科技股份有限公司 人机交互移动轨迹检测方法、装置、设备和可读存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150529A (ja) * 2001-11-19 2003-05-23 Hitachi Ltd 情報交換方法、情報交換端末装置、情報交換サーバ装置、プログラム
JP3876702B2 (ja) * 2001-12-11 2007-02-07 ソニー株式会社 サービス提供システム、情報提供装置および方法、情報処理装置および方法、並びにプログラム
US20050188016A1 (en) * 2002-11-25 2005-08-25 Subramanyam Vdaygiri Method and system for off-line, on-line, and instant-message-based multimedia collaboration
US7330608B2 (en) * 2004-12-22 2008-02-12 Ricoh Co., Ltd. Semantic document smartnails
US20070074125A1 (en) * 2005-09-26 2007-03-29 Microsoft Corporation Preview information for web-browsing
US8156186B2 (en) * 2005-11-11 2012-04-10 Scenera Technologies, Llc Method and system for organizing electronic messages using eye-gaze technology
JP3997256B1 (ja) 2007-02-28 2007-10-24 Sky株式会社 再生装置と再生装置のためのプログラム
GB0712880D0 (en) 2007-07-03 2007-08-08 Skype Ltd Instant messaging communication system and method
US10091460B2 (en) * 2008-03-31 2018-10-02 Disney Enterprises, Inc. Asynchronous online viewing party
US10320857B2 (en) * 2009-01-16 2019-06-11 International Business Machines Corporation Hybrid synchronous/asynchronous means for sharing user interactions across multiple devices
US20130047072A1 (en) * 2011-08-19 2013-02-21 Microsoft Corporation Progressive presentation of document markup
US20130083210A1 (en) * 2011-09-30 2013-04-04 Successfactors, Inc. Screen and webcam video capture techniques
US10289660B2 (en) * 2012-02-15 2019-05-14 Apple Inc. Device, method, and graphical user interface for sharing a content object in a document
US9948589B2 (en) * 2012-11-14 2018-04-17 invi Labs, Inc. System for and method of organizing contacts for chat sessions on an electronic device
US9223766B2 (en) * 2012-11-21 2015-12-29 Microsoft Technology Licensing, Llc Preserving formatting of content selection through snippets
US9477375B1 (en) * 2014-08-18 2016-10-25 Google Inc. Techniques for insertion of content into chat communication
JP2016126445A (ja) 2014-12-26 2016-07-11 Line株式会社 サーバ、サーバの制御方法およびプログラム
US20160197872A1 (en) * 2015-01-07 2016-07-07 Salesforce.Com, Inc. Providing context for instant messages
EP3096277A1 (en) * 2015-05-19 2016-11-23 ResearchGate GmbH Enhanced online user-interaction tracking
US11755193B2 (en) * 2015-07-20 2023-09-12 Michael Stewart Shunock Method and system for receiving feedback from a user
US10394437B2 (en) * 2016-07-19 2019-08-27 International Business Machines Corporation Custom widgets based on graphical user interfaces of applications

Also Published As

Publication number Publication date
JP2018073387A (ja) 2018-05-10
US20180121394A1 (en) 2018-05-03
US11087068B2 (en) 2021-08-10

Similar Documents

Publication Publication Date Title
JP6972743B2 (ja) オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法、コンピュータに実装された方法、プログラム、及びコンピュータ化システム
US11849196B2 (en) Automatic data extraction and conversion of video/images/sound information from a slide presentation into an editable notetaking resource with optional overlay of the presenter
JP6237386B2 (ja) 映像ストリームをナビゲートするシステム、方法及びプログラム
US20210056251A1 (en) Automatic Data Extraction and Conversion of Video/Images/Sound Information from a Board-Presented Lecture into an Editable Notetaking Resource
JP5556911B2 (ja) コンテンツ表現を作成する、方法、プログラム、及びシステム
CN108141499B (zh) 惯性音频滚动
US8635293B2 (en) Asynchronous video threads
Yoon et al. RichReview: blending ink, speech, and gesture to support collaborative document review
EP2795885B1 (en) Managing playback of supplemental information
CN114375435A (zh) 增强物理活动表面上的有形内容
US20170083214A1 (en) Keyword Zoom
US20130268826A1 (en) Synchronizing progress in audio and text versions of electronic books
US11423073B2 (en) System and management of semantic indicators during document presentations
US9582138B2 (en) System and method for superimposing a context-sensitive virtual agent on a web-based user interface
JP2005339560A (ja) ジャストインタイムのユーザ支援を提供する手法
US11418551B2 (en) Method and system for providing virtual whiteboard based collaboration service
US9098503B1 (en) Subselection of portions of an image review sequence using spatial or other selectors
KR20230172004A (ko) 비디오 콘텐츠와의 인터렉션을 촉진하기 위한 사용자 인터페이스 및 도구
WO2015177809A2 (en) System and method for collaborative annotations of streaming videos on mobile devices
Hall et al. Capturing synchronous collaborative design activities: A state-of-the-art technology review
Fox et al. Towards a dynamic multiscale personal information space: beyond application and document centered views of information
Vega-Oliveros et al. Viewing by interactions: Media-oriented operators for reviewing recorded sessions on tv
JP3987483B2 (ja) マルチメディア・コンテンツ流通システム
JP2024521613A (ja) ビデオコンテンツとのインタラクションを容易にするユーザインターフェースおよびツール
Nilsson et al. Mobile and stationary user interfaces–differences and similarities based on two examples

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6972743

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150