JP4081056B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP4081056B2
JP4081056B2 JP2004250249A JP2004250249A JP4081056B2 JP 4081056 B2 JP4081056 B2 JP 4081056B2 JP 2004250249 A JP2004250249 A JP 2004250249A JP 2004250249 A JP2004250249 A JP 2004250249A JP 4081056 B2 JP4081056 B2 JP 4081056B2
Authority
JP
Japan
Prior art keywords
annotation
document
semantic class
information
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004250249A
Other languages
English (en)
Other versions
JP2006065754A (ja
Inventor
優 鈴木
康人 石谷
研 植野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004250249A priority Critical patent/JP4081056B2/ja
Priority to US11/211,744 priority patent/US8402365B2/en
Publication of JP2006065754A publication Critical patent/JP2006065754A/ja
Application granted granted Critical
Publication of JP4081056B2 publication Critical patent/JP4081056B2/ja
Priority to US13/776,462 priority patent/US20130174008A1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Description

本発明は情報処理装置に関する。
ユーザに情報を提示し、この提示された情報に対するユーザのアクションを処理する従来技術としては、グラフィカルユーザインタフェース(GUI)と呼ばれる方式が一般に普及している。GUIではマウスなどの指示装置によってユーザが画面上のオブジェクトを指し示し、このオブジェクトに対して施したいアクションをユーザがメニュー画面から選択するなどの方式がとられる。
特にGUIにおけるコンテクストメニューと呼ばれる技術では、対象となるデータの形式によって選択可能な操作を限定してメニュー表示することで、ユーザによるアクションの指示を簡易にしている。
また電子メールを閲覧するアプリケーションにおいては、文章中のURLやメールアドレスとみなせる部分を自動的にハイパーリンク化して提示する技術が利用されている。
第1のドキュメントを表示する際に他の関連するドキュメントを示す技術がある(例えば、特許文献1参照)。
ユーザによりマーキングされたペーパー文書と、マーキングされていないオリジナル文書とからマークを抽出し、マーキングされたアイテムに関連する動作を行う技術もある(例えば、特許文献2参照)。
ペンなどによってユーザから入力されたアノテーションに基づいてアクションを実行する技術もある(例えば特許文献3参照)。
特開2000−10981公報 特開平10−149410号公報 特開平7−78053号公報 特開平8−16312号公報
しかしながら、従来は、形式的な手がかりに基づいて機械的に操作の限定を行うのみであり、形式のみならず文脈を含めたデータの内容によってユーザの所望する操作が異なるような高度な要求には対応できなかった。
また、ユーザが文書上に自然に行う操作の違い、例えばペンによる操作であれば丸印をつける、アンダーラインをひく、枠で囲う、文字列による書き込みを施す、などの違いを文書の内容と関連付けて操作の選択に反映することはできなかった。
そこで、本願発明は、文書上にユーザがアンダーライン、囲み、文字、記号などによるマーキングを行うだけで、当該文書に含まれる所望の情報に対し、ユーザの意図に沿った処理の実行を行うことができる情報処理方法及び装置を提供することを目的とする。
本発明は、表示された文書に、アンダーライン、囲み、文字、文字列、記号及び記号列のうちの少なくとも1つのアノテーションが入力されると、入力されたアノテーションの種別及び当該文書中の当該アノテーションの適用範囲を認識し、当該アノテーションの種別及び当該適用範囲内の情報を基に、ユーザの意図を推定する。この推定された意図を基に、当該文書に対するアクションを選択し実行する。
意図を推定する際には、アノテーションの種別、当該アノテーションの適用範囲内の情報の属性、及び前記文書中の当該情報を含む構成要素のうちの少なくとも1つを基にユーザの意図を推定する。
本発明によれば、文書上にユーザがアンダーライン、囲み、文字、記号などによるマーキングを行うことにより、当該文書に含まれる所望の情報に対し、ユーザの意図に沿った処理を実行することができる。
以下、本発明の実施形態について、図面を参照して説明する。
(第1の実施形態)
第1の実施形態は、インターネット上のコンテンツ、あるいはHTML形式を含む電子メールの内容を表示し、ペンによるユーザからの入力を受けて表示内容に関するアクションを実行する、ペン入力可能なノート型PCあるいはPDAによって実現される情報処理装置について説明したものである。
図1は、第1の実施形態に係る情報処理装置の構成例を示したものである。
文書情報入力部101は文書情報を入力するためのものである。この文書情報は、HTML形式の文書、XML(Extensible markup language)で記述された文書、構造を持たない平文の文書、紙に印字された文書を既知のOCR技術によって電子的なテキストに変換した文書など、種々の形式の文書であってよい。文書情報入力部101にはこれら文書が記録媒体やネットを介して入力される。
また、文書情報入力部101は例えば、所定のディスプレイ装置の画面上に透明なタブレットを重ねて、ペン(スタイラス)などのポインティングデバイスを表示画面上(タブレット上)を動かすと、その座標を取得するような入力装置も備えている。
意味クラス解析知識記憶部102には、文書情報入力部101により入力された文書情報に含まれる文字列から、予め設定された意味クラスを表す部分を判別するための意味クラス解析知識情報が蓄積されている。意味クラス解析部103は、意味クラス解析知識記憶部102に蓄積された意味クラス解析知識情報に基づいて、文書情報入力部101で入力された文書を解析し、予め設定された意味クラスを表す部分を求めて、これを解析結果タグで囲んだ意味クラス解析結果を出力する。表示部104は、文書情報入力部101で入力された文書情報を表示する。
アノテーション入力部120は、表示部104で表示された文書情報に対し所望のアノテーションを例えばペン入力するためのものである。具体的には、ユーザは、表示部104で表示された文書上の所望の位置に所望のアノテーションをペンを用いて書き込むように入力する。入力される(ペンで書き込まれる)アノテーションはアンダーライン、囲み、文字、文字列、記号及び記号列などがあり、アノテーションとして予め定められたものであれば何でも良い。また、ペンで入力する場合に限らず、例えば、キーボード上から所定のキーを入力することで、所定のアノテーションを入力するようにしてもよい。
アノテーション部105は、アノテーション入力部120から入力されたアノテーションの種別や、文書中の当該アノテーションの適用範囲を認識する。アノテーション部105は、入力されたアノテーションの種別を文字認識により判定する場合には、アノテーションテンプレート記憶部121に記憶されているアノテーションテンプレートを参照するようになっている。アノテーションテンプレートには、アノテーションとして入力され得る文字や記号などを認識するために必要な特徴情報などである。
意図推定知識記憶部106には、文書情報入力部101で入力された文書情報、意味クラス解析部103の出力である意味クラス解析結果、アノテーション入力部120から入力されたアノテーションに対する認識結果などを基に、ユーザの意図を推定するための意図推定知識情報が記憶されている。
意図推定部107は、意図推定知識記憶部106に記憶された意図推定知識情報に従い、文書情報入力部101で入力された文書情報、意味クラス解析部103の出力である意味クラス解析結果、アノテーション入力部120から入力されたアノテーションに対する認識結果などを基に、ユーザの意図を推定する。
アクション選択知識記憶部108には、意図推定部107の出力である意図推定結果に基づき、文書情報入力部101から入力された文書情報に対するアクションを選択するためのアクション選択知識情報が記憶されている。
アクション選択部109は、アクション選択知識記憶部108に記憶されたアクション選択知識情報に従い、意図推定部107の出力である意図推定結果に基づいて、文書情報入力部101から入力された文書情報に対するアクションを選択する。
アクション実行部110は、アクション選択部109によって選択されたアクションを実行する。
以下、第1の実施形態に係る情報処理装置の動作を具体的な例をあげて詳細に説明する。
文書情報入力部101によって、例えば、図2に示すようなHTML形式のインターネット文書または電子メールが入力される場合を例にとり説明する。なお、図2は文書情報の一部を省略して示している。
文書情報入力部101により入力される文書情報は、図2に示したようなHTML形式の文書である必要はなく、XML(Extensible markup language)で記述された文書や、構造を持たない平文の文書、紙に印字された文書を既知のOCR技術によって電子的なテキストに変換した文書など、種々の形式の文書であってもよい。文書情報入力部101で入力された文書情報は意味クラス解析部103に渡される。
なお、処理対象とする文書がXMLで記述されたXML文書のように、任意の名称のタグにより囲まれた複数の要素からなる階層化構造を有し、既に、文書中の各情報がタグ名などにより各種意味クラスに分類されているような文書の場合には、意味クラス解析部103における意味クラス解析処理を行わずに(意味クラス解析部103での処理をスキップして)、そのまま表示部104で所定の表示画面上に表示し、次の処理を行うようにしてもよい。
図3は、意味クラス解析知識記憶部102に記憶された意味クラス解析知識情報の例を示したものである。意味クラス解析知識情報には、当該意味クラスに属する情報がもつパタン、例えば、文字列や記号などからなるパタンと、当該パタンにマッチする情報の種別や意味などの属性を表す意味クラスが含まれている。
意味クラス解析部103は図4に示したフローチャートに従って、文書情報の意味クラスを解析する。意味クラス解析部103での意味クラス解析手法は、例えば、公知の固有表現抽出方法(「質問応答と日本語固有表現抽出および固有表現体系の関係についての考察」、市村由美,他,情報処理学会研究報告,NL−161−3,2004)を用いることができる。
まず、意味クラス解析部103は、文書情報入力部101から渡された文書情報を読み込む(ステップS1)。ここでは図2に示した文書情報が読み込まれたとする。次に、意味クラス解析知識記憶部102に記憶された意味クラス解析知識情報をひとつずつ読み込む(ステップS2)。ここでは例として、図3の意味クラス解析知識情報301が読み込まれたときを例として説明する。
意味クラス解析部103は、読み込んだ意味クラス解析知識情報301からパタン(パタンタグで囲まれた値)を取り出す。この例では「(株式会社[^あ−ん]+)」というパタンが取り出される。この例では、パタンとしてPerl言語(「プログラミングPerl」,Larry Wall,Tom Christiansen,Randal L. Schwartz著,近藤嘉雪訳,オライリージャパン,1997)の正規表現を利用している。
意味クラス解析知識情報301のパタンは、「株式会社」という文字列の直後に連続する1文字以上の平仮名以外の文字列があることを示し、このパタンにマッチする文字列は「COMPANY」という意味クラスであると判定されるようになっている。
ステップS1で読み込まれた文書情報に対し、ステップS2で取り出された意味クラス解析知識情報のパタンを照合し、マッチするか否かを判定する(ステップS3)。この意味クラス解析知識情報301が読み込まれたときの例では、図2の文書情報中「株式会社TSB」という文字列がマッチする(ステップS3のYes)。なお、ここでは、説明の簡単なパタンを例にとり説明しているが、実際には、ステップS1で読み込んだ文書情報に対し形態素解析を施した後に、解析知識情報のパタンとの照合を行うことにより、より高精度に当該パタンに対応する文字列を得ることができる。ステップS3で、図2の文書情報中「株式会社TSB」という文字列が意味クラス解析知識情報301のパタンにマッチするので、ステップS4へ進み、当該文字列の両端に意味クラス解析結果タグ(以下、簡単に解析結果タグ)が挿入される。この挿入されるタグには、その属性として、当該文字列の属する意味クラスが記述されている。すなわち、上記文字列「株式会社TSB」の場合には、その両端に意味クラスが「COMPANY」という属性である解析結果タグのSPANタグが挿入されて、「<SPAN class=“COMPANY”>株式会社TSB</SPAN>」となる。すなわち、ある文字列を、開始タグ(例えば<SPAN>)と終了タグ(例えば</SPAN>)で囲み、意味クラス解析結果の意味クラス属性を付与して、1つのSPAN要素が生成される。
ステップS3において、当該文書情報中に当該意味クラス解析知識情報のパタンにマッチする文字列が存在しなかった場合(ステップS3のNo)には、ステップS4をスキップしてステップS5へ進む。
ステップS3〜ステップS4の処理は意味クラス解析知識記憶部102に記憶された全ての意味クラス解析知識情報について繰り返し実行される(ステップS5)。ここでは例として図3の意味クラス解析知識情報301〜308について処理を行なったとする。全ての意味クラス解析知識情報について処理が終了すると、意味クラス解析部103は解析結果を出力する(ステップS6)。意味クラス解析部103による解析結果の例を図5に示す。
図5は、HTMLタグのSPANタグ(<SPAN></SPAN>で囲まれた範囲をひとかたまりとするタグ)を用いて、このSPANタグの属性として意味クラスを記述したものを元の文書情報に埋め込む形で解析結果を出力した場合の例である。なお、解析結果の出力が図5に示したような形式である必要はなく、例えば、解析結果と対応する箇所の文書情報中の位置を、文書情報の先頭からの文字数あるいはバイト数で表現することにより、解析結果を文書情報とは別のデータとして出力してもよい。
意味クラス解析部103から出力された解析結果は表示部104へと送られる。表示部104による文書情報の表示例を図6に示す。表示部104は、既存のインターネットコンテンツ閲覧アプリケーションと同様に、HTML文書をレンダリングして表示している。
図5に示した意味クラス解析結果は、解析結果タグがレンダリングに影響しないHTML形式で文書情報に埋め込まれているため、図6の解析結果の表示例では、解析結果タグ自体は表示されていない。しかし、この場合に限らず、意味クラス解析結果が表示されていてもよい。あるいはカスケーディングスタイルシート(CSS)を用いて、意味クラス解析結果中のSPAN要素に含まれる属性classに対して表示方法の指定を行ない、表示部104による表示に意味クラス解析の結果を反映させてもよい。
表示部104によって表示された文書情報を閲覧した利用者は、アノテーション入力部120によって文書情報に関わるアノテーションを入力する。ここでは、アノテーション入力部120は、表示部104の画面上にペンによって直接アノテーションを入力するようになっている。このようなアノテーションの入力方法は、既存のPDAもしくはタブレットPCと呼ばれるペン入力可能なノート型PCによって実現されている技術を適用すればよい。本発明は入力方法の発明ではないため、その詳細については省略する。図6に示した表示画面上にユーザによって入力されるアノテーションの例を図7〜図9に示す。
図7は、表示部104によって表示された文書情報中の「4月9日」という文字列部分に対してアンダーライン(アノテーション401)がひかれている。図8は、表示部104によって表示された文書情報の第2段落部分が線で囲われている。ここでは、この囲みがアノテーション402である。図9は、表示部104によって表示された文書情報の「GB G21」という文字列の付近にクエスチョンマーク(アノテーション)403が書き込まれている。
アノテーション入力部120は、例えばアノテーションのパスが連続していること、あるいはパスが不連続であってもそれらの時間的な間隔が予め設定された時間よりも短いことによって、各アノテーションを区別し、入力された各アノテーションの開始点(ペンによる書き始め)や終了点(書き終わり)、筆順、線の方向や長さ(パスの長さ)、位置などの情報を、表示画面の左下を基準とし、画面を構成するピクセルを単位として検出するようになっている。
アノテーション部105は、図7〜図9に示したアノテーション401〜403の開始点や終了点の座標やパスの長さなどから、文書中の各アノテーションの適用範囲を認識して、当該文書中の当該適用範囲の先頭と終端に「ANNOTATION」タグを挿入し、それぞれ図10〜図12に示したように内部表現として扱う。
図10の例において、startX、startYがアノテーション401の開始点のX座標とY座標を示し、endX、endYがアノテーション401の終了点のX座標とY座標を示している。またlengthはアノテーション401の開始から終了までの道のりとしてのパスの長さを示している。アノテーション401の開始点及び終了点の座標値及びパスの長さ等の情報は、アノテーション401の適用範囲である当該アノテーション401が書き込まれた文字列の両端に「ANNOTATION」タグを用いて挿入されている。各座標の基準点及び単位は処理系毎に規定すればよい。例えば図10では、画面の左下を基準とし、画面を構成するピクセルを単位とする。
アノテーション部105は、入力されたアノテーションが、予め定められた複数の種別のうちのいずれに属するかを判定する。ここではアノテーションが、図7〜図9に示した「アンダーライン」、「囲み」、「書き込み」の3種類であるとする。
また、アノテーション部105は、表示画面上に入力されたアノテーションが、表示画面上に表示された文書情報中のどの部分に対し入力されたのかを、例えば、文書情報の画面上の座標とアノテーションの座標とから判定する。
図13は、アノテーション部105が入力されたアノテーションの種別の判定処理を説明するためのフローチャートである。
まずステップS11で、入力されたアノテーションが読み込まれる。ステップS12〜ステップS14では、当該アノテーションの文書情報中の開始点startX、startY、終了点endX、endY、パスの長さlengthの各値を用いて、当該アノテーションの種別を判定するようになっている。
ステップS12では、アノテーションが「アンダーライン」であるための条件を満たすか否かをチェックしている。すなわち、開始点のX座標と終了点のX座標の差が所定値(ここでは例えば「10」)より大きく、かつ開始点のY座標と終了点のY座標の差が所定値(ここでは例えば「5」)より小さく、かつ開始点と終了点の間の距離がパスの長さ(length)の所定数(ここでは例えば「0.8」)倍よりも長い場合には、ステップS13へ進み、当該アノテーションは「アンダーライン」と判定する。
図7のアノテーション401の場合、図10に示したように、開始点はstartX=101、startY=52、終了点はendX=123、endY=54、パスの長さはlength=26であるから、
|endX−startX|=22(>10)、
|endY−startY|=2(<5)、
(endX−startX)+(endY−startY)=488
(length×0.8)=432.64
となり、「アンダ−ライン」であるための条件を満たすため、アノテーション401の種別は「アンダーライン」と判定される。
図8のアノテーション401の場合、図11に示したように、開始点はstartX=14、startY=43、終了点はendX=14、endY=42、パスの長さはlength=221であるから、
|endX−startX|=0(<10)、
となり、「アンダ−ライン」であるための条件を満たしていない。
図9のアノテーション403の場合、図12に示したように、開始点はstartX=24、startY=62、終了点はendX=25、endY=51、パスの長さはlength=24であるから、
|endX−startX|=1(<10)、
となり、やはり、「アンダ−ライン」であるための条件を満たしていない。
ステップS12において、「アンダーライン」であるための条件を満たしていないアノテーションについては、ステップS14へ進み、当該アノテーションが「囲み」であるための条件を満たすか否かチェックする。すなわち、開始点のX座標と終了点のX座標の差が所定値(ここでは例えば「5」)より小さく、かつ開始点のY座標と終了点のY座標の差も所定値(ここでは例えば「5」)より小さく、かつ開始点と終了点の間の距離がパスの長さ(length)の所定数(ここでは例えば「0.5」)倍よりも短い場合には、ステップS15へ進み、当該アノテーションは「囲み」と判定する。
図8のアノテーション402の場合、
|endX−startX|=0(<5)、
|endY−startY|=1(<5)、
(endX−startX)+(endY−startY)=1
(length×0.5)=12210.25
であるから、「囲み」であるための条件を満たすため、アノテーション402の種別は「囲み」と判定される。
一方、図9のアノテーション403の場合、
|endX−startX|=1(<5)、
|endY−startY|=11(>5)、
であるから、「囲み」であるための条件を満たしていない。
「アンダーライン」であるための条件及び「囲み」であるための条件を満たさないアノテーションについては、ステップS16へ進み、「書き込み」と判定される。従って、図9のアノテーション403は、ステップS16において「書き込み」と判定されることになる。
「書き込み」と判定されると、ステップS17へ進み、アノテーション403は、既知の文字認識技術(特に、入力されたストロークをリアルタイムで文字認識していくオンライン文字認識技術)を用いて、当該アノテーションがどのような書き込みであるか、すなわち、書き込みの種別(例えば、書き込まれた文字・記号等の種別等)を判定する。すなわち、アノテーション部105は、アノテーションテンプレート記憶部121に記憶されている各テンプレートと、「書き込み」と判定されたアノテーションとを照合して、当該アノテーションの線のベクトルまたは文字情報が、あらかじめアノテーションテンプレート記憶部121で記憶されている各テンプレートとどれだけ一致しているかを示すスコア(類似度)を求め、このなかから、最も類似度の高いテンプレートを求める。この類似度の最も高いテンプレートに対応する文字や記号等が当該アノテーションに対応する書き込みの種別であると判定する。例えば、アノテーション403の書き込みの種別は、「?」と判定される。
ステップS18では、以上の判定処理の結果を出力する。すなわち、アノテーション部105によって判定された、文書中に入力された各アノテーションの種別は、図14〜図16に示すように、当該文書中の各アノテーションの適用範囲の先頭と終端に挿入された「ANNOTATION」タグのtype属性として当該文書中に書き込まれる。また、「書き込み」と判定された場合には、この書き込みの種別が当該文書中の「ANNOTATION」タグのvalue属性として当該文書中に書き込まれる。
例えば、図7のアノテーション401の種別が「アンダーライン」と判定されると、図14に示すように、「ANNOTATION」タグのtype属性として「アンダーライン」と書き込まれる。また、図8のアノテーション402の種別が「囲み」と判定されると、図15に示すように、「ANNOTATION」タグのtype属性として「囲み」と書き込まれる。さらに、図9のアノテーション403の種別が「書き込み」と判定された場合には、図16に示すように、「ANNOTATION」タグのtype属性として「書き込み」、value属性として「?」と書き込まれる。
このように、アノテーションの種別が「アンダーライン」や「囲み」である場合には、type属性により当該アノテーションの種別が一意に特定され、アノテーションの種別が「書き込み」である場合には、type属性とvalue属性により、当該アノテーションの種別が一意に特定される。
次に、意図推定部107は、図14〜図16に示すような文書情報を基に、当該文書情報中の「ANNOTATION」タグで囲まれた各アノテーション要素に対するユーザの意図を推定する。
図17は、意図推定知識記憶部106に記憶された意図推定知識情報の例を示したものである。各意図推定知識情報は、推定されるユーザの各意図(INTENTION)、「ANNOTATION」タグで囲まれたアノテーション要素のtype属性(ANNOTATION_TYPE)の値やvalue属性(VALUE)の値、当該アノテーション要素に含まれる「SPAN」タグの意味クラス(class)属性(SEMANTIC_CLASS)の値などを含み、ユーザの各意図(INTENTION)を、アノテーション要素のtype属性の値やvalue属性の値、当該アノテーション要素に含まれる「SPAN」タグの意味クラス(class)属性の値により特定することができるようになっている。
例えば、図17(a)に示す意図推定知識情報は、type属性が「アンダーライン」のアノテーション要素に、意味クラスが「DATE」であるようなSPAN要素が含まれているときには、当該アノテーション要素に対するユーザの意図は「スケジュール追加」であることを示している。図17(b)に示す意図推定知識情報は、type属性が「アンダーライン」のアノテーション要素に、「COUNT」「CAPACITY」「FREQUENCY」「SIZE」「LENGTH」のうちの少なくとも1つの意味クラスのSPAN要素が含まれているときには、当該アノテーション要素に対するユーザの意図は「データベース追加」であることを示している。図17(c)に示す意図推定知識情報は、type属性が「書き込み」、value属性が「?」のアノテーション要素に、「TITLE」「COMPANY」「PERSON」「PRODUCT」「COUNTRY」「NONE」のうちの少なくとも1つの意味クラスのSPAN要素が含まれているときには、当該アノテーション要素に対するユーザの意図は「検索」であることを示している。
図18は、意図推定部107の処理動作を説明するためのフローチャートである。ここでは、図14〜図16に示した、アノテーション部105におけるアノテーションの認識結果(アノテーションの種別(type属性やvalue属性)当該アノテーションの適用範囲)の書き込まれた文書情報を基に、各アノテーション要素からユーザの意図を推定する場合を例にとり説明する。
意図推定部107は、アノテ−ション部105からアノテーションの認識結果を含む文書情報を受け取ると、当該文書情報中に含まれる各アノテーション要素に対し、図18に示す処理を行う。まず、アノテーション要素を1つ取出すと(ステップS21)、次に、意図推定知識記憶部106から意図推定知識情報を1つ取り出す(ステップS22)。
当該アノテーション要素のtype属性の値が、当該意図推定知識情報の「ANNOTATION_TYPE」項目の値(あるいは、複数の値が記述され、そのうちのいずれか1つに一致すればよいという条件の場合には、そのうちの1つの値)に一致する場合(ステップS23)、ステップS24に進む。ステップS24では、当該アノテーション要素に含まれるSPAN要素のうちの1つの意味クラス(class属性の値)を取り出す。この取り出された意味クラスが、当該意図推定知識情報の「SEMANTIC_CLASS」項目で指定されている1つまたは複数の意味クラスのうちの1つに一致する場合(ステップS25)、意図推定知識情報の「INTENTION」の項目に記述されている値を一時的に記憶する(ステップS26)。
ステップS24〜ステップS26の処理は、当該アノテーション要素に含まれる全てのSPAN要素の意味クラスに対して実行される(ステップS27)。この時、ステップS25で、1つのアノテーション要素に含まれる複数のSPAN要素の各意味クラスが意図推定知識情報の「SEMANTIC_CLASS」の項目に指定されている意味クラスに一致する場合には、その都度、意図推定知識情報の「INTENTION」の項目に記述されている値を追記的に記憶していく。また、ステップS22〜ステップS27の処理は、意図推定知識記憶部106に記憶されている全ての意図推定知識情報に対して繰り返される(ステップS28)。
当該アノテーション要素について、全ての意図推定知識情報との照合(ステップS22〜ステップS27)が終了すると(ステップS28)、当該アノテーション要素について得られた(ステップS26で一時記憶された)意図推定知識情報中の「INTENTION」項目の値をリストを出力する(ステップS29)。当該リストには、当該アノテーション要素に対し推定されたユーザの意図が列挙されている。
例えば、図14のアノテーション要素の場合、type属性が「アンダーライン」であり、当該アノテーション要素には意味クラスが「DATE」であるSPAN要素が含まれているので、これは図17(a)の意図推定知識情報に合致する。従って、この「INTENTION」項目に記述されている「スケジュール追加」が意図推定結果として出力される(図18のステップS29)。この意図推定結果は、例えば、図19に示すように、当該アノテーション要素のINTENTION属性として記述される。
同様に、図15のアノテーション要素の場合、type属性が「囲み」であり、当該アノテーション要素には意味クラスが「CAPACITY」「COUNT」といったSPAN要素が含まれているから、これは図17(b)の意図推定知識情報に合致する。従って、この「INTENTION」項目に記述されている「データベース追加」が、図20に示すように、当該アノテーション要素のINTENTION属性として記述される。
また、図16のアノテーション要素の場合、type属性が「書き込み」及びvalue属性が「?」であり、当該アノテーション要素には意味クラスが「TITLE」というSPAN要素が含まれているから、これは図17(c)の意図推定知識情報に合致する。従って、この「INTENTION」項目に記述されている「検索」が図21に示すように、当該アノテーション要素のINTENTION属性として記述される。
次に、図19〜図21に示すような意図推定結果を基に、アクション選択部109は、各アノテーション要素に対し、アクションを選択する。
図22は、アクション選択知識記憶部108に記憶されているアクション選択知識情報の例を示したものである。各アクション選択知識情報は、推定されるアクション(ACTION)、アノテーション要素のtype属性(ANNOTATION_TYPE)の値やvalue属性(VALUE)の値、INTENTION属性の値、当該アノテーション要素に含まれる「SPAN」タグの意味クラス(class)属性(SEMANTIC_CLASS)の値、などを含み、各アクションを、アノテーション要素のtype属性の値、value属性の値、INTENTION属性の値、当該アノテーション要素に含まれる「SPAN」タグの意味クラス(class)属性の値により特定することができるようになっている。
例えば、図22(a)に示すアクション選択知識情報は、INTENTION属性が「スケジュール追加」のアノテーション要素に、意味クラスが「DATE」のSPAN要素が含まれているとき、当該アノテーション要素に対するアクションは、意味クラスが「DATE」のSPAN要素の値をスケジュール追加のためのアクションであることを示している。
図23は、アクション選択部109の処理動作を説明するためのフローチャートである。アクション選択部109は、意図推定部107から出力された図19〜図21に示すような意図推定結果を含む文書情報を受け取ると、当該文書情報に含まれる各アノテーション要素に対し、図23に示す処理を行う。まず、アノテーション要素を1つ取り出すと(ステップS31)、次に、アクション選択知識記憶部108からアクション選択知識情報を1つ取り出す(ステップS32)。
当該アノテーション要素のINTENTION属性の値が、当該アクション選択知識情報の「INTENTION」項目の値(あるいは、複数の値が記述され、そのうちのいずれか1つに一致すればよいという条件の場合には、そのうちの1つの値)に一致する場合(ステップS33)、ステップS34に進む。ステップS34では、当該アノテーション要素に含まれるSPAN要素のうちの1つの意味クラス(class属性の値)を取り出す。この取り出した意味クラスが、当該アクション選択知識情報の「SEMANTIC_CLASS」項目で指定されている1つまたは複数の意味クラスのうちの1つに一致する場合(ステップS35のYes)、当該アクション選択知識情報の「ACTION」項目に記述されている値を一時的に記憶する(ステップS36)。
なお、アクション選択知識情報によっては、アノテーション要素のtype属性やvalue属性などを指定しているが、この場合には、例えばステップS33において、当該アノテーションのINTENTION属性の他に、type属性やvalue属性なども当該アクション選択知識情報と照合するようにする。
ステップS34〜ステップS36の処理は、当該アノテーション要素に含まれる全てのSPAN要素の意味クラスに対して実行される(ステップS37)。この時、ステップS35で、1つのアノテーション要素に含まれる複数のSPAN要素の各意味クラスがアクション選択知識情報の「SEMANTIC_CLASS」の項目に指定されている意味クラスに一致する場合には、その都度、アクション選択知識情報の「ACTION」項目に記述されている値を追記的に記憶していく。また、ステップS32〜ステップS37の処理は、アクション選択知識記憶部108に記憶されている全てのアクション選択知識情報に対して繰り返される(ステップS38)。
当該アノテーション要素について、全てのアクション選択知識情報との照合(ステップS32〜ステップS37)が終了すると(ステップS38)、当該アノテーション要素について得られた(ステップS36で一時記憶された)アクション選択知識情報中の「ACTION」項目の値のリストを出力する(ステップS39)。当該リストには、当該アノテーション要素に対し選択されたアクションが列挙されている。アクション選択部109は、当該リストをアクション実行部110へ送る(ステップS39)。
例えば、図19のアノテーション要素の場合、意図推定結果のINTENTION属性の値が「スケジュール追加」であり、当該アノテーション要素は「DATE」という意味クラスのSPAN要素を含むので、これは図22(a)のアクション選択知識情報に合致する。従って、この「ACTION」項目に記述されている「add_schedule(<SPAN class=“DATE”>、<body>)」という値がアクション実行部110に送られる。
ここで、アクション選択知識情報の「ACTION」項目の値は、例えば、コンピュータに実行させるコマンドや処理手順をテキストで記述したもの、スクリプトなどであってもよい。
アクション実行部110は、アクション選択部109によって選択されたアクションを実行する。アクション実行部110がアクションを実行する機構は、例えば既存のスクリプト言語実行環境によって実現される。
ここでは、図22(a)のアクション選択知識の「ACTION」項目の値である「add_schedule(<SPAN class=“DATE”>、<body>)」というスクリプトが送られたとする。
ここで、「add_schedule(第1引数、第2引数)」というスクリプトの関数は、例えばスケジュール管理アプリケーションに対して、第1引数に指定した日付に第2引数に指定した情報を関連付ける、という処理が定義されているものとする。このスクリプトが実行されると、ユーザが日付にアンダーラインをひいた場合(種別が「アンダーライン」のアノテーション401を入力した場合)には、この日付のスケジュールに閲覧中の文書をリンク情報として追加する、ということが実現される。
同様に、図20のアノテーション要素の場合、図22(b)のアクション選択知識情報に適合するため、その「ACTION」項目の値、すなわち、「add_database(<ANNOTATION>)」というスクリプトがアクション実行部110に入力される。「add_database(引数)」というスクリプトの関数は、例えば、引数に与えられた情報をデータベースに登録しインデクシングを行う、という処理が定義されているものとする。このスクリプトがアクション実行部110で実行されると、ユーザが「数」「容量」「周波数」「サイズ」「長さ」などの意味クラスを含む情報を囲んだ場合(種別が「囲み」のアノテーション402を入力した場合)には、この囲んだところに含まれる情報をデータベースに登録しておく、ということが実現される。
図21のアノテーション要素の場合、図22(c)のアクション選択知識情報に適合するため、この「ACTION」項目の値、すなわち、「search_www(<ANNOTATION>)」というスクリプトがアクション実行部110に入力される。「search_www(引数)」というスクリプトの関数は、例えば引数に与えられた情報を検索語としてインターネット検索を実行するという処理が定義されているものとする。このスクリプトがアクション実行部110で実行されると、ユーザが「題名」または「不明」という意味クラスの語に対してクエスチョンマーク(?)を書き込んだ場合(種別が「書き込み」及び「?」であるアノテーション403を入力した場合)に、この書き込んだ語を検索キーとしてインターネットを検索する、ということが実現される。
図22(d)に示すアクション選択知識情報は、アノテーション要素のINTENTION属性が「検索」であり、当該アノテーション要素が、「COMPANY(企業名)」、「PERSON(人名)」、「PRODUCT(製品名)」、「COUNTRY(国名)」のうちいずれかの意味クラスのSPAN要素を少なくとも1つ含む場合には、「search_db(<ANNOTATION>、<body>)というスクリプトをアクション実行部110に入力する、ということを示している。「search_db(第1引数、第2引数)」というスクリプトの関数は、例えば第1引数に与えられた情報を検索語とし、第2引数に含まれる語をOR条件として、ローカルのデータベースを検索するという処理が定義されている。このスクリプトがアクション実行部110で実行されると、ユーザが「COMPANY」「PERSON」「PRODUCT]「COUNTRY」という意味クラスの語に対してクエスチョンマークを書き込んだ場合に、この書き込んだ語を検索キーとしてデータベースを検索する、ということが実現される。
このように、上記第1の実施形態によれば、アノテーション入力部120で、表示された文書の所望の箇所(アノテーションの適用範囲)に、アンダーライン、囲み、文字、文字列、記号及び記号列のうちの少なくとも1つのアノテーションを入力し(マーキングを行い)、あるいは、アノテーションを入力するとともに、当該文書中の当該アノテーションの適用範囲を指定する。アノテーション部105は、入力されたアノテーションの種別及び当該文書中の当該アノテーションの適用範囲を認識し、意図推定部107は、アノテーションの種別及び当該文書中の当該アノテーションの適用範囲内の各種情報を基に、ユーザの意図を推定する。この推定された意図を基に、アクション選択部109で当該文書に対するアクションを選択し、アクション実行部110で当該選択されたアクションを実行する。これにより、文書上にユーザがアンダーラインをひく、枠で囲む、文字や記号を書き込み等の自然な操作を行うだけで、当該文書に含まれる所望の情報に対し、ユーザの意図に沿った処理(アクション)の実行を行うことができる。
また、印刷された紙とペンで従来行ってきたのと同様の操作によって電子的な情報を扱うことができるので、ユーザは特別な操作方法を習得する必要がなくなる。また、情報やユーザによる書き込みの内容によって適切な操作が行われるので、ユーザは操作内容をシステムに指示する必要がなくなるか、あるいは手間が削減される。
以下、第2及び第3の実施形態では、上記第1の実施形態に係る情報処理装置の具体的な処理動作の例を示す。
(第2の実施形態)
ここでは、電子メールによる会議のスケジューリングを行う場合を例にとり、図1の情報処理装置の処理動作について具体的に説明する。
会議の主催者はまず、電子メールで会議に召集するメンバー(例えば、ここでは、佐藤、斉藤、岡田の3名)の電子メールアドレスリストを作成する。これは、メーラのアドレス帳やLDAPアプリケーションなどを利用して作成する。
主催者は、会議開催の候補日時、予定場所、議題、準備すべき項目、返信期限、メールタイトル、あいさつ文、結びの言葉ならびにシグネチャなどを含む、図24に示すような文書を作成する。
文書情報入力部101は、図24に示したような文書が入力されると、これを意味クラス解析部103に送る。
図25は、図24の文書に適用される意味クラス解析知識情報sk1〜sk8を示したものである。
意味クラス解析部103は、図4のフローチャートに示したように、図24の文書中から意味クラス解析知識記憶部102に記憶された各意味クラス解析知識情報のパタンと一致する文字列を求めて、これを解析結果タグすなわちSPANタグで囲み、図26に示すような意味クラス解析結果を出力する。
図26では、意味クラス解析知識情報sk1のパタンにマッチする文字列には、意味クラス「EMTITLE」をもつSPANタグst1が付与されている。意味クラス解析知識情報sk2のパタンにマッチする文字列には、意味クラス「TO_NAME」をもつSPANタグst2がそれぞれ付与されている。意味クラス解析知識情報sk3のパタンにマッチする文字列には、意味クラス「DIV_OR_CO」をもつSPANタグst3、意味クラス「SENDER」をもつSPANタグst4、意味クラス「DIV_OR_CO」をもつSPANタグst9が付与されている。意味クラス解析知識情報sk4のパタンにマッチする文字列には、意味クラス「AGENDA」をもつSPANタグst5が付与されている。意味クラス解析知識情報sk5のパタンにマッチする文字列には、意味クラス「DATETIME」をもつSPANタグst6が付与されている。意味クラス解析知識情報sk6のパタンにマッチする文字列には、意味クラス「HW」をもつSPANタグst7が付与されている。意味クラス解析知識情報sk7のパタンにマッチする文字列には、意味クラス「COMPANY」をもつSPANタグst8が付与されている。意味クラス解析知識情報sk8のパタンにマッチする文字列には、意味クラス「EMADDRESS」をもつSPANタグst10が付与されている。
図25の意味クラス解析知識情報sk2は、図27に示すように、スクリプトが埋め込まれていてもよい。すなわち、意味クラス解析知識情報sk2には、与えられた文書中に「○○様」といったパタンの表現が連続して出現する場合には、この連続する各表現に、意味クラス「TO_NAME」をもつSPANタグを連続して付与することができるように繰返し処理を行うようなスクリプトが埋め込まれているので、この意味クラス解析知識情報sk2と当該文書との1回の照合により、連続する各表現に、意味クラス「TO_NAME」をもつSPANタグを付与することができるようになっている。
図26に示したような意味クラス解析結果を含む文書は、表示部104によってユーザに提示される。この際、第1の実施形態で説明したように、付与された意味クラスは表示されてもされていなくてもよい。
ユーザは、意味クラス解析結果を含む文書が表示されている表示画面上に、図28に示すように、アノテーション入力部120で、「T」という表記のアノテーション501をペン入力する。アノテーション入力部120は、ペン入力されたアノテーションの幾何情報を取得する。この幾何情報とは、たとえば、手書き文字の線の方向と長さをあらわすベクタや文字の特徴を表すベクトルのことである。
なお、「書き込み」という種別のアノテーションを入力する場合には、まず、当該アノテーションの適用範囲をユーザが明示的に指示した後に、アノテーションを入力するようにしてもよい。例えば、図28において、ユーザは、まず、表示画面上の文書の領域502の範囲を指定する。この後、当該領域502内に「T」という表記のアノテーション501を入力する。このように明示的に適用範囲を指定することで、意味クラスの誤認識を極力排除することが可能となる。
アノテーション部105は、アノテーション入力部120で入力された上記アノテーション501に関する情報(アノテーション501の開始点及び終了点の座標、パスの長さなど)を取得すると、図13のフローチャートに示したように、その種別を判定する。ここでは、アノテーション501の開始点及び終了点の座標、パスの長さから、「書き込み」と判定されるので、第1の実施形態で説明したように、公知公用の文字認識手法を用いて、当該アノテーション501の文字認識を行う。すなわち、アノテーションテンプレート記憶部121に記憶されている各テンプレートと、「書き込み」と判定されたアノテーション501とを照合して、最も類似度の高いテンプレートを求める。ここでは、「T」のテンプレートとアノテーション501との類似度が最も高くなるので、アノテーション501の書き込みの種別は「T」と判定される。
ここで、アノテーションとテンプレートとの照合方法について説明する。アノテーションテンプレート記憶部121に記憶されているテンプレートの集合をT、各テンプレートjのi個の各特徴ベクトルをCij、入力されたアノテーションのi個の各特徴ベクトルDとすると、アノテーション部105は、次式(1)により、入力されたアノテーションと各テンプレートとの類似度Sを求める。
Figure 0004081056
上記式(1)によれば、i個からなる特徴ベクトルの値の誤差の二乗が最小になるテンプレートjを当該アノテーションに最も類似するテンプレートとして選択することを意味している。類似度の算出手法は、画像認識、パターン認識で広く使われている最短距離法、相互相関法、フーリエ位相相関法などを用いても良いし、その他のパターン認識手法を用いても良い。
以上のようにして、アノテーション入力部120から入力されたアノテーションの種別が「T」であると判定される。この判定時、当該アノテーションの種別が「書き込み」である場合には、書き込みの種別を含めてアノテーションの種別とする。アノテーション部105は、表示画面上の当該アノテーションの開始点や終了点の座標、パスの長さなどから、当該アノテーションが表画面上に表示された文書情報中のどの部分に対し入力されたのか、すなわち、文書中の当該アノテーションの適用範囲を判定し、あるいは、ユーザにより明示的に指示された当該アノテーションの適用範囲(図28の領域502)の表示画面上の座標値を基に、当該適用範囲の先頭と終端に、「ANNOTATION」タグをそれぞれ挿入する。そして、このアノテーションの種別が判定されると、「ANNOTATION」タグのtype属性を「書き込み」、value属性を「T」とする。
図29は、アノテーション部105から出力されるアノテーション部105での上記アノテーションの認識結果を含む文書の一例を示したものである。図29に示す文書には、type属性およびvalue属性をもつアノテーション要素が含まれている。
意図推定部107は、図18に示したように、意図推定知識情報を用いて、当該文書情報中の「ANNOTATION」タグで囲まれたアノテーション要素に対するユーザの意図を推定する。
当該アノテーション要素のtype属性は「書き込み」、value属性は「T」であり、当該アノテーション要素には、意味クラスが「TO_NAME」や「DATETIME」であるSPAN要素が含まれている。従って、このアノテーション要素は、図30に示すような意図推定知識情報にマッチするから、意図推定部107は、当該アノテーション要素に対するユーザの意図は、図30の意図推定知識情報の「INTENTION」項目に記述されている「スケジュール表作成」であると判定する。
意図推定結果の「スケジュール表作成」は、当該アノテーション要素のINTENTION属性として記述される。
次に、上記意図推定結果を含むアノテーション要素に対し、アクション選択部109は、図23に示したように、アクション選択知識情報を用いてアクションを選択する。
ここでは、当該アノテーション要素のINTENTION属性は「スケジュール表作成」であり、当該アノテーション要素は「TO_NAME」や「DATETIME」という意味クラスのSPAN要素を含む。従って、当該アノテーション要素は、図31(a)に示すアクション選択知識情報にマッチするから、アクション選択部109は、図31(a)のアクション選択知識情報の「ACTION」項目に記述されている値をアクション実行部110へ渡す。
図31(a)のアクション選択知識情報の「ACTION」項目の値は、行の項目に「TO_NAME」という意味クラスをもつ各SPAN要素の値、列の項目に「DATETIME」という意味クラスをもつ各SPAN要素の値を配置して、スケジュール表を作成するスクリプト「make_schedTable(<SPAN class=“TO_NAME”>, <SPAN class=“DATETIME”>)」である。
なお、この「make_schedTable」というアクションには、上記のスケジュール表を作成するスクリプト(第1のスクリプト)の他に、図31(b)に示すように、図24に示したメールの送信先の各メンバーからの返信メールを基に、上記スケジュール表上の、当該返信メールに記述された当該メンバーの都合のよい日時に該当するセルに「○」を書き込むためのスクリプト(第2のスクリプト)が含まれている。
アクション実行部110は、アクション選択部109で選択されたアクション「make_schedTable(<SPAN class=“TO_NAME”>、 <SPAN class=“DATETIME”>)」を実行する。すなわち、アクション実行部110は、このアクションを、例えば、電子メールのプラグインソフトウェアとして実装されたモジュールに渡す。この結果、図29に示した文書に対する第1のスクリプトが実行されて、図32に示すようなスケジュール表が作成され、表示部104により所定の表示装置に表示される。
図32に示すスケジュール表の各行の項目には、図29に示すアノテーション要素内の「TO_NAME」という意味クラスをもつ各SPAN要素の値、すなわち、「佐藤」、「斉藤」、「岡田」が配置されている。また、各列の項目には、図29に示すアノテーション要素内の「DATETIME」という意味クラスをもつ各SPAN要素の値、すなわち、「第1候補日時:2004.07.07 13:30−15:30」、「第2候補日時:2004.07.08 10:00−12:00」が配置されている。
なお、図32に示したようなスケジュール表を作成するためのアクションを実行させるための手順としては、必ずしも上述の手順に従う必要はない。
ここでは、図32に示したようなスケジュール表を作成するためのアクションを実行させるための他の手順について説明する。
ここでは、意味クラス解析部103での意味クラス解析結果を含む文書が、当該意味クラス解析結果とともに表示部104により所定の表示画面に表示される。すなわち、「SPAN」タグや、意味クラス属性も表示される。アノテーション入力部120からアノテーションを入力する際には、図33に示すように、まず、スケジュール表の各行の項目に配置したい部分(図33の領域503)をペンで囲む。次に、スケジュール表の各列の項目に配置したい部分(図33の領域504)をペンで囲む。この後、前述同様、「T」という表記のアノテーション501を入力する。
この場合、アノテーション部105は、図34に示すように、領域503及び504を含む領域の先頭と終端部分に、前述のように、アノテーションの認識結果を含む「ANNOTATION」タグを挿入するとともに、さらに、ユーザにより指定された文書中の各領域情報を保持する。例えば、ユーザにより指定された文書中の各領域の先頭と終端部分に、指定された順番を示す属性をもつタグを挿入するようにしてもよい。
意図推定部107及びアクション選択部109での処理を経て、アクション実行部110は、アクション選択知識情報の「ACTION」項目の値として記述されているスクリプトを実行することにより、最初に指定された領域内の各SPAN要素の値をスケジュール表の各行の項目に配置し、次に指定された領域内の各SPAN要素の値をスケジュール表の各列の項目に配置して、図32に示すようなスケジュール表を作成する。
次に、図28に示した内容のメールが、各メンバーに送信された後、主催者が当該メールの送信先の各メンバーから出欠に関する電子メールを受け取った際のシステムの動作を説明する。
アクション実行部110で図32に示すようなスケジュール表が作成されると、例えば、図35に示すように、「ACTIVE」マークが当該スケジュール表の左上に表示される。この「ACTIVE」マークが表示されている状態(アクティブ状態)のとき、返信されてきたメールの文面が、文書情報入力部101から自動的に取り込まれて、当該スケジュール表への書き込みが行われる。なお、「ACTIVE」マークをダブルクリックすると、返信メールをもと当該スケジュール表へ書き込みを行う処理を停止することができる。
いま、あるメンバーからの返信メールが主催者側へ届くと、当該返信メールは文書情報入力部101で取り込まれる。意味クラス解析部103は、図4のフローチャートに示したように、意味クラス解析知識記憶部102の意味クラス解析知識情報を利用し、当該返信メール中に、意味クラス属性をもつ「SPAN」タグを挿入する。
図36は、意味クラス解析部103から出力された意味解析結果を含む(意味クラス属性をもつ「SPAN」タグの挿入された)返信メールの一例を示したものである。
図37は、図36の文書に適用された意味クラス解析知識情報sk9〜sk11を示したものである。
図36において、図25の意味クラス解析知識情報sk1、sk3、sk5等のパタンにそれぞれマッチする文字列には、それぞれの意味クラスをもつ「SPAN」タグst11、st12とst13、st16がそれぞれ付与されている。
また、図36において、当該返信メールの「TITLE」には「Re:」が付されており、4行目の「佐藤」という文字列と、意味クラス「DIV_OR_CO」をもつ「第二開発部」という文字列とは、図37の意味クラス解析知識情報sk9のパタンにマッチするから、4行目の「佐藤」という文字列には、意味クラス「REPLY_SENDER」をもつSPANタグst15が付与されている。
同様に、2行目の「田中」という文字列は、図37の意味クラス解析知識情報sk10のパタンにマッチするから、意味クラス「SENDER」をもつSPANタグst13が付与されている。
また、10行目の文字列「第2候補」は、図25の意味クラス解析知識情報sk5のパタンにマッチするから、意味クラス「DATETIME」をもつSPANタグst16が付与されている。さらに、その後に、「だいじょうぶ」という文字列が続き、5行目及び6行目には、意味クラス「DATETIME」のSPAN要素が引用されているから、「第2候補…だいじょうぶです。」という文字列は、図37の意味クラス解析知識情報sk11のパタンにマッチし、従って、意味クラス「PLAN」をもつSPANタグst17が付与されている。返信者が「第2候補」と正確に記述することが難しければ、例えば、図36の6行目のDATETIMEタグで囲まれた部分をクリックすると、10行目に「第2候補」と自動的に書き込まれるようにしてもよい。
意味クラス解析知識情報sk11には、図37(c)に示すように、当該意味クラス解析知識情報sk11のパタンに一致する、意味クラス「PLAN」をもつ文字列に対するアクションを実行するためのスクリプト「table(REPLY_SENDER,PLAN)」が含まれている。従って、意味クラス「PLAN」をもつSPAN要素には、このスクリプトが付加される。あるいは、当該SPAN要素の属性として当該スクリプトを付加するようにしてもよい。
図36に示したような意味クラス解析結果を含む返信メールは、表示部104によってユーザに提示されるが(その際、第1の実施形態で説明したように、付与された意味クラスは表示されてもされていなくてもよい。)、先に作成されたスケジュール表がアクティブ状態になっている場合(すなわち、図35に示すように、「ACTIVE」マークが当該スケジュール表の左上に表示されている場合)に、さらに、当該返信メールに、意味クラスが「PLAN」というSPAN要素が含まれているとき、図36に示した意味クラス解析結果を含む返信メールは、そのままアクション実行部110に渡される。
アクション実行部110では、スケジュール表がアクティブ状態になっている間は、先にアクション選択部109で選択された「make_schedTable」というアクションに含まれている図31(b)に示すような上記第2のスクリプトが待機している。一方、図36の意味クラス解析結果を含む返信メールの「PLAN」という意味クラスをもつSPAN要素には、スクリプト「table(REPLY_SENDER,PLAN)」が付加されている。
このような条件下においては、アクション実行部110は、まず、当該返信メール中の「PLAN」という意味クラスをもつSPAN要素に付加されているスクリプトを実行する。このスクリプトを実行することにより、図36の返信メールから「REPLY_SENDER」という意味クラスのSPAN要素と、「PLAN」という意味クラスのSPAN要素が取り出される。次に、図31(b)に示すような、現在待機中の上記第2のスクリプトを実行する。この第2のスクリプトを実行することにより、まず、先に取り出された意味クラス「PLAN」のSPAN要素からさらに、意味クラス「DATETIME」のSPAN要素の値(図36の返信メールの場合には「佐藤」)を取出す。そして、図35のスケジュール表の各行の項目(TO_NAME_1〜TO_NAME_n)のうち、当該取り出された、意味クラス「DATETIME」のSPAN要素の値と一致する項目の行を選択する。但し、ここではDATETIMEのSPAN要素の値のうち「第X候補」の部分だけに省略されている場合も一致とみなすこととする。また、図35のスケジュール表の各列の項目(DATETIME_1からDATETIME_m)のうち、先に取り出された意味クラス「REPLY_SENDER」のSPAN要素の値(図36の返信メールの場合「第2候補」)と一致する列を選択する。図35のスケジュール表の当該選択された行と列とで特定されるセルに「○」を書き込み、図38に示すような「○」の書き込まれたスケジュール表が表示部104により表示される。
各メンバーからの返信メールが届くたびに、上記同様にして、当該返信メールから、「PLAN」という意味クラスのSPAN要素が認識されると、スケジュール表の該当するセルに「○」を書き込んでいく。最終的に、図39に示すようなスケジュール表が完成する。
図39に示すようなスケジュール表が表示部104で表示されると、ユーザは、このスケジュール表から、容易に、全員が参加できる日程を理解することができる。この場合、佐藤、斉藤、岡田の3名が会議に参加できるのは第2候補日時の2004年7月8日10:00−12:00であることが分かる。
上記第2の実施形態は、会議だけでなく、飲み会、旅行や様々な企画に対する参加者リストの作成ならびに管理に利用できる。
なお、上記第2の実施形態では、意味クラス解析部103で、各返信メールから会議に参加できる候補日時を抽出するためのパタンをもつ意味クラス解析知識情報sk11(図37参照)を用いて、返信メール中に参加できる候補日時が記載されている場合には、この記載されている候補日時を意味クラス「PLAN」のSPAN要素として抽出し、スケジュール表に「○」を書き込むアクションについて説明したが、この場合に限らず、例えば、意味クラス解析知識情報sk11に、参加できない候補日時や「不参加」を抽出するためのパタンを追加して(あるいは、そのようなパタンをもつ別の意味クラス解析知識情報を用いて)、返信メール中に参加できない候補日時や「不参加」が記載されている場合には、この記載を意味クラス「PLAN」(あるいは別の意味クラスであってもよい)のSPAN要素として抽出し、スケジュール表に「×」を書き込むスクリプトを当該アクション「make_schedTable」に追加するようにしてもよい。
(第3の実施形態)
ここでは、電子メールを用いてアドレス帳を作成する場合を例にとり、図1の情報処理装置の処理動作について具体的に説明する。
電子メールでやり取りした相手の氏名や所属、電子メールアドレスは、仕事、私事の別に関わらず、重要な情報である。多くのメールでは、電子メールの末端に署名としてこれらの情報がまとめて書かれている場合が多い。第3の実施形態にかかる情報処理装置によれば、電子メールの文面中に書かれた氏名、所属、電子メールアドレスなどの情報を取り出し、自動的にアドレス帳を作成することが可能となる。
まず、図40に示すようなアドレス帳のスキーマを用意する。これは、電子メールやアドレス帳のアプリケーションによって通常使われているスキーマをそのまま利用しても良い。ここでは、名前、電子メールアドレス、所属、TEL、FAXの5種類の情報からアドレス帳が構成されているとする。
たとえば、図41に示すような電子メールがユーザの下に送られてきたとする。文書情報入力部101は、この電子メール(以下、文書と呼ぶ)を取り込む。意味クラス解析部103は、図4のフローチャートに示したように、取り込まれた文書から、意味クラス解析知識記憶部102に記憶された各意味クラス解析知識情報のパタンと一致する文字列を求めて、これを解析結果タグすなわちSPANタグで囲み、図45に示すような意味クラス解析結果を出力する。
意味クラス解析部103では、図41の文書に対し意味クラス解析を行う際に、図43や図44に示すような意味クラス解析知識情報を用いる。図44に示す意味クラス解析知識情報は、拡張された意味クラス解析知識情報である。拡張された意味クラス解析知識情報では、通常の意味クラス解析知識情報に含まれるパタンが、論理演算子などを用いて拡張されていたり、同一パタンの文字列を探索するためのプログラムが含まれていたり、さらには、パタンの他に条件記述部分が含まれている。
ここで、図42及び図45を参照して、意味クラス解析部103での処理動作について説明する。なお、図42は、図43に示す意味クラス解析知識情報を用いた意味クラス解析結果を示したもので、図45は、図42の意味クラス解析結果にさらに、図44に示した拡張された意味クラス解析情報を用いて意味クラス解析を行った結果を示している。
意味クラス解析部103は、図43の意味クラス解析知識情報ak1を用いて、図42のSPAN要素at1、at2、at6を生成する。同様に図43の意味クラス解析知識情報ak3を用いて、図42のSPAN要素at3を生成し、図43の意味クラス解析知識情報ak5やak6を用いて、図42のSPAN要素at5を生成し、図43の意味クラス解析知識情報ak7、ak8やak2を用いて、図42のSPAN要素at7、at8を生成する。
次に、意味クラス解析部103は、図42の意味クラス解析結果に対し、図44の拡張された意味クラス解析知識情報を用いて、意味クラス解析よりを行う。まず、図42の文書には、SPAN要素at3〜at8が含まれている部分が意味クラス解析知識情報ak11で指定されているパタンにマッチするため、図45の意味クラス「SIGNATURE」のSPAN要素at9を生成する。同様に、意味クラス解析知識情報ak9を用いて図45の意味クラス「FULLNAME」のSPAN要素at11を生成し、意味クラス解析知識情報ak10を用いて、図45の意味クラス「AFFILIATION」のSPAN要素at10を生成する。
なお、図45に示す文書において、SPAN要素at9は、差出人の氏名(意味クラス「SENDER」)と電子メールアドレス(意味クラス「EMADDRESS」)がともに含まれ、会社名(意味クラス「COMPANY」)や部署名(意味クラス「DIV_OR_CO」)、電話番号(意味クラス「TEL」)、ファックス番号(意味クラス「FAX」)などが含まれている部分が、いわゆる署名部分として、意味クラス「SIGNATURE」のSPANタグで囲まれている。
上記のように、文書中の署名部分あるいはアドレスに登録した情報の記載されている部分を、意味クラス解析知識情報を用いて抽出することができた。
意味クラス解析部103から出力された、図45に示した意味クラス解析結果を含む文書が表示部104で表示されると、ユーザは、アノテーション入力部120から、例えば、「A」という表記の(アドレス帳への登録を指示するという意味を含む)アノテーション601をペンで入力する(図46)。アノテーション部105は、第1及び第2の実施形態で説明したように、アノテーション入力部120で入力された上記アノテーション601に関する情報(アノテーション501の開始点及び終了点の座標、パスの長さなど)を取得すると、図13のフローチャートに示したように、その種別を判定する。ここでは、アノテーション601の開始点及び終了点の座標、パスの長さから、「書き込み」と判定されるので、次に当該アノテーション601の文字認識を行う。すなわち、アノテーションテンプレート記憶部121に記憶されている各テンプレートと、「書き込み」と判定されたアノテーション601とを照合して、最も類似度の高いテンプレートを求める。ここでは、「A」のテンプレートとアノテーション601との類似度が最も高くなるので、アノテーション601の書き込みの種別は「A」と判定される。
アノテーション部105は、表示画面上のアノテーション601の開始点や終了点の座標、パスの長さなどから、ここでは例えば、アノテーション601が表画面上に表示された文書全体に対し入力されたものと判定し、当該文書の先頭と終端に、「ANNOTATION」タグをそれぞれ挿入する。そして、このアノテーション601の種別が判定されると、「ANNOTATION」タグのtype属性を「書き込み」、value属性を「A」とする。
意図推定部107は、図18に示したように、意図推定知識情報を用いて、当該文書中の「ANNOTATION」タグで囲まれたアノテーション要素に対するユーザの意図を推定する。
当該アノテーション要素のtype属性は「書き込み」、value属性は「A」であり、当該アノテーション要素には、意味クラス「SIGNATURE」のSPAN要素内に、意味クラスが「FULLNAME」や「EMADDRESS」「AFFILIATION」「TEL」「FAX」といったSPAN要素が含まれている。従って、このアノテーション要素は、図47に示すような意図推定知識情報にマッチするから、意図推定部107は、当該アノテーション要素に対するユーザの意図は、図47の意図推定知識情報の「INTENTION」項目に記述されている「アドレス帳への追加」であると判定する。
なお、図47の意図推定知識情報は、「WHERE」項目にて指定された範囲、すなわち、意味クラスが「SIGNATURE」のSPAN要素内に、意味クラスが「FULLNAME」「EMADDRESS」「AFFILIATION」「TEL」「FAX」のいずれかであるSPAN要素が含まれていることを指定している。
意図推定結果の「アドレス帳への追加」は、当該アノテーション要素のINTENTION属性として記述される。
次に、上記意図推定結果を含むアノテーション要素に対し、アクション選択部109は、図23に示したように、アクション選択知識情報を用いてアクションを選択する。
ここでは、当該アノテーション要素のINTENTION属性は「アドレス帳への追加」であり、当該アノテーション要素は、意味クラスが「FULLNAME」や「EMADDRESS」「AFFILIATION」「TEL」「FAX」といったSPAN要素が含まれている。従って、当該アノテーション要素は、図48に示すアクション選択知識情報にマッチするから、アクション選択部109は、図48のアクション選択知識情報の「ACTION」項目に記述されている値をアクション実行部110へ渡す。
図48のアクション選択知識情報の「ACTION」項目の値には、意味クラスが「FULLNAME」、「EMADDRESS」、「AFFILIATION」、「TEL」、「FAX」であるようなSPAN要素の値をアドレス帳へ追加するためのスクリプト「add_AddressBook(<SPAN class=“FULLNAME”>、 <SPAN class=“EMADDRESS”>、 <SPAN class=“AFFILIATION”>)、 <SPAN class=“TEL”>、 <SPAN class=“FAX”>」と、図49に示すようなアドレス帳への登録規則が含まれている。
図49のアドレス帳への登録規則は、意味クラスと当該意味クラスに対応するアドレス帳の各項目との対応を示しており、意味クラスが「FULLNAME」、「EMADDRESS」、「AFFILIATION」、「TEL」、「FAX」である各SPAN要素の値は、アドレス帳の「名前」項目、「電子メールアドレス」項目、「所属」項目、「TEL」項目、「FAX」項目にそれぞれに登録できるような規則を示している。
アクション実行部110は、アクション選択部109で選択されたアクション「add_AddressBook」を実行する。すなわち、アクション実行部110は、上記スクリプトを、電子メールのプラグインプログラムなどで実装されたアドレス帳作成プログラムに渡す。当該プログラムが実行されることにより、上記アドレス帳への登録規則に従って、文書中の署名部分に対応する、上記意味クラス「SIGNATURE」のSPAN要素内の各意味クラスのSPAN要素の値が、図50に示すように、アドレス帳に登録される。
アクション実行部110で、上記スクリプトが一旦実行されると、アドレス帳の左上には、図50に示すように「ACTIVE」マークが表示される。ユーザは、この「ACTIVE」マークをダブルクリックすることで自動的にアドレス帳に追加するアクションを中止するよう指示することができる。
このような、ユーザからの特別な中止指示がない限り、自動的に文面をタグ付けし、アドレス帳に情報を追加していく。
なお、上記説明では、文書中の署名部分あるいはアドレスに登録した情報の記載されている部分を、意味クラス解析知識情報を用いて抽出する場合を説明したが、文書中の署名部分を抽出する方法は、上記のように、意味クラス解析知識情報を用いて抽出する方法の他にも、ペンによる範囲指定を行うことで、より確実に署名部分、あるいは、アドレス帳に登録したい情報の記載されている部分を抽出することができる。
例えば、意味クラス解析部103で、図43に示した意味クラス解析知識情報を用いて、図42に示したような意味クラス解析結果を得られた時点で、これを表示部104で表示する。このとき、意味クラス属性も表示するようにしてもよい。ユーザは、アノテーション入力部120により、図51に示すように、表示画面上に、ペンで、文書中の署名部分あるいは、アドレス帳に登録したい情報の記載されている部分(領域602)を囲む。署名部分あるいはアドレス帳に登録した情報の記載されている部分を明示的に指定することで、誤った部分を抽出することを防ぐことができる。その後、前述同様、「A」という表記のアノテーション603を入力する。
この場合、アノテーション部105は、ユーザにより指定された文書中の領域602の先頭と終端部分に、「ANNOTATION」タグをそれぞれ挿入する。そして、このアノテーション603の種別が判定されると、「ANNOTATION」タグのtype属性、value属性を、それぞれ「書き込み」、「A」とする。
意図推定部107は、前述同様に、意図推定知識情報を用いて、当該文書中の「ANNOTATION」タグで囲まれたアノテーション要素に対するユーザの意図を推定する。その後の処理動作は前述同様である。
このように、各種アノテーションを入力する前に、アノテーションの適用範囲を文書中で明示的に指定することで、より正確に、アクションを実行することができる。
上記第3の実施形態によれば、任意の文書中にペンによりアノテーションを入力するだけで自動的にアドレス帳への情報を追加することができる。また、メール文面からのアドレス帳作成だけでなく、スキャナなどで入力した名刺情報やレシートなどの文書も同様に、所望の情報がアドレス帳に登録することができる。このような機能をユーザに提供することで、人的情報が分散して管理が困難になる問題を解決し、人的情報の一元管理に役立つものと考えられる。
なお、上記第1〜第3の実施形態では、ユーザにより入力されたアノテーションの種別(type属性やvalue属性)、当該アノテーションの適用範囲、当該適用範囲内(アノテーション要素内)の各種情報の属する意味クラスなどから、意図推定知識を用いてユーザの意図を推定するようになっている。
各意図推定知識情報では、ユーザの意図を推定するために、アノテーションの種別、アノテーション要素内の情報に含まれる意味クラスなどが指定されているが、HTMLやXMLで記述された文書を対象としている場合には、さらに、当該文書の構成要素、すなわち、任意のタグで囲まれた要素を指定することにより、より正確にユーザの意図を推定することが可能となる。また、意図推定知識情報との照合を行う際に文書中の探索範囲を指定された範囲(構成要素)内に絞り込むことができるため、より高速にユーザの意図を推定することができる。たとえば、単にアノーテーション要素内に含まれる意味クラスを指定することで、その意味クラスを含むタグに囲まれた該当部分をアノーテーション適用範囲として指定するのではなく、該当部分を挟む他のタグを指定することでアノーテーション適用範囲を指定するのでもよい。また、XMLで記述された文書を対象にしている場合には、任意のタグや、複数の任意のタグにより部分構造が指定さていてもよい。
図52は、文書中の構成要素を指定する「DOCUMENT_STRUCTURE」項目を含む意図推定知識情報の一例を示したものである。図52に示す意図推定知識情報では、アノテーションの種別が「アンダーライン」であるアノテーション要素に含まれる情報のうち、タグ<P>で囲まれている各段落の中に意味クラスが「DATE」であるSPAN要素が含まれている場合に、ユーザの意図が「スケジュール追加」であるというを示している。
意図推定部107は、対象とする文書中のアノテーション要素が、図52の意図推定知識情報にマッチするか否かを調べる際には、当該アノテーション要素のtype属性が「アンダーライン」であり、当該アノテーション要素にタグ<p>で囲まれている要素が存在し、この中に意味クラス属性が「DATE」のSPAN要素が存在するかを調べる。
なお、図47に示した意図推定知識情報のように、アノテーションの種別の他に、「WHERE」項目で、意味クラス解析結果である各情報の属する意味クラスを指定し、「SEMANTIC_CLASS」項目で、当該意味クラスに属する情報に含まれる情報の意味クラスを指定することにより、ユーザの意図を推定するといった意図推定知識情報もある。
以上説明したように、上記第1乃至第3の実施形態によれば、文書上にユーザがアンダーラインをひく、枠で囲む、文字や記号を書き込み等の自然な操作を行うだけで、当該文書に含まれる所望の情報に対し、ユーザの意図に沿った処理(アクション)の実行を行うことができる。
本発明の実施の形態に記載した本発明の手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、半導体メモリなどの記録媒体に格納して頒布することもできる。例えば、図1の文書情報入力部101、意味クラス解析部103,表示部104,アノテーション部105、意図認識部107、アクション選択部109、アクション実行部110の各構成部のそれぞれの機能を実現するためのプログラムをコンピュータの記憶装置に記憶して、コンピュータの演算手段(CPU等)により上記各プログラムを実行させることにより、当該コンピュータを上記第1乃至第3の実施形態に係る情報処理装置として機能させることができる。
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
第1乃至第3の実施形態に係る情報処理装置の構成例を示した図。 文書の一例を示した図。 意味クラス解析知識情報の例を示した図。 意味クラス解析部における意味クラス解析処理動作を説明するためのフローチャート。 意味クラス解析部から出力される意味クラス解析結果を含む文書の例を示した図。 図5の文書の表示部での表示例を示した図。 表示された文書に対し入力されたアノテーション(アンダーライン)の一例を示した図。 表示された文書に対し入力されたアノテーション(囲み)の一例を示した図。 表示された文書に対し入力されたアノテーション(書き込み「?」)の一例を示した図。 ANNOTATIONタグの挿入された文書の一例を示した図。 ANNOTATIONタグの挿入された文書の一例を示した図。 ANNOTATIONタグの挿入された文書の一例を示した図。 アノテーション部のおけるアノテーションの種別の判定処理を説明するためのフローチャート。 アノテーション部から出力されるアノテーション認識結果を含む文書の一例を示した図。 アノテーション部から出力されるアノテーション認識結果を含む文書の一例を示した図。 アノテーション部から出力されるアノテーション認識結果を含む文書の一例を示した図。 意図推定結果知識情報の例を示した図。 意図推定部の処理操作を説明するためのフローチャート。 意図推定部から出力される意図推定結果を含む文書の例を示した図。 意図推定部から出力される意図推定結果を含む文書の例を示した図。 意図推定部から出力される意図推定結果を含む文書の例を示した図。 アクション選択知識情報の例を示した図。 アクション選択部の処理動作を説明するためのフローチャート。 第2の実施形態に係る情報処理装置の処理動作を説明するための文書の他の例を示した図。 図24の文書に適用される意味クラス解析知識情報の例を示した図。 意味クラス解析部から出力される意味クラス解析結果を含む文書の例を示した図。 スクリプトの埋め込まれている意味クラス解析知識情報の例を示した図。 表示画面上でのアノテーションの入力例を示した図。 アノテーション部から出力されるアノテーション認識結果を含む文書の他の例を示した図。 図28の文書に適用される意図推定知識情報の例を示した図。 アクション選択知識情報の例を示した図。 アクション実行部で選択されたアクションを実行することにより作成されたスケジュール表の例を示した図。 表示画面上でのアノテーションの他の入力例を示した図。 アノテーション部から出力されるアノテーション認識結果を含む文書のさらに他の例を示した図。 アクション実行部で選択されたアクションを実行することにより作成されたスケジュール表の表示例を示した図。 意味クラス解析部から出力された意味解析結果を含む返信メールの一例を示した図。 返信メールの意味クラス解析処理で用いた意味クラス解析知識情報の例を示した図。 返信メールに対し、アクションを実行した結果を示した図。 返信メールに対し、アクションを実行した結果を示した図。 第3の実施形態にかかる情報処理装置の処理動作を説明するためのもので、アドレス帳のスキーマの例を示した図。 第3の実施形態にかかる情報処理装置の処理動作を説明するための文書の一例を示した図。 図41の文書に対し図43の意味クラス解析知識情報を用いて意味クラス解析を行った結果を含む文書の例を示した図。 意味クラス解析部で用いる意味クラス解析知識情報の例を示した図。 意味クラス解析部で用いる、拡張された意味クラス解析知識情報の例を示した図。 意味クラス解析部から出力された意味クラス解析結果を含む文書の例を示した図。 表示画面上でのアノテーションの入力例を示した図。 図45の文書に適用される意図推定知識情報の例を示した図。 図45の文書に適用されるアクション選択知識情報の例を示した図。 アクション実行時に用いるアドレス帳への登録規則の一例を示した図。 アクションを実行した結果得られるアドレス帳の表示例を示した図。 表示画面上でのアノテーションの他の入力例を示した図。 意図推定知識情報の他の例を示した図。
符号の説明
101…文書情報入力部
102…意味クラス解析知識記憶部
103…意味クラス解析部
104…表示部
105…アノテーション部
106…意図推定知識記憶部
107…意図推定部
108…アクション選択知識記憶部
109…アクション選択部
110…アクション実行部
120…アノテーション入力部
121…アノテーションテンプレート記憶部

Claims (5)

  1. 文字・文字列及び記号で表された複数のパターンと、各パターンに対し、当該パターンにマッチする情報のもつ意味や種別を表す意味クラスとを記憶する第1の記憶手段と、
    意図毎に、当該意図を推定するためのアノテーションの種別と、情報の意味クラスとを示した複数の意図推定知識情報を記憶する第2の記憶手段と、
    表示対象の文書中の前記パターンにマッチする情報に対し前記意味クラスを与える意味クラス解析手段と、
    表示された前記文書に、アンダーライン、囲み、文字、文字列、記号及び記号列のうちの少なくとも1つのアノテーションを入力する入力手段と、
    前記入力手段から入力された前記アノテーションの種別及び前記文書中の当該アノテーションの適用範囲を認識するアノテーション認識手段と、
    前記複数の意図推定知識情報のうち、認識された前記アノテーションの種別と、前記適用範囲内にある前記文書中の情報に与えられた前記意味クラスとを含む意図推定知識情報から、ユーザの意図を推定する意図推定手段と、
    前記意図推定手段により推定された意図を基に、前記文書に対するアクションを選択するアクション選択手段と、
    前記アクション選択手段により選択された前記アクションを実行する実行手段と、
    を具備したことを特徴とする情報処理装置。
  2. 前記入力手段は、表示された文書に、前記アノテーションとともに、当該アノテーションの適用範囲を入力し、
    前記アノテーション認識手段は、入力された前記アノテーションの適用範囲を認識することを特徴とする請求項1記載の情報処理装置。
  3. 前記アノテーション認識手段は、前記入力手段で入力されたアノテーションを文字認識する文字認識手段を有することを特徴とする請求項1記載の情報処理装置。
  4. 文字・文字列及び記号で表された複数のパターンと、各パターンに対し、当該パターンにマッチする情報のもつ意味や種別を表す意味クラスとを記憶する第1の記憶手段と、
    意図毎に、当該意図を推定するためのアノテーションの種別と、情報の意味クラスとを示した複数の意図推定知識情報を記憶する第2の記憶手段と、
    表示対象の文書中の前記パターンにマッチする情報に対し前記意味クラスを与える意味クラス解析手段と、
    表示された文書に、アンダーライン、囲み、文字、文字列、記号及び記号列のうちの少なくとも1つのアノテーションを入力する入力手段及び演算手段を備えたコンピュータにおける情報処理方法であって、
    前記意味クラス解析手段が、表示対象の文書中の情報と前記第2の記憶手段に記憶されている各パターンとを照合し、該パターンにマッチする情報に対し前記意味クラスを与えるステップと、
    前記入力手段が、表示された前記文書に前記アノテーション及び当該アノテーションの適用範囲を入力するステップと、
    前記演算手段が、
    入力された前記アノテーションの種別及び前記文書中の当該アノテーションの適用範囲を認識するステップと、
    前記複数の意図推定知識情報のうち、認識された前記アノテーションの種別と、前記適用範囲内にある前記文書中の情報に与えられた前記意味クラスとを含む意図推定知識情報から、ユーザの意図を推定するステップと、
    推定された意図を基に、前記文書に対するアクションを選択するアクションステップと、
    選択された前記アクションを実行するステップと、
    を有することを特徴とする情報処理方法。
  5. コンピュータを
    文字・文字列及び記号で表された複数のパターンと、各パターンに対し、当該パターンにマッチする情報のもつ意味や種別を表す意味クラスとを記憶する第1の記憶手段、
    意図毎に、当該意図を推定するためのアノテーションの種別と、情報の意味クラスとを示した複数の意図推定知識情報を記憶する第2の記憶手段と、
    表示対象の文書中の前記パターンにマッチする情報に対し前記意味クラスを与える意味クラス解析手段、
    表示された前記文書に、アンダーライン、囲み、文字、文字列、記号及び記号列のうちの少なくとも1つのアノテーションを入力する入力手段、
    入力された前記アノテーションの種別及び前記文書中の当該アノテーションの適用範囲を認識するアノテーション認識手段、
    前記複数の意図推定知識情報のうち、認識された前記アノテーションの種別と、前記適用範囲内にある前記文書中の情報に与えられた前記意味クラスとを含む意図推定知識情報から、ユーザの意図を推定する意図推定手段と、
    前記意図推定手段により推定された意図を基に、前記文書に対するアクションを選択するアクション選択手段、及び
    選択された前記アクションを実行する実行手段、
    として機能させるためのプログラム。
JP2004250249A 2004-08-30 2004-08-30 情報処理装置、情報処理方法及びプログラム Expired - Fee Related JP4081056B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004250249A JP4081056B2 (ja) 2004-08-30 2004-08-30 情報処理装置、情報処理方法及びプログラム
US11/211,744 US8402365B2 (en) 2004-08-30 2005-08-26 Information processing method and apparatus
US13/776,462 US20130174008A1 (en) 2004-08-30 2013-02-25 Information processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004250249A JP4081056B2 (ja) 2004-08-30 2004-08-30 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2006065754A JP2006065754A (ja) 2006-03-09
JP4081056B2 true JP4081056B2 (ja) 2008-04-23

Family

ID=36112173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004250249A Expired - Fee Related JP4081056B2 (ja) 2004-08-30 2004-08-30 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
US (2) US8402365B2 (ja)
JP (1) JP4081056B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2306341A1 (en) 2009-09-29 2011-04-06 Kabushiki Kaisha Toshiba Candidate presentation apparatus, candidate presentation method, and candidate presentation program

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4455357B2 (ja) * 2005-01-28 2010-04-21 キヤノン株式会社 情報処理装置及び情報処理方法
JP4728860B2 (ja) 2006-03-29 2011-07-20 株式会社東芝 情報検索装置
JP4810469B2 (ja) * 2007-03-02 2011-11-09 株式会社東芝 検索支援装置、プログラム及び検索支援システム
JP4247284B2 (ja) 2007-03-28 2009-04-02 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム
JP4398992B2 (ja) 2007-03-29 2010-01-13 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム
JP2008276487A (ja) * 2007-04-27 2008-11-13 Fuji Xerox Co Ltd 文書処理プログラム、文書処理装置及び文書処理システム
JP2009053757A (ja) * 2007-08-23 2009-03-12 Toshiba Corp 情報処理装置、入力方法およびプログラム
JP5295605B2 (ja) * 2008-03-27 2013-09-18 株式会社東芝 検索キーワード改良装置、サーバ装置、および方法
JP5161658B2 (ja) 2008-05-30 2013-03-13 株式会社東芝 キーワード入力支援装置、キーワード入力支援方法及びプログラム
JP2010039572A (ja) * 2008-07-31 2010-02-18 Sky Co Ltd 文字装飾システム及び文字装飾プログラム
KR101452664B1 (ko) * 2010-09-03 2014-10-22 아이패러다임스, 엘엘씨 문서 분석 시스템 및 방법
JP5811435B2 (ja) * 2011-04-12 2015-11-11 コニカミノルタ株式会社 表示装置及び表示制御プログラム
EP2857985A4 (en) * 2012-05-31 2016-08-03 Toshiba Kk KNOWLEDGE EXTRACTION DEVICE, KNOWLEDGE UPGRADING DEVICE AND PROGRAM
JP2014186366A (ja) * 2013-03-21 2014-10-02 Toshiba Corp 商品比較装置、方法、及びプログラム
JP2014186379A (ja) * 2013-03-21 2014-10-02 Toshiba Corp アノテーション検索装置、方法、及びプログラム
CN104243759B (zh) * 2013-06-19 2018-07-13 英华达(上海)科技有限公司 扫描处理系统及其方法
US20150178259A1 (en) * 2013-12-19 2015-06-25 Microsoft Corporation Annotation hint display
US10565219B2 (en) * 2014-05-30 2020-02-18 Apple Inc. Techniques for automatically generating a suggested contact based on a received message
US10579212B2 (en) 2014-05-30 2020-03-03 Apple Inc. Structured suggestions
JP6173990B2 (ja) 2014-09-16 2017-08-02 株式会社東芝 検索支援装置、方法およびプログラム
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10445425B2 (en) 2015-09-15 2019-10-15 Apple Inc. Emoji and canned responses

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH063612B2 (ja) * 1985-10-04 1994-01-12 三洋電機株式会社 文字認識装置の誤読文字訂正方式
JPH05181857A (ja) * 1992-01-08 1993-07-23 Canon Inc 情報処理装置
JP2989084B2 (ja) * 1993-02-16 1999-12-13 シャープ株式会社 情報処理装置
JPH06242885A (ja) * 1993-02-16 1994-09-02 Hitachi Ltd 文書編集方法
JPH06324798A (ja) * 1993-05-17 1994-11-25 Sharp Corp 手書き編集機能を持つ文書処理装置
JPH0778053A (ja) 1993-09-08 1995-03-20 Matsushita Electric Ind Co Ltd 手書きコマンド入力装置
JPH0816312A (ja) 1994-06-24 1996-01-19 Matsushita Electric Ind Co Ltd 手書きコマンド入力装置
JP3704777B2 (ja) * 1996-01-10 2005-10-12 ソニー株式会社 ペン入力型情報処理装置及びコマンド入力方法
US6081829A (en) * 1996-01-31 2000-06-27 Silicon Graphics, Inc. General purpose web annotations without modifying browser
US5692073A (en) 1996-05-03 1997-11-25 Xerox Corporation Formless forms and paper web using a reference-based mark extraction technique
JPH11144024A (ja) * 1996-11-01 1999-05-28 Matsushita Electric Ind Co Ltd 画像合成装置、画像合成方法及び媒体
JP2000010981A (ja) 1998-06-19 2000-01-14 Fuji Xerox Co Ltd リンク識別方法及び電子ドキュメントシステム
AU5926499A (en) * 1998-09-15 2000-04-03 Microsoft Corporation Interactive playlist generation using annotations
JP3795238B2 (ja) * 1998-10-01 2006-07-12 シャープ株式会社 文書画像処理装置及び文書画像処理方法
US6918082B1 (en) * 1998-12-17 2005-07-12 Jeffrey M. Gross Electronic document proofing system
US6529215B2 (en) * 1998-12-31 2003-03-04 Fuji Xerox Co., Ltd. Method and apparatus for annotating widgets
US6687878B1 (en) * 1999-03-15 2004-02-03 Real Time Image Ltd. Synchronizing/updating local client notes with annotations previously made by other clients in a notes database
JP3634686B2 (ja) * 1999-08-30 2005-03-30 シャープ株式会社 文字修正装置および文字修正方法
JP3895892B2 (ja) * 1999-09-22 2007-03-22 株式会社東芝 マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体
CA2285877A1 (en) * 1999-10-15 2001-04-15 Ibm Canada Limited-Ibm Canada Limitee System and method for capturing document style by example
US20010049671A1 (en) * 2000-06-05 2001-12-06 Joerg Werner B. e-Stract: a process for knowledge-based retrieval of electronic information
US7451389B2 (en) * 2000-06-06 2008-11-11 Microsoft Corporation Method and system for semantically labeling data and providing actions based on semantically labeled data
US7346841B2 (en) * 2000-12-19 2008-03-18 Xerox Corporation Method and apparatus for collaborative annotation of a document
WO2003001413A1 (en) * 2001-06-22 2003-01-03 Nosa Omoigui System and method for knowledge retrieval, management, delivery and presentation
US7305614B2 (en) * 2001-07-17 2007-12-04 International Business Machines Corporation Interoperable retrieval and deposit using annotated schema to interface between industrial document specification languages
US20030018668A1 (en) * 2001-07-20 2003-01-23 International Business Machines Corporation Enhanced transcoding of structured documents through use of annotation techniques
US7747943B2 (en) * 2001-09-07 2010-06-29 Microsoft Corporation Robust anchoring of annotations to content
US20030103071A1 (en) * 2001-09-08 2003-06-05 William Lusen User interface system for processing documents for display
US6900819B2 (en) * 2001-09-14 2005-05-31 Fuji Xerox Co., Ltd. Systems and methods for automatic emphasis of freeform annotations
JP2003140791A (ja) * 2001-10-31 2003-05-16 Toshiba Corp 情報処理装置及び情報処理装置の制御方法
US20030204490A1 (en) * 2002-04-24 2003-10-30 Stephane Kasriel Web-page collaboration system
US7313754B2 (en) * 2003-03-14 2007-12-25 Texterity, Inc. Method and expert system for deducing document structure in document conversion
US7603267B2 (en) * 2003-05-01 2009-10-13 Microsoft Corporation Rules-based grammar for slots and statistical model for preterminals in natural language understanding system
US20040243554A1 (en) * 2003-05-30 2004-12-02 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis
US20040267798A1 (en) * 2003-06-20 2004-12-30 International Business Machines Corporation Federated annotation browser
US20040261016A1 (en) * 2003-06-20 2004-12-23 Miavia, Inc. System and method for associating structured and manually selected annotations with electronic document contents
US7555705B2 (en) * 2003-09-10 2009-06-30 Microsoft Corporation Annotation management in a pen-based computing system
US7418656B1 (en) * 2003-10-03 2008-08-26 Adobe Systems Incorporated Dynamic annotations for electronics documents
US7478105B2 (en) * 2004-10-26 2009-01-13 International Business Machines Corporation E-mail based Semantic Web collaboration and annotation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2306341A1 (en) 2009-09-29 2011-04-06 Kabushiki Kaisha Toshiba Candidate presentation apparatus, candidate presentation method, and candidate presentation program

Also Published As

Publication number Publication date
JP2006065754A (ja) 2006-03-09
US20130174008A1 (en) 2013-07-04
US20060080276A1 (en) 2006-04-13
US8402365B2 (en) 2013-03-19

Similar Documents

Publication Publication Date Title
JP4081056B2 (ja) 情報処理装置、情報処理方法及びプログラム
US11023666B2 (en) Narrative-based media organizing system for transforming and merging graphical representations of digital media within a work area
JP6904449B2 (ja) レビューされた1つ以上の文書へのリンクを含む会議レビュー文書の生成
US11270060B2 (en) Generating suggested document edits from recorded media using artificial intelligence
US11080466B2 (en) Updating existing content suggestion to include suggestions from recorded media using artificial intelligence
CN108027873B (zh) 基于捕捉到的笔画信息来与助理组件交互
US11263384B2 (en) Generating document edit requests for electronic documents managed by a third-party document management service using artificial intelligence
US7966352B2 (en) Context harvesting from selected content
RU2683174C2 (ru) Преобразование чернил в текстовое представление
US11392754B2 (en) Artificial intelligence assisted review of physical documents
JP3478725B2 (ja) 文書情報管理システム
US20040196313A1 (en) Ink repurposing
US20160203115A1 (en) Intelligent text annotation
US20070098263A1 (en) Data entry apparatus and program therefor
US20200293605A1 (en) Artificial intelligence assisted review of electronic documents
US20130212463A1 (en) Smart document processing with associated online data and action streams
US7962846B2 (en) Organization of annotated clipping views
US7512874B2 (en) Document information management system
JP2003037677A (ja) マルチメディア会議議事録作成方法及びプログラマブル・デバイスと通信する方法
JP2001014303A (ja) 文書管理装置
US20040093565A1 (en) Organization of handwritten notes using handwritten titles
CN110462613A (zh) 自动生成文档
CN110020279B (zh) 页面数据处理方法、装置及存储介质
KR101005651B1 (ko) 트리 구조와 대화하는 방법 및 시스템
US7360156B1 (en) Method and system for performing actions on content in a region within a free form two-dimensional workspace

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120215

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120215

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130215

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140215

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees