JP2000339309A - 文字列解析装置、文字列解析方法及び提供媒体 - Google Patents

文字列解析装置、文字列解析方法及び提供媒体

Info

Publication number
JP2000339309A
JP2000339309A JP11152809A JP15280999A JP2000339309A JP 2000339309 A JP2000339309 A JP 2000339309A JP 11152809 A JP11152809 A JP 11152809A JP 15280999 A JP15280999 A JP 15280999A JP 2000339309 A JP2000339309 A JP 2000339309A
Authority
JP
Japan
Prior art keywords
character string
type
predetermined
information represented
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11152809A
Other languages
English (en)
Inventor
Masahiro Fujiwara
雅宏 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11152809A priority Critical patent/JP2000339309A/ja
Publication of JP2000339309A publication Critical patent/JP2000339309A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】本発明は、文字列が表す情報の種類を柔軟かつ
正確に判別する。 【解決手段】本発明は、外部からの入力情報を所定フォ
ーマットの文字列に変換する入力手段と、当該入力手段
によって変換された文字列を記憶する記憶手段と、当該
記憶手段に記憶された文字列を黒板モデルにおける異な
る種類の知識源を用いてそれぞれ協調的に解析し、当該
解析した中間結果を記憶手段に書き込むことで異なる種
類の知識源が中間結果を共有し、当該中間結果を統合す
ることにより文字列が表す情報の種類を判別する複数の
解析処理手段とを設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字列解析装置、文
字列解析方法及び提供媒体に関し、例えばパーソナルコ
ンピュータに適用して好適なものである。
【0002】
【従来の技術】従来、パーソナルコンピュータ(以下、
これをコンピュータ装置と呼ぶ)は内部のハードディス
クに格納された例えばウィンドウズ98(商標)等のO
S(Operating System)に基づいてシステム全体を管理し
ており、当該OSを介してアプリケーションソフトウェ
ア(以下、これをアプリケーションと呼ぶ)を起動させ
ることにより所望の処理を実行するようになされてい
る。
【0003】また最近では、特願平09-305351 で知られ
る文字列抽出システムと呼ばれるプログラムを一部に含
んだアプリケーションが提案されており、当該アプリケ
ーションを用いたコンピュータ装置1においてはファイ
ル内のテキストデータのうち所望の文字列(例えば英単
語)が画面上のカーソルによって指定されると、前後の
スペースやピリオド等の終端文字で挟まれた部分を指定
された英単語として抽出し、辞書アプリケーションと連
携させてその英単語の意味を検索して調べた後カーソル
近傍に表示することが行われている。
【0004】
【発明が解決しようとする課題】ところでかかる構成の
文字列抽出システムをアプリケーションとして搭載した
コンピュータ装置においては、ファイルを構成している
テキストデータのうち英単語を文字列として抽出し、当
該抽出した文字列に対して予め関連付けられた辞書アプ
リケーションと連携させて英単語の意味を検索すること
はできるが、あくまで単語の意味を解釈するレベルでの
拡張処理であり、例えば「東京都世田谷区成城○−×−
△」、「電話番号03-1234-5678」等の複数の文字で構成
された構文に対して構文全体が意味する情報の種類を解
析することや、段組みされて記述された構文や複数行に
亘つて記述された構文が意味する情報の種類を解析する
ことは困難であった。
【0005】本発明は以上の点を考慮してなされたもの
で、文字列が表す情報の種類を柔軟かつ正確に判別し得
る文字列解析装置、文字列解析方法及び提供媒体を提案
しようとするものである。
【0006】
【課題を解決するための手段】かかる課題を解決するた
め本発明においては、外部からの入力情報を所定フォー
マットの文字列に変換する入力手段と、当該入力手段に
よって変換された文字列を記憶する記憶手段と、当該記
憶手段に記憶された文字列を協調的に解析し、当該解析
した中間結果を記憶手段に書き込むことで共有し、中間
結果を統合することにより文字列が表す情報の種類を判
別する複数の解析処理手段とを設けることにより、明確
な手続きが存在しない場合でも、できるところから解析
して徐々に得られる中間結果を共有しながら統合してい
くことで漸次的に文字列が表す情報の種類を判別するこ
とができる。
【0007】また本発明においては、外部からの入力情
報を所定フォーマットの文字列に変換する入力ステップ
と、当該入力ステップで変換された文字列を記憶手段に
記憶する記憶ステップと、記憶手段に記憶された文字列
を協調的に解析し、当該解析した中間結果を記憶手段に
書き込むことで共有し、中間結果を統合することにより
文字列が表す情報の種類を判別する解析処理ステップと
を設けることにより、明確な手続きが存在しない場合で
も、できるところから解析して徐々に得られる中間結果
を共有しながら統合していくことで漸次的に文字列が表
す情報の種類を判別することができる。
【0008】さらに本発明においては、外部からの入力
情報を所定フォーマットの文字列に変換する入力ステッ
プと、当該入力ステップで変換された文字列を記憶手段
に記憶する記憶ステップと、記憶手段に記憶された文字
列を協調的に解析し、当該解析した中間結果を記憶手段
に書き込むことで共有し、中間結果を統合することによ
り文字列が表す情報の種類を判別する解析処理ステップ
とからなることを特徴とするプログラムを情報処理装置
に実行させることにより、明確な手続きが存在しない場
合でも、できるところから解析して徐々に得られる中間
結果を共有しながら統合していくことで漸次的に文字列
が表す情報の種類を判別することができる。
【0009】
【発明の実施の形態】以下図面について、本発明の一実
施の形態を詳述する。
【0010】(1)コンピュータ装置の外観構成 図1において、1は全体として情報処理装置としての携
帯型パーソナルコンピュータ装置(以下、これをコンピ
ュータ装置と呼ぶ)を示し、この場合B5サイズ以下の
持ち運び易いノート型パーソナルコンピュータである。
【0011】このコンピュータ装置1は、本体2と当該
本体2に対して開閉自在に取り付けられた表示部3とに
よって構成されている。本体2には、上面に各種文字や
記号及び数字等を入力する複数の操作キー4、表示部3
に表示されるカーソルを移動するときに操作するスティ
ック式ポインティングデバイス5、内蔵スピーカ6、表
示部3に設けられたCCD(Charge Coupled Device) カ
メラ23によって画像を撮像するときに操作するシャッ
タボタン7が設けられている。
【0012】表示部3の正面には、LCD(Liquid Crys
tal Display)でなる液晶ディスプレイ21が設けられて
おり、正面の中央上端部にCCDカメラ23を備えた撮
像部22が表示部3に対して回動自在に取り付けられて
いる。
【0013】すなわち撮像部22は、表示部3の正面方
向及び背面方向との間の180度の角度範囲内で回動し
て任意の位置に位置決めし得るようになされている。ま
た撮像部22には、図2に示すようにCCDカメラ23
のフォーカス調整を行う調整リング25が設けられてい
る。
【0014】また表示部3(図1)の正面には、撮像部
22の左隣にマイクロフォン24が設けられており、当
該マイクロフォン24を介して表示部3の背面側(図
5)からも集音し得るようになされている。
【0015】また表示部3における正面の中央下端部に
は、LED(Light Emitting Diode)でなる電源ランプP
L、電池ランプBL、メッセージランプML及びその他
の種々の用途に対応したランプが設けられている。
【0016】さらに表示部3の正面上端部には、マイク
ロフォン24の左隣にツメ13が設けられると共に、当
該ツメ13と対応する本体2の所定位置に孔部8が設け
られており、表示部3を本体2に閉塞した状態でツメ1
3が孔部8に嵌合されてロックするようになされてい
る。
【0017】本体2の正面には、図2に示すようにスラ
イドレバー9が設けられており、当該スライドレバー9
を正面に沿って矢印方向にスライドすることにより、孔
部8に嵌合されたツメ13のロックを解除して表示部3
を本体2に対して展開し得るようになされている。
【0018】また本体2の正面には、1回のボタン操作
で電源オンから所定のアプリケーションソフトウェア
(以下、これを単にアプリケーションと呼ぶ)を立ち上
げて予め設定しておいた一連の動作を自動的に実行する
ためのプログラマブルパワーキー(PPKキー)10が
左端部に設けられると共に、右端部に複数の吸気孔11
が設けられている。
【0019】本体2の左側面には、図3に示すようにス
ライド式の電源スイッチ40、4ピン対応のIEEE(I
nstitute of Electrical and Electronics Engineers)
1394端子41、USB(Universal Serial Bus)端子
42、マイクロフォン用入力端子43、ヘッドフォン端
子44及びIrDA(Infrared Data Association) 準拠
の赤外線ポート45が設けられている。
【0020】本体2の右側面には、図4に示すように排
気孔12が設けられており、当該排気孔12の右隣には
PCMCIA(Personal Computer Memory Card Interna
tional Association) カード(以下、これをPCカード
と呼ぶ)を挿入するためのPCカードスロット13が設
けられている。
【0021】また本体2の下面には、図5に示すように
増設メモリを取り付けるための開口部25を被覆する蓋
26が取り付けられると共に、当該蓋26のロック用ツ
メを外すためのピン挿入用孔48が設けられている。
【0022】(2)コンピュータ装置の回路構成 図6に示すように本体2においては、起動シーケンス制
御部83のPCI(Peripheral Component Interconnec
t) バス51に、CPU(Central Processing Unit) 5
2、PC(Personal Computer) カードスロット13、R
AM(Random Access Memory)54、表示部3の液晶ディ
スプレイ21に表示する画像を生成するためのグラフィ
ックス処理回路55及び他のコンピュータ装置や外部機
器と接続してディジタルデータを取り込むためのIEE
E1394端子41に直結されたIEEEインターフェ
ース56が接続されている。
【0023】CPU52は、本体2における各種機能を
統括的に制御するコントローラであり、RAM54にロ
ードされた各種プログラムを実行することにより各種機
能を実行し得るようになされている。
【0024】PCIバス51は、ISA(Industrial St
andard Architecture)バス59に接続されており、当該
ISAバス59にはハードディスクドライブ60、I/
O(In/Out)コントローラ61、キーボードコントローラ
62、ポインティングデバイスコントローラ63、サウ
ンドチップ64、LCDコントローラ65、モデム66
及びUSBインターフェース67が接続されている。
【0025】ここでキーボードコントローラ62は、操
作キー4(図1)の押下に応じた制御信号の入力をコン
トロールし、ポインティングデバイスコントローラ63
はスティック式ポインティングデバイス5(図1)によ
る制御信号の入力をコントロールする。
【0026】またサウンドチップ64は、マイクロフォ
ン24(図1)からの音声入力を取り込み又は内蔵スピ
ーカ6(図1)に対して音声信号を供給し、モデム66
は公衆電話回線90、インターネットサービスプロバイ
ダ(以下、これをプロバイダと呼ぶ)91を介してイン
ターネット92やメールボックス93Aを有したメール
サーバ93に接続する。なおUSBインターフェース6
7は、USB端子42に接続されており、USBマウス
やフロッピーディスクドライブ等の周辺機器を接続する
ようになされている。
【0027】ハードディスクドライブ60には、CCD
カメラ23を介して静止画像を取り込むためのキャプチ
ャーソフトウェア60A、ディジタル地図ソフトウェア
60B及びWindows98(商標) でなるOS(Operating Sys
tem)60Cや各種アプリケーションソフトウェア(図示
せず)が格納されており、必要に応じてCPU52によ
って読み出されてRAM54にロードされる。
【0028】I/Oコントローラ61は、I/Oインタ
ーフェース69、CPU70、EEPROM(Electrica
lly Erasable and Programmable Read Only Memory) で
なるROM(Read Only Memory)71及びRAM72が相
互に接続されて構成されており、RTC(Real-Time Clo
ck) 81によって現在時刻が常時供給されている。
【0029】I/Oコントローラ61のROM71に
は、BIOS(Basic Input/Output Sustem) 73、ウェ
イクアッププログラム74、キー入力監視プログラム7
5及びLED制御プログラム76が格納されると共に、
RAM72にはキー入力ステイタスレジスタ77、設定
時刻レジスタ78、LED制御レジスタ79及びキー対
応アプリケーションレジスタ80が設けられている。
【0030】RAM72に格納されているキー入力ステ
イタスレジスタ77は、操作キーフラグを格納し得るよ
うになされており、CPU70はキー入力監視プログラ
ム75に基づいてワンタッチ操作用のPPKキー10
(図2)が押下されたか否かを監視し、当該PPKキー
10が押下されるとキー入力ステイタスレジスタ77に
操作キーフラグを格納する。
【0031】また設定時刻レジスタ78は、ユーザが予
め任意に設定した開始時刻等の時間情報を格納し得るよ
うになされており、CPU70はウェイクアッププログ
ラム74に基づいてRTC81から与えられる現在時刻
が任意に設定した開始時刻になったか否かを検出し、開
始時刻になると所定の処理を実行する。
【0032】さらにキー対応アプリケーションレジスタ
80は、PPKキー10や予め設定された操作キー4の
組み合わせに対応して、PPKキー10や複数の組み合
わせでなる操作キー4と起動すべきアプリケーションと
の対応関係を記憶しており、CPU70はPPKキー1
0や予め設定された組み合わせの操作キー4が押下され
たときに、対応するアプリケーションを立ち上げるため
の制御データをISAバス59及びPCIバス51を順
次介してCPU52に送出し、当該CPU52によって
制御データに応じたアプリケーションを立ち上げる。
【0033】またLED制御レジスタ79は、キー対応
アプリケーションレジスタ80に記憶したアプリケーシ
ョンが立ち上げられて動作が終了すると終了フラグを格
納し、CPU70はLED制御プログラム76に基づい
てLED制御レジスタ79に終了フラグが格納されてい
ることを検出すると、メッセージランプMLを点灯す
る。
【0034】なおLED制御レジスタ79は、電源スイ
ッチ40が押下されると電源フラグを格納し、バッテリ
から供給される電源電圧で本体2が動作するときには電
池フラグを格納する。従ってCPU70は、LED制御
プログラム76に基づいて電源フラグ又は電池フラグが
格納されていることを検出すると、電源ランプPL及び
電池ランプBLを点灯する。
【0035】ここでI/Oコントローラ61には、バッ
クアップ用のバッテリ82が接続されていることによ
り、本体2の電源スイッチ40がオフで図示しない電源
から電力の供給がなされていない状態でもRAM72の
キー入力ステイタスレジスタ77、設定時刻レジスタ7
8、LED制御レジスタ79及びキー対応アプリケーシ
ョンレジスタ80の各データを保持するようになされて
いる。
【0036】またI/Oコントローラ61に接続された
反転スイッチ88は、撮像部22(図1)が表示部3の
液晶ディスプレイ21の反対側を撮像する方向に180
度回転されたときオンされ、その状態をCPU70に通
知する。またPPKキー10も、反転スイッチ88が押
下されたときと同様に、その状態をCPU70に通知す
る。
【0037】さらに半押しスイッチ86は、本体2の上
面に設けられたシャッタボタン7が半押し状態にされた
ときオンしてその状態をI/Oコントローラ61のCP
U70に通知し、全押しスイッチ87はシャッタボタン
7が全押し状態にされたときオンしてその状態をI/O
コントローラ61のCPU70に通知するようになされ
ている。
【0038】すなわちI/Oコントローラ61のCPU
70は、ハードディスクドライブ60のキャプチャーソ
フトウェア60Aを立ち上げた状態で、ユーザによって
シャッタボタン7が半押し状態にされると静止画像モー
ドに入り、CCDカメラ23を制御して静止画像のフリ
ーズを実行し、全押し状態にされるとフリーズされた静
止画像データを取り込み、データ処理部85に送出す
る。
【0039】これに対してI/Oコントローラ61のC
PU70は、キャプチャーソフトウェア60Aを立ち上
げない状態で動画像モードに入ると、最大60秒程度ま
での動画像を取り込み、データ処理部85に送出する。
【0040】またI/Oコントローラ61は、PCIバ
ス51に接続されているグラフィックス処理回路55を
制御するようになされており、CCDカメラ23によっ
て取り込まれた静止画又は動画でなる画像データをデー
タ処理部85によって所定のデータ処理を施した後にグ
ラフィックス処理回路55に入力する。
【0041】グラフィックス処理回路55は、供給され
た画像データを内蔵のVRAM(Video Random Access M
emory)55Aに格納して適宜読み出した後LCDコント
ローラ65に送出し、必要に応じてハードディスクドラ
イブ60に格納する。
【0042】LCDコントローラ65は、表示部3のバ
ックライト84を制御して液晶ディスプレイ21の後方
から照明すると共に、グラフィックス処理回路55から
供給された画像データを液晶ディスプレイ21に出力し
て表示させるようになされている。
【0043】一方、CPU52はハードディスクドライ
ブ60から読み出したディジタル地図ソフトウェア60
BをRAM54上に立ち上げた場合、当該ディジタル地
図ソフトウェア60Bによる地図データをグラフィック
ス処理回路55に送出する。
【0044】このときグラフィックス処理回路55は、
供給された地図データに基づいて液晶ディスプレイ21
に表示する地図画像データを生成してVRAM55Aに
格納し、適宜読み出してLCDコントローラ65に送出
する。
【0045】これによりLCDコントローラ65は、グ
ラフィックス処理回路55から供給された地図画像デー
タに基づいて表示部3の液晶ディスプレイ21に地図画
像を表示させるようになされている。
【0046】またPCIバス51に接続されているPC
カードスロット13は、オプション機能を追加するとき
にPCカード(図示せず)を介して適宜装着され、当該
PCカードを介してCPU52とデータを授受するよう
になされている。例えばPCカードスロット13にPC
MCIA型のGPS(Global Positioning System) カー
ド57が装着された場合、当該GPSカード57に接続
されるGPSアンテナ58によりGPS衛星からの電波
を受信して現在位置データを得るようになされている。
【0047】これによりGPSカード57は、GPSア
ンテナ58を介して受信した現在位置データ(緯度デー
タ、経度データ及び高度データ)をPCIバス51を介
してCPU52へ送出する。
【0048】この場合CPU52は、現在位置データを
グラフィックス処理回路55に送出し、当該グラフィッ
クス処理回路55により現在位置データに基づく現在位
置を示す矢印アイコンを生成した後、LCDコントロー
ラ65を介して液晶ディスプレイ21の地図画像に矢印
アイコンを重ねた状態で表示するようになされている。
【0049】かくして液晶ディスプレイ21は、GPS
カード57によって検出した位置データを基に矢印アイ
コンを地図画像上で移動させながら表示し得るようにな
されている。
【0050】(3)本発明におけるOSのシステム構成 ここでハードディスク60に格納されているOSは、主
としてソフトウェアによって実現され、各種システム機
能を呼び出すためのシステム関数群からなる図示しない
API(Application Program Interface) を備えてお
り、CPU52の制御によりAPIを介してOS上でア
プリケーションを起動することにより、液晶ディスプレ
イ21に所望のアプリケーション画面を表示するように
なされている。
【0051】またOSは、アプリケーション画面上のカ
ーソルが重ねられた部分の文字列を抽出し、当該抽出し
た文字列が表す情報の種類を判定すると共に、文字列の
情報そのものを正確に求めるようになされた文字列解析
装置を一部に有している。
【0052】図7に示すようにコンピュータ装置1は、
例えばワードプロセッサソフトウェアや表計算ソフトウ
ェアさらには電子メール送受信ソフトウェア等の種々の
アプリケーション201によって表示されたアプリケー
ション画面においてテキスト文書中のユーザが注目する
文字列を文字列解析装置200に取り込む。
【0053】文字列解析装置200は、取り込んだ文字
列を解析し得る所定フォーマットに変換した後、文字列
が表す情報の種類を判定しその種類を示すタグを生成す
ると共に、文字列の誤り訂正及び欠落している文字の補
完を行って正確な文字列データを生成し、情報の種類に
関連した例えばWebブラウザや地図検索アプリケーシ
ョン等の他のアプリケーション203に文字列データを
供給して連携させる。これによりコンピュータ装置1
は、文字列の種類に応じた次の処理を自動的に実行し得
るようになされている。
【0054】次に、文字列解析装置200の構成を図8
を用いて説明する。文字列解析装置200は、黒板モデ
ル210と当該黒板モデル210で得られた解析結果の
表示や、解析結果である情報の種類に関連した他のアプ
リケーションとの連携を統括的に制御するシステムマネ
ージャ211とから構成されている。
【0055】ここで黒板モデルとは、多数の知識源が黒
板と呼ばれる共有メモリを介して協調的に働いて問題を
解決するものであり、「多くの人が黒板の前に集まり、
知恵を出し合う」という状況を思い起こさせることから
名付けられた問題解決システムをいう。
【0056】このような黒板モデルの長所を要約すると
以下の通りとなる。黒板モデルでは、複数の異なる種類
の知識源を協調させて用いることが可能であり、独立の
知識を有する他数の知識源が黒板を通じて中間結果を共
有することができるため、自然な協調を実現することが
できる。
【0057】また黒板モデルでは、複数の抽象化階層を
用いることが可能である。ここで抽象化は、問題解決に
要する計算量を削減する一般的な手法であり、抽象化階
層を用いるとボトムアップ的な解の組上げだけでなく、
トップダウン的に解を精錬していくことも可能である。
例えば上位の抽象階層で早めに解が予測できれば、下位
の抽象階層ではその解の検証に重点をおくことができ
る。
【0058】さらに黒板モデルでは、機会主義的な問題
解決を実現し得る。機会主義は、問題解決に明確な手続
きが存在しない場合に、できるところから進めて徐々に
得られた中間結果を統合して行くという漸次的な問題解
決の手法である。(参考文献B.Hayes-Roth,"A Blackboa
rd Architecture for Control,"Artifical Intelligenc
e,Vol.26,No.3,pp.251-321,1985.) 実際上、黒板モデル210においては、複数の入力エー
ジェントI1 〜In と複数の解析エージェントA1 〜A
m とが共有メモリでなる共有黒板212を共有し、知識
源である解析エージェントA1 〜Am が協調的に解析す
ることによって得られた解析結果を出力エージェントO
1 〜Oj を介してそれぞれ専用のアプリケーションへ供
給することにより、当該アプリケーションと解析結果の
文字列データとを連携させるようになされている。
【0059】ここで黒板モデル210は、入力エージェ
ントI1 〜In 、解析エージェントA1 〜Am 及び出力
エージェントO1 〜Oj の数を必要に応じて後から追加
的に拡張することが可能であり、解析機能及び解析能力
を拡張し得るようになされている。また各エージェント
の個数n、m及びjは、全て同じ個数の場合や、全て別
々の個数の場合もあり得る。
【0060】実際上、入力エージェントI1 〜In はそ
れぞれ専用の方法でユーザの注目する文字列を取り込ん
だ後に自然言語の文字列D1に変換し、これを共有黒板
管理部213へ送出するようになされている。ここで入
力エージェントI1 は、カーソルが重ねられたアプリケ
ーション画面上のウィンドウ文字(テキスト文書)を抽
出するウィンドウ文字抽出用であり、入力エージェント
2 は外部から入力された音声を認識して文字列に変換
する音声認識用であり、入力エージェントInは撮像部
22のCCDカメラ23によって撮像された画像中の文
字画像をOCR(Optical Character Reader)技術によっ
て読み出して抽出する文字画像列抽出用である。
【0061】例えば入力エージェントI1 は、アプリケ
ーション画面のテキスト文書上に重ねられたカーソルの
前後数文字分の文字列「京都世田谷区……、電話番号12
34-5678 (不明)」を取り込み、これを自然言語の文字
列D1に変換した後に共有黒板管理部213に送出す
る。この場合入力エージェントI1 は、電話番号部分に
重ねられたカーソルの前後数文字分の文字列を取り込
む。
【0062】実際上OSでは、テキスト文書上にカーソ
ルが重ねられると、当該重ねられた部分の前後数文字分
の文字列がカーソルで隠れてしまうことを防ぐために再
表示を行うが、この再表示を行うときにアプリケーショ
ンからAPIに再度供給される文字列を入力エージェン
トI1 が取り込むようになされている。
【0063】ここで、入力エージェントI1 が取り込む
べき前後数文字分の範囲は予め設定されているが任意に
設定変更可能であり、単語や文字単体での取り込みでは
なく複数の単語や文字が組み合わされた構文レベルの取
り込みが可能である。
【0064】共有黒板管理部213は、システムマネー
ジャ211の制御に基づいて動作し、図9に示すように
入力エージェントI1 から供給された文字列D1をイン
ターフェース220を介してトークン化部221に入力
する。
【0065】トークン化部221は、入力エージェント
1 によって取り込まれた時刻を示すタイムスタンプT
Sを文字列D1に対して付加し、アプリケーション画面
上において文字列D1(「京都世田谷区……、電話番号
1234-5678 」)が占める領域R1の2次元座標範囲r1
(例えば(50,50) 〜(250,100) )を付加すると共に、入
力エージェント1によって取り込まれた文字列D1の正
当確率(例えば取り込んだ文字列D1が正しい確率)P
1を付加した後、さらに情報の種類を示すタグを付加す
ることによりトークンを生成し、これを図10に示すト
ークンTO として共有黒板212に書き込む。
【0066】この場合トークンTO では、文字列D1が
入力エージェントI1 によって取り込まれただけであ
り、文字列D1が表す情報の種類が解析されたわけでは
ないので「不明」を示すタグが付加されている。
【0067】システムマネージャ211(図8)は、共
有黒板管理部213を介して解析エージェントA1 〜A
m に対して解析処理を依頼する。解析エージェントA1
〜Am では、それぞれ文字列D1が表す情報の種類を判
別するため専門の分野に別れており、そのうちの解析エ
ージェントA1 は文字列D1が表す情報の種類が住所で
あることを判定する住所認識用であり、解析エージェン
トA2 は文字列D1が表す情報の種類が電話番号である
ことを判定する電話番号認識用であり、解析エージェン
トAm は文字列D1が表す情報の種類が電子メールアド
レスであることを判定する電子メールアドレス認識用で
ある。これ以外にも、郵便番号であることを判定する郵
便番号認識用の解析エージェント等、他の種々の解析エ
ージェントを用いることが可能である。
【0068】実際上、解析エージェントA1 〜Am は解
析処理の依頼を受けると、共有黒板管理部213のイン
ターフェース220を介して構文解析部223へ所定の
文法に応じた演算命令を指定する。ここで文法とは、文
字列D1の情報の種類を判別する際に用いられる解析フ
ォーマットである。
【0069】例えば、解析エージェントA1 が用いる文
法(住所解析フォーマット)G1 では、住所データベー
スに基づいて「・・都(道、府又は県……)・・区
(市、町は村……)・・○−△−□」のように文字列D
1の中に都道府県のいずれかと市区町村のいずれかが存
在したときに、これは住所であると認識するように定義
されている。
【0070】また解析エージェントA2 が用いる文法G
2 (電話番号解析フォーマット)では、電話番号データ
ベースに基づいて「電話番号03-1234-5678」又は「TE
L0427-25-1234」のように文字列D1の中に存在する電
話番号又はTELという文字に対して数字が10桁続い
たとき、あるいは電話番号又はTELという文字に係わ
らず数字が10桁続いたときに、これは電話番号である
と認識するように定義されている。
【0071】さらに解析エージェントAm が用いる文法
(電子メールアドレス解析フォーマット)Gm では、電
子メールアドレスデータベースに基づいて「……@…
….ne.jp」のように文字列D1の中に「@」が存在した
ときに、これは電子メールアドレスであると認識するよ
うに定義されている。
【0072】従って構文解析部223は、解析エージェ
ントA1 から文法G1 に応じた演算命令の指定を受ける
と、共有黒板212から未だ解析されていないトークン
0を読み出す。
【0073】図11に示すように構文解析部223で
は、構文解析器232が解析エージェントA1 で指定さ
れた文法G1 の演算命令を文法データベース231から
読み出し、当該読み出した演算命令に従ってトークンT
0 の「京都世田谷区……、」でなる住所表示部分と住所
データベースとを参照比較し、誤りの検出及び欠落した
文字の補完(京都を東京都に補完)を行って誤りを訂正
すると共に情報の種類を判別し、当該情報の種類を示す
[Address] のタグを付加することにより、解析エージェ
ントA1 による解析結果を生成する。
【0074】続いて構文解析部223では、構文解析器
232が入力エージェントI1 によって文字列D1を取
り込んだときのタイムスタンプTSと、文字列D1の正
当確率P1と、トークンT0 の住所表示部分だけが占め
るアプリケーション画面上の領域R2の重心座標K1
(X1、Y1)とを確率分布生成器233に供給する。
【0075】ここで住所表示部分だけが占めるアプリケ
ーション画面上の領域R2の重心座標K1(X1、Y
1)は、構文解析器232によってトークンT0 の住所
表示部分だけが占めるアプリケーション画面上の領域R
2の2次元座標範囲r2を基に算出される。
【0076】また確率分布生成器233には、このとき
図示しないクロック発生器からの現在時刻tと、ポイン
ティングデバイスコントローラ63から与えられるステ
ィック式ポインティングデバイス5によるカーソルのア
プリケーション画面上における位置C1(x1、y1)
とが供給されている。
【0077】従って確率分布生成器233は、アプリケ
ーション画面上における住所表示部分の重心座標K1
(X1、Y1)とカーソルのアプリケーション画面上に
おけるカーソル位置C1(x1、y1)とに基づいて、
ユーザが注目している文字列D1のユーザ関心度を表
す。ここで確率分布生成器233は、例えば2次元正規
分布(又は3次元正規分布でも良い)を用いてユーザ関
心度を表す。
【0078】このとき確率分布生成器233は、重心座
標K1(X1、Y1)とカーソル位置C1(x1、y
1)との差分絶対値を算出し、当該差分絶対値に基づい
てユーザ関心度を表す。ここで差分絶対値が「0」に近
い程、カーソルが住所表示部分の重心近くに重ねられて
いるのでユーザ関心度が高く、差分絶対値が大きくなる
程ユーザ関心度が低くなることを表している。
【0079】続いて確率分布生成器233は、文字列D
1を取り込んだときのタイムスタンプTSと現在時刻t
とを比較する。ここで確率分布生成器233は、現在時
刻tとタイムスタンプTSとの時間差を算出し、当該時
間差に基づいてデータの新旧度を表す。ここで時間差が
「0」に近い程、取り込んだ文字列D1のデータが新し
く、時間差が大きい程、取り込んだ文字列D1のデータ
が旧いことを表している。
【0080】従って確率分布生成器233は、データの
新旧度に基づいて住所表示部分のユーザ関心度をさらに
変位させ、その結果得られるユーザ関心度に文字列D1
の正当確率P1を乗算することにより、ユーザ関心度と
正当確率P1に基づく最終的な判定値UP2を算出し、
これを構文解析器232に出力する。
【0081】構文解析器232は、第1解析フェーズの
解析結果に対して判定値UP2を付加することにより、
図10に示すような第1解析フェーズによる住所表示部
分のトークンT1 を生成し、これを共有黒板212に書
き込む。ここでトークンT1は、「東京都世田谷区…」
が誤り訂正及び補完の行われた文字列データD2に相当
し、[Address] が文字列D1が表す情報の種類を示すタ
グとなる。
【0082】次に構文解析部223は、解析エージェン
トA2 から文法G2 に応じた演算命令の指定を受ける
と、共有黒板212からトークンT0 を再度読み出す。
【0083】構文解析部223では、構文解析器232
が解析エージェントA2 によって指定された文法G2
演算命令を文法データベース231から読み出し、演算
命令に従ってトークンT0 の「電話番号1234-5678 」で
なる電話番号表示部分と電話番号データベースとを参照
比較し、誤りの検出及び欠落した文字の補完(市外局番
03を補完)を行って誤りを訂正すると共に情報の種類を
解析し、当該情報の種類を示す[TEL] のタグを付加する
ことにより、第2解析フェーズによる解析結果を生成す
る。
【0084】続いて構文解析部223では、構文解析器
232が入力エージェントI1 によって文字列D1を取
り込んだときのタイムスタンプTSと、文字列D1の正
当確率P1と、トークンT0 の電話番号表示部分がアプ
リケーション画面上を占める領域R3の重心座標K2
(X2、Y2)とを確率分布生成器233に供給する。
【0085】ここで、電話番号表示部分だけが占めるア
プリケーション画面上の領域R3の重心座標K2(X
2、Y2)は、構文解析器232によってトークンT0
の電話番号表示部分だけが占めるアプリケーション画面
上の領域R3の2次元座標範囲r3を基に算出される。
【0086】また確率分布生成器233には、このとき
の現在時刻tと、ポインティングデバイスコントローラ
63から与えられるスティック式ポインティングデバイ
ス5によるカーソルのアプリケーション画面上における
位置C2(x1、y2)とが供給されている。
【0087】従って確率分布生成器233は、アプリケ
ーション画面上における電話番号表示部分の重心座標K
2(X2、Y2)とカーソルのアプリケーション画面上
における位置C2(x2、y2)との差分絶対値に基づ
いて、ユーザが注目している情報のユーザ関心度を表
す。
【0088】続いて確率分布生成器233は、文字列D
1を取り込んだときのタイムスタンプTSと現在時刻t
とを比較する。ここで確率分布生成器233は、現在時
刻tとタイムスタンプTSとの時間差を算出し、当該時
間差に基づいてデータの新旧度を生成する。
【0089】そして確率分布生成器233は、データの
新旧度に基づいて電話番号表示部分に対するユーザ関心
度をさらに変位させ、その結果得られるユーザ関心度に
文字列D1の正当確率P1を乗算することにより、ユー
ザ関心度と正当確率P1に基づく最終的な判定値UP3
を算出し、これを構文解析器232に出力する。
【0090】構文解析器232は、第2解析フェーズの
解析結果に対して判定値UP3を付加することにより、
図10に示すような第2解析フェーズによる電話番号表
示部分のトークンT2 を生成し、これを共有黒板212
に書き込む。ここでトークンT2 は、「電話番号03-123
4-5678」が誤り訂正及び補完の行われた文字列データD
2に相当し、[TEL] が文字列D1の情報の種類を示すタ
グとなる。
【0091】これにより共有黒板212には、元の情報
である文字列D1のトークンT0 、判定値UP2の付加
された住所表示部分のトークンT1 、判定値UP3の付
加された電話番号表示部分のトークンT2 がそれぞれ書
き込まれたことになる。
【0092】ここで共有黒板212には、トークンT0
〜T2 を書き込む際の二次元的なアドレスといった概念
は存在せず、トークンT0 〜T2 に付加されているアプ
リケーション画面上の2次元座標範囲r2及びr3によ
って文字列D1における住所表示部分及び電話番号表示
部分の領域R2及びR3が示されている。
【0093】黒板モデル210における出力エージェン
トO1 〜OJ (図8)は、専用のアプリケーションにそ
れぞれ接続されており、当該接続されているアプリケー
ションで処理し得るフォーマットに文字列データD2を
変換して供給し、当該供給した文字列データD2をアプ
リケーションと連携させてCPU52の制御により所定
の処理を実行するようになされている。
【0094】システムマネージャ211は、トークンT
1 及びトークンT2 の判定値UP2及び判定値UP3に
基づいてユーザ関心度が高くかつ正当確率の高い方のト
ークンT2 を選択し、当該トークンT2 に対する読出命
令を共有黒板管理部213に送出する。この場合、カー
ソルが文字列D1の電話番号表示部分に重ねられていた
ため判定値UP3が判定値UP2よりも高いことを想定
しており、このためシステムマネージャ211はトーク
ンT2 を選択する。
【0095】共有黒板管理部213は、インターフェー
ス220を介して受けた読出命令に応じてトークンT2
を共有黒板212から読み出し、これを非トークン化部
222によってタイムスタンプTS、2次元座標範囲r
3、正当確率P1、判定値UP3及び[TEL] のタグを除
去することにより、単なる文字列データD2に相当する
電話番号データを抽出し、これをインターフェース22
0を介して出力エージェントO1 〜OJ に送出する。
【0096】そして出力エージェントO1 〜OJ は、供
給された電話番号データが自身に接続されているアプリ
ケーションで処理し得るデータであるときに限り、当該
アプリケーションで処理し得る形式に変換し、これをア
プリケーションへ供給して連携させる。因みに出力エー
ジェントO1 は、例えばディジタル地図ソフトウェア6
0Bに接続されており、供給された電話番号データを所
定の形式に変換し、ディジタル地図ソフトウェア60B
に供給して連携させる。
【0097】この場合コンピュータ装置1は、ディジタ
ル地図ソフトウェア60Bをハードディスク60から読
み出し、当該ディジタル地図ソフトウェア60BをAP
Iを介してOS上で起動させた後に電話番号データをデ
ィジタル地図ソフトウェア60Bに供給し、当該ディジ
タル地図ソフトウェア60Bに従って電話番号データの
領域を含む地図を検索して表示するようになされてい
る。
【0098】(4)文字列解析装置による文字列の解析
処理手順 次に、コンピュータ装置1においてOSの文字列解析装
置200によってアプリケーション画面のテキスト文書
上でカーソルが重ねられた部分の文字列が表す情報の種
類を自動的に解析する構文解析処理手順を図12のフロ
ーチャートを用いて説明する。ここで文字列解析装置2
00は、CPU52の制御によってAPIを介してOS
上で起動し、システムマネージャ211によって以下の
処理が実行される。
【0099】文字列解析装置200は、RT1の開始ス
テップから入って次のステップRT2に進み、入力エー
ジェントI1 〜In による共有黒板212へのトークン
の書き込み処理手順に入ると、図13に示すステップS
P11に移る。
【0100】ステップSP11においてシステムマネー
ジャ211は、入力エージェントI1 〜In が取り込む
べき新たなデータがあるか否かを判定する。ここで否定
結果が得られると、このことは取り込むべき新たなデー
タが存在しないことを表しており、このときシステムマ
ネージャ211は、共有黒板212に書き込むべき新た
なデータが存在しないのでステップSP15に移って処
理を終了する。
【0101】これに対してステップSP11において肯
定結果が得られると、このことは取り込むべき新たなデ
ータが存在していることを表しており、このときシステ
ムマネージャ211は入力エージェントI1 〜In のい
ずれかに対して読み出し命令を送出し、次のステップS
P12に移る。
【0102】ステップSP12においてシステムマネー
ジャ211は、入力エージェントI1 〜In のいずれか
によって新たなデータを入力し、次のステップSP13
に移る。
【0103】ステップSP13においてシステムマネー
ジャ211は、入力エージェントI1 〜In のいずれか
によって入力した新たなデータを文字列D1に変換し、
次のステップSP14に移る。
【0104】実際上、入力エージェントI1 の場合では
カーソルの重ねられた部分の前後数文字分の文字列を取
り込んで自然言語の文字列D1に変換し、入力エージェ
ントI2 の場合には認識した音声を自然言語の文字列D
1に変換し、入力エージェントIn の場合には画像中の
文字画像をOCR技術によって読み出して自然言語の文
字列D1に変換する。
【0105】ステップSP14においてシステムマネー
ジャ211は、文字列D1を共有黒板管理部213(図
9)のトークン化部221によってトークン化すること
により未解析のトークンを生成し、これを共有黒板21
2に書き込んだ後にステップSP15に移ってトークン
の書込処理手順を終了し、次のステップSP2(図1
2)に進む。
【0106】ステップSP2においてシステムマネージ
ャ211は、共有黒板212に対して書き込まれたトー
クンの読み出し処理を実行し、次のステップSP3に移
る。
【0107】ステップSP3においてシステムマネージ
ャ211は、共有黒板212に書き込まれたトークンの
中で未解析の新たなトークンが存在するか否かを判定す
る。ここで否定結果が得られると、このことは共有黒板
212に書き込まれている全てのトークンが既に解析済
みであることを示しており、このときシステムマネージ
ャ211はステップSP8に移って解析処理を終了す
る。
【0108】これに対してステップSP3において肯定
結果が得られると、このことは共有黒板212に書き込
まれたトークンの中で未だ解析されていない新たなトー
クンが存在していることを示しており、このときシステ
ムマネージャ211は次のステップSP4に移る。
【0109】ステップSP4においてシステムマネージ
ャ211は、共有黒板212から未だ解析されていない
新たなトークンを読み出した後に次のステップRT3の
構文解析処理に入り、図14に示すステップRT4の構
文解析及びトークンの生成処理に進む。
【0110】ステップRT4の構文解析及びトークンの
生成処理に入ると、システムマネージャ211は図15
に示すステップSP31に移る。
【0111】ステップSP31においてシステムマネー
ジャ211は、共有黒板212から未解析のトークンを
読み出して取得し、次のステップSP32に移る。
【0112】ステップSP32においてシステムマネー
ジャ211は、解析エージェントA1 〜Am で指定され
た文法の演算命令に従ってトークンの解析処理を実行
し、次のステップSP33に移る。
【0113】ステップSP33においてシステムマネー
ジャ211は、トークンが文法のフォーマット(住所解
析フォーマット、電話番号解析フォーマット又は電子メ
ールアドレス解析フォーマット)に合致したか否かを判
定する。ここで肯定結果が得られると、このことはトー
クンが所定の解析フォーマットに合致したことを表して
おり、このときシステムマネージャ211は次のステッ
プSP41に移る。
【0114】ステップSP41においてシステムマネー
ジャ211は、所定の解析フォーマットに応じてトーク
ンを解析することにより、誤り訂正及び文字の補完を行
うことにより得られた文字列データD2に情報の種類を
示すタグや判定値等を付加することにより新たなトーク
ンを生成して共有黒板212に書き込み、次のステップ
SP42に移って新たなトークンの生成処理を終了した
後にステップSP22(図14)に進む。
【0115】これに対してステップSP33において否
定結果が得られると、このことはトークンが文法のフォ
ーマットに合致していないことを表しており、このとき
システムマネージャ211は次のステップSP34に移
る。
【0116】ここで図16に示すように、例えば上下2
行に亘つて段組みされた構文によって郵便番号及び住所
が液晶ディスプレイ21のアプリケーション画面上に表
示されていた場合、入力エージェントI1 〜In は各行
毎にトークンA及びトークンBを生成して共有黒板21
2に書き込む。
【0117】この場合の構文解析処理は、2行に亘つて
段組みされている構文に対して行うものであり、図10
に示す構文解析パターン(第1及び第2解析フェーズ)
とは若干異なるために、未解析のトークンT0 に相当す
るものをトークンTA 及びトークンTB とし、第1解析
フェーズによる解析結果のトークンT1 に相当するもの
をトークンTC とし、第2解析フェーズによる解析結果
のトークンT2 に相当するものをトークンTD とする。
【0118】この場合のトークンTA 及びトークンTB
は、共に郵便番号と住所とが混在しているためにそれぞ
れ郵便番号解析フォーマット及び住所解析フォーマット
のどちらにも完全には合致しない。因みにトークンTA
及びトークンTB においては、タイムスタンプ、2次元
座標範囲及び正当確率や判定値等の付加情報については
説明上ここでは省略し、 [不明] のタグだけが表示され
ている状態である。
【0119】しかしながら、トークンTA 及びトークン
B 共に郵便番号解析フォーマット及び住所解析フォー
マットから完全に外れているわけではなく一部分だけ合
致しており、このときのトークンTA 及びトークンTB
の正当確率P1はその分だけ減少したある確率値を示す
ことになる。
【0120】つまりステップSP34においてシステム
マネージャ211は、トークンT又はトークンT
に対して実行された所定の解析フォーマットによる解析
結果の正当確率P1が一定値以下であるか否かを判定す
る。例えばトークンTA の場合、「郵便番号158-」に対
して「東京都品川区」が続いているので、トークンTA
が郵便番号又は住所を示している正当確率P1はその分
減少している。
【0121】このステップSP34において肯定結果が
得られると、このことは解析フォーマットに合致する部
分が殆ど無くトークンTA 又はトークンTB の正当確率
P1が一定値以下なので解析不能であると判断し、この
ときシステムマネージャ211はステップSP42に移
って処理を終了する。
【0122】これに対してステップSP34において否
定結果が得られると、このことは正当確率P1が一定値
を越えているので未だ解析できる可能性が高いと判断
し、このときシステムマネージャ211は次のステップ
SP35に移って2次元的な構文解析処理に入る。
【0123】ステップSP35においてシステムマネー
ジャ211は、トークンTA の右隣にトークンTZ が存
在するか否かを判定する。ここで肯定結果が得られる
と、このことはトークンTA の右隣にトークンTZ が存
在していることを表しており、このときシステムマネー
ジャ211はトークンTA の右隣に存在しているトーク
ンTZ についても解析する必要があるとして、次のサブ
ルーチンRT36に移る。
【0124】因みに図16の場合には、トークンTA
右隣にトークンTZ は存在せず、トークンTA の下近傍
にトークンTB が存在するだけである。ここで右隣のト
ークンTZ とは、共有黒板212上の右隣を示す位置で
はなく、アプリケーション画面上において右隣に表示さ
れている文字列に対応するトークンのことであり、アプ
リケーション画面上の2次元座標範囲に基づいて判断さ
れる。
【0125】サブルーチンRT36においてシステムマ
ネージャ211は、ステップSP31〜ステップSP4
2迄の一連の処理を再帰的に実行することでトークンT
A の右隣に存在するトークンTZ を取得し、トークンT
A とトークンTZ とによる構文を文法の解析フォーマッ
トに従って解析、すなわちトークンTA とトークンTZ
とによる構文に対してステップSP32〜ステップSP
42迄の一連の処理を再帰的に適用することで解析し、
次のステップSP37に移る。
【0126】ステップSP37においてシステムマネー
ジャ211は、トークンTA とトークンTZ とによる構
文が文法の解析フォーマットに合致したか否かを判定す
る。ここで肯定結果が得られると、このことはトークン
A とトークンTZ とによる構文が文法の解析フォーマ
ットに合致し得たことを表しており、このときシステム
マネージャ211は次のステップSP41に移る。
【0127】ステップSP41においてシステムマネー
ジャ211は、所定の解析フォーマットに応じてトーク
ンTA とトークンTZ とによる構文を解析することによ
り文字例データD2を得、当該文字列データD2に情報
の種類を示すタグや判定値(図示せず)を付加すること
により新たなトークンを生成して共有黒板212に書き
込み、次のステップSP42に移って処理を終了した後
にステップSP22(図14)に進む。
【0128】これに対してステップSP37において否
定結果が得られると、このことはトークンTA とトーク
ンTZ とによる構文が文法の解析フォーマットに合致し
ていないことを表しており、このときシステムマネージ
ャ211は次のステップSP38に移る。
【0129】一方ステップSP35において否定結果が
得られると、このことはトークンTA の右隣にトークン
Z が存在しないことを表しており、このときシステム
マネージャ211は次のステップSP38に移る。
【0130】ステップSP38においてシステムマネー
ジャ211は、トークンTA の下近傍にトークンTB
存在するか否かを判定する。この場合もトークンTA
下近傍の位置は、アプリケーション画面上における領域
を示している。
【0131】ここで否定結果が得られると、このことは
トークンTA の下近傍にトークンTB が存在しないこと
を表しており、このときシステムマネージャ211はス
テップSP42に移って処理を終了する。
【0132】これに対してステップSP38において肯
定結果が得られると、このことはトークンTA の下近傍
にトークンTB が存在していることを表しており、この
ときシステムマネージャ211はトークンTA の下近傍
に存在しているトークンTBについても解析する必要が
あるとして、次のサブルーチンRT39に移る。
【0133】サブルーチンRT39においてシステムマ
ネージャ211は、ステップSP31〜ステップSP4
2迄の一連の処理を再帰的に実行することでトークンT
A の下近傍に存在するトークンTB を取得し、トークン
A とトークンTB とによる構文を文法の解析フォーマ
ットに従って解析、すなわちトークンTA とトークンT
B とによる構文に対してステップSP32〜ステップS
P42迄の処理を再帰的に適用することで解析し、次の
ステップSP40に移る。
【0134】ステップSP40においてシステムマネー
ジャ211は、トークンTA とトークンTB とによる構
文が文法の解析フォーマットに合致したか否かを判定す
る。ここで否定結果が得られると、このことはトークン
A とトークンTB とによる構文が文法の解析フォーマ
ットに合致していないことを表しており、このときシス
テムマネージャ211はステップSP42に移って処理
を終了する。
【0135】これに対してステップSP40において肯
定結果が得られると、このことはトークンTA とトーク
ンTB とによる構文が文法の解析フォーマットのいずれ
かに合致し得たことを表しており、このときシステムマ
ネージャ211は次のステップSP41に移る。
【0136】ステップSP41においてシステムマネー
ジャ211は、所定の解析フォーマットに応じてトーク
ンTA とトークンTB とによる構文を解析することによ
り、図16に示すような文字列データD2(「郵便番号
158-0083」及び「東京都品川区北品川3-5-△」)を得、
当該文字列データD2に情報の種類を示すタグ( [〒]
及び[Address] )と判定値(図示せず)とをそれぞれ付
加することにより新たなトークンTC 及びトークンTD
を生成して共有黒板212に書き込み、次のステップS
P42に移って構文解析及びトークンの生成処理を終了
した後にステップSP22(図14)に進む。
【0137】ステップSP22においてシステムマネー
ジャ211は、共有黒板212に新たなトークンTC
びトークンTD が書き込まれているか否かを判定する。
ここで否定結果が得られると、このことは構文解析され
ず新たなトークンが生成されなかったことを表してお
り、このときシステムマネージャ211はステップSP
26に移って解析処理を終了する。
【0138】これに対してステップSP22において肯
定結果が得られると、このことは構文解析された結果、
新たなトークンTC 及びトークンTD が生成されて共有
黒板212に書き込まれていることを表しており、この
ときシステムマネージャ211は次のステップSP23
に移る。
【0139】ステップSP23においてシステムマネー
ジャ211は、新たなトークンTC及びトークンTD
知識データベースとをパターンマッチング等の手法を用
いて構文解析器232で比較参照することにより、新た
なトークンTC 及びトークンTD の矛盾を検出し、次の
ステップSP24に移る。
【0140】ステップSP24においてシステムマネー
ジャ211は、新たなトークンTC及びトークンTD
矛盾が存在するか否かを判定する。ここで肯定結果が得
られると、このことは新たに生成したトークンTC 及び
トークンTD に矛盾が存在していることを表しており、
このときシステムマネージャ211は解析結果に間違い
がある可能性が高いので構文解析処理が失敗したものと
判断し、トークンTC及びトークンTD を共有黒板21
2から消去した後、ステップSP26に移って解析処理
を終了する。
【0141】これに対してステップSP24において否
定結果が得られると、このことは新たに生成したトーク
ンTC 及びトークンTD に矛盾が存在しておらず、解析
結果が正しいことを表しており、このときシステムマネ
ージャ211は次のステップSP25に移る。
【0142】ステップSP25においてシステムマネー
ジャ211は、構文解析処理が成功したことを認識し、
次のステップSP26で解析処理を終了した後にステッ
プSP6(図12)に移る。
【0143】ステップSP6においてシステムマネージ
ャ211は、ステップRT3における構文解析処理が成
功したか否かを判定する。ここで否定結果が得られる
と、このことは構文解析処理が失敗したことを表してお
り、このときステップSP8に移って処理を終了する。
【0144】これに対してステップSP6において肯定
結果が得られると、このことは構文解析処理が成功した
ことを表しており、このときシステムマネージャ211
は次のステップSP7に移る。
【0145】ステップSP7においてシステムマネージ
ャ211は、構文解析処理が成功したので新たに生成し
たトークンTC 及びトークンTD を共有黒板212に残
したまま、次のステップSP8に移って構文解析処理を
全て終了する。
【0146】(5)文字列解析結果のアプリケーション
連携処理手順 次に、コンピュータ装置1において文字列解析装置20
0で解析した文字列D1が表す情報の種類(タグ)に関
連したアプリケーションに、文字列D1の情報そのもの
である文字列データD2を供給して連携させる連携処理
手順について、図17のフローチャートを用いて説明す
る。
【0147】文字列解析装置200は、RT5の開始ス
テップから入ってステップSP51に移る。ステップS
P51においてシステムマネージャ211は、共有黒板
212に書き込まれたトークンの中から解析結果が最も
確からしい(ユーザ関心度と正当確率によって算出され
た判定値の最も高いもの)と思われるものを読み出す処
理を出力エージェントO1 〜Oj に実行させ、ステップ
SP52に移る。
【0148】ステップSP52においてシステムマネー
ジャ211は、共有黒板212から読み出すべき判定値
の高いトークンが存在するか否かを判定する。ここで否
定結果が得られると、このことは該当するトークンが存
在しないことを表しており、このときシステムマネージ
ャ211はステップSP57に移って連携処理を実行す
ることなく終了する。
【0149】これに対してステップSP52において肯
定結果が得られると、このことは該当するトークンが存
在していることを表しており、このときシステムマネー
ジャ211は次のステップSP53に移る。
【0150】ステップSP53においてシステムマネー
ジャ211は、該当するトークンを共有黒板212から
読み出して取得し、当該取得したトークンが出力エージ
ェントO1 〜Oj の供給先であるアプリケーションによ
って処理可能か否かを確認し、次のステップSP54に
移る。
【0151】ステップSP54においてシステムマネー
ジャ211は、取得したトークンが出力エージェントO
1 〜Oj の供給先であるアプリケーションによって処理
することが困難であった場合、ステップSP57に移っ
て連携処理を実行することなく終了する。
【0152】これに対してステップSP54において取
得したトークンが出力エージェントO1 〜Oj の供給先
であるアプリケーションによって処理可能であった場
合、システムマネージャ211は次のステップSP55
に移る。
【0153】ステップSP55においてシステムマネー
ジャ211は、取得したトークンから不要なタイムスタ
ンプTSやタグ等の付加情報を非トークン化部222に
よって除去した後、供給先であるアプリケーションが処
理し得る形式に文字列データD2を変換し、次のステッ
プSP56に移る。
【0154】ステップSP56においてシステムマネー
ジャ211は、変換した文字列データD2(例えば電話
番号データ)だけをアプリケーションに供給して連携さ
せ、当該アプリケーションに従って所定の処理を実行さ
せた後、ステップSP57に移ってアプリケーション連
携処理手順を全て終了する。
【0155】実際上、コンピュータ装置1は、例えば図
18に示すようにアプリケーション画面に表示されたテ
キスト文書である「phone:03-5448-○△△×」の文字列
にカーソル399が重ねられると、文字列解析装置20
0によってカーソル399が重ねられた部分の文字列が
表す情報の種類を判別し、その解析結果を解析結果画面
400として表示する。
【0156】この解析結果画面400は、表示領域40
1に「電話番号 03-5448- ○△△×」を表示するように
なされており、これによりカーソル399が重ねられた
部分の文字列が表す情報の種類が「電話番号」であり、
その電話番号自体が「 03-5448- ○△△×」であるとユ
ーザに認識させる。
【0157】また解析結果画面400は、表示領域40
1の解析結果に対する認識程度のレベルを示した認識レ
ベルバー402を表示するようになされており、このレ
ベルが右側に振れるほど解析結果の確からしさが高いこ
とを示し、ユーザに対して一目で解析結果の確からしさ
を認識させ得るようになされている。
【0158】ユーザは、この解析結果画面400を確認
し、注目した文字列に対する所望の解析結果であると認
識すると、右クリック操作によって開いたメニューの中
からポップアップメニューの表示を指示する。
【0159】これによりコンピュータ装置1は、図19
に示すように電話番号に関連したアプリケーションを文
字列データD2の供給先としてユーザが選択するための
アプリ選択メニューM1を含んだポップアップメニュー
PM2を生成して表示する。このポップアップメニュー
PM2は、アプリ選択メニューM1の中に電話番号に関
連した複数のアプリケーションを用いて行う処理内容が
表示されており、ユーザはこの中から所望の処理を選択
する。
【0160】すなわちポップアップメニューPM2にお
けるアプリ選択メニューM1の中から「電話番号の中か
ら個人情報を検索」がユーザによって選択されると、コ
ンピュータ装置1はハードディスクドライブ60によっ
て[AAAA Org]のファイル名を持つ個人情報検索アプリケ
ーションを読み出して立ち上げ、出力エージェントO1
から供給された電話番号データを用いて電話番号の中か
ら個人情報を検索するようになされている。
【0161】又は、ポップアップメニューPM2におけ
るアプリ選択メニューM1の中から「電話をかける」が
ユーザによって選択されると、コンピュータ装置1はハ
ードディスクドライブ60によって[BBBB Phone]のファ
イル名を持つ自動発呼アプリケーションを読み出して立
ち上げ、出力エージェント1から供給された電話番号デ
ータを用いて電話をかける処理を実行するようになされ
ている。
【0162】あるいは、ポップアップメニューPM2に
おけるアプリ選択メニューM1の中から「電話番号から
地図を表示」がユーザによって選択されると、コンピュ
ータ装置1はハードディスクドライブ60によって[CCC
C Map]のファイル名を持つ地図アプリケーションを読み
出して立ち上げ、出力エージェントO1 から供給された
電話番号データに対応した地図上の位置を検索し、その
領域を表した地図を表示するようになされている。
【0163】(6)本実施の形態における動作及び効果 以上の構成において、文字列解析装置200は例えば入
力エージェントI1 によってアプリケーション画面のテ
キスト文書にカーソルが重ねられて静止した部分をユー
ザの注目する情報として取り込んだ後、これを解析エー
ジェントA1 〜Am で解析可能なフォーマットの文字列
D1に変換し、タイムスタンプ、2次元座標範囲、正当
確率等の付加情報を付加することにより未解析の新たな
トークン(T0 又はTA 、TB )として共有黒板212
に書き込む。
【0164】そして文字列解析装置200は、システム
マネージャ211の制御に基づいて複数の解析エージェ
ントA1 〜Am のいずれかによって共有黒板212に書
き込まれた未解析のトークン(T0 又はTA 、TB )を
解析し、その中間結果を共有黒板212に書き込むこと
で他の解析解析エージェントA1 〜Am と共に中間結果
を共有する。
【0165】他の解析エージェントA1 〜Am は、共有
黒板212で共有している中間結果を解析エージェント
1 〜Am によって順次解析して中間結果を統合するこ
とにより、文字列D1が表す情報の種類を判定し得ると
共に、誤り訂正及び文字補完によって文字列D1が表す
正確な情報として文字列データD2を生成し得、これら
を解析結果のトークン(T1 、T2 又はTC 、TD )と
して共有黒板212に再び書き込む。
【0166】ここで共有黒板212に書き込まれた解析
結果のトークン(T1 、T2 又はTC 、TD )には、カ
ーソルの重ねられた位置に応じて決まるユーザ関心度と
文字列D1の正当確率とに基づく判定値が付加されてい
る。従って文字列解析装置200のシステムマネージャ
211は、ユーザ関心度及び文字列D1の正当確率が高
いトークンを共有黒板212の中から選択し、これを解
析結果画面400(図18)としてアプリケーション画
面に表示すると共に、選択したトークンから情報の種類
と文字列データD2を取り出した後、判別した情報の種
類に関連したアプリケーションに出力エージェントO1
〜Oj を介して文字列データD2を供給して連携させる
ことができる。
【0167】このように文字列解析装置200では、カ
ーソルの重ねられた位置に応じてユーザ関心度が変位
し、ユーザ関心度の高いトークンを解析結果として出力
するようにしたことにより、解析結果がユーザの注目点
とは異なっていた場合に、ユーザは解析を希望する部分
の文字列にカーソルが重なるように当該カーソルを移動
する操作を無意識に行うだけで、ユーザが注目している
文字列の解析結果を容易に得ることができる。
【0168】またコンピュータ装置1では、カーソルで
指定された文字列D1が表す情報の種類を文字列解析装
置200によって判定し、当該情報の種類に関連したア
プリケーションに対して文字列データD2を供給して連
携させることを自動的に行うことにより、ユーザに対し
てカーソルで指定した文字列の情報を一旦クリップボー
ドに保存した後、所定のアプリケーションを起動させて
該当する箇所に文字列の情報を貼り付けるカットアンド
ペースト操作を行う必要がなく、短時間で容易にアプリ
ケーションへの連携を実行することができる。
【0169】さらに文字列解析装置200は、ユーザが
注目している文字列が複数行に亘つてアプリケーション
画面上に表示されていた場合でも、複数の解析エージェ
ントA1 〜Am 毎にそれぞれ異なる分法の解析フォーマ
ットを用いて2次元的に構文解析を行うようにしたこと
により、複数行に亘つて記述された文字列であっても各
行毎の文字を結合した状態で構文解析を実行し、最も相
応しく続く文字列に対して情報の種類を判別すると共に
文字列データD2を生成することができるので、段組み
された構文に対しても一段と正確かつ柔軟な解析を有効
に行うことができる。
【0170】また文字列解析装置200は、入力エージ
ェントI1 〜In 、解析エージェントA1 〜Am 、出力
エージェントO1 〜Oj を追加的に拡張し得ることによ
り、将来的な未知の入力エージェント、未知のアプリケ
ーションへの文字列データD2の情報供給、未知の文法
の解析フォーマットに対しても十分に対応することがで
きる。
【0171】以上の構成によれば、文字列解析装置20
0は入力エージェントI1 〜In による入力情報を文字
列D1に変換し、これを新たなトークンとして共有黒板
212に書き込み、解析エージェントA1 〜Am によっ
て解析した中間結果を共有黒板212を介して共有し、
当該中間結果を順次解析して統合することにより、文字
列D1が表す情報の種類をより正確に判別し得ると共
に、誤り訂正及び文字補完によって文字列D1が表す正
確な情報としての文字列データD2を生成することがで
きる。
【0172】(7)他の実施の形態 なお上述の実施の形態においては、入力手段としての入
力エージェントI1 〜In によって表示手段としての液
晶ディスプレイ21に表示されているカーソルが重ねら
れた部分の前後数文字分の文字列を自然言語の文字列D
1に変換した後、トークン化して記憶手段としての共有
黒板212に書き込むようにした場合について述べた
が、本発明はこれに限らず、文字画像抽出手段としての
OCR(Optical Character Reader)装置を用いてCCD
カメラ23によって撮像された画像中の文字画像を読み
出して文字列D1に変換したり、また所定の音声認識手
段によってマイク等から入力した音声を音声認識した後
に文字列D1に変換したり、さらにユーザの視線を追尾
する視線追尾装置によって検出されたユーザの注目する
所定画面上の情報を文字列D1に変換したり、さらに所
定のアプリケーションによって生成された入力情報を文
字列D1に変換するようにしても良く、要はユーザが注
目している情報を所定フォーマットの文字列D1に変換
し得れば他の種々の入力手段を用いるようにしても良
い。この場合にも、上述の実施の形態と同様の効果を得
ることができる。
【0173】ここでOCR装置は、CCDカメラ23に
よって撮像された画像中の文字画像を文字認識エンジン
を用いて認識することにより読み出した後、文字列D1
に変換するようになされている。
【0174】また視線追尾装置としては、ヘッドマウン
トディスプレイの表示部に表示されたアプリケーション
画面を注視しているユーザの視線を追尾して検出し、当
該視線の停止した注視点位置の文字列を抽出するように
なされている。
【0175】実際上、図20に示すようにヘッドマウン
トディスプレイでは、視線検知部130L及び130R
を内部に有し、赤外線光を投光する発光ダイオード(L
ED)等の光源161から出射した光束が投光レンズ1
62及びハーフミラー163を介して透過した後に眼球
300の角膜301で反射すると、当該反射した角膜反
射象がハーフミラー163及び受光レンズ164を介し
てCCD(Charge Coupled Device) 等でなる光電変換素
子165に結像され、当該光電変換素子165の結像位
置Zddを注視点位置処理部131L及び131Rに送
出する。
【0176】続いて視線検知部130L及び130R
は、角膜301で反射した赤外線光の一部により生成さ
れる虹彩303の両端部の反射象a及びbが結像位置Z
aa及びZbbに結象され、当該結像位置Zaa及びZ
bbを注視点位置処理部131L及び131Rに送出す
る。これにより注視点位置処理部131L及び131R
は、角膜反射象の結像位置Zdd、反射象a及びbの結
像位置Zaa及びZbbの位置関係に基づいて眼球30
0の眼球光軸Bの回転角θb(視線方向)を求めること
ができ、かくしてユーザの視線が停止した注視点位置を
検出し得るようになされている。
【0177】また上述の実施の形態においては、文字列
解析装置200をコンピュータ装置1のOSの一部とし
て用いるようにした場合について述べたが、本発明はこ
れに限らず、フロッピーディスク、CD−ROM(Compa
ct Disc-Read Only Memory)、DVD(Digital Video Di
sc)等のパッケージメディア、プログラムが一時的もし
くは永続的に格納される半導体メモリや磁気ディスク、
さらにローカルエリアネットワークやインターネット、
ディジタル衛星放送等の有線又は無線通信媒体及びこれ
らの通信媒体を介して提供されるプログラムを転送もし
くは受信するルータやモデム等の各種通信インターフェ
ース等の提供媒体によって提供されるアプリケーション
として用いるようにしても良い。
【0178】さらに上述の実施の形態においては、解析
処理手段としての解析エージェントA1 〜Am から指定
される文法に従って解析処理手段としての構文解析部2
23によって文字列D1が表す情報の種類を電話番号で
あると判別し、出力手段としての出力エージェントO1
〜Oj によって情報の種類に関連したアプリケーション
に対して処理可能な形式に文字列データD2を変換した
後に供給して連携させるようにした場合について述べた
が、本発明はこれに限らず、種々のデータベースを用い
て郵便番号、緯度経度、当該緯度経度を表すマップコー
ド、電子メールアドレス、URL(Uniform Resource Lo
cator)、日時、金額の単位、又はkm、kg、cm、y
ard……等の汎用的な単位を文字列の種類として解析
し、郵便番号が定義されている地図上の位置を検索して
示す郵便番号位置検索アプリケーション、住所に対応す
る地図上の位置を検索して示す住所位置検索アプリケー
ション、緯度経度に対応する地図上の位置を検索して示
す緯度経度検索アプリケーション、マップコードに対応
する地図上の位置を検索して示すマップコード検索アプ
リケーション、電子メールアドレスに対して電子メール
を送信する電子メール送信アプリケーション、URLに
基づいてホームページを開くHTML(HyperText Marku
p Language)ブラウザ、日時に対応したカレンダや予定
表を開くスケジューラアプリケーション、所定の金額を
他の貨幣の単位に応じた金額に自動換算する貨幣換算ア
プリケーション、又は単位に応じた数値を用いて種々の
計算を行う電子計算機アプリケーション、郵便番号、住
所、緯度経度、マップコード、電子メールアドレス又は
URLを基に個人情報を検索する個人情報検索アプリケ
ーションに文字列データD2を供給して連携させるよう
にしても良い。
【0179】さらに上述の実施の形態においては、アプ
リケーション画面に表示されたテキスト文書上でカーソ
ルが重ねられた部分の文字列を入力エージェントI1
よって取り込むようにした場合について述べたが、本発
明はこれに限らず、アプリケーション画面に表示された
HTML(Hyper Text Markup Language)文書、XML(e
Xtensible Markup Language)文書上でカーソルが重ねら
れた部分の文字列を取り込むようにしても良い。
【0180】
【発明の効果】上述のように本発明によれば、外部から
の入力情報を所定フォーマットの文字列に変換する入力
手段と、当該入力手段によって変換された文字列を記憶
する記憶手段と、当該記憶手段に記憶された文字列を協
調的に解析し、当該解析した中間結果を記憶手段に書き
込むことで共有し、中間結果を統合することにより文字
列が表す情報の種類を判別する複数の解析手段とを設け
ることにより、明確な手続きが存在しない場合でも、で
きるところから解析して徐々に得られる中間結果を共有
しながら統合していくことで漸次的に文字列が表す情報
の種類を判別することができ、かくして文字列が表す情
報の種類を柔軟かつ正確に判別し得る文字列解析装置を
実現できる。
【0181】また本発明によれば、外部からの入力情報
を所定フォーマットの文字列に変換する入力ステップ
と、当該入力ステップによって変換された文字列を記憶
手段に記憶する記憶ステップと、記憶手段に記憶された
文字列を協調的に解析し、当該解析した中間結果を記憶
手段に書き込むことで共有し、中間結果を統合すること
により文字列が表す情報の種類を判別する解析ステップ
とを設けることにより、明確な手続きが存在しない場合
でも、できるところから解析して徐々に得られる中間結
果を共有しながら統合していくことで漸次的に文字列が
表す情報の種類を判別することができ、かくして文字列
が表す情報の種類を柔軟かつ正確に判別し得る文字列解
析方法を実現できる。
【0182】さらに本発明によれば、外部からの入力情
報を所定フォーマットの文字列に変換する入力ステップ
と、当該入力ステップによって変換された文字列を記憶
手段に記憶する記憶ステップと、記憶手段に記憶された
文字列を協調的に解析し、当該解析した中間結果を記憶
手段に書き込むことで共有し、中間結果を統合すること
により文字列が表す情報の種類を判別する解析ステップ
とからなるプログラムを情報処理装置に実行させること
により、明確な手続きが存在しない場合でも、できると
ころから解析して徐々に得られる中間結果を共有しなが
ら統合していくことで漸次的に文字列が表す情報の種類
を判別することができ、かくして文字列が表す情報の種
類を柔軟かつ正確に判別し得るプログラムを提供し得る
提供媒体を実現できる。
【図面の簡単な説明】
【図1】本発明によるコンピュータ装置の構成を示すブ
ロツク図である。
【図2】本体の正面構成を示す略線図である。
【図3】本体に対して表示部を閉鎖した状態を示す略線
図である。
【図4】本体に対して表示部を180度開いた状態を示
す略線図である。
【図5】本体の下面構成を示す略線図である。
【図6】コンピュータ装置の回路構成を示すブロック図
である。
【図7】コンピュータ装置における文字列解析処理の流
れを示す略線的ブロック図である。
【図8】文字列解析装置のソフトウェア的な構成を示す
機能ブロック図である。
【図9】共通黒板管理部のソフトウェア的な構成を示す
機能ブロック図である。
【図10】トークンのデータ内容を示す略線図である。
【図11】構文解析部の構成を示すソフトウェア的な構
成を示す機能ブロック図である。
【図12】文字列解析装置による構文解析処理手順を示
すフローチャートである。
【図13】入力エージェントによるトークンの書込処理
手順を示すフローチャートである。
【図14】解析エージェントによる解析処理手順を示す
フローチャートである。
【図15】構文解析器による構文解析及びトークンの生
成処理手順を示すフローチャートである。
【図16】2行に段組みされた文字列の構文解析処理の
説明に供する略線図である。
【図17】出力エージェントによるアプリケーション連
携処理手順を示すフローチャートである。
【図18】カーソルで指定された文字列の解析結果画面
を示す略線図である。
【図19】カーソルで指定された文字列の種類に対応し
たアプリ選択メニューを含むポップアップメニュー表示
を示す略線図である。
【図20】他の実施の形態における視線追尾装置の構成
を示す略線図である。
【符号の説明】
1……コンピュータ装置、2……本体、3……表示部、
21……液晶ディスプレイ、52……CPU、54……
RAM、60……ハードディスク、200……文字列解
析装置、211……システムマネージャ、212……共
有黒板、213……共有黒板管理部、232……構文解
析器、233……確率分布生成器。

Claims (69)

    【特許請求の範囲】
  1. 【請求項1】外部からの入力情報を所定フォーマットの
    文字列に変換する入力手段と、 上記入力手段によって変換された上記文字列を記憶する
    記憶手段と、 上記記憶手段に記憶された上記文字列を協調的に解析
    し、当該解析した中間結果を上記記憶手段に書き込むこ
    とで共有し、上記中間結果を統合することにより上記文
    字列が表す情報の種類を判別する複数の解析処理手段と
    を具えることを特徴とする文字列解析装置。
  2. 【請求項2】上記入力手段は、上記入力情報を上記解析
    処理手段で解析可能な自然言語の上記文字列に変換する
    ことを特徴とする請求項1に記載の文字列解析装置。
  3. 【請求項3】上記入力手段は、所定の画面上に表示され
    たテキスト文書、HTML(Hyper Text Markup Languag
    e)文書、XML(eXtensible Markup Language)文書上の
    カーソルが重ねられた部分の前後数文字分を上記入力情
    報として上記文字列に変換することを特徴とする請求項
    2に記載の文字列解析装置。
  4. 【請求項4】上記入力手段は、所定の音声認識手段を有
    し、当該音声認識手段によって認識した音声を上記入力
    情報として上記文字列に変換することを特徴とする請求
    項2に記載の文字列解析装置。
  5. 【請求項5】上記入力手段は、画像中の文字画像を抽出
    する所定の文字画像抽出手段を有し、当該文字画像抽出
    手段によって抽出した上記文字画像を上記入力情報とし
    て上記文字列に変換することを特徴とする請求項2に記
    載の文字列解析装置。
  6. 【請求項6】上記入力手段は、所定の視線追尾手段を有
    し、当該視線追尾手段によってユーザが注目している所
    定画面上の上記入力情報を上記文字列に変換することを
    特徴とする請求項2に記載の文字列解析装置。
  7. 【請求項7】上記入力手段は、所定のアプリケーション
    ソフトウェアによって生成された上記入力情報を上記文
    字列に変換することを特徴とする請求項2に記載の文字
    列解析装置。
  8. 【請求項8】上記解析処理手段は、所定の知識データべ
    ースに基づいて上記文字列の誤りの訂正及び欠落してい
    る文字の補完を行うことを特徴とする請求項1に記載の
    文字列解析装置。
  9. 【請求項9】上記解析処理手段は、上記文字列が表す情
    報の種類を判別すると共に、上記カーソルが重ねられた
    部分の上記入力情報の2次元座標と、上記画面上に表示
    された上記文字列の表示領域の重心座標との差分絶対値
    に基づいてユーザの関心度を表すことを特徴とする請求
    項3に記載の文字列解析装置。
  10. 【請求項10】上記解析処理手段は、上記文字列が表す
    情報の種類毎にそれぞれ定義された文法に基づいて上記
    文字列が表す情報の種類を判別することを特徴とする請
    求項1に記載の文字列解析装置。
  11. 【請求項11】上記解析処理手段は、上記文字列が表す
    情報の種類毎にそれぞれ定義された文法に基づいて複数
    行に亘る文字列を2次元的に解析することにより、上記
    文字列が表す情報の種類を判別することを特徴とする請
    求項10に記載の文字列解析装置。
  12. 【請求項12】上記解析処理手段は、上記文法として所
    定の電話番号データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を電話番号であると判別する
    ことを特徴とする請求項10に記載の文字列解析装置。
  13. 【請求項13】上記解析処理手段は、上記文法として所
    定の郵便番号データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を郵便番号であると判別する
    ことを特徴とする請求項10に記載の文字列解析装置。
  14. 【請求項14】上記解析処理手段は、上記文法として所
    定の住所データベースのフォーマットに基づいて上記文
    字列が表す情報の種類を住所であると判別することを特
    徴とする請求項10に記載の文字列解析装置。
  15. 【請求項15】上記解析処理手段は、上記文法として所
    定の電子メールアドレスデータベースのフォーマットに
    基づいて上記文字列が表す情報の種類を電子メールアド
    レスであると判別することを特徴とする請求項10に記
    載の文字列解析装置。
  16. 【請求項16】上記解析処理手段は、上記文法として所
    定のURL(Uniform Resource Locator)データベースの
    フォーマットに基づいて上記文字列が表す情報の種類を
    ホームページのURLであると判別することを特徴とす
    る請求項10に記載の文字列解析装置。
  17. 【請求項17】上記解析処理手段は、上記文法として所
    定の日時データベースのフォーマットに基づいて上記文
    字列が表す情報の種類を日時であると判別することを特
    徴とする請求項10に記載の文字列解析装置。
  18. 【請求項18】上記解析処理手段は、上記文法として所
    定の金額単位データベース又は数値単位データベースの
    フォーマットに基づいて上記文字列が表す情報の種類を
    金額の単位又は数値を表す単位であると判別することを
    特徴とする請求項10に記載の文字列解析装置。
  19. 【請求項19】上記解析処理手段は、上記文法として所
    定の緯度経度データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を緯度経度であると判別する
    ことを特徴とする請求項10に記載の文字列解析装置。
  20. 【請求項20】上記解析処理手段は、上記文法として所
    定の緯度経度を表すマップコードデータベースのフォー
    マットに基づいて上記文字列が表す情報の種類をマップ
    コードであると判別することを特徴とする請求項10に
    記載の文字列解析装置。
  21. 【請求項21】上記文字列解析装置は、 上記解析処理手段によって解析された上記文字列が表す
    情報の種類を表示する表示手段とを具えることを特徴と
    する請求項1に記載の文字列解析装置。
  22. 【請求項22】上記文字列解析装置は、 上記文字列が表す情報の種類に関連した所定のアプリケ
    ーションソフトウェアで処理可能な形式に上記文字列を
    変換して出力する出力手段とを具えることを特徴とする
    請求項1に記載の文字列解析装置。
  23. 【請求項23】上記出力手段は、上記変換した文字列を
    上記アプリケーションソフトウェアに供給して連携させ
    ることを特徴とする請求項22に記載の文字列解析装
    置。
  24. 【請求項24】外部からの入力情報を所定フォーマット
    の文字列に変換する入力ステップと上記入力ステップで
    変換された上記文字列を記憶手段に記憶する記憶ステッ
    プと、 上記記憶手段に記憶された上記文字列を協調的に解析
    し、当該解析した中間結果を上記記憶手段に書き込むこ
    とで共有し、上記中間結果を統合することにより上記文
    字列が表す情報の種類を判別する解析処理ステップとを
    具えることを特徴とする文字列解析方法。
  25. 【請求項25】上記入力ステップは、上記入力情報を上
    記解析処理ステップで解析可能な自然言語の上記文字列
    に変換することを特徴とする請求項24に記載の文字列
    解析方法。
  26. 【請求項26】上記入力ステップは、所定の画面上に表
    示されたテキスト文書、HTML(Hyper Text Markup L
    anguage)文書、XML(eXtensible Markup Language)文
    書上のカーソルが重ねられた部分の前後数文字分を上記
    入力情報として上記文字列に変換することを特徴とする
    請求項25に記載の文字列解析方法。
  27. 【請求項27】上記入力ステップは、所定の音声認識手
    段によって認識した音声を上記入力情報として上記文字
    列に変換することを特徴とする請求項25に記載の文字
    列解析方法。
  28. 【請求項28】上記入力ステップは、画像中の文字画像
    を抽出する所定の文字画像抽出手段によって抽出した上
    記文字画像を上記入力情報として上記文字列に変換する
    ことを特徴とする請求項25に記載の文字列解析方法。
  29. 【請求項29】上記入力ステップは、所定の視線追尾手
    段によってユーザが注目している所定画面上の上記入力
    情報を上記文字列に変換することを特徴とする請求項2
    5に記載の文字列解析方法。
  30. 【請求項30】上記入力ステップは、所定のアプリケー
    ションソフトウェアで生成された上記入力情報を上記文
    字列に変換することを特徴とする請求項25に記載の文
    字列解析方法。
  31. 【請求項31】上記解析処理ステップは、所定の知識デ
    ータべースに基づいて上記文字列の誤りの訂正及び欠落
    している文字の補完を行うことを特徴とする請求項24
    に記載の文字列解析方法。
  32. 【請求項32】上記解析処理ステップは、上記文字列が
    表す情報の種類を判別すると共に、上記カーソルが重ね
    られた部分の上記入力情報の2次元座標と、上記画面上
    に表示された上記文字列の表示領域の重心座標との差分
    絶対値に基づいてユーザの関心度を表すことを特徴とす
    る請求項26に記載の文字列解析方法。
  33. 【請求項33】上記解析処理ステップは、上記文字列が
    表す情報の種類毎にそれぞれ定義された文法に基づいて
    上記文字列が表す情報の種類を判別することを特徴とす
    る請求項24に記載の文字列解析方法。
  34. 【請求項34】上記解析処理ステップは、上記文字列が
    表す情報の種類毎にそれぞれ定義された文法に基づいて
    複数行に亘る文字列を2次元的に解析することにより、
    上記文字列が表す情報の種類を判別することを特徴とす
    る請求項33に記載の文字列解析方法。
  35. 【請求項35】上記解析処理ステップは、上記文法とし
    て所定の電話番号データベースのフォーマットに基づい
    て上記文字列が表す情報の種類を電話番号であると判別
    することを特徴とする請求項33に記載の文字列解析方
    法。
  36. 【請求項36】上記解析処理ステップは、上記文法とし
    て所定の郵便番号データベースのフォーマットに基づい
    て上記文字列が表す情報の種類を郵便番号であると判別
    することを特徴とする請求項33に記載の文字列解析方
    法。
  37. 【請求項37】上記解析処理ステップは、上記文法とし
    て所定の住所データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を住所であると判別すること
    を特徴とする請求項33に記載の文字列解析方法。
  38. 【請求項38】上記解析処理ステップは、上記文法とし
    て所定の電子メールアドレスデータベースのフォーマッ
    トに基づいて上記文字列が表す情報の種類を電子メール
    アドレスであると判別することを特徴とする請求項33
    に記載の文字列解析方法。
  39. 【請求項39】上記解析処理ステップは、上記文法とし
    て所定のURL(Uniform Resource Locator)データベー
    スのフォーマットに基づいて上記文字列が表す情報の種
    類をホームページのURLであると判別することを特徴
    とする請求項33に記載の文字列解析方法。
  40. 【請求項40】上記解析処理ステップは、上記文法とし
    て所定の日時データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を日時であると判別すること
    を特徴とする請求項33に記載の文字列解析方法。
  41. 【請求項41】上記解析処理ステップは、上記文法とし
    て所定の金額単位データベース又は数値単位データベー
    スのフォーマットに基づいて上記文字列が表す情報の種
    類を金額の単位又は数値を表す単位であると判別するこ
    とを特徴とする請求項33に記載の文字列解析方法。
  42. 【請求項42】上記解析処理ステップは、上記文法とし
    て所定の緯度経度データベースのフォーマットに基づい
    て上記文字列が表す情報の種類を緯度経度であると判別
    することを特徴とする請求項33に記載の文字列解析方
    法。
  43. 【請求項43】上記解析処理手段は、上記文法として所
    定の緯度経度を表すマップコードデータベースのフォー
    マットに基づいて上記文字列が表す情報の種類をマップ
    コードであると判別することを特徴とする請求項33に
    記載の文字列解析方法。
  44. 【請求項44】上記文字列解析方法は、 上記解析処理ステップによって解析された上記文字列が
    表す情報の種類を表示する表示ステップとを具えること
    を特徴とする請求項24に記載の文字列解析方法。
  45. 【請求項45】上記文字列解析方法は、 上記文字列が表す情報の種類に関連した所定のアプリケ
    ーションソフトウェアで処理可能な形式に上記文字列を
    変換して出力する出力ステップとを具えることを特徴と
    する請求項24に記載の文字列解析方法。
  46. 【請求項46】上記出力ステップは、上記変換した文字
    列を上記アプリケーションソフトウェアに供給して連携
    させることを特徴とする請求項45に記載の文字列解析
    方法。
  47. 【請求項47】外部からの入力情報を所定フォーマット
    の文字列に変換する入力ステップと上記入力ステップで
    変換された上記文字列を記憶手段に記憶する記憶ステッ
    プと、 上記記憶手段に記憶された上記文字列を協調的に解析
    し、当該解析した中間結果を上記記憶手段に書き込むこ
    とで共有し、上記中間結果を統合することにより上記文
    字列が表す情報の種類を判別する解析処理ステップとか
    らなることを特徴とするプログラムを情報処理装置に実
    行させる提供媒体。
  48. 【請求項48】上記入力ステップは、上記入力情報を上
    記解析処理ステップで解析可能な自然言語の上記文字列
    に変換するを具えることを特徴とする請求項47に記載
    の提供媒体。
  49. 【請求項49】上記入力ステップは、所定の画面上に表
    示されたテキスト文書、HTML(Hyper Text Markup L
    anguage)文書、XML(eXtensible Markup Language)文
    書上のカーソルが重ねられた部分の前後数文字分を上記
    入力情報として上記文字列に変換することを特徴とする
    請求項48に記載の提供媒体。
  50. 【請求項50】上記入力ステップは、所定の音声認識手
    段によって認識した音声を上記入力情報として上記文字
    列に変換することを特徴とする請求項48に記載の提供
    媒体。
  51. 【請求項51】上記入力ステップは、画像中の文字画像
    を抽出する所定の文字画像抽出手段によって抽出した上
    記文字画像を上記入力情報として上記文字列に変換する
    ことを特徴とする請求項48に記載の提供媒体。
  52. 【請求項52】上記入力ステップは、所定の視線追尾手
    段によってユーザが注目している所定画面上の上記入力
    情報を上記文字列に変換することを特徴とする請求項4
    8に記載の提供媒体。
  53. 【請求項53】上記入力ステップは、所定のアプリケー
    ションソフトウェアで生成された上記入力情報を上記文
    字列に変換することを特徴とする請求項48に記載の提
    供媒体。
  54. 【請求項54】上記解析処理ステップは、所定の知識デ
    ータべースに基づいて上記文字列の誤りの訂正及び欠落
    している文字の補完を行うことを特徴とする請求項47
    に記載の提供媒体。
  55. 【請求項55】上記解析処理ステップは、上記文字列が
    表す情報の種類を判別すると共に、上記カーソルが重ね
    られた部分の上記入力情報の2次元座標と、上記画面上
    に表示された上記文字列の表示領域の重心座標との差分
    絶対値に基づいてユーザの関心度を表すことを特徴とす
    る請求項49に記載の提供媒体。
  56. 【請求項56】上記解析処理ステップは、上記文字列が
    表す情報の種類毎にそれぞれ定義された文法に基づいて
    上記文字列が表す情報の種類を判別することを特徴とす
    る請求項47に記載の提供媒体。
  57. 【請求項57】上記解析処理ステップは、上記文字列が
    表す情報の種類毎にそれぞれ定義された文法に基づいて
    複数行に亘る文字列を2次元的に解析することにより、
    上記文字列が表す情報の種類を判別することを特徴とす
    る請求項56に記載の提供媒体。
  58. 【請求項58】上記解析処理ステップは、上記文法とし
    て所定の電話番号データベースのフォーマットに基づい
    て上記文字列が表す情報の種類を電話番号であると判別
    することを特徴とする請求項56に記載の提供媒体。
  59. 【請求項59】上記解析処理ステップは、上記文法とし
    て所定の郵便番号データベースのフォーマットに基づい
    て上記文字列が表す情報の種類を郵便番号であると判別
    することを特徴とする請求項56に記載の提供媒体。
  60. 【請求項60】上記解析処理ステップは、上記文法とし
    て所定の住所データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を住所であると判別すること
    を特徴とする請求項56に記載の提供媒体。
  61. 【請求項61】上記解析処理ステップは、上記文法とし
    て所定の電子メールアドレスデータベースのフォーマッ
    トに基づいて上記文字列が表す情報の種類を電子メール
    アドレスであると判別することを特徴とする請求項56
    に記載の提供媒体。
  62. 【請求項62】上記解析処理ステップは、上記文法とし
    て所定のURL(Uniform Resource Locator)データベー
    スのフォーマットに基づいて上記文字列が表す情報の種
    類をホームページのURLであると判別することを特徴
    とする請求項56に記載の提供媒体。
  63. 【請求項63】上記解析処理ステップは、上記文法とし
    て所定の日時データベースのフォーマットに基づいて上
    記文字列が表す情報の種類を日時であると判別すること
    を特徴とする請求項56に記載の提供媒体。
  64. 【請求項64】上記解析処理ステップは、上記文法とし
    て所定の金額単位データベース又は数値単位データベー
    スのフォーマットに基づいて上記文字列が表す情報の種
    類を金額の単位又は数値を表す単位であると判別するこ
    とを特徴とする請求項56に記載の提供媒体。
  65. 【請求項65】上記解析処理ステップは、上記文法とし
    て所定の緯度経度データベースのフォーマットに基づい
    て上記文字列が表す情報の種類を緯度経度であると判別
    することを特徴とする請求項56に記載の提供媒体。
  66. 【請求項66】上記解析処理ステップは、上記文法とし
    て所定の緯度経度を表すマップコードデータベースのフ
    ォーマットに基づいて上記文字列が表す情報の種類をマ
    ップコードであると判別することを特徴とする請求項5
    6に記載の提供媒体。
  67. 【請求項67】上記提供媒体は、上記解析処理ステップ
    によって解析された上記文字列が表す情報の種類を表示
    する表示ステップとを具えることを特徴とする請求項4
    7に記載の提供媒体。
  68. 【請求項68】上記提供媒体は、 上記文字列が表す情報の種類に関連した所定のアプリケ
    ーションソフトウェアで処理可能な形式に上記文字列を
    変換して出力する出力ステップとを具えることを特徴と
    する請求項47に記載の提供媒体。
  69. 【請求項69】上記出力ステップは、上記変換した文字
    列を上記アプリケーションソフトウェアに供給して連携
    させることを特徴とする請求項68に記載の提供媒体。
JP11152809A 1999-05-31 1999-05-31 文字列解析装置、文字列解析方法及び提供媒体 Pending JP2000339309A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11152809A JP2000339309A (ja) 1999-05-31 1999-05-31 文字列解析装置、文字列解析方法及び提供媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11152809A JP2000339309A (ja) 1999-05-31 1999-05-31 文字列解析装置、文字列解析方法及び提供媒体

Publications (1)

Publication Number Publication Date
JP2000339309A true JP2000339309A (ja) 2000-12-08

Family

ID=15548635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11152809A Pending JP2000339309A (ja) 1999-05-31 1999-05-31 文字列解析装置、文字列解析方法及び提供媒体

Country Status (1)

Country Link
JP (1) JP2000339309A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993718B2 (en) * 2001-08-24 2006-01-31 Sony Corporation Information processing method and apparatus
WO2008144350A1 (en) * 2007-05-17 2008-11-27 Microsoft Corporation Speech recognition macro runtime
US7743060B2 (en) 2004-01-26 2010-06-22 International Business Machines Corporation Architecture for an indexer
US8271498B2 (en) 2004-09-24 2012-09-18 International Business Machines Corporation Searching documents for ranges of numeric values
US8285724B2 (en) 2004-01-26 2012-10-09 International Business Machines Corporation System and program for handling anchor text
US8296304B2 (en) 2004-01-26 2012-10-23 International Business Machines Corporation Method, system, and program for handling redirects in a search engine
US8417693B2 (en) 2005-07-14 2013-04-09 International Business Machines Corporation Enforcing native access control to indexed documents

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993718B2 (en) * 2001-08-24 2006-01-31 Sony Corporation Information processing method and apparatus
US7743060B2 (en) 2004-01-26 2010-06-22 International Business Machines Corporation Architecture for an indexer
US8285724B2 (en) 2004-01-26 2012-10-09 International Business Machines Corporation System and program for handling anchor text
US8296304B2 (en) 2004-01-26 2012-10-23 International Business Machines Corporation Method, system, and program for handling redirects in a search engine
US8271498B2 (en) 2004-09-24 2012-09-18 International Business Machines Corporation Searching documents for ranges of numeric values
US8346759B2 (en) 2004-09-24 2013-01-01 International Business Machines Corporation Searching documents for ranges of numeric values
US8655888B2 (en) 2004-09-24 2014-02-18 International Business Machines Corporation Searching documents for ranges of numeric values
US8417693B2 (en) 2005-07-14 2013-04-09 International Business Machines Corporation Enforcing native access control to indexed documents
WO2008144350A1 (en) * 2007-05-17 2008-11-27 Microsoft Corporation Speech recognition macro runtime
US8620652B2 (en) 2007-05-17 2013-12-31 Microsoft Corporation Speech recognition macro runtime

Similar Documents

Publication Publication Date Title
CN109522538B (zh) 表格内容的自动分列方法、装置、设备及存储介质
US6157935A (en) Remote data access and management system
CN1790326B (zh) 同步自然语言输入元素和图形用户界面的系统和方法
EP2249264B1 (en) Image processing apparatus, image processing method and storage medium
US7694214B2 (en) Multimodal note taking, annotation, and gaming
US20020138476A1 (en) Document managing apparatus
US20200258146A1 (en) Electronic purchase order generation method and device, terminal and storage medium
US6993718B2 (en) Information processing method and apparatus
CN101241537A (zh) Nfc应用的话音接口
CN105074672A (zh) 用于异步程序的调用栈
CN102033710A (zh) 用于管理文件夹的方法和相关设备
CN101467003A (zh) 用于收集关于地理数据的用户更新请求以支持自动化分析、处理和地理数据更新的方法和系统
CN101576878A (zh) 用户勾圈网页即时翻译系统及方法
CN114020197B (zh) 跨应用的消息的处理方法、电子设备及可读存储介质
WO2012028817A1 (fr) Procède de recueil de données a caractères événementiel de formulaires électroniques
CN112182196A (zh) 应用于多轮对话的服务设备及多轮对话方法
JP2000339309A (ja) 文字列解析装置、文字列解析方法及び提供媒体
WO2024179519A1 (zh) 语义识别方法及其装置
CN111722893A (zh) 一种电子设备图形用户界面交互方法、装置和终端设备
US7428569B1 (en) Information processing apparatus, information processing method, and provision medium
US20020133272A1 (en) Information registration method and system
JP2000076285A (ja) 情報処理装置および方法、並びに提供媒体
US7197494B2 (en) Method and architecture for consolidated database search for input recognition systems
JP2000330681A (ja) 情報処理装置、情報処理方法及び提供媒体
JP4314502B2 (ja) 情報処理装置及び情報処理方法