JP2004021791A - 自然言語による既存データの記述方法及びそのためのプログラム - Google Patents

自然言語による既存データの記述方法及びそのためのプログラム Download PDF

Info

Publication number
JP2004021791A
JP2004021791A JP2002178303A JP2002178303A JP2004021791A JP 2004021791 A JP2004021791 A JP 2004021791A JP 2002178303 A JP2002178303 A JP 2002178303A JP 2002178303 A JP2002178303 A JP 2002178303A JP 2004021791 A JP2004021791 A JP 2004021791A
Authority
JP
Japan
Prior art keywords
data
natural language
expression
user
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002178303A
Other languages
English (en)
Inventor
Shuichi Araki
荒木 修一
Michio Ogura
小倉 道雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2002178303A priority Critical patent/JP2004021791A/ja
Priority to AU2003211815A priority patent/AU2003211815A1/en
Priority to US10/517,810 priority patent/US20050228635A1/en
Priority to PCT/JP2003/002278 priority patent/WO2004001570A1/ja
Publication of JP2004021791A publication Critical patent/JP2004021791A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

【課題】あるソフトウェアで作成した既存のデータを他のソフトウェアで利用したり、他の目的で利用したりすることを容易化する。
【解決手段】特定のソフトウェア・オブジェクトで作成された既存のデータを解析し、前記ソフトウェア・オブジェクトが該データを作成するために実行した命令記述列に変換し、前記命令記述列をユーザに理解可能な自然言語による機能記述表現に変換し、前記機能記述表現から意味的な情報を獲得し、前記機能記述表現に意味を付加した要求記述表現を生成する。要求記述表現は自然言語で記述されており、元のデータを再現するために必要な情報が全て含まれている。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータ上で動作するソフトウェア・オブジェクトにより作成された既存データを自然言語で記述する技術に関し、特に、自然言語で操作可能なソフトウェア・オブジェクトに入力すべき自然言語文字列を既存データから生成する技術に関する。本明細書においてソフトウェア・オブジェクトとは、パーソナル・コンピュータやマイコン制御機器等の電子機器を制御するためのオペレーティング・システム(OS)や、OS上で動作するアプリケーション・プログラムのことをいう。また、入力機器(キーボード、マイク、手書きタブレット等)から受け取った信号を処理して自然言語の文字列を生成し、その文字列を解析し、解析結果に基づいてソフトウェア・オブジェクトの操作命令を生成するシステムのことを、本明細書では自然言語インターフェースと呼ぶ。
【0002】
【従来の技術】
ソフトウェア・オブジェクトを自然言語で操作するための自然言語インターフェースに関する研究は従来より盛んに行われている。例として、特開平8−147096号公報に記載の手書き入力方法及び装置、特開平6−75692号公報に記載の情報処理装置、特開平6−131108号公報に記載の情報入力装置、特開平6−282566号公報に記載の情報入力装置等が挙げられる。これら従来の自然言語インターフェースは、ソフトウェア・オブジェクトに用意された内部機能を自然言語で呼び出すために用いられる。例えば、特開平6−75692には、ユーザが「大きくする」と手書き入力すると予め指定された文字列が倍角文字になるようなワードプロセッサが開示されている。また、特開平8−147096には、ユーザが「録画」と手書き入力すると録画処理が始まるような制御系を有するビデオデッキが開示されている。
【0003】
従来の自然言語インターフェースは、例えばワードプロセッサ・プログラムやビデオデッキの制御プログラムといった個々のソフトウェア・オブジェクトに特化したものばかりであって、あるソフトウェア・オブジェクトのために開発された自然言語インターフェースを他のソフトウェア・オブジェクトの操作に転用することは基本的に想定されていない。このため、ソフトウェア開発者は、あるソフトウェア・オブジェクト用の自然言語インターフェースを装備したい場合、専用の自然言語インターフェースを新たに開発するために相当な労力を費やさなければならない。
【0004】
また、従来の自然言語インターフェースでは、ソフトウェア・オブジェクトに予め用意された内部機能を呼び出すための命令が入力されることが想定されている。従って、ユーザは、ソフトウェア・オブジェクトがどのような機能を備えており、それをどのような自然言語で呼び出せばよいかに関する情報(知識)を予め持ち合わせていなければならない。つまり、ユーザの要求に応える形でソフトウェア・オブジェクトが機能するというより、ソフトウェア・オブジェクトの機能に合わせてユーザが命令を出すのである。このような形態に留まる限り、自然言語によるソフトウェア・オブジェクトの操作は柔軟性を欠いたものとならざるを得ない。例えば、ユーザが「映画鑑賞会のお知らせを作成したい」と考え、その考えをそのまま言葉にして入力したとする。「映画鑑賞会のお知らせを作成したい」は、いわばユーザの要求、願望又は目的を表現したものであって、ソフトウェア・オブジェクトの何らかの機能を明示的に呼び出すための命令ではない。従来の自然言語インターフェースではこのような入力に対して適切な処理を実行することは不可能である。
【0005】
上記課題に鑑み、本願出願人らは、複数の異なるソフトウェア・オブジェクトを統一的に操作できる汎用性と、ユーザの要求、願望、目的等の自然言語表現を入力として受け取ったときでも適切な処理ができる柔軟性を備えた自然言語インターフェースに関する発明を成した(特願2002−76319)。この発明では、入力された自然言語の文字列をユーザの要求の表現ととらえて文字列の解析を行い、その要求に応じた処理を行うのに最適なソフトウェア・オブジェクトを選択し、そのソフトウェア・オブジェクトに前記処理を行わせるための機能記述表現を中間的に生成し、その機能記述表現をOS又はプログラムにより実行可能な命令記述列に変換する。
【0006】
【発明が解決しようとする課題】
一方、従来のソフトウェア・オブジェクトでは、ユーザの要求を実現するために生成するデータを、そのソフトウェア・オブジェクトだけが理解可能な専用の書式で保存していることが多い。ソフトウェア・オブジェクトが生成するデータには、文書や映像などのコンテンツ・データや、他のソフトウェア・オブジェクトやハードウェア機器などを制御するための制御シーケンス・データなどがある。しかし、その書式は特定のソフトウェア・オブジェクトだけが理解可能なため、データ自体の再利用性に乏しい。例えば、あるワードプロセッサで既に作成した文書データを、他のワードプロセッサで内容を編集して再利用したい場合がある。その場合、その文書データを特定のワードプロセッサが理解可能な専用の書式に変換するか、どのワードプロセッサでも理解可能な汎用の書式に変換することが必要になる。また、ワードプロセッサで作成した文書データを、他の種類のソフトウェア・オブジェクト、例えばメール・アプリケーションやプレゼンテーション・アプリケーションを使って他の用途に転用したい場合も、同様の書式の問題のため、煩雑なデータ変換作業が必要であったり、用途が限定されてしまうことが多い。
【0007】
さらにまた、従来のソフトウェア・オブジェクトでは、ユーザの要求を実現するために生成するデータに、ユーザの要求を実現するための必要最低限の情報しか含まないことが一般的である。例えば、ワードプロセッサが生成する文書データには、文書のタイトルや作成日、作成者などの文字列が含まれているが、どの文字列がタイトルで、どの文字列が作成日なのかを特定する情報(いわゆる文字列の意味的情報)は一般に含まれていない。このため、ユーザが文書データの一部を修正して、他の用途に転用した場合でも、ソフトウェア・オブジェクトは文書データのどの部分を修正すればよいかを判断する情報を持たず、すべてユーザの判断に任されることになる。
【0008】
従来の自然言語インターフェースは、以上のような従来のソフトウェア・オブジェクトが抱えるデータの再利用性の問題を解決していない。ユーザがソフトウェア・オブジェクトを使って既に作成したデータには、ある特定の用途に限られたものではあるが、ユーザの要求を実現するのに必要十分な情報が含まれている。従って、これらのデータを他の用途に転用したい場合、他のソフトウェア・オブジェクトを使って表現形式を変更したり、既存のデータの一部分だけを修正することで、望みのデータが得られことが多い。実際、人間は日常的に、既存のデータを元にして、その構造や意味を理解して、適切なソフトウェア・オブジェクトを選択し、最小限の修正で望みのデータを作成することを行っている。しかし、従来の自然言語インターフェースは、ユーザが入力する自然言語で表現された要求には着目しているが、ソフトウェア・オブジェクトが出力したデータを再利用することには着目していないため、ユーザに対して多大な負荷を強いる結果となっている。
【0009】
本発明は以上のような課題を解決するために成されたものであり、その目的とするところは、複数の異なるソフトウェア・オブジェクトを統一的に操作できる汎用性と、ユーザの要求を実現するために作成したデータを他の用途に転用することができる柔軟性を備えた自然言語インターフェースを実現するための技術を提供することにある。
【0010】
【課題を解決するための手段】
上記課題を解決するために成された本発明は、
特定のソフトウェア・オブジェクトで作成された既存のデータを指定する手順、
前記データを解析し、前記ソフトウェア・オブジェクトが該データを作成するために実行した命令記述列に変換する手順、
前記命令記述列をユーザに理解可能な自然言語による機能記述表現に変換する手順、及び、
前記機能記述表現から意味的な情報を獲得し、前記機能記述表現に意味を付加した要求記述表現を生成する手順
を含む処理をコンピュータに実行させることを特徴とする。
【0011】
また、本発明は、コンピュータに上記のような処理を実行させるためのプログラムを提供する。
【0012】
【発明の実施の形態】
本発明による処理の手順は次の通りである。まず、ユーザが直接的に、もしくは間接的に、ユーザの要求を実現するために参照するデータを指定する。ここで言う「直接的」とは、ユーザ自身または他のユーザが特定のソフトウェア・オブジェクトを使って既に作成したデータ(一般にはデータファイル)を、コンピュータのOS(オペレーティング・システム)の機能を使って指定することである。また、「間接的」とは、ユーザがコンピュータの入力手段を使って入力した要求を解釈して、その要求を実現するのに最も適切なデータを既存のデータから選択し、指定することである。ここでは「映画鑑賞会のお知らせ」というタイトルの文書データが、ユーザにより直接的に指定されたものとする。
【0013】
次に、指定したデータを解析して、そのデータを作成したソフトウェア・オブジェクトが実行可能な命令記述列に変換する。具体的には、データの各書式と、ソフトウェア・オブジェクトが実行可能な命令記述との対応を表した辞書(以下、データ解析部辞書と呼ぶ)を用いて、指定したデータを命令記述列に変換する。データ解析部辞書は、指定したデータを作成するソフトウェア・オブジェクトごとに用意する。前述の「映画鑑賞会のお知らせ」というタイトルの文書データが指定された場合は、文書データを作成した特定のワードプロセッサ用のデータ解析部辞書が選択され、例えば、文書データ内にサイズが24ポイントの文字列が見つかると、「Selection.Font.Size = 24」のように変換する。
【0014】
次に、変換した命令記述列から、ユーザが理解可能な自然言語による機能記述表現に変換する。具体的には、各命令記述と、ユーザが理解可能な自然言語による機能記述表現との対応を表した辞書(以下、命令伝達部辞書と呼ぶ)を用いて、命令記述列を機能記述表現に変換する。命令伝達部辞書は、命令記述列を実行可能なソフトウェア・オブジェクトごとに用意する。前述の「映画鑑賞会のお知らせ」というタイトルの文書データが指定された場合は、文書データを作成した特定のワードプロセッサ用の命令伝達部辞書が選択され、例えば、「Selection.Font.Size = 24」という命令記述を、「選択した文字列の大きさを24ポイントにする」のように変換する。
【0015】
次に、変換した機能記述表現から意味的な情報を獲得し、機能記述表現に意味を付加した要求記述表現を生成する。具体的には、各機能記述と、ユーザの要求の意味論表現との対応を表した辞書(以下、機能翻訳部辞書と呼ぶ)を用いて、機能記述表現から要求記述表現を生成する。機能翻訳部辞書の一例を図2に示す。図2の機能翻訳部辞書は、機能記述表現および要求記述表現に用いられる語句について、相互に置き換え可能な語句組(語句A、語句B)を一つの変換対とした変換表である。この変換表により、例えば「文字列のサイズを大きくする」という語句は、「文字列を視覚的に強調する」という語句に変換できる。また逆に、「文字列を視覚的に強調する」を「文字列のサイズを大きくする」に変換することも可能である。また、図2の「($A=)」という書式は、語句内の可変要素を表す変数で、「($A=12)」のような形式で具体的な値を代入することで、通常の機能記述表現および要求記述表現として使える。
【0016】
図2の辞書に基づく機能記述表現から要求記述表現の生成手順を更に具体的に説明する。 例えば、
「選択した文字列の大きさを24ポイントにする」
「選択した文字列をセンタリングする」
「選択した文字列を波型にする」
という一連の機能記述表現は、機能翻訳部辞書内にある、
「文字列のサイズを大きくする」×「文字列のサイズを($B=24)ポイントにする」
「文字列を視覚的に強調する」×「文字列のサイズを大きくする」
「文字列を視覚的に強調する」×「文字列をセンタリングする」
「文字列を視覚的に強調する」×「文字列を波型にする」
といった変換対に適合することから、
「選択した文字列は視覚的に強調されている」
という記述に変換することができる。
さらに、
「文字列『映画鑑賞会のお知らせ』を入力する」
という記述が機能記述表現の先頭にあると、機能翻訳部辞書内にある、
「文書のタイトル」×「『($A=)のお知らせ』」
「文書のタイトルを入力する」×「文字列『($A=)』を入力する/文字列を文書冒頭に配置する」
といった変換対に適合することから、
前述の「選択した文字列は視覚的に強調されている」という記述と併せることにより、
「文書のタイトルの文字列『($A1=($A2=映画鑑賞会)のお知らせ) 』を入力する」
という記述に変換することができる。すなわち、入力された『映画鑑賞会のお知らせ』という文字列は、文書のタイトルと認識されたことになる。
これらの結果より、
「文字列『映画鑑賞会のお知らせ』を入力する」
「入力した文字列を選択する」
「選択した文字列の大きさを24ポイントにする」
「選択した文字列をセンタリングする」
「選択した文字列を波型にする」
という一連の機能記述表現から、最終的に、
「文書のタイトルの文字列『($A1=($A2=映画鑑賞会)のお知らせ)』を入力する」「文書のタイトルの文字列の大きさを($B=24)ポイントにする」
「文書のタイトルの文字列をセンタリングする」
「文書のタイトルの文字列を波型にする」
というテンプレート形式の要求記述表現が得られる。
【0017】
【発明の効果】
以上のように、本発明は、ソフトウェア・オブジェクトにより作成された既存のデータから、ユーザの要求を実現するための自然言語による要求記述表現を、自動的に生成する基本的なアーキテクチャを提供するものである。このような本発明により、ソフトウェア・オブジェクトと自然言語インターフェースとの連携を従来よりも簡単に実現することができる。すなわち、生成された要求記述表現は特定のソフトウェア・オブジェクトに依存しない自然言語で表現されているため、もしユーザの要求を、他のソフトウェア・オブジェクトを操作することにより実現する場合でも、要求記述表現と命令記述列とを関連付ける辞書を作成するだけで、そのソフトウェア・オブジェクトを操作できる仕組みを実現することができる。
【0018】
また、生成された要求記述表現は、ユーザが理解可能な自然言語で表現されているということだけでなく、ユーザの要求に含まれる意味的な情報が加味され、かつ可変要素が認識されているため、要求の可変要素部分の最小限の変更だけで、他の用途に転用することができる。その結果、ユーザ自身または他のユーザが過去に作成した膨大なデータを、様々な用途に有効に利用することができる。
【0019】
例えば、本発明の方法で得られる要求記述表現は自然言語表現であるから、それはそのまま特願2002−76319の方法における入力情報することができる。このように2つの発明を組み合わせることにより、自然言語を介したデータ変換が可能になる。例えば、Aというワードプロセッサで作成されたデータをBというワードプロセッサで利用したいが、BにはAの出力データを読み込むための変換フィルタがなく、しかも、Aというワードプロセッサが手元にない場合、まず、本発明に係る方法でAの出力データを自然言語の中間データに変換し、更にその中間データを特願2002−76319の方法でBの形式のデータに変換するのである。このとき、中間データの段階でユーザはその内容を自然言語の要求記述表現で確認することができ、必要ならそこで適宜内容を編集してからBに読み込ませることも可能である。要求記述表現には「タイトル」「宛名」「日付」というように、文書の構成要素の意味を示す情報が含まれているため、AやBの操作を全く知らないユーザでも容易に文書編集が可能である。
【0020】
他にも、例えば、本発明の方法で得られる自然言語の要求記述表現から元のデータファイルの構造を解析することができる。また、本発明の方法で機器制御設定データを自然言語の要求記述表現に変換し、ユーザが適宜修正してから、特願2002−76319の方法で元の機器設定データに戻すことも可能である。また、本発明の方法でサンプル文書データを自然言語の要求記述表現に変換すれば、サンプル文書が出来上がるまでの操作手順を示す文書が出来上がる。このような文書は、例えばアプリケーション操作学習用テキストの作成に利用できる。また、本発明の方法で得られた自然言語の要求記述表現を既存の翻訳プログラムで他国語に翻訳すれば、単にテキスト情報だけでなく書式やレイアウト等に関する指示まで当該他国語に翻訳された文書が得られる。
【0021】
【実施例】
本発明の一実施例であるシステムについて図面を参照しながら説明する。本実施例のシステムは、特願2002−76319に記載の方法を応用してファイルを間接的に指定し、そのファイルのデータを本発明による方法で自然言語の要求記述表現に変換する。本実施例のシステムの概略構成を図3に示す。このコンピュータ・システムは、一般のパーソナル・コンピュータを利用して構成されたものであって、CPU(中央演算処理装置)10、ROM(読出し専用主記憶装置)11、RAM(読書き可能主記憶装置)12、外部記憶装置コントローラ13と外部記憶装置(補助記憶装置)14、外部と連携するためのネットワーク・コントローラ15、ユーザ・インターフェース・アダプター16、ディスプレイ・コントローラ21とディスプレイ22、サウンド・コントローラ23、スピーカー24を備えている。ユーザ・インターフェース・アダプター16には、言葉列を入力するための各種入力機器(キーボード17、音声入力用マイク18、マウス19、手書き入力用タブレット20)が接続されている。
【0022】
本実施例のシステムの機能的構成を図4に示す。図4において、自然言語入力部30は自然言語による言葉、言葉列又は文(以下、これらをまとめて「言葉」と呼ぶ)の入力を受け付け、その言葉を表す文字列を生成する手段である。言葉の入力方法としては、キーボード17を用いたキー入力、マイク18を用いた音声入力、マウス19を用いた画面上の文字入力パネルの操作、あるいは、タブレット20を用いた手書き入力から選択できる。もちろん、これら以外の方法でも、そのための入力機器とそのためのソフトウェア(ドライバ)を用意しさえすれば、言葉の入力に利用できる。
【0023】
自然言語解析部34は、自然言語解析、辞書によるパーシング、対話形式構文生成、カテゴリー辞書マネージャー機能を有しており、上記文字列を解析して意味論的表現を生成する。文字列の解析には、自然言語処理の分野で一般的に知られた技術が利用できる。例えば、奈良先端科学技術大学院大学の「茶筌」、京都大学の「KNP」等の自然言語解析エンジンが既に知られているが、このような既存のエンジンを用いて自然言語解析部34を構成することができる。
【0024】
データ指定部36は、意味論的表現に現れる全ての概念でデータ指定部辞書42を検索し、ユーザの要求に応じた処理を行うのに最適なソフトウェア・オブジェクト、およびそのソフトウェア・オブジェクトが作成したデータを選択する。データ指定部辞書42には、意味論的表現に用いられる概念とシステムで利用可能なソフトウェア・オブジェクト、およびそのソフトウェア・オブジェクトが生成したデータとを関連付ける情報が保存されている。
【0025】
データ解析部37は、データ指定部36により指定したデータを構文的に解析し、指定したデータを作成したソフトウェア・オブジェクトが、指定したデータを作成するための実行可能な命令記述列に変換する。
【0026】
命令記述変換部38は、データ解析部37により作成された命令記述列を、命令伝達部辞書44を検索することにより、自然言語で表現された機能記述表現に変換する。
【0027】
機能記述変換部40は、命令記述変換部38により作成された機能記述表現を、機能翻訳部辞書46を検索することにより、機能記述表現から意味的な情報を獲得し、機能記述表現に意味を付加した要求記述表現を生成する。機能翻訳部辞書46の構成例は図2に示した通りである。
【0028】
機能翻訳部41は、意味論的表現に現れる全ての概念で機能翻訳部辞書46を検索し、辞書に記憶されているソフトウェア・オブジェクトの機能に合った機能記述表現に置き換える。
【0029】
命令伝達部39は、機能翻訳部41により作成された機能記述表現に現れる全ての概念で命令伝達部辞書44を検索し、辞書に記憶されているソフトウェア・オブジェクト45の機能を実行するための命令記述列を生成する。命令記述列は、例えば、該当ソフトウェア・オブジェクト45のAPIとパラメータ、あるいは、コマンドストリームを介して渡すコマンド列である。命令伝達部39は命令記述列を実行し、該当ソフトウェア・オブジェクト45の機能を実行する。
【0030】
応答発生部33は、命令伝達部39により実行されたソフトウェア・オブジェクト45の実行結果を受け取り、ユーザが所望する形態で応答する。応答の形態は、例えば、ディスプレイ22への表示、プリンタ(図示せず)による印刷、データベースへの情報格納、機器の制御等、様々なものが考えられる。
【0031】
辞書管理部35は、データ指定部辞書42、データ解析部辞書43、命令伝達部辞書44、機能翻訳部辞書46の新規情報の作成、格納情報の変更、削除、閲覧表示を行う。さらに、制御部32は自然言語入力部30、自然言語解析部34、データ指定部36、データ解析部37、命令記述変換部38、命令伝達部39、機能記述変換部40、機能翻訳部41、応答発生部33、ユーザ対話部31、辞書管理部35に必要なデータを受け渡し、一連の動作を制御する。
【0032】
「映画鑑賞会のお知らせを作成したい」という入力文字列の処理を本実施例のシステムで行う手順について図1、図2及び図5を参照しながら説明する。
【0033】
映画鑑賞会のお知らせを作成しよう考えたユーザが、例えばキーボード17を用いて「映画鑑賞会のお知らせを作成したい」という文を打ち込むと、自然言語入力部30が、キーボード入力インターフェースを通じて「映画鑑賞会のお知らせを作成したい」という文字列を受け取る(ステップ50)。この文字列は自然言語解析部34に渡される。
【0034】
自然言語解析部34は受け取った文字列を解析し、例えば「映画(の)」、「鑑賞会(の)」、「お知らせ(を)」及び「作成(したい)」という、構文および意味的に分離した4つの言葉から成る意味論的表現を生成する(ステップ51)。この意味論的表現はデータ指定部36に渡される。
【0035】
データ指定部36は、データ指定部辞書42に基づいて上記4つの言葉のソフトウェア・オブジェクト別評価点を取得する。データ指定部辞書42の一部の構成例を図5に示す。図5の辞書を用いた場合、「映画(の)」「鑑賞会(の)」「お知らせ(を)」「作成(したい)」という意味論的表現から、
ワードプロセッサの評価点=1.7
電子メールクライアントの評価点=1.2
作図ソフトの評価点=0.1
というようにソフトウェア・オブジェクト毎の評価点が得られる。この結果から、データ指定部36は、総合的な評価点の最も高いソフトウェア・オブジェクトは「ワードプロセッサ」であると判断し、データ指定部辞書42に格納されている「ワードプロセッサ」向けのデータ指定処理を実行する。
【0036】
データ指定処理は、意味論的表現から適切なデータを検索し、評価することにより、最適なデータを指定する。例えば、意味論的表現に含まれる言葉をファイル名に含むデータファイルであって、先に選択したソフトウェア・オブジェクト(今の例では「ワードプロセッサ」)により作成されたデータファイルを検索し、最新の日付のデータファイルを最適と評価して指定する。なお、最適なデータファイルを自動評価する前に候補ファイルの一覧を表示し、ユーザに確認及び選択の機会を与えるようにしてもよい。ここでは「映画鑑賞会」という名前のデータファイルが指定されたとする。(ステップ52)
【0037】
データ解析部37は、データ指定部36により指定したデータを構文的に解析し、指定したデータを作成するためのソフトウェア・オブジェクトが実行可能な命令記述列に変換する。例えば、データ指定部36で指定したデータがワードプロセッサにより作成された文書データであった場合、データ解析部37はそのワードプロセッサ用のデータ解析部辞書43により、文書データ内に格納されている文字列データ、および文字列の大きさや位置を指定したレイアウト情報を読み取り、ソフトウェア・オブジェクトが実行可能な命令記述に変換する。例えば、文書データ内にサイズが24ポイントの文字列が見つかると、「Selection.Font.Size = 24」のように変換する。(ステップ53)
【0038】
次に、命令記述変換部38は、データ解析部37により作成された命令記述列を、命令伝達部辞書44を検索することにより、特定のソフトウェア・オブジェクトに依存しない、自然言語で表現された機能記述表現に変換する。例えば、「Selection.Font.Size = 24」という命令記述を、「選択した文字列の大きさを24ポイントにする」のように変換する。(ステップ54)
【0039】
機能記述変換部40は、命令記述変換部38により作成された機能記述表現を、機能翻訳部辞書46(図2)を検索することにより、機能記述表現から意味的な情報を獲得し、機能記述表現に意味を付加した要求記述表現を生成する。例えば、
「文字列『映画鑑賞会のお知らせ』を入力する」
「入力した文字列を選択する」
「選択した文字列の大きさを24ポイントにする」
「選択した文字列をセンタリングする」
「選択した文字列を波型にする」
という一連の機能記述表現から、
「文書のタイトルの文字列『($A1=($A2=映画鑑賞会)のお知らせ)』を入力する」「文書のタイトルの文字列の大きさを($B=24)ポイントにする」
「文書のタイトルの文字列をセンタリングする」
「文書のタイトルの文字列を波型にする」
という要求記述表現を生成する。(ステップ55)
【0040】
次に、機能翻訳部41は、要求記述表現に含まれる可変要素を再定義して、機能記述表現に翻訳する。機能翻訳部41は、要求記述表現に含まれる可変要素を見つけると、ユーザ対話部31を介してユーザに可変要素部分の値を問い合わせる。ユーザが定義に相当する言葉(文字列)を入力すると、機能翻訳部41は要求記述表現の可変要素部分をその言葉で置き換え、機能記述表現に変換する。例えば、要求記述表現に、「日付の文字列『($Y=)年($M=)月($D=)日』を入力する」があれば、三つの可変要素の値をユーザに問い合わせて、「日付の文字列『($Y=2002)年($M=12)月($D=1)日』を入力する」という機能記述表現に翻訳する。同様に、「場所の文字列『($P=)』を入力する」、「題名の文字列『($T=)』を入力する」、「あらすじの文字列『($S=)』を入力する」という要求記述表現の可変要素部分の値をユーザに問い合わせることにより、可変要素の含まれない機能記述表現に翻訳する。(ステップ56)
【0041】
次に、命令伝達部39は可変要素を含まない機能記述表現を、命令伝達部辞書44を用いて命令記述列を生成し、ソフトウェア・オブジェクト45に対してその命令を実行する。例えば、「ワードプロセッサを起動する」という機能記述表現に対しては、ハードディスクの所定場所に保存されたワードプロセッサのプログラムを読み出して実行するための命令記述列を生成し、OSに実行させる。また、「日付の文字列『($Y=2002)年($M=12)月($D=1)日』を入力する」という機能記述表現に対しては、文字列挿入機能を呼び出すための命令記述列を生成し、OSを通じてワードプロセッサのプログラムに実行させる。OSに渡すべき命令記述列はOSのアプリケーション・プログラミング・インターフェース(API)の仕様に従って作成し、ワードプロセッサのプログラムに渡すべき命令記述列はワードプロセッサのAPIの仕様に従って作成する。(ステップ57)
【0042】
このようにして、ユーザはユーザ対話部31のガイダンスに沿い、「文書のタイトル」、「日付」、「場所」、「題名」、「あらすじ」という最小限の情報を入力することで、「映画鑑賞会のお知らせ」という文書データを簡単に作成できる。
【0043】
以上、本発明の実施例について説明したが、実施例は上記に限られるものではない。例えば、作成したデータが案内文書で、文書内に「山田様」もしくは「会員各位」という文字列があった場合に、機能翻訳部辞書により「宛名の文字列『($N=山田)様』を入力する」もしくは「宛名の文字列『($N=会員)各位』を入力する」という要求記述表現が生成される。すなわち、案内文書の宛名部分に可変要素である変数が含まれていることが認識されることになる。ここで、本発明の実施例のシステムに、既存の会員名簿データベース管理システムを連動させると、宛名の可変要素である変数$Nに、会員名簿データベース内の「会員名」を結び付けることにより、各会員宛ての大量の案内文書を一度に作成することもできる。
【0044】
また、上記実施例ではワードプロセッサのようなソフトウェア・オブジェクトが作成したコンテンツ・データを対象としたが、他のソフトウェア・オブジェクトやハードウェア機器などを制御するための制御シーケンス・データにも有効である。例えば、あるハードウェア機器を操作するための制御シーケンス・データを自然言語で表現し、音声出力型コントローラを設けて読み上げることにより、機器操作に不慣れな初心者に対しても、より良い操作インタフェースを提供することができる。
【0045】
さらにまた、本発明では、ソフトウェア・オブジェクトが生成するデータを、その書式や内容に関わらず、ユーザの要求を実現するために用いられた自然言語で表現することができるため、自然言語文字列によるデータの検索効率を向上させることができる。例えば、「映画」という文字列をキーとしたデータ検索により、「映画鑑賞会のお知らせ」というタイトルの文書データだけでなく、従来の非言語的な表現形式では不可能であった、「映画番組を予約する」ためのビデオ機器の制御シーケンス・データなども探知することができ、データの再利用性をさらに向上させることができる。
【図面の簡単な説明】
【図1】本発明に係る方法によるデータ記述の生成と利用手順の一例を示すフローチャート。
【図2】機能翻訳部辞書の構成例。
【図3】本発明の一実施例であるコンピュータ・システムのハードウエア構成を示すブロック図。
【図4】本発明に従って構成された自然言語インターフェ−スの機能的構成を示すブロック図。
【図5】データ指定部辞書の一部の構成例。
【符号の説明】
30…自然言語入力部
31…ユーザ対話部
32…制御部
33…応答発生部
34…自然言語解析部
35…辞書管理部
36…データ指定部
37…データ解析部
38…命令記述変換部
39…命令伝達部
40…機能記述変換部
41…機能翻訳部
42…データ指定部辞書
43…データ解析部辞書
44…命令伝達部辞書
45…ソフトウェア・オブジェクト
46…機能翻訳部辞書

Claims (2)

  1. 特定のソフトウェア・オブジェクトで作成された既存のデータを指定する手順、
    前記データを解析し、前記ソフトウェア・オブジェクトが該データを作成するために実行した命令記述列に変換する手順、
    前記命令記述列をユーザに理解可能な自然言語による機能記述表現に変換する手順、及び、
    前記機能記述表現から意味的な情報を獲得し、前記機能記述表現に意味を付加した要求記述表現を生成する手順、
    を含む処理をコンピュータに実行させることを特徴とする自然言語による既存データの記述方法。
  2. 請求項1に記載の方法をコンピュータに実行させるためのプログラム。
JP2002178303A 2002-06-19 2002-06-19 自然言語による既存データの記述方法及びそのためのプログラム Pending JP2004021791A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002178303A JP2004021791A (ja) 2002-06-19 2002-06-19 自然言語による既存データの記述方法及びそのためのプログラム
AU2003211815A AU2003211815A1 (en) 2002-06-19 2003-02-27 Method for describing existing data by a natural language and program for that
US10/517,810 US20050228635A1 (en) 2002-06-19 2003-02-27 Method for describing existing data by a natural language and program for that
PCT/JP2003/002278 WO2004001570A1 (ja) 2002-06-19 2003-02-27 自然言語による既存データの記述方法及びそのためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002178303A JP2004021791A (ja) 2002-06-19 2002-06-19 自然言語による既存データの記述方法及びそのためのプログラム

Publications (1)

Publication Number Publication Date
JP2004021791A true JP2004021791A (ja) 2004-01-22

Family

ID=29996515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002178303A Pending JP2004021791A (ja) 2002-06-19 2002-06-19 自然言語による既存データの記述方法及びそのためのプログラム

Country Status (4)

Country Link
US (1) US20050228635A1 (ja)
JP (1) JP2004021791A (ja)
AU (1) AU2003211815A1 (ja)
WO (1) WO2004001570A1 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762134B2 (en) 2012-08-30 2014-06-24 Arria Data2Text Limited Method and apparatus for situational analysis text generation
US8762133B2 (en) 2012-08-30 2014-06-24 Arria Data2Text Limited Method and apparatus for alert validation
US9244894B1 (en) 2013-09-16 2016-01-26 Arria Data2Text Limited Method and apparatus for interactive reports
US9336193B2 (en) 2012-08-30 2016-05-10 Arria Data2Text Limited Method and apparatus for updating a previously generated text
US9355093B2 (en) 2012-08-30 2016-05-31 Arria Data2Text Limited Method and apparatus for referring expression generation
US9396181B1 (en) 2013-09-16 2016-07-19 Arria Data2Text Limited Method, apparatus, and computer program product for user-directed reporting
US9405448B2 (en) 2012-08-30 2016-08-02 Arria Data2Text Limited Method and apparatus for annotating a graphical output
US9600471B2 (en) 2012-11-02 2017-03-21 Arria Data2Text Limited Method and apparatus for aggregating with information generalization
US9904676B2 (en) 2012-11-16 2018-02-27 Arria Data2Text Limited Method and apparatus for expressing time in an output text
US9946711B2 (en) 2013-08-29 2018-04-17 Arria Data2Text Limited Text generation from correlated alerts
US9990360B2 (en) 2012-12-27 2018-06-05 Arria Data2Text Limited Method and apparatus for motion description
US10115202B2 (en) 2012-12-27 2018-10-30 Arria Data2Text Limited Method and apparatus for motion detection
US10445432B1 (en) 2016-08-31 2019-10-15 Arria Data2Text Limited Method and apparatus for lightweight multilingual natural language realizer
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
US10565308B2 (en) 2012-08-30 2020-02-18 Arria Data2Text Limited Method and apparatus for configurable microplanning
US10664558B2 (en) 2014-04-18 2020-05-26 Arria Data2Text Limited Method and apparatus for document planning
US10776561B2 (en) 2013-01-15 2020-09-15 Arria Data2Text Limited Method and apparatus for generating a linguistic representation of raw input data
US11176214B2 (en) 2012-11-16 2021-11-16 Arria Data2Text Limited Method and apparatus for spatial descriptions in an output text

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4024137B2 (ja) * 2002-11-28 2007-12-19 沖電気工業株式会社 数量表現検索装置
US20110068164A1 (en) * 2009-09-24 2011-03-24 Trimble Navigation Limited Method and Apparatus for Barcode and Position Detection

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2534685B2 (ja) * 1986-10-27 1996-09-18 キヤノン株式会社 情報表示方法
JPH0546656A (ja) * 1991-08-16 1993-02-26 Toshiba Corp 文章解析装置
JPH0683669A (ja) * 1992-09-03 1994-03-25 Nec Ic Microcomput Syst Ltd デバッグプログラム装置
JP3350293B2 (ja) * 1994-08-09 2002-11-25 株式会社東芝 対話処理装置及び対話処理方法
JP2954041B2 (ja) * 1996-10-28 1999-09-27 米沢日本電気株式会社 日本語によるプログラム作成機能付きromエミュレーションシステムと処理方法
US7089261B2 (en) * 2002-07-25 2006-08-08 International Business Machines Corporation Programmable use of data extracted from common presentation files

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10565308B2 (en) 2012-08-30 2020-02-18 Arria Data2Text Limited Method and apparatus for configurable microplanning
US9336193B2 (en) 2012-08-30 2016-05-10 Arria Data2Text Limited Method and apparatus for updating a previously generated text
US10467333B2 (en) 2012-08-30 2019-11-05 Arria Data2Text Limited Method and apparatus for updating a previously generated text
US9323743B2 (en) 2012-08-30 2016-04-26 Arria Data2Text Limited Method and apparatus for situational analysis text generation
US9640045B2 (en) 2012-08-30 2017-05-02 Arria Data2Text Limited Method and apparatus for alert validation
US9355093B2 (en) 2012-08-30 2016-05-31 Arria Data2Text Limited Method and apparatus for referring expression generation
US10839580B2 (en) 2012-08-30 2020-11-17 Arria Data2Text Limited Method and apparatus for annotating a graphical output
US8762134B2 (en) 2012-08-30 2014-06-24 Arria Data2Text Limited Method and apparatus for situational analysis text generation
US10963628B2 (en) 2012-08-30 2021-03-30 Arria Data2Text Limited Method and apparatus for updating a previously generated text
US8762133B2 (en) 2012-08-30 2014-06-24 Arria Data2Text Limited Method and apparatus for alert validation
US9405448B2 (en) 2012-08-30 2016-08-02 Arria Data2Text Limited Method and apparatus for annotating a graphical output
US10769380B2 (en) 2012-08-30 2020-09-08 Arria Data2Text Limited Method and apparatus for situational analysis text generation
US10282878B2 (en) 2012-08-30 2019-05-07 Arria Data2Text Limited Method and apparatus for annotating a graphical output
US10026274B2 (en) 2012-08-30 2018-07-17 Arria Data2Text Limited Method and apparatus for alert validation
US10504338B2 (en) 2012-08-30 2019-12-10 Arria Data2Text Limited Method and apparatus for alert validation
US10216728B2 (en) 2012-11-02 2019-02-26 Arria Data2Text Limited Method and apparatus for aggregating with information generalization
US9600471B2 (en) 2012-11-02 2017-03-21 Arria Data2Text Limited Method and apparatus for aggregating with information generalization
US9904676B2 (en) 2012-11-16 2018-02-27 Arria Data2Text Limited Method and apparatus for expressing time in an output text
US10311145B2 (en) 2012-11-16 2019-06-04 Arria Data2Text Limited Method and apparatus for expressing time in an output text
US11580308B2 (en) 2012-11-16 2023-02-14 Arria Data2Text Limited Method and apparatus for expressing time in an output text
US11176214B2 (en) 2012-11-16 2021-11-16 Arria Data2Text Limited Method and apparatus for spatial descriptions in an output text
US10853584B2 (en) 2012-11-16 2020-12-01 Arria Data2Text Limited Method and apparatus for expressing time in an output text
US10803599B2 (en) 2012-12-27 2020-10-13 Arria Data2Text Limited Method and apparatus for motion detection
US10860810B2 (en) 2012-12-27 2020-12-08 Arria Data2Text Limited Method and apparatus for motion description
US10115202B2 (en) 2012-12-27 2018-10-30 Arria Data2Text Limited Method and apparatus for motion detection
US9990360B2 (en) 2012-12-27 2018-06-05 Arria Data2Text Limited Method and apparatus for motion description
US10776561B2 (en) 2013-01-15 2020-09-15 Arria Data2Text Limited Method and apparatus for generating a linguistic representation of raw input data
US10671815B2 (en) 2013-08-29 2020-06-02 Arria Data2Text Limited Text generation from correlated alerts
US9946711B2 (en) 2013-08-29 2018-04-17 Arria Data2Text Limited Text generation from correlated alerts
US10860812B2 (en) 2013-09-16 2020-12-08 Arria Data2Text Limited Method, apparatus, and computer program product for user-directed reporting
US9396181B1 (en) 2013-09-16 2016-07-19 Arria Data2Text Limited Method, apparatus, and computer program product for user-directed reporting
US10282422B2 (en) 2013-09-16 2019-05-07 Arria Data2Text Limited Method, apparatus, and computer program product for user-directed reporting
US9244894B1 (en) 2013-09-16 2016-01-26 Arria Data2Text Limited Method and apparatus for interactive reports
US11144709B2 (en) 2013-09-16 2021-10-12 Arria Data2Text Limited Method and apparatus for interactive reports
US10255252B2 (en) 2013-09-16 2019-04-09 Arria Data2Text Limited Method and apparatus for interactive reports
US10664558B2 (en) 2014-04-18 2020-05-26 Arria Data2Text Limited Method and apparatus for document planning
US10853586B2 (en) 2016-08-31 2020-12-01 Arria Data2Text Limited Method and apparatus for lightweight multilingual natural language realizer
US10445432B1 (en) 2016-08-31 2019-10-15 Arria Data2Text Limited Method and apparatus for lightweight multilingual natural language realizer
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
US10963650B2 (en) 2016-10-31 2021-03-30 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
US11727222B2 (en) 2016-10-31 2023-08-15 Arria Data2Text Limited Method and apparatus for natural language document orchestrator

Also Published As

Publication number Publication date
AU2003211815A1 (en) 2004-01-06
US20050228635A1 (en) 2005-10-13
WO2004001570A1 (ja) 2003-12-31

Similar Documents

Publication Publication Date Title
JP2004021791A (ja) 自然言語による既存データの記述方法及びそのためのプログラム
JPH09134282A (ja) プログラム作成方法
JP2006011739A (ja) オントロジを利用する装置、コンピュータシステムおよびデータ処理方法
US20100241645A1 (en) Method and system for integrating personal information search and interaction on web/desktop applications
JP2002278757A (ja) Htmlアプリケーションにおいてユーザーインターフェースオブジェクトの文法ベースの認識のための方法及び装置
JPH07311677A (ja) 操作処理装置
JP2008145769A (ja) 対話シナリオ生成システム,その方法およびプログラム
US11182542B2 (en) Exposing annotations in a document
US20050165712A1 (en) Method for operating software object using natural language and program for the same
JP7247593B2 (ja) 生成装置、ソフトウェアロボットシステム、生成方法及び生成プログラム
JP4435144B2 (ja) データ検索システム及びプログラム
JP2005025257A (ja) 言い換えを利用した文章作成支援処理プログラム、文章作成支援処理プログラム記録媒体、および文章作成支援処理方法
JP2003296327A (ja) 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Grover et al. A framework for text mining services
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
TW201537372A (zh) 動作設計裝置及動作設計程式產品
JP3734101B2 (ja) ハイパーメディア構築支援装置
JP4248549B2 (ja) 機械翻訳編集装置、機械翻訳編集プログラム及び機械翻訳編集方法
JP3537260B2 (ja) リンク付文書検索表示システム
JPH0744343A (ja) 操作支援情報自動生成装置
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06214776A (ja) ソフトウェア自動生成システム
JPS6190272A (ja) 辞書機能を用いた翻訳方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061128