JPH0944479A - 言語処理装置および言語処理方法 - Google Patents
言語処理装置および言語処理方法Info
- Publication number
- JPH0944479A JPH0944479A JP7194702A JP19470295A JPH0944479A JP H0944479 A JPH0944479 A JP H0944479A JP 7194702 A JP7194702 A JP 7194702A JP 19470295 A JP19470295 A JP 19470295A JP H0944479 A JPH0944479 A JP H0944479A
- Authority
- JP
- Japan
- Prior art keywords
- language processing
- language
- processing systems
- candidates
- systems
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Transfer Between Computers (AREA)
- Character Discrimination (AREA)
- Computer And Data Communications (AREA)
- Machine Translation (AREA)
Abstract
相互間のデータ授受の制御を吸収してシステム構築の労
力を大幅に軽減する言語処理装置を提供する。 【解決手段】それぞれに別個の計算機上で動作可能な複
数種類の言語処理システム7a〜7bを有する言語処理
装置において、複数種類の言語処理システム相互間の依
存関係を定義する記述言語を記憶する記述言語記憶部3
と、この記述言語記憶部3に記憶された記述言語を解釈
する解釈部2と、この解釈部2の解釈にしたがって、各
言語処理システムを実行するとともに前記各言語処理シ
ステム相互間のデータの授受を制御する実行部5とを具
備し、各言語処理システムが複数候補をもった曖昧性を
含むデータを出力した際に、これらの複数候補の中から
いずれかの候補を選択すること特徴とする。
Description
計算機上で動作可能な複数種類の言語処理システムの機
能を相互に利用する言語処理装置および言語処理方法に
係り、特に言語処理固有の曖昧性を含む言語処理システ
ム相互間のデータ授受の制御を吸収して、システム構築
の労力を大幅に軽減する言語処理装置および言語処理方
法に関する。
び大容量化には著しいものがあり、この高速化および大
容量化にともなって、計算機ネットワーク上に分散した
記憶資源、CPU資源、デバイス資源などの計算機資源
を共有する各種情報システムの実用化が進んでいる。ま
た、今後、パーソナルコンピュータ、エンジニアリング
ワークステーション、およびスーパーコンピュータなど
といった異種の計算機や異種のオペレーティングシステ
ムなどが同一の計算機ネットワークで結合され、異種の
計算機上で動作する複数の情報処理機能を有機的に結合
して利用することがますます盛んになっていくと予測さ
れる。
テムを構築する利点は、異なるシステムで稼働する情報
処理機能を有機的に結合することが容易であり、新しい
情報処理アプリケーションシステムを実現することがで
きるという点にある。また、全く同じ機能を他の計算機
システムやオペレーティングシステムで稼働するように
移植する手間やコストが不要になるという点も大きな利
点である。
システムにおいては、単独の計算機で稼働するシステム
が大半であったため、使用することのできる計算機シス
テムやオペレーティングシステムが限定されるという問
題点があった。
機械翻訳、自動抄録作成、情報検索、かな漢字変換、音
声認識、および文字認識(OCR)などの言語処理に基
づいた情報変換や情報認識機能を総称するものである。
として、たとえばグラフィカルユーザインタフェースの
部分だけをネットワーク対応として分離し、他の計算機
上で稼働できるようにしたシステムなどが存在する。
処理の根幹に関わる処理部は、一つの計算機システム内
で閉じており、他の言語処理システムを有機的に結合す
るという段階にはいたっていない。このため、計算機ネ
ットワークを介して異なる計算機上で稼働させることに
よるシステム開発のコストや手間の大幅な削減が期待さ
れている。
出力するなど、その出力データに曖昧性を含んでいる。
このため、その曖昧性を考慮して複数の言語処理システ
ムやアプリケーションシステム間のデータ授受を行なう
必要がある。
まっては、言語処理システムの能力を十分に発揮するこ
とはできない。たとえば、機械翻訳を考えた場合に、得
られる第1の訳文が利用者にとって望ましいものとは限
らない。したがって、利用者が次の訳文候補を得ようと
した場合に、その訳文を表示できるようにしておくこと
が望ましい。
る。すなわち、文字認識処理だけでは正しい文字認識候
補を絞り込むことができないが、単語として存在するか
どうかなどのチェックを校正支援サーバを利用して行な
い、正しい候補に絞り込むことは可能である。したがっ
て、クライアントに第1候補のみを送るだけでは、この
ようなことは不可能である。
は、訳文の候補すべてをクライアントコンピュータ側に
送信するサーバ/クライアント型の機械翻訳システムが
記載されており、サーバコンピュータ側で各クライアン
トコンピュータの状態を記憶しないようにすることでサ
ーバの処理負荷を減らす点、サーバとクライアント間の
データのやりとりの回数を減らすことでネットワーク通
信量を削減する点などが効果として挙げられている。す
なわち、複数候補をもった曖昧性を含むデータすべてを
クライアントコンピュータ側に出力することにより、ク
ライアントコンピュータ側は、利用者とのインタラクシ
ョンなどを通じて、より正しい候補に絞り込めることに
なる。
をクライアントコンピュータ側に送信するだけでは、ク
ライアントコンピュータ側の処理の負担が増すことにな
ってしまう。したがって、複数の言語処理システムを組
み合わせて新たなアプリケーションを作成しようとする
アプリケーションプログラマにとっては、その利便性が
著しく減退してしまうことになる。
の言語処理アプリケーションシステムにおいては、単独
の計算機で稼働するシステムが大半であったため、使用
することのできる計算機システムやオペレーティングシ
ステムが限定されるという問題点があった。
ものであり、ある言語処理システムが出力したデータを
他の言語処理システムやアプリケーションシステムの入
力とする際に、そのデータ変換をサポートするといっ
た、言語処理固有の曖昧性を含む言語処理システム相互
間のデータ授受の制御を吸収して、システム構築の労力
を大幅に軽減する言語処理装置および言語処理方法を提
供することを目的とする。
は、それぞれに別個の計算機上で動作可能な複数種類の
言語処理システムを有する言語処理装置において、前記
複数種類の言語処理システム相互間の依存関係を定義す
る記述言語を記憶する記憶手段と、この記憶手段に記憶
された記述言語を解釈する解釈手段と、この解釈手段の
解釈にしたがって、前記各言語処理システムを実行する
とともに前記各言語処理システム相互間のデータの授受
を制御する実行手段と、前記各言語処理システムが複数
候補をもった曖昧性を含むデータを出力した際に、これ
らの複数候補の中からいずれかの候補を選択する選択処
理実行手段とを具備してなることを特徴とする。
に別個の計算機上で動作可能な複数種類の言語処理シス
テムを有する言語処理装置に適用される言語処理方法で
あって、前記複数種類の言語処理システム相互間の依存
関係を定義する記述言語を解釈し、この解釈にしたがっ
て、前記各言語処理システムを実行するとともに前記各
言語処理システム相互間のデータの授受を制御し、前記
各言語処理システムが複数候補をもった曖昧性を含むデ
ータを出力した際に、これらの複数候補の中からいずれ
かの候補を選択することを特徴とする。
によれば、言語処理に本質的な曖昧性のあるデータをサ
ーバコンピュータとクライアントコンピュータとの間で
授受できるようにするとともに、データ授受の制御は言
語記述または装置に隠蔽される。
組み合わせたアプリケーションシステムが簡便に構築で
きるようになり、また、アプリケーション作成の手間が
大幅に軽減されることとなる。
実施形態を説明する。なお、同実施形態では、たとえば
OCR機能を持つ全文検索システムなどのように、複数
の言語処理システムを利用して実現されるアプリケーシ
ョンシステムを言語処理装置の対象とする。
能ブロック図である。図1に示すように、同実施形態の
言語処理装置1は、利用可能な言語処理サーバ(言語処
理システム7a〜7b)を定義した言語処理サーバ定義
部2、言語処理サーバ相互間の依存関係を定義する記述
言語で記述される言語記述を格納する記述言語記憶部
3、この記述言語記憶部3に格納された言語記述にした
がって解釈を行なう解釈部4、この解釈部4が解釈した
結果に基づいて複数の言語処理サーバの実行処理を行な
う実行部5、およびこの実行の際に必要となるライブラ
リ関数を格納した実行ライブラリ格納部8からなる。な
お、同実施形態では、記述言語記憶部3に格納されてい
る言語記述にしたがって逐次実行するインタプリタ形式
を例に説明する。
記述の例を示す。図2において、「EJtrans 」は、英語
から日本語への機械翻訳、「OCR 」は、文字認識、「VS
ynth」は、音声合成、「VRecog」は、音声認識、および
「Rewrite 」は、正しい文への書き換え処理をそれぞれ
意味している。なお、これらは実行部5がアクセス可能
な言語処理システムの名前である。
述言語の予約語として予め定義されたものである。「$b
est 」は、入力に対して、第1番目の候補だけを出力す
る機能を表現しており、「$interact 」は、複数候補の
入力に対して、ユーザにメニューなどを提示して選ばせ
る機能を表現している。そして、これらの実行ライブラ
リはあらかじめ実行ライブラリ格納部8に格納されてい
る。
ぞれ以下のことを表現している。 (1)機械翻訳の第1位の結果を音声合成に引き渡す。 (2)文字認識の結果すべてを「Rewrite 」に引渡し、
さらに「Rewrite 」の出力を機械翻訳に引き渡す。 (3)音声認識の結果をユーザにメニューで表示し、複
数候補のいずれかをユーザに選ばせる。 (4)機械翻訳の結果、上位5位までを音声合成に引き
渡す。 (5)機械翻訳の結果すべてを音声合成に引き渡す。
て、実行部5が実行可能なように解釈される。図3に言
語処理サーバ定義部2に記述される言語処理サーバ記述
を示す。
義では、言語処理サーバ名、実行オブジェクト、および
入出力の形態がそれぞれ記述される。たとえば、英語か
ら日本語への機械翻訳では、言語処理サーバ名が「EJtr
ans 」、実行オブジェクトが「MT -d ej」、および実行
オブジェクトへの入力と出力とがともに文字型であるこ
とを表している(図3の(1))。また、文字認識の
「OCR 」では、実行オブジェクトが「adr 」、入力がイ
メージ型、および出力が文字型であることを表している
(図3の(2))。
述されている定義にしたがって、実行オブジェクトを実
行部5に伝達する。そして、実行部5は、対応する言語
処理サーバを起動して実行する。
4では、図2に示したような記述言語を項単位で順次読
み込み、言語処理サーバ相互間の情報授受テーブルを生
成する。この情報授受テーブルには、情報の出力側であ
るancestor(AS)と、情報の入力側であるdescendant
(DS)との対が格納される。
ると、まず始めの項として「EJtrans 」が読み込まれて
ITEMに設定される(図4のステップA2)。この「EJtr
ans」は、言語処理サーバ定義部2に定義された言語処
理サーバであるので(図4のステップA3のY)、DS
には「EJtrans 」が設定される(図4のステップA
4)。
NULLであるので(図4のステップA5のY)、情報授受
テーブルへの出力は行われず、次の項を読むステップに
処理が進む。
る。したがって、変数ASに、変数DSに格納されてい
る「EJtrans 」がコピーされ(図4のステップA8)、
次の項を読むステップに処理が進む。
設定されるのは、「$best 」である。これは、実行ライ
ブラリ名であるので(図4のステップA3のN,図4の
ステップA6のY)、変数DSにこの値「$best 」が設
定される(図4のステップA4)。この時点では、変数
ASに設定されている値は「EJtrans 」であるので(図
4のステップA5のN)、ASとDSとの対、すなわち
「EJtrans 」と「$best 」との対が、情報授受テーブル
に出力される(図4のステップA10)。
示すような情報授受テーブルが生成される。なお、2つ
の言語処理サーバ間での情報授受が行われるような場
合、たとえば、図2の(2)における「OCR 」と「Rewr
ite 」のような場合には、入出力タイプの整合性のチェ
ックが行われ(図4のステップA9)、整合しない場合
にエラーとなる。
報授受テーブルにしたがって、実行部5は処理を行な
う。図6に実行部5の動作手順を示す。
ている情報出力側の言語処理サーバまたは実行ライブラ
リからのイベントを受け取り(図6のステップB3の
Y)、そのイベントが出力イベントである場合に(図6
のステップB5のY)、その出力イベントを発生した言
語処理サーバまたは実行ライブラリから、それに対して
情報授受テーブルに格納されているdescendantとなって
いる言語処理サーバまたは実行ライブラリへと、データ
の転送を行なう(図6のステップB6)。
されるまで、出力イベントが発生する度にこの処理を行
なう。図7に各言語処理サーバが出力するデータの形式
の一例を示す。
に示すようなラティス構造を表現するために、ラティス
構造中の各ノードのデータ本体、およびノード同士を結
合するためのポインタからなっている。
力データ全体のデータ長が記述されるフィールドであ
る。また、「COUNT 」は、ラティス構造の開始ノードの
個数が記述されるフィールドであり、「COUNT 」分のポ
インタが「P1」、「P2」〜「Pcount」のフィールドに記
述される。ポインタ「P1」によって参照できる「LENGTH
1 」のフィールドには、ポインタ「P1」で参照されてい
るノードのデータの長さ、「SCORE1」にはそのノードの
スコア、「DATALENGTH1」にはそのノードのデータ本体
の長さ、「DATA1 」にはデータ本体、「COUNT1」にはそ
のノードの接続ノードとなるノードへのポインタの個数
がそれぞれ記述される。また、後続ノードへの「COUNT
1」分のポインタが「P11 」、「P12 」〜「P1count 」
のフィールドに記述される。
ータを表現する場合に、唯一の候補しかない場合であっ
ても、そのデータを表現することは可能である。たとえ
ば、「I LOVE YOU. 」という文字列が唯一の候補である
場合、以下のようなデータが出力されることになる(な
お、「I 」、空白、「l 」、「o 」、「v 」、「e 」、
空白、「y 」「o 」、「u 」、「. ]のそれぞれの文字
コードは、0x49、0x20、0X6c、0x6f、0x76、0x65、0x2
0、0x6f、0x75、0x2eであるとする)。 001a 0001 0006 0014 0010 000c 4920 6c6f 7665 2079 6f75 2e00 0000 上述してきたように、各言語処理サーバが出力するデー
タには曖昧性を含むことが多い。そこで、同実施形態で
は、最良解を求める処理モジュールやユーザとインタラ
クションにより最良解を求めるモジュールを実行ライブ
ラリとして提供する。
れぞれ設定されている。そこで、最良解を求めるモジュ
ールである「$best 」では、各ノードに設定されたスコ
アに基づいて最良解を求めるといった一般的な問題を処
理することになる。このような問題を解くアルゴリズム
としては、たとえばダイナミックプログラミングアルゴ
リズムを利用することが可能である。
うモジュール「$interact 」の動作手順を示す。なお、
同実施形態では、入力と出力だけからなる記述言語に関
する例を示したが、UNIXのshell などで実現されている
ように、記述言語において、「if-then」や「do whil
e」、および「case switch 」などの制御構造を持つよ
うに拡張することは容易である。したがって、これらの
制御構造をもたせた記述言語を処理できるように解釈部
4を拡張することも容易である。
により言語処理サーバ相互間の関係記述を行なう例につ
いて説明する。図9に支援システム11の構成を示す。
支援システム11は、言語処理サーバの定義を記述する
言語処理サーバ定義部2、言語処理サーバ相互間の依存
関係を定義する記述言語で記述される言語記述を格納す
る記述言語記憶部4、登録されている言語処理サーバの
一覧表示や、それらの間の関係記述を表示する表示部1
2、ユーザからの入力を受け付ける入力部13、および
これらの処理部を制御する制御部14からなる。
示す。この例では、言語処理サーバの一覧を表示する言
語処理一覧、選択処理の一覧を表示する選択処理一覧、
および言語処理サーバ間の関係を記述する定義ウインド
ウからなっている。
順を示す。すなわち、制御部14は、表示部12により
言語処理一覧および選択処理一覧を表示して(図11の
ステップD1〜D2)、この表示にしたがってユーザが
指定する内容を入力部13から取り込み、言語処理サー
バ間の関係を記述言語記憶部4に格納する(図11のス
テップD17)。
は選択処理一覧に表示されている処理リストから利用し
たい処理を選択し、定義ウインドウ上でそれらの間の組
合わせ処理を定義することが可能となる。
装置および言語処理方法によれば、言語処理固有の曖昧
性を含む出力データに対する選択処理と、複数の言語処
理システム相互間の結合とが簡単に行えるようになり、
システム構築の労力を大幅に軽減することができること
となる。
の機能ブロック図。
記述の例を示す図。
る言語処理サーバ記述を示す図。
ャート。
ャート。
タの形式の一例を示す図。
なうモジュール「$interact 」の動作手順を示すフロー
チャート。
す図。
チャート。
チャート。
述言語記憶部、4…解釈部、5…実行部、6…言語処理
システム群、7a,7b…言語処理システム、8…実行
ライブラリ格納部、11…支援システム、12…表示
部、13…入力部、14…制御部。
Claims (4)
- 【請求項1】 それぞれに別個の計算機上で動作可能な
複数種類の言語処理システムを有する言語処理装置にお
いて、 前記複数種類の言語処理システム相互間の依存関係を定
義する記述言語を記憶する記憶手段と、この記憶手段に
記憶された記述言語を解釈する解釈手段と、この解釈手
段の解釈にしたがって、前記各言語処理システムを実行
するとともに前記各言語処理システム相互間のデータの
授受を制御する実行手段と、前記各言語処理システムが
複数候補をもった曖昧性を含むデータを出力した際に、
これらの複数候補の中からいずれかの候補を選択する選
択処理手段とを具備してなることを特徴とする言語処理
装置。 - 【請求項2】 前記各言語処理システム相互間で授受さ
れるデータは、ラティス構造であることを特徴とする請
求項1記載の言語処理装置。 - 【請求項3】 利用可能な言語処理システムを一覧表示
する表示手段と、この一覧表示された言語処理システム
の中から所望の言語処理システムを選択する選択手段
と、この選択された言語処理システム相互間の依存関係
を入力する入力手段とを有するユーザ支援システムをさ
らに具備してなることを特徴とする請求項1記載の言語
処理装置。 - 【請求項4】 それぞれに別個の計算機上で動作可能な
複数種類の言語処理システムを有する言語処理装置に適
用される言語処理方法であって、 前記複数種類の言語処理システム相互間の依存関係を定
義する記述言語を解釈し、この解釈にしたがって、前記
各言語処理システムを実行するとともに前記各言語処理
システム相互間のデータの授受を制御し、前記各言語処
理システムが複数候補をもった曖昧性を含むデータを出
力した際に、これらの複数候補の中からいずれかの候補
を選択することを特徴とする言語処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19470295A JP3469366B2 (ja) | 1995-07-31 | 1995-07-31 | 言語処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19470295A JP3469366B2 (ja) | 1995-07-31 | 1995-07-31 | 言語処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0944479A true JPH0944479A (ja) | 1997-02-14 |
JP3469366B2 JP3469366B2 (ja) | 2003-11-25 |
Family
ID=16328849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19470295A Expired - Lifetime JP3469366B2 (ja) | 1995-07-31 | 1995-07-31 | 言語処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3469366B2 (ja) |
-
1995
- 1995-07-31 JP JP19470295A patent/JP3469366B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3469366B2 (ja) | 2003-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5211563A (en) | Computer assisted learning support system and processing method therefor | |
US7681119B2 (en) | Method and apparatus for providing a graphical user interface for creating and editing a mapping of a first structural description to a second structural description | |
US5485544A (en) | History sensitive help control method and system | |
US5630126A (en) | Systems and methods for integrating computations into compound documents | |
US5606702A (en) | Method for specifying user interfaces and programming system running a multiple user interface computer | |
US6009436A (en) | Method and apparatus for mapping structured information to different structured information | |
US7634720B2 (en) | System and method for providing context to an input method | |
EP1073953B1 (en) | Computer architecture using self-manipulating trees | |
JPH1055269A (ja) | 情報処理装置 | |
KR20050039551A (ko) | 컴퓨터 플랫폼용 프로그래밍 인터페이스 | |
JPH0831058B2 (ja) | ハイパーメディア・システム及びハイパーメディア・システムで実施されるリンク・マーカ操作方法 | |
EP1280055B1 (en) | Method and computer system for creating and processing a browser compliant human interface description | |
US5682542A (en) | Language processing system using object networks | |
EP1909170B1 (en) | Method and system for automatically generating a communication interface | |
JP3349568B2 (ja) | データベースへの単語記憶方法、データベースへの単語追加装置及び語彙トランスジューサの作成及び修正方法 | |
JPH0475182A (ja) | データ駆動型情報処理装置 | |
JPS6250931A (ja) | パラメ−タ・テ−ブルの利用方式 | |
WO1992017838A1 (en) | Method for specifying user interfaces and programming system running a multiple user interface type computer | |
JP3469366B2 (ja) | 言語処理装置 | |
EP1862924A1 (en) | Object-oriented system for mapping structered information to different structured information | |
KR100275607B1 (ko) | 다단식 전치 처리기 시스템 | |
JP3526616B2 (ja) | データ検索装置 | |
JP3294691B2 (ja) | オブジェクト指向システム構築方法 | |
JP3449256B2 (ja) | クライアント/サーバアプリケーション作成方法及びその装置並びに情報記録媒体 | |
JP2003296327A (ja) | 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070905 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080905 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080905 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090905 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090905 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100905 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100905 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110905 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120905 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120905 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130905 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term |