JPH1139306A - 多言語情報の処理システムおよび処理方法 - Google Patents

多言語情報の処理システムおよび処理方法

Info

Publication number
JPH1139306A
JPH1139306A JP9191571A JP19157197A JPH1139306A JP H1139306 A JPH1139306 A JP H1139306A JP 9191571 A JP9191571 A JP 9191571A JP 19157197 A JP19157197 A JP 19157197A JP H1139306 A JPH1139306 A JP H1139306A
Authority
JP
Japan
Prior art keywords
language
document
unit
input
input document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9191571A
Other languages
English (en)
Inventor
Franz Alexander
フランヅ アレキサンダー
Keiko Horiguchi
恵子 堀口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9191571A priority Critical patent/JPH1139306A/ja
Publication of JPH1139306A publication Critical patent/JPH1139306A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】入力文書の言語が母国語でない場合や入力文書
が大量である場合でも、ユーザによって入力文書中の情
報を容易に理解可能にする。 【解決手段】入力文書の要約部、さらには入力文書やそ
の要約結果を他の自然言語に翻訳する翻訳部を備える。
ローカル又はリモートの情報源から入力文書(ファクシ
ミリ文書、電子メイル文書、指定ファイル等)を受領し
(ST1)、この入力文書に対して言語の判定や分野を、i
f-then推論規則や統計情報を使用して判定する(ST2,ST
3)。入力文書に対して要約が必要であるときは、要約
部によって要約を作成する(ST4,ST5)。この要約は、
例えばテンプレートのスロットを埋めることで作成す
る。また、入力文書や要約結果に対して他の言語への翻
訳が必要であるときは、翻訳部によって翻訳を作成する
(ST6,ST7)。そして、言語判定結果、分野判定結果、
要約結果、翻訳結果等を、ローカルまたはリモートのユ
ーザに送る(ST8)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、多くの自然言語
で構成された文書に記載された大量の情報を取り扱う際
に適用して好適な多言語情報の処理システムおよび処理
方法に関する。詳しくは、入力文書を要約する機能、さ
らには入力文書やその要約を他の自然言語に翻訳する機
能を持たせることによって、文書中の情報をユーザが容
易に理解し得るようにした多言語情報処理システム等に
係るものである。
【0002】
【従来の技術】情報を含有する文書を受け取り、データ
ベースに保存し、様々な基準に基づいて抽出してユーザ
に表示するデータベースシステムまた手法はすでに存在
する(例えば、Salton,Gerard;and McGill,MichaeI J.1
983. "Introduction to Modernlnformation Retrieva
l." New York:McGraw-HiII.参照)。
【0003】このようなデータベースシステムにおい
て、関係する文書が大量にあったり非常に長いものであ
った場合、ユーザはすべてを読んで内容を理解すること
ができない場合があった。さらにデータベースに保存さ
れている文書がユーザの理解し得ない言語で書かれてい
る場合には、その文書の情報を理解することも不可能で
あった。文書を受け取り、他の自然言語に翻訳し、結果
をユーザに表示する自動翻訳システムや手法もすでに存
在する(例えば、US Patent 5528491 ″Apparatus and
method for automated natural language translatio
n″参照)。
【0004】しかし、もとの文書が大量にあったり非常
に長いものであった場合、ユーザはすべての翻訳結果を
読み、もとの文書に書かれていた情報をすべて理解する
ことは困難であった。さらに、自動翻訳システムによる
出力の質はいまだに高くはなく、人間が書いた文章に比
べてほとんど常に劣っている。そのため、自動翻訳シス
テムからの出力を人間が書いた文章のようにすばやく読
んで理解することは非常に難しい。結果として、自動翻
訳された文書を読むのにはさらに長い時間がかかり、情
報管理の問題をさらに悪化させている。
【0005】自動翻訳システムによってある言語から他
の言語に文書を翻訳し、結果を自動的に音声合成してユ
ーザに提示する手法やシステムもすでに存在する。その
ように翻訳・合成された結果を理解しやすくする技術も
開発されている。例えば、USpatent 5546500 ″Arrang
ement for increasing the comprehension of speech w
hen translating speech from a first language to a
second language″には、入力音声の韻律情報を出力音
声に転写させる技術が書かれている。 しかし、ある言語から他の言語への自動翻訳結果には、
語や句の誤選択、誤削除、文法上の誤りなど、様々な誤
りが含まれている。そのような誤りを含んだまま音声出
力が合成された場合、ユーザには不自然な音声となり、
長い間注意を集中して内容を聴き取り理解することはき
わめて難しい作業となる。さらに、すぐ前の部分を簡単
に読み返すことの出来る文書と異なり、音声で出力され
た場合には、前に読まれた単語や句、文などを聞き返す
ことが容易には出来ない。さらに、いわゆる「斜め読
み」をして要点をつかむことの出来る文書と異なり、音
声で出力された場合には、とばして速く要点をつかむこ
とができない。
【0006】SGML(Standard Generalized Markup
Language)やHTML(HypertextMarkup Language)の
ようなタグのついた文書を翻訳する自動翻訳システムに
ついては、例えば、US Patent 5548508 ″Machine Tra
nslation apparatus for translating document with t
ag″に示されている。
【0007】この装置は、文書中のSGMLタグを判別
し、文書に追加すべき情報を明記した定義ファイルを参
照しながら、文書に必要な情報を追加する。この装置は
情報を追加するのみであり、SGMLタグから文書の特
徴やメタ情報を判別したりすることはなく、そのような
文書の特徴やメタ情報を独立した記憶バッファに保存す
るようなこともせず、文書の特徴やメタ情報をのちの情
報システムでのプロセスの中で用いることもせず、文書
の特徴やメタ情報を使って、複数の翻訳部の中から適切
な処理部を選択するのに使用することもせず、文書の特
徴やメタ情報を使って、複数の翻訳用データベースの中
から適切なものを選択するのに使用することもしない。
【0008】入力文書の全体または一部を翻訳する機械
翻訳システムは、例えば、US Patent 4814988 ″Machi
ne Translation system translating all or a selecte
d portion of an input sentence″に示されている。こ
のシステムは、入力文書の全体を必ずしも翻訳しない。
そのかわり、ユーザに翻訳してほしい部分を指示させ、
その部分のみ翻訳することが出来る。また、ユーザに翻
訳して欲しくない部分を指示させ、その部分を除いて翻
訳することもできる。このようなシステムにおいて、ユ
ーザはもとの文書を理解し、どこが翻訳されるべきか
(またはされないべきか)を判定することができなけれ
ばならない。さらにユーザは翻訳する部分を確定するた
めにもとの文章をもとの言語で読まなければならない。
【0009】文書を分類するシステムと手法は、例え
ば、US Patent 5182708 ″Method and Apparatus for
classifying text″に示されている。この手法は、文書
を様々なカテゴリーに分類するために、文書中の異なる
単語数や単語の長さに基づく統計手法を用いる。この手
法はある力テゴリーに特徴的な特定の単語やパターンを
考慮に入れてはおらず、SGMLやHTMLのタグで表
されたような注釈を考慮に入れてもいない。
【0010】テーマにより文書を要約する手法とシステ
ムは、例えば、US Patent 5384703″Method and appara
tus for summarizing documents according to theme″
に示されている。この手法では、再帰的に文書中の一部
を選択していくことにより要約を作成する。選択するの
は、まず文書中にもっとも頻繁に表れる表現を探し、そ
の表現を含む部分からである。この手法では、頻繁には
表れないが文書中の重要な部分を示唆するパターンなど
を利用することはできない。さらに分野に特有のパター
ンや規則も利用しない。
【0011】単語コードを使用した言語/分野判定手法
は、例えば、US Patent 5546507″Language identifica
tion process using coded language words″に示され
ている。この手法では、特定の言語や分野を示唆する単
語の表れる頻度を加算して行き、加算結果のもっとも多
い言語または分野を選択する。この手法は文書自体に含
まれているSGMLやHTMLタグのようなメタ情報を
利用したり、言語や分野を特定するためのif-then推定
規則を利用したりはしない。
【0012】
【発明が解決しようとする課題】我々は文章の形での膨
大な量の情報に毎日接している。電子メイル、ワールド
ワイドウェブのぺージ上の文書、ファクシミリからの文
書、データベースの文書、その他様々なところからの情
報が文書の形でやってくる。さらにそれら文書は異なる
自然言語で書かれている。国際ビジネス、ワールドワイ
ドウェブのような全地球的な情報ネットワーク、ファク
シミリや電子メイルのような国際通信などの発達に伴
い、母国語以外で書かれた文書に接する機会も増えてい
る。このような状況で文書中の情報量が多すぎてすべて
を理解するのが不可能であったり、外国語で書かれてい
るために内容を理解するのが不可能であるといった問題
が発生する。
【0013】そこで、この発明では、文書中の情報をユ
ーザが容易に理解し得るようにした多言語情報処理シス
テム等を提供することを目的とする。
【0014】
【課題を解決するための手段】この発明に係る多言語情
報処理システムは、自然言語で書かれた入力文書を受領
する文書受領手段と、この入力文書の言語を判定する言
語判定手段と、この言語判定手段の言語判定結果を利用
し、入力文書の要約を作成する要約作成手段とを備える
ものである。
【0015】また、この発明に係る多言語情報処理方法
は、自然言語で書かれた入力文書を受領する文書受領ス
テップと、入力文書の言語を判定する言語判定ステップ
と、言語判定ステップの言語判定結果を利用し、入力文
書の要約を作成する要約作成ステップとを備えるもので
ある。
【0016】この発明においては、自然言語で書かれた
入力文書が受領される。この場合、ユーザからの入力の
仕様に含まれる入手場所の指定情報で指定される入手場
所、例えばファクシミリ、電子メイル、ファイルまたは
データベース等からの入力文書が受領される。そして、
この入力文書の言語の判定が行われる。この言語の判定
では、例えばif-then推論規則が適用されて候補言語が
ランキングされる。
【0017】そして、言語の判定結果を利用し、入力文
書の要約が作成される。例えば、要約は、要約テンプレ
ートを用いて作成され、あるいは規則および統計情報を
用いて作成される。要約テンプレートを用いて要約を作
成する場合、ユーザからの要約の仕様で指定された要約
テンプレートがデータベースより読み出されて使用さ
れ、あるいはデータベースより入力文書に最適な要約テ
ンプレートが読み出されて使用される。規則および統計
情報を用いて要約を作成する場合、ユーザからの要約の
仕様に含まれる要約率や要約結果の長さの情報に適合す
るように入力文書の要約が行われる。
【0018】入力文書またはその要約を、他の自然言語
に翻訳する翻訳手段を備えていてもよい。これにより、
例えば入力文書やその要約結果をユーザの理解可能な所
望の言語に翻訳することが可能となる。そして、要約結
果や翻訳結果は、例えばユーザの指示によってローカル
またはリモートの設備に送信される。
【0019】
【発明の実施の形態】以下、図面を参照しながら、この
発明の実施の形態を説明する。図1は、実施の形態とし
ての、多言語情報処理システム10の構成を示してい
る。この処理システム10は、出入力インタフェース部
100と、CPU(central processingunit)200
と、記憶装置300とを有して構成されている。
【0020】出入力インタフェース部100は、電話回
線に接続するための電話回線インタフェース101と、
LAN(Local Area Network)等のネットワークに接続
するためのネットワークインタフェース102と、各種
の仕様等をユーザがキー入力するためのキーボード10
3と、その各種の仕様等をユーザが音声で入力するため
のマイクロフォン104と、各種の仕様等をモニタの画
面上で入力するためのマウスやタッチスクリーン等10
5と、処理システム10の状態や処理結果等を表示する
液晶素子等で構成されるモニタ106とを有している。
【0021】CPU200は、実質的に以下の機能部を
有している。すなわち、CPU200は、出入力インタ
フェース部100との間で様々なデータのやり取りを行
うためのユーザインタフェース部201と、マイクロフ
ォン104より入力される音声を認識するための音声認
識部202と、この音声認識部202の認識結果やユー
ザのキーボード103からの入力言語を理解してシステ
ム言語コマンドに翻訳するための自然言語理解部203
と、後述するように要約結果や翻訳結果を電話に送信す
るために音声信号を合成する音声合成部204とを有し
ている。そして、ユーザインタフェース部201には、
出入力コントロール部205と、エラーメッセージを生
成するエラーメッセージ生成部206が備えられてい
る。
【0022】また、CPU200は、後述する言語判
定、分野判定、要約および翻訳の対象となる入力文書を
受領するための入力受領部211と、後述する要約結果
や翻訳結果をユーザが指定する場所に送信するための出
力部212と、入力文書の言語を判定する言語判定部2
13と、入力文書の分野を判定する分野判定部214
と、入力文書の要約を作成する要約部215と、入力文
書やその要約結果を他の自然言語に翻訳する翻訳部21
6と、これら入力受領部211、出力部212、言語判
定部213、分野判定部214、要約部215および翻
訳部216の動作を制御する中央制御部217とを有し
ている。
【0023】図2のフローチャートを使用して、処理シ
ステム10の動作概要を説明する。まず、ステップST
1で、入力受領部211によってローカルまたはリモー
トの情報源からの入力文書を受領し、この入力文書を記
憶装置300の記憶バッファ301に記憶する。次に、
ステップST2で、言語判定部212によって、記憶バ
ッファ301に記憶した入力文書の言語を判定し、その
判定結果を記憶装置300の記憶バッファ302に記憶
する。
【0024】次に、ステップST3で、分野判定部21
4によって、記憶バッファ301に記憶した入力文書の
分野を判定し、その判定結果を記憶装置300の記憶バ
ッファ303に記憶する。次に、ステップST4で、要
約が必要か否かを判定し、必要であるときは、ステップ
ST5で、要約部215によって、記憶バッファ302
に記憶した言語判定結果を利用し、記憶バッファ301
に記憶した入力文書の要約を作成し、その要約結果を記
憶装置300の記憶バッファ304に記憶する。
【0025】次に、ステップST6で、入力文書または
記憶バッファ305に記憶した要約結果の翻訳が必要か
否かを判定し、必要であるときは、ステップST7で、
翻訳部216によって、入力文書または要約結果を他の
自然言語に翻訳し、その翻訳結果を記憶装置300の記
憶バッファ305に記憶する。次に、ステップST8
で、出力部212によって、記憶バッファ302〜30
5等に記憶した言語判定結果、分野判定結果、要約結
果、翻訳結果等を、ローカルまたはリモートのユーザに
送る。
【0026】なお、記憶装置300には、上述したよう
にマイクロホン104を使用して音声入力され、あるい
はキーボード103よりキー入力されるユーザからの仕
様を記憶する記憶バッファ306も設けられている。
【0027】図3は、入力受領部211の構成を示して
いる。この入力受領部211は、全体の動作を制御する
入力受領制御部211aと、記憶装置300の記憶バッ
ファ306より、入力仕様を抽出して入力受領制御部2
11aに供給するユーザ仕様抽出部211bと、入力文
書として電子メイル文書を受領するための電子メイル受
領部211cと、入力文書としてSGML/HTML文
書を受領するためのSGML/HTML受領部211d
と、ローカルまたはリモートのファイルやデータベース
から指定ファイルを受領するファイル/データベース受
領部211eとを有している。
【0028】また、入力受領部211は、入力文書とし
てファクシミリ文書を受領するためのファクシミリ受領
部211fを有している。このファクシミリ受領部21
1fは、全体の動作を制御するファクシミリ入力受領制
御部211gと、記憶装置300の記憶バッファ306
より、言語仕様を抽出して入力受領制御部211gに供
給するユーザ仕様抽出部211hと、イメージデータを
テキストデータに変換するための言語1〜言語nのため
のn個の文字認識部211k1〜211knとを有してい
る。
【0029】図4のフローチャートを使用して、入力受
領部211の動作を説明する。ステップST11で、入
力文書の入手場所を指定するユーザからの入力仕様を取
得する。この場合、ユーザ仕様抽出部211bは、記憶
装置300の記憶バッファ306より入力仕様を抽出
し、この入力仕様を入力受領制御部211aに供給す
る。そして、ステップST12で、入力仕様がファクシ
ミリ文書の受領を指定しているか否かを判定する。ファ
クシミリ文書の受領を指定しているときは、ステップS
T13で、後述するファクシミリ文書の受領動作をす
る。
【0030】ステップST12でファクシミリ文書の受
領を指定していないときは、ステップST14で、電子
メイル文書の受領を指定しているか否かを判定する。電
子メイル文書の受領を指定しているときは、ステップS
T15で、電子メイル受領部211cによって、出入力
コントロール部205を介して指定の電子メイル文書
(テキストデータ)を受領する。そして、ステップST
16で、受領した電子メイル文書を入力文書として記憶
装置300の記憶バッファ301に記憶する。
【0031】ステップST14で電子メイル文書の受領
を指定していないときは、ステップST17で、SGM
L/HTML文書の受領を指定しているか否かを判定す
る。SGML/HTML文書の受領を指定しているとき
は、ステップST18で、SGML/HTML受領部2
11dによって、ローカルまたはリモートにあるSGM
LやHTMLのファイルより、出入力コントロール部2
05を介して、指定のSGML文書やHTML文書(テ
キストデータ)を受領する。そして、ステップST19
で、受領したSGML文書やHTML文書を入力文書と
して記憶バッファ301に記憶する。
【0032】ステップST17でSGML/HTML文
書の受領を指定していないときは、ステップST20で
ファイルやデータベースからの入力を指定するものであ
るか否かを判定する。ファイルやデータベースからの入
力を指定するものであるときは、ステップST21で、
ファイル/データベース受領部211eによって、ロー
カルまたはリモートにあるファイルやデータベースよ
り、出入力コントロール部205を介して、指定のファ
イル(テキストデータ)を受領する。そして、ステップ
ST22で、受領したファイルを入力文書として記憶バ
ッファ301に記憶する。
【0033】ステップST20で、ファイルやデータベ
ースからの入力を指定するものでないときは、ステップ
ST23で、入力受領制御部211aは中央制御部21
7にエラー情報を送る。これにより、中央制御部217
よりユーザインタフェース部201にエラー情報が供給
され、エラーメッセージ部206でエラーメッセージが
生成され、例えば出入力インタフェース部100のモニ
タ106にエラーメッセージが表示される。
【0034】図5のフローチャートを使用して、ファク
シミリ文書の受領動作を説明する。ステップST31
で、ファクシミリ受領部211fによって、出入力コン
トロール部205を介して、ファクシミリ文書(イメー
ジデータ)を受領する。そして、ステップST32で、
ユーザ仕様抽出部211hによって、ファクシミリ文書
の自然言語を示すユーザからの言語仕様を取得する。こ
の場合、ユーザ仕様抽出部211hは、記憶装置300
の記憶バッファ306より言語仕様を抽出し、この言語
仕様をファクシミリ入力受領制御部211gに供給す
る。
【0035】次に、ステップST33-1〜33-nで、そ
れぞれ言語仕様で示される自然言語が言語1〜言語nで
あるか否かを判定する。そして、言語1〜言語nである
ときは、それぞれステップST34-1〜34-nで、文字
認識部211k1〜211knによって、受領したファク
シミリ文書(イメージデータ)に対する言語1〜言語n
の文字認識を実行する。そして、ステップST35で、
文字認識されてテキストデータに変換されたファクシミ
リ文書を入力文書として記憶バッファ301に記憶す
る。
【0036】一方、言語仕様で示される自然言語が言語
1〜言語nのいずれでもないときは、ステップST36
で、ファクシミリ入力受領制御部211gは入力受領制
御部211aにエラー情報を送る。これにより、中央制
御部217よりユーザインタフェース部201にエラー
情報が供給され、エラーメッセージ部206でエラーメ
ッセージが生成され、例えば出入力インタフェース部1
00のモニタ106にエラーメッセージが表示される。
【0037】図6は、言語判定部213の構成を示して
いる。この言語判定部213は、全体の動作を制御する
言語判定制御部213aと、記憶装置300の記憶バッ
ファ306より、入力文書の言語を示す言語仕様を抽出
して言語判定制御部213aに供給するユーザ仕様抽出
部213bと、記憶装置300の記憶バッファ301に
記憶されている入力文書を、SGMLやHTMLのタ
グ、その他のデータ、単語、句、文、その他のユニット
に分割する文章分割部213cとを有している。
【0038】また、言語判定部213は、入力文書に含
まれる、その入力文書の言語を示す注釈やタグを解析し
て入力文書の言語を判定するタグ等解析部213dと、
入力文書の特定の単語、句やパターンが存在するか否か
によって文書がどの言語で書かれている確率が高いか
を、規則データベース213eからのif-then推論規則
データを適用して判定し、候補言語をランキングする規
則による言語判定部213fと、1また複数バイトのパ
ターンの起こる頻度(n-grams)とそれぞれの言語との
相関関係を示す統計データベース213gからの統計情
報を利用し、入力文書中のパターンの起こる頻度と比較
し、その結果を用いて候補言語のランキングを調整し、
最上位ランキングの言語を判定結果とする統計情報によ
る言語判定部213hとを有している。
【0039】図7のフローチャートを使用して、言語判
定部213の動作を説明する。ステップST41で、文
章分割部213cによって、記憶バッファ301に記憶
されている入力文書をSGMLやHTMLのタグ、その
他のデータ、単語、句、文、その他のユニットに分割
し、その分割済入力文書を記憶装置300の記憶バッフ
ァ307に記憶する。
【0040】次に、ステップST42で、記憶バッファ
307に記憶している分割済み入力文書に基づき、入力
文書に、その言語を示す注釈やタグを含むか否かを判定
する。言語を示す注釈やタグを含むときは、ステップS
T43で、タグ等解析部213dによって、注釈やタグ
から入力文書の言語情報を取得し、ステップST44
で、その取得した言語情報を言語判定結果として記憶装
置300の記憶バッファ302に記憶する。
【0041】ステップST42で言語を示す注釈やタグ
を含まないときは、ステップST45で、ユーザが言語
仕様を入力したか否かを判定する。言語仕様を入力して
いるときは、ステップST46で、ユーザ仕様抽出部2
13bによって、記憶装置300の記憶バッファ306
より言語仕様を抽出することで、ユーザからの言語情報
を取得し、ステップST44で、その取得した言語情報
を言語判定結果として記憶装置300の記憶バッファ3
02に記憶する。
【0042】次に、ステップST45でユーザが言語仕
様を入力していないときは、ステップST47で、規則
による言語判定部213fによって、記憶バッファ30
7に記憶している分割済み入力文書を利用し、if-then
推論規則により、入力文書に特定の単語、句やパターン
が存在するかどうかで、その入力文書がどの言語で書か
れている確率が高いかを判定し、候補言語をランキング
する。この候補言語のリストは、統計情報による言語判
定部213hに供給される。ここで、if-then推論規則
とは、「もしAがBであるならDという処理を実行し、
CであるならEという処理を実行する」といった、場合
分けをし、場合毎に実行すべき処理を規定する規則であ
る。
【0043】次に、ステップST48で、言語判定部2
13hによって、記憶バッファ307に記憶している分
割済み入力文書を利用し、入力文書中のパターンの起こ
る頻度と統計情報とを比較し、その結果を用いて候補言
語のランキングを調整し、最上位の候補言語を最も確か
らしい言語として選択する。そして、ステップST44
で、その選択された言語の情報を言語判定結果として記
憶装置300の記憶バッファ302に記憶する。
【0044】図8は、分野判定部214の構成を示して
いる。この分野判定部214は、全体の動作を制御する
言語判定制御部214aと、記憶装置300の記憶バッ
ファ306より、入力文書の分野を示す分野仕様を抽出
して分野判定制御部214aに供給するユーザ仕様抽出
部214bと、記憶装置300の記憶バッファ301に
記憶されている入力文書を、SGMLやHTMLのタ
グ、その他のデータ、単語、句、文、その他のユニット
に分割する文章分割部214cとを有している。
【0045】また、分野判定部214は、入力文書に含
まれる、その入力文書の言語を示す注釈やタグを解析し
て入力文書の分野を判定するタグ等解析部214dと、
入力文書の特定の単語、句やパターンが存在するか否か
によって文書がどの分野に属している確率が高いかを、
規則データベース214eからのif-then推論規則デー
タを適用して判定し、候補分野をランキングする規則に
よる分野判定部214fと、1また複数バイトのパター
ンの起こる頻度(n-grams)とそれぞれの分野との相関
関係を示す統計データベース214gからの統計情報を
利用し、入力文書中のパターンの起こる頻度と比較し、
その結果を用いて候補分野のランキングを調整し、最上
位ランキングの言語を判定結果とする統計情報による分
野判定部214hとを有している。
【0046】図9のフローチャートを使用して、分野判
定部214の動作を説明する。ステップST51で、文
章分割部214cによって、記憶バッファ301に記憶
されている入力文書をSGMLやHTMLのタグ、その
他のデータ、単語、句、文、その他のユニットに分割
し、その分割済入力文書を記憶装置300の記憶バッフ
ァ307に記憶する。
【0047】次に、ステップST52で、記憶バッファ
307に記憶した分割済み入力文書に基づき、入力文書
に、その分野を示す注釈やタグを含むか否かを判定す
る。分野を示す注釈やタグを含むときは、ステップST
53で、タグ等解析部214dによって、注釈やタグか
ら入力文書の分野情報を取得し、ステップST54で、
その取得した分野情報を分野判定結果として記憶装置3
00の記憶バッファ303に記憶する。
【0048】ステップST52で分野を示す注釈やタグ
を含まないときは、ステップST55で、ユーザが分野
仕様を入力したか否かを判定する。分野仕様を入力して
いるときは、ステップST56で、ユーザ仕様抽出部2
14bによって、記憶装置300の記憶バッファ306
より分野仕様を抽出することで、ユーザからの分野情報
を取得し、ステップST54で、その取得した分野情報
を言語判定結果として記憶装置300の記憶バッファ3
03に記憶する。
【0049】次に、ステップST55でユーザが分野仕
様を入力していないときは、ステップST57で、規則
による分野判定部214fによって、記憶バッファ30
7に記憶している分割済み入力文書を利用し、if-then
推論規則により、入力文書に特定の単語、句やパターン
が存在するかどうかで、その入力文書がどの分野に属す
る確率が高いかを判定し、候補分野をランキングする。
この候補分野のリストは、統計情報による分野判定部2
14hに供給される。
【0050】次に、ステップST58で、分野判定部2
14hによって、記憶バッファ307に記憶している分
割済み入力文書を利用し、入力文書中のパターンの起こ
る頻度と統計情報とを比較し、その結果を用いて候補分
野のランキングを調整し、最上位の候補分野を最も確か
らしい分野として選択する。そして、ステップST54
で、その選択された候補分野の情報を分野判定結果とし
て記憶装置300の記憶バッファ303に記憶する。
【0051】図10は、要約部215の構成を示してい
る。この要約部215は、全体の動作を制御する要約制
御部215aと、記憶装置300の記憶バッファ306
より、要約仕様を抽出して要約制御部215aに供給す
るユーザ仕様抽出部215bと、記憶装置300の記憶
バッファ301に記憶されている入力文書に対してテン
プレートを使って要約を作成するテンプレートによる要
約部219と、同様に入力文書に対して規則および統計
情報を使って要約を作成する規則と統計情報による要約
部218とを有している。
【0052】図11のフローチャートを使用して、要約
部215の動作を説明する。ステップST61で、ユー
ザからの要約仕様を取得する。この場合、ユーザ仕様抽
出部215bは、記憶装置300の記憶バッファ306
より要約仕様を抽出し、この要約仕様を要約制御部21
5aに供給する。そして、ステップST62で、要約仕
様がテンプレートによる要約を指定しているか否かを判
定する。テンプレートによる要約を指定しているとき
は、ステップST63で、要約部219によって、記憶
バッファ301に記憶されている入力文書に対して、テ
ンプレートを使って要約を作成し、その要約結果を記憶
装置300の記憶バッファ304に記憶する。
【0053】ステップST62でテンプレートによる要
約を指定していないときは、ステップST64で、要約
仕様が規則および統計情報による要約を指定しているか
否かを判定する。規則および統計情報による要約を指定
しているときは、ステップST65で、要約部218に
よって、規則および統計情報を使って要約を作成し、そ
の要約結果を記憶バッファ304に記憶する。
【0054】ステップST64で規則および統計情報に
よる要約を指定していないときは、適当な要約方法の指
定がなかったものとして、ステップST66で、要約制
御部215aは中央制御部217にエラー情報を送る。
これにより、中央制御部217よりユーザインタフェー
ス部201にエラー情報が供給され、エラーメッセージ
部206でエラーメッセージが生成され、例えば出入力
インタフェース部100のモニタ106にエラーメッセ
ージが表示される。
【0055】図12は、テンプレートによる要約部21
9の構成を示している。要約部219は、全体の動作を
制御する要約制御部219aと、記憶装置300の記憶
バッファ306よりユーザからのテンプレートの指定情
報を抽出し、テンプレートデータベース219bよりそ
の指定情報で指定されたテンプレートを選択するテンプ
レート選択部219cと、ユーザからのテンプレートの
指定情報がないとき、テンプレートデータベース219
bより最適なテンプレートを選択するテンプレート自動
選択部219dとを有している。
【0056】また、要約部219は、記憶装置300の
記憶バッファ302に記憶されている言語判定結果を利
用して、記憶バッファ301に記憶されている入力文書
を単語、句、文等に分割する文章分割部219eと、テ
ンプレート選択部219cまたはテンプレート自動選択
部219dで選択されたテンプレートを使った要約の作
成を実行するテンプレート実行部219fとを有してい
る。
【0057】図13のフローチャートを使用して、テン
プレートによる要約部219の動作を説明する。ステッ
プST71で、ユーザからのテンプレートの指定がある
か否かを判定する。ユーザからのテンプレートの指定が
あるときは、ステップST72で、テンプレート選択部
219cによって、記憶バッファ306よりユーザから
のテンプレートの指定情報を抽出し、テンプレートデー
タベース219bよりその指定情報で指定されたテンプ
レートを選択し、そのテンプレートを要約作成に使用す
るテンプレートとして記憶装置300の記憶バッファ3
08に記憶する。一方、ユーザからのテンプレートの指
定がないときは、ステップST73で、テンプレート自
動選択部219dによって、テンプレートデータベース
219bより最適なテンプレートを選択し、そのテンプ
レートを要約作成に使用するテンプレートとして記憶バ
ッファ308に記憶する。
【0058】次に、ステップST74で、記憶装置30
0の記憶バッファ301に記憶されている入力文書の言
語を判定する。この場合、記憶装置300の記憶バッフ
ァ302に記憶されている上述した言語判定部213に
よる言語判定結果を利用できる。そして、ステップST
75で、この言語判定結果に基づき、文章分割部219
eによって、入力文書を単語、句、文等に分割し、その
分割済入力文書を記憶装置300の記憶バッファ309
に記憶する。
【0059】次に、ステップST76で、テンプレート
実行部219fによって、テンプレート中の各スロット
に含まれている情報抽出のためのif-then推論規則を実
行する。そして、ステップST77で、同様にテンプレ
ート実行部219fによって、テンプレート中の各スロ
ットに含まれている情報表示のためのif-then推論規則
を実行し、ステップST78で、その実行結果を要約結
果として、記憶装置300の記憶バッファ304に記憶
する。
【0060】図14は、規則と統計情報による要約部2
18の構成を示している。要約部218は、全体の動作
を制御する要約制御部218aと、記憶装置300の記
憶バッファ306よりユーザからの要約率または要約結
果の長さの指定情報を抽出し、その要約率の指定情報を
要約制御部218aに供給するユーザ仕様抽出部218
bと、記憶装置300の記憶バッファ302に記憶され
ている言語判定結果を利用して、記憶バッファ301に
記憶されている入力文書を単語、句、文等に分割する文
章分割部218cとを有している。
【0061】また、要約部218は、文章分割部218
cによって分割された分割済入力文書より、単語や句の
現れる頻度や互いの近さ等の特徴を取得する入力文書特
徴取得部218dと、特定の単語や句、その他のパター
ンの存在、その順番、互いの近さ等が要約における有効
性にどんな影響があるかについての規則データベース2
14eからのif-then推論規則を、入力文書特徴取得部
218dで取得された入力文書の特徴と照合すること
で、入力文書中の単語、句、文を重要度順にランキング
する規則による要約部218fとを有している。
【0062】また、要約部218は、特定の単語や句、
その他のパターンの存在、その順番、互いの近さ等と要
約における有用性との相関関係についての統計データベ
ース218gからの統計情報と入力文書の特徴とを比較
し、その結果を用いて入力文書中の単語、句、文の重要
度順のランキングを調整する統計情報による要約部21
8hと、ユーザからの要約率や要約結果の長さの情報
と、要約部218hで調整された入力文書中の単語、
句、文の重要度順のランキングを基に、要約文を作成す
る要約文作成部218iとを有している。
【0063】図15のフローチャートを使用して、規則
と統計情報による要約部218の動作を説明する。ステ
ップST81で、ユーザからの要約率または要約結果の
長さの指定情報を取得する。この場合、ユーザ仕様抽出
部218bは、記憶装置300の記憶バッファ306よ
りユーザからの要約率または要約結果の長さの指定情報
を抽出し、この指定情報を要約制御部218aに供給す
る。
【0064】次に、ステップST82で、記憶装置30
0の記憶バッファ301に記憶されている入力文書の言
語を判定する。この場合、記憶装置300の記憶バッフ
ァ302に記憶されている上述した言語判定部213に
よる言語判定結果を利用できる。そして、ステップST
83で、この言語判定結果に基づき、文章分割部218
cによって、入力文書を単語、句、文等に分割し、その
分割済入力文書を記憶装置300の記憶バッファ309
に記憶する。
【0065】次に、ステップST84で、入力文書特徴
取得部218dによって、記憶バッファ309に記憶さ
れている分割済入力文書より、単語や句の現れる頻度や
互いの近さ等の特徴を取得する。そして、ステップST
85で、要約部218fによって、特定の単語や句、そ
の他のパターンの存在、その順番、互いの近さ等が要約
における有効性にどんな影響があるかについてのif-the
n推論規則を、入力文書の特徴と照合し、入力文書中の
単語、句、文を重要度順にランキングする。
【0066】次に、ステップST86で、要約部218
hによって、特定の単語や句、その他のパターンの存
在、その順番、互いの近さ等と要約における有用性との
相関関係についての統計情報と、入力文書の特徴とを比
較し、その結果を用いて入力文書中の単語、句、文の重
要度順のランキングを調整する。そして、ステップST
87で、要約文作成部218iによって、ユーザからの
要約率や要約結果の長さの情報と、要約部218hで調
整された入力文書中の単語、句、文の重要度順のランキ
ングを基に、ユーザからの要約率や要約結果の長さに適
合するように要約文を作成する。そして、ステップST
88によって、作成された要約文を要約結果として、記
憶装置300の記憶バッファ304に記憶する。
【0067】図16は、翻訳部216の構成を示してい
る。この翻訳部216は、全体の動作を制御する翻訳制
御部216aと、記憶装置300の記憶バッファ306
より、翻訳仕様を抽出して翻訳制御部216aに供給す
るユーザ仕様抽出部216bと、記憶装置300の記憶
バッファ304に要約結果として記憶されているテンプ
レートを他の自然言語に翻訳するテンプレート翻訳部2
21と、記憶装置300の記憶バッファ301に記憶さ
れている入力文書または記憶バッファ304に要約結果
として記憶されている入力文書の要約を他の自然言語に
翻訳するテンプレート以外の翻訳部222とを有してい
る。
【0068】図17のフローチャートを使用して、翻訳
部216の動作を説明する。ステップST91で、ユー
ザからの翻訳仕様を取得する。この場合、ユーザ仕様抽
出部216bは、記憶装置300の記憶バッファ306
より翻訳仕様を抽出し、この翻訳仕様を翻訳制御部21
6aに供給する。そして、ステップST92で、翻訳仕
様がテンプレートの翻訳を指定しているか否かを判定す
る。
【0069】テンプレートの翻訳を指定しているとき
は、ステップST93で、翻訳部221によって、記憶
バッファ304に記憶されている要約結果としてのテン
プレートの翻訳を行って、その翻訳結果を記憶装置30
0の記憶バッファ305に記憶する。一方、テンプレー
トの翻訳ではなく、入力文書の全体またはその入力文書
の要約の翻訳を指定しているときは、ステップST94
で、翻訳部222によって、記憶装置300の記憶バッ
ファ301に記憶されている入力文書または記憶バッフ
ァ304に記憶されているその入力文書の要約の翻訳を
行って、その翻訳結果を記憶バッファ305に記憶す
る。
【0070】図18のフローチャートを使用して、テン
プレート翻訳部221の動作をさらに詳しく説明する。
ステップST101で、記憶バッファ304よりテンプ
レートとそれに付随する全ての情報(各スロットの埋め
られた情報)を抽出する。そして、ステップST102
で、テンプレート出力言語を取得する。この出力言語の
情報は、翻訳仕様に含まれており、翻訳制御部216a
より供給される。
【0071】次に、ステップST103で、テンプレー
ト中のスロットを順番に翻訳していくためのカウント値
iを1に初期化する。そして、ステップST104で、
カウント値iがスロット数より大きく、全てのスロット
との翻訳が終わったか否かを判定し、全てのスロットの
翻訳が終わったときは翻訳動作を終了する。一方、全て
のスロットの翻訳が終わっていないときは、ステップS
T105で、スロットiの翻訳方法を取得し、ステップ
ST107で、その翻訳方法をスロットiの内容に適用
して翻訳を実行する。
【0072】そして、ステップST108で、出力言語
でのスロット表示規則を実行し、ステップST109
で、その結果を記憶装置300の記憶バッファ305に
翻訳結果として記憶する。そして、ステップST110
で、カウント値iをインクリメントして、ステップST
104に戻り、次のスロットの翻訳処理に移行する。
【0073】図19のフローチャートを使用して、テン
プレート以外の翻訳部222の動作をさらに詳しく説明
する。まず、ステップST111で、翻訳対象である入
力文書または要約の分野を判定する。この場合、記憶装
置300の記憶バッファ303に記憶されている上述し
た分野判定部214による分野判定結果を利用できる。
そして、ステップST112で、翻訳対象である入力文
書または要約の言語を判定する。この場合、記憶装置3
00の記憶バッファ302に記憶されている上述した言
語判定部213による言語判定結果を利用できる。さら
に、ステップST113で、出力言語を取得する。この
出力言語の情報は、翻訳仕様に含まれており、翻訳制御
部216aより供給される。
【0074】次に、翻訳対象としての入力文書またはそ
の要約に対する翻訳を実行する。上述せずも、この翻訳
部222は、入力言語LI1〜LInのそれぞれから出力
言語LO1〜LOmのいずれかへの翻訳を可能とする。そ
こで、ステップST114-1,ステップST114-2
・・・,ST114-kで、それぞれ[入力言語LI1
出力言語LO1]、[入力言語LI1、出力言語L
2]、・・・、[入力言語LIn、出力言語LOm]の
組み合わせであるか否かを判定する。そして、それぞれ
の組み合わせであるときは、ステップST115-1,S
T115-2,・・・,ST115-kで、翻訳実行部によ
って、その組み合わせに対応する翻訳を実行し、ステッ
プST116で、記憶装置300の記憶バッファ305
に、その翻訳結果を記憶する。
【0075】一方、いずれの組み合わせによる翻訳でも
ないときは、ステップST117で、翻訳部222は翻
訳制御部216aにエラー情報を送る。これにより、中
央制御部217よりユーザインタフェース部201にエ
ラー情報が供給され、エラーメッセージ部206でエラ
ーメッセージが生成され、例えば出入力インタフェース
部100のモニタ106にエラーメッセージが表示され
る。
【0076】図20は、テンプレート以外の翻訳部22
2における翻訳実行部223の構成を示している。この
翻訳実行部223は、全体の動作を制御する翻訳実行制
御部223aと、翻訳対象としての記憶バッファ301
に記憶されている入力文書または記憶バッファ304に
記憶されている入力文書の要約(以下、「入力文」とい
う)を単語、句、文等に分割する文章分割部223bと
を有している。翻訳実行制御部223aの動作は、テン
プレート以外の翻訳部222を構成する翻訳制御部22
2aによって制御されている。
【0077】また、翻訳実行部223は、文章分割部2
23bで分割された入力文の単語や句に後述する構文解
析の前処理としての形態素解析をする形態素解析部22
3cと、この形態素解析部223cの解析結果に基づい
て、連続した単語や句の集合に構文解析をする構文解析
部223dと、この構文解析部223dで構文解析済み
の入力文を、部分毎に対訳例文データベース223eか
らの対訳ペアと照合して翻訳語句を得る推論による翻訳
実行部223fと、この翻訳実行部223fからの入力
文の各部分の翻訳語句を組み合わせて翻訳文を作成する
翻訳文作成部223gとを有している。対訳例文データ
ベース223eには、構文解析済の入力言語(原言語)
表現とそれに対応する出力言語(目標言語)表現のペア
が数多く保存されている。
【0078】図21のフローチャートを使用して、翻訳
実行部223の動作を説明する。まず、ステップST1
21で、文章分割部223bによって、翻訳対象として
の入力文を単語、句、文等に分割し、その分割済み入力
文を記憶装置300の記憶バッファ310に記憶する。
そして、ステップST122で、形態素解析部223c
によって、分割された入力文の単語や句に形態素解析を
行って、その解析結果を構文解析部223dに供給す
る。
【0079】次に、ステップST123で、構文解析部
223dによって、形態素解析の解析結果から連続した
単語や句の集合に構文解析をする。そして、ステップS
T124で、翻訳実行部223fによって、構文解析済
みの入力文を部分毎に対訳例文データベース223eの
中の対訳ペアと照合し、さらにステップST125で、
最も近い対訳ペアを選択し、その目標言語部分を翻訳語
句として得る。そして、ステップST126で、入力文
の全ての部分の照合が終了したか否かを判定し、終了す
るまでステップST124,ST125の処理を繰り返
し実行する。
【0080】入力文の全ての部分の照合が終了したとき
は、ステップST127で、翻訳文作成部223gによ
って、入力文の各部分の翻訳語句を組み合わせて翻訳文
を作成し、ステップST128で、その作成された翻訳
文を翻訳結果として記憶装置300の記憶バッファ30
5に記憶する。
【0081】図22は、音声認識部202の構成を示し
ている。音声認識部202は、全体の動作を制御する音
声認識制御部202aと、ローカルまたはリモートの場
所のユーザから出力入力コントロール部205を介して
音声波を取得する音声波取得部202bと、記憶装置3
00の記憶バッファ306より、ユーザからの言語仕様
を抽出して音声認識制御部202aに供給するユーザ仕
様抽出部216cと、音声波取得部202bで取得され
た音声波より単語、句、文等を認識する言語1〜言語n
用のn個の音声認識部202d1〜202dnとを有して
いる。
【0082】図23のフローチャートを使用して、音声
認識部202の動作を説明する。まず、ステップST1
31で、音声波取得部202bによって、ローカルまた
はリモートの場所のユーザから電話やマイクロフォンを
通じて音声波を取得し、ステップST132で、その音
声波を記憶装置300の記憶バッファ311に記憶す
る。そして、ステップST133で、ユーザ仕様抽出部
202cによって、音声波の自然言語を示すユーザから
の言語仕様を取得する。この場合、ユーザ仕様抽出部2
02cは、記憶装置300の記憶バッファ306より言
語仕様を抽出し、この言語仕様を音声認識制御部202
aに供給する。
【0083】次に、ステップST134-1〜134
-nで、それぞれ言語仕様で示される自然言語が言語1〜
言語nであるか否かを判定する。そして、言語1〜言語
nであるときは、それぞれステップST135-1〜13
-nで、音声認識部202d1〜202dnによって、記
憶バッファ311に記憶された音声波に対する言語1〜
言語nの音声認識を実行する。そして、ステップST1
36で、音声波から認識された単語、句、文等を音声認
識結果として記憶装置300の記憶バッファ312に記
憶する。
【0084】一方、言語仕様で示される自然言語が言語
1〜言語nのいずれでもないときは、ステップST13
7で、音声認識制御部202aはユーザインタフェース
部201にエラー情報を送る。これにより、エラーメッ
セージ部206でエラーメッセージが生成され、例えば
出入力インタフェース部100のモニタ106にエラー
メッセージが表示される。
【0085】図24は、自然言語理解部203の構成を
示している。この自然言語理解部203は、全体の動作
を制御する自然言語理解制御部203aと、ローカルま
たはリモートの場所のユーザから出入力コントロール部
205を介して自然言語表現を取得し、または上述した
記憶バッファ312に記憶されている音声認識結果を自
然言語表現として取得する自然言語表現取得部203b
と、この自然言語取得部203bで取得した自然言語表
現の言語を判定し、その判定結果を自然言語理解制御部
203aに供給する言語判定部203cと、自然言語表
現(ユーザ自然言語コマンド)を解析し、ユーザ仕様と
してのシステムコマンド表現に変換する言語1〜言語n
用のn個の自然言語解析部202d1〜202dnとを有
している。
【0086】言語判定部203cは、上述した言語判定
部213と同様に構成され、ユーザからの言語仕様があ
るときは、その言語仕様を記憶装置300の記憶バッフ
ァ306より抽出して言語判定結果とすると共に、ユー
ザからの言語仕様がないときは、規則や統計情報による
言語判定処理によって言語判定結果を得るように構成さ
れている。
【0087】図25のフローチャートを使用して、自然
言語理解部203の動作を説明する。まず、ステップS
T141で、自然言語表現取得部203bによって、ロ
ーカルまたはリモートの場所のユーザより出入力コント
ロール部205を介して自然言語表現を取得し、あるい
は記憶バッファ312より音声認識結果としての自然言
語表現を取得し、記憶装置300の記憶バッファ313
にユーザ自然言語コマンドとして記憶する。そして、ス
テップST142で、言語判定部203cによって、取
得した自然言語表現の言語を判定し、この言語判定結果
を自然言語理解制御部203aに供給する。
【0088】次に、ステップST143-1〜143
-nで、それぞれ言語判定結果で示される自然言語が言語
1〜言語nであるか否かを判定する。そして、言語1〜
言語nであるときは、それぞれステップST144-1
144-nで、自然言語解析部203d1〜203dnによ
って、記憶バッファ313に記憶された自然言語表現に
対する言語1〜言語nの自然言語解析を実行する。そし
て、ステップST145で、言語解析結果としてのシス
テムコマンド表現を記憶装置300の記憶バッファ30
6にユーザからの仕様として記憶する。
【0089】一方、言語判定結果で示される自然言語が
言語1〜言語nのいずれでもないときは、ステップST
146で、自然言語理解制御部203aはユーザインタ
フェース部201にエラー情報を送る。これにより、エ
ラーメッセージ部206でエラーメッセージが生成さ
れ、例えば出入力インタフェース部100のモニタ10
6にエラーメッセージが表示される。
【0090】図26は、自然言語理解部203における
自然言語解析実行部224の構成を示している。この解
析実行部224は、全体の動作を制御する自然言語解析
実行制御部224aと、記憶バッファ313に記憶され
ている自然言語表現を単語、句、文等に分割する文章分
割部224bとを有している。解析実行制御部224a
の動作は、自然言語理解制御部203aによって制御さ
れている。
【0091】また、解析実行部224は、文章分割部2
24bで分割された、自然言語表現の単語や句に後述す
る構文解析の前処理としての形態素解析をする形態素解
析部224cと、この形態素解析部224cの解析結果
に基づいて、連続した単語や句の集合に構文解析をする
構文解析部224dと、この構文解析部224dで構文
解析済みの自然言語表現を、部分毎に自然言語/システ
ムコマンド対訳例文データベース224eからの対訳ペ
アと照合してコマンド言語意味表現を得る推論による翻
訳実行部224fと、この翻訳実行部224fからの自
然言語表現の各部分のコマンド言語意味表現を組み合わ
せてシステムコマンド表現を作成するシステムコマンド
表現生成部224gとを有している。対訳例文データベ
ース224eには、構文解析済の自然言語表現とそれに
対応するコマンド言語意味表現のペアが数多く保存され
ている。
【0092】図27のフローチャートを使用して、解析
実行部224の動作を説明する。まず、ステップST1
51で、文章分割部224bによって、解析対象として
の自然言語表現を単語、句、文等に分割し、その分割済
み自然言語表現を記憶装置300の記憶バッファ314
に記憶する。そして、ステップST152で、形態素解
析部224cによって、分割された自然言語表現の単語
や句に形態素解析を行って、その解析結果を構文解析部
224dに供給する。
【0093】次に、ステップST153で、構文解析部
224dによって、形態素解析の解析結果から連続した
単語や句の集合に構文解析をする。そして、ステップS
T154で、翻訳実行部224fによって、構文解析済
みの自然言語表現を部分毎に対訳例文データベース22
4eの中の対訳ペアと照合し、さらにステップST15
5で、最も近い対訳ペアを選択し、コマンド言語意味表
現を得る。そして、ステップST156で、自然言語表
現の全ての部分の照合が終了したか否かを判定し、終了
するまでステップST154,ST155の処理を繰り
返し実行する。
【0094】自然言語表現の全ての部分の照合が終了し
たときは、ステップST157で、システムコマンド表
現生成部224gによって、自然言語表現の各部分のコ
マンド言語意味表現を組み合わせてシステムコマンド表
現を生成し、ステップST158で、その生成されたシ
ステムコマンド表現をユーザ仕様として記憶装置300
の記憶バッファ306に記憶する。
【0095】図28は、出力部212の構成を示してい
る。この出力部212は、全体の動作を制御する出力制
御部212aと、記憶装置300の記憶バッファ306
より、出力仕様を抽出して出力制御部212aに供給す
るユーザ仕様抽出部212bと、記憶装置300の記憶
バッファ302〜305等に記憶されている要約結果、
翻訳結果、言語判定結果、分野判定結果等の出力文書を
ページャに送信するためのページャ出力部212cと、
出力文書を電話機に送信するための電話出力部212d
とを有している。
【0096】また、出力部212は、出力文書を電子メ
イルに送信するための電子メイル出力部212eと、出
力文書をSGML文書やHTML文書を保存表示できる
ローカルまたはリモートにある設備に送信するためのS
GML/HTML出力部212fと、出力文書をローカ
ルまたはリモートのファイルやデータベースに保存する
ためのファイル/データベース出力部212gと、出力
文書をファクシミリに送信するためのファクシミリ出力
部212hとを有している。
【0097】図29のフローチャートを使用して、出力
部212の動作を説明する。ステップST161で、要
約結果、翻訳結果、言語判定結果、分野判定結果等の出
力文書の出力先を指定するユーザからの出力仕様を取得
する。この場合、ユーザ仕様抽出部212bは、記憶装
置300の記憶バッファ306より出力仕様を抽出し、
この出力仕様を出力制御部212aに供給する。そし
て、ステップST162で、出力仕様がページャを指定
しているか否かを判定する。ページャを指定していると
きは、ステップST163で、ページャ出力部212c
によって、出力文書をページャに送信する。
【0098】ステップST162でページャを指定して
いないときは、ステップST164で、出力仕様が電話
機を指定しているか否かを判定する。電話機を指定して
いるときは、電話出力部212dによって、出力文書を
電話機に送信する。つまり、ステップST165で、出
力文書(テキストデータ)を音声合成部204で音声信
号に変換し、ステップST166で、この出力文書に対
応した音声信号を電話回線を通じて電話機に送信する。
【0099】ステップST164で電話機を指定してい
ないときは、ステップST167で、出力仕様が電子メ
イルを指定しているか否かを判定する。電子メイルを指
定しているときは、電子メイル出力部212eによっ
て、ステップST168で、出力文書を電子メイルに送
信する。
【0100】ステップST167で電子メイルを指定し
ていないときは、ステップST169で、SGML文書
やHTML文書を保存表示できるローカルまたはリモー
トの設備を指定しているか否かを判定する。その設備を
指定しているときは、SGML/HTML出力部212
fによって、出力文書をその設備に送信する。すなわ
ち、ステップST170で、SGMLフォーマットやH
TMLフォーマットのページを生成し、ステップST1
71で、そのページをローカルまたはリモートの設備に
送信する。
【0101】ステップST169でSGML文書やHT
ML文書を保存表示できるローカルまたはリモートの設
備を指定していないときは、ステップST172で、出
力仕様がローカルまたはリモートのファイルやデータベ
ースを指定しているか否かを判定する。そのファイルや
データベースを指定しているときは、ステップST17
3で、ファイル/データベース出力部212gによっ
て、出力文書をローカルまたはリモートにあるファイル
やデータベースに保存する。
【0102】ステップST172でファイルやデータベ
ースを指定していないときは、ステップST174で出
力仕様がファクシミリを指定しているか否かを判定す
る。ファクシミリを指定しているときは、ファクシミリ
出力部212hによって、出力文書をファクシミリに送
信する。すなわち、ステップST175で、出力文書
(テキストデータ)をイメージデータに変換し、ステッ
プST176で、そのイメージデータをファクシミリに
送信する。
【0103】ステップST174でファクシミリを指定
していないときは、ステップST177で、出力制御部
212aは中央制御部217にエラー情報を送る。これ
により、中央制御部217よりユーザインタフェース部
201にエラー情報が供給され、エラーメッセージ部2
06でエラーメッセージが生成され、例えば出入力イン
タフェース部100のモニタ106にエラーメッセージ
が表示される。
【0104】図30は、上述した図1に示す多言語情報
処理システム10が、コンピュータネットワーク上でア
クセス可能なソフトウェアのシステムを構成している接
続例を示している。この場合、多言語情報処理システム
10はLAN(Local Area Network)122上に接続さ
れたコンピュータ121上で作動している。LAN12
2は、さらにWAN(Wide Area Network)126、例
えばインターネットの一部に接続されている。WAN1
26は、さらにLAN125やLAN127等にも接続
されている。ユーザ124はLAN125に接続されて
いるコンピュータ123から操作する。情報源129は
LAN3に接続されているコンピュータ3に関連付けら
れている。
【0105】情報源129は、HTMLファイルを送信
するワールドワイドウェブ(WWW)のサーバープログ
ラムやその他のタイプのサーバープログラムのように、
必要に応じて情報を送信する手段と見ることができる。
また情報源129は、リモートのコンピュータで作動す
る電子メイル送信プログラムやファクシミリ送信機など
独立して情報を送信する手段である場合もある。多言語
情報処理システム10は、ユーザ124とは独立して入
力文書を受け取りそれを記憶装置に保存する。その後
に、ユーザが多言語情報処理システム10に接続し、保
存済の入力文書を選択したとき、それを解析することと
なる。
【0106】多言語情報処理システム10はオンライン
でもオフラインでも操作可能である。オンラインモード
では、多言語情報処理システム10に接続したユーザが
システム10と交信し、入力文書、出力先、入力言語・
分野、その他の情報を指定する。オンラインモードで
は、ユーザは要約また翻訳の結果をすぐに表示させて見
ることができる。オフラインモードでは、まずユーザが
システムに接続し、システム10がオンライン交信なし
に情報の処理を行えるように、ユーザのプロファイルを
作成する。その後、ユーザはシステム10との接続を絶
ち、多言語情報処理システム10はユーザとの交信なし
に独立して文書の処理を行う。
【0107】ユーザがシステムと交信する手段も多種類
用意されている。固定または無線のコンピュータネット
ワークに接続するローカルまたはリモートのコンピュー
タ上のGUI(Graphical User Interface)を操作して
交信するのも一つの例である。またコンピュータのテキ
スト画面でタイプしたり、メニューから単語を選ぶこと
により自然言語コマンドを通してユーザが交信するのも
可能な例である。
【0108】また、図1に示す多言語情報処理システム
10によって、図31に示すように、ユーザが電話によ
ってアクセスできるシステムを構成することも可能であ
る。ユーザ130は、電話回線132に接続されている
固定、モービルまたは無線の電話131を用いる。多言
語情報処理システム10は、電話回線インタフェース1
33を備えているコンピュータ134上で作動してい
る。
【0109】この場合、多言語情報処理システム10
は、ユーザ130からの音声波を受け取り、記憶バッフ
ァに保存し、音声認識、自然言語理解を行い、得られた
コマンドを実行する。ユーザ130に出力結果を送信す
るとき、多言語情報処理システム10は、出力結果を音
声波に合成し、電話回線132を通じてユーザに送信す
る。
【0110】入力文書の言語や分野を指定する情報は様
々な方法で入力文書自体に注釈として含めることができ
る。例えば、HTMLフォーマットの入力文書はSGM
Lのタグを使って次のように言語(LANGUAGE)や分野
(SUBJECT)の情報を備えることができる。
【0111】 〈LANGUAGE value="japanese"〉 〈LANGUAGE value="english"〉 〈SUBJECT value="internal medicine"〉 〈SUBJECT value="unix programming〉 また、既存のHTMLのMETAタグが、この情報を含
むように拡張される。 〈META name="language" content="japanese"〉 〈META name="language" content="english"〉 〈META name="subject" content="internal medicin
e"〉 〈META name="subject" content="unix programming"〉 入力文書を要約する際の規則を系統立てるテンプレート
も様々な方法で実施することができる。図32に、テン
プレートの一例を示している。このテンプレートは名前
部136、分野部137、情報源部138、スロット部
139から構成されている。名前部136にはテンプレ
ートの名前が書かれている。分野部137には、そのテ
ンプレートが適用され得る分野のリストと、その分野の
文書を要約する際の適切性を示すスコアとが書かれてい
る。情報源部138には、このテンプレートを埋めるた
めに必要な情報を入手する方法が書かれている。スロッ
ト部139には、テンプレートのスロットが単数または
複数含まれている。それぞれのスロットには、スロット
名140、スロット値を得るための規則141、スロッ
ト値を表示するための規則147、スロット値を翻訳す
るための規則153、スロット値159が備えられてい
る。
【0112】スロット値を得るための規則141は、言
語ごとに整理されている。スロット値を得るための規則
141の欄には、少なくとも一つのデフォルト規則14
6が用意されており、入力言語に対応する規則が見つか
らない場合に適用される。スロット値を得るための規則
141の欄には、さらに言語毎に対応する規則の欄14
2,145が設けられている。言語毎の規則は、言語指
定欄143と規則欄144からなり、規則欄144は、
入力文書からそのスロット値の情報を得るための仕様が
記されている。入力文書から抽出されるべき単語、句や
節などを特定したパターンマッチング表現(正規表現)
などがその例である。
【0113】スロット値を表示するための規則147も
言語毎に整理されている。スロット値を表示するための
規則147の欄には、少なくとも一つのデフォルト規則
152が用意されており、入力言語に対応する規則が見
つからない場合に適用される。スロット値を表示するた
めの規則147の欄には、さらに言語毎に対応する規則
の欄148,151が設けられている。言語毎の規則は
言語指定欄149と規則欄150からなり、規則欄はス
ロット値を表示する仕様が記されている。スロット値を
含むプリントコマンドを含むプログラム文などがその例
である。
【0114】スロット値を翻訳するための規則153も
言語毎に整理されている。スロット値を翻訳するための
規則153の欄には、少なくとも一つのデフォルト規則
158が用意されており、入力言語に対応する規則が見
つからない場合に適用される。スロット値を翻訳するた
めの規則153の欄には、さらに言語毎に対応する規則
の欄154,157が設けられている。言語毎の規則は
言語指定欄155と規則欄156からなり、規則欄はス
ロット値を翻訳するための仕様が記されている。スロッ
ト値の属する分野の指定などがその例である。
【0115】スロット値159も言語毎に整理されてい
る。スロット値159の欄には、少なくとも一つのデフ
ォルト値164が用意されており、入力言語に対応する
規則が見つからない場合に適用される。スロット値15
9の欄には、さらに言語毎に対応する値の欄160,1
63が設けられている。言語毎のスロット値の欄には言
語指定欄161とテキスト欄162からなり、テキスト
欄には入力文書から抽出したスロット値が記される。
【0116】以上説明したように、図1に示す多言語情
報処理システム10は、ある自然言語から別の自然言語
へと翻訳する翻訳部216を備えているため、入力文書
が書かれている言語をユーザが理解できない場合でも、
入力文書中の情報をユーザが理解することが可能とな
る。
【0117】また、多言語情報処理システム10は、入
力文書を要約する要約部215を備えているため、入力
文書全体を読む時間がないユーザも文書中の情報を理解
することが可能となる。そして、ユーザは要約率または
要約結果の長さを指定できるので、自分の必要にあった
要約を柔軟に行わせることができる。例えば、外国語で
書かれた大量の電子メイルを毎日受け取るユーザは、そ
れぞれの電子メイル文書を1文に要約し、母国語に翻訳
するように指定することができる。そのようにすること
によって、ユーザはすばやく全ての電子メイル文書をチ
ェックし、詳しく読むことが必要な重要な文書を選び出
すことができる。
【0118】また、多言語情報処理システム10は、コ
ンピュータネットワークや電話回線などの様々な通信情
報チャンネルで作動させることができるため、様々な情
報源から入手する情報を管理することが可能となる。こ
のシステム10は、さらに要約された、また翻訳された
文書を様々なチャンネルに送信することもできる。
【0119】例えば、ユーザが携帯電話のみを携えた旅
行中に外国語で書かれたファクシミリ文書を受け取った
場合、既にファクシミリを受信し保存している多言語情
報処理システム10に電話で接続し、そのファクシミリ
文書の要約をユーザの母国語で提示するよう指示するこ
とができる。これに対して、多言語情報処理システム1
0は、ファクシミリ文書のイメージデータを認識し、要
約し、翻訳し、合成音で電話先のユーザに提示すること
ができる。
【0120】また、多言語情報処理システム10は、キ
ーボード入力(タイプ入力)、音声入力、さらにその他
の手段により入力された自然言語によるシステムへの指
示を可能にしている。例えば、ユーザはコンピュータの
キーボードでタイプすることにより、コンピュータのマ
イクロホンに話しかけることにより、電話から話しかけ
ることにより、また携帯端末のタッチスクリーンのメニ
ューから自然言語表現を組み立てることにより、多言語
情報処理システム10へ指示を出すことができる。その
ようにして、ユーザは様々な通信情報チャンネルを介し
て、簡潔で直感的な方法でシステムへの指示を出すこと
ができる。
【0121】ここでシステムへの指示とは、多言語情報
処理システム10への入力文書の指定、要約また翻訳さ
れた出力文書の送信先の指定、入力文書の言語の指定、
出力言語の指定、多言語情報処理システム10との交信
に使用する言語、希望する要約率や要約結果の長さなど
がある。さらに、ユーザは埋めたいテンプレートを指定
するか、システム10が自動的にテンプレートを選択す
べきかを指示したりできる。また、ユーザは自然言語で
多言語情報処理システムに質問をし、システム10はそ
の質問にもっともふさわしいテンプレートを選択し、テ
ンプレートを情報で埋め、その結果をユーザに提示する
ことができる。
【0122】
【発明の効果】この発明によれば、入力文書を要約する
機能、さらには入力文書やその要約を他の自然言語に翻
訳する機能を持つものであり、入力文書の言語が母国語
でない場合や入力文書が大量である場合でも、ユーザは
入力文書中の情報を容易に理解できる等の効果がある。
【図面の簡単な説明】
【図1】実施の形態としての多言語情報処理システムの
構成を示すブロック図である。
【図2】多言語情報処理システムの動作概要を説明する
ためのフローチャートである。
【図3】多言語情報処理システムの入力受領部の構成を
示すブロック図である。
【図4】入力受領部の動作を説明するためのフローチャ
ートである。
【図5】入力受領部のファクシミリ文書の受領動作を説
明するためのフローチャートである。
【図6】多言語情報処理システムの言語判定部の構成を
示すブロック図である。
【図7】言語判定部の動作を説明するためのフローチャ
ートである。
【図8】多言語情報処理システムの分野判定部の構成を
示すブロック図である。
【図9】分野判定部の動作を説明するためのフローチャ
ートである。
【図10】多言語情報処理システムの要約部の構成を示
すブロック図である。
【図11】要約部の動作を説明するためのフローチャー
トである。
【図12】要約部のなかのテンプレートによる要約部の
構成を示すブロック図である。
【図13】テンプレートによる要約部の動作を説明する
ためのフローチャートである。
【図14】要約部のなかの規則と統計情報による要約部
の構成を示すブロック図である。
【図15】規則と統計情報による要約部の動作を説明す
るためのフローチャートである。
【図16】多言語情報処理システムの翻訳部の構成を示
すブロック図である。
【図17】翻訳部の動作を説明するためのフローチャー
トである。
【図18】翻訳部のなかのテンプレート翻訳部の動作を
説明するためのフローチャートである。
【図19】翻訳部のなかのテンプレート以外の翻訳部の
動作を説明するためのフローチャートである。
【図20】テンプレート以外の翻訳部における翻訳実行
部の構成を示すブロック図である。
【図21】翻訳実行部の動作を説明するためのフローチ
ャートである。
【図22】多言語情報処理システムの音声認識部の構成
を示すブロック図である。
【図23】音声認識部の動作を説明するためのフローチ
ャートである。
【図24】多言語情報処理システムの自然言語理解部の
構成を示すブロック図である。
【図25】自然言語理解部の動作を説明するためのフロ
ーチャートである。
【図26】自然言語理解部における自然言語解析実行部
の構成を示すブロック図である。
【図27】自然言語解析実行部の動作を説明するための
フローチャートである。
【図28】多言語情報処理システムの出力部の構成を示
すブロック図である。
【図29】出力部の動作を説明するためのフローチャー
トである。
【図30】多言語情報処理システムがコンピュータネッ
トワーク上でアクセス可能なシステムを構成する接続例
を示した図である。
【図31】多言語情報処理システムがユーザによる電話
アクセスが可能なシステムを構成する接続例を示した図
である。
【図32】入力文書を要約する際に使用されるテンプレ
ート例を示す図である。
【符号の説明】
10・・・多言語情報処理システム、100・・・出入
力インタフェース部、101・・・電話回線インタフェ
ース、102・・・ネットワークインタフェース、10
3・・・キーボード、104・・・マイクロホン、10
5・・・マウス、タッチスクリーン等、106・・・モ
ニタ、200・・・CPU、201・・・ユーザインタ
フェース部、202・・・音声認識部、203・・・自
然言語理解部、204・・・音声合成部、205・・・
出入力コントロール部、211・・・入力受領部、21
2・・・出力部、213・・・言語判定部、214・・
・分野判定部、215・・・要約部、216・・・翻訳
部、217・・・中央制御部、300・・・記憶装置

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 自然言語で書かれた入力文書を受領する
    文書受領手段と、 上記入力文書の言語を判定する言語判定手段と、 上記言語判定手段の言語判定結果を利用し、上記入力文
    書の要約を作成する要約作成手段とを備えることを特徴
    とする多言語情報処理システム。
  2. 【請求項2】 上記要約作成手段は、要約テンプレート
    を用いて上記入力文書を要約することを特徴とする請求
    項1に記載の多言語情報処理システム。
  3. 【請求項3】 ユーザからの要約の仕様を受領する要約
    受領手段をさらに備え、 上記要約作成手段は、上記要約の仕様に含まれる要約方
    法の情報に基づき、上記入力文書を要約テンプレートを
    用いて要約することを特徴とする請求項2に記載の多言
    語情報処理システム。
  4. 【請求項4】 上記要約テンプレートのデータベースを
    さらに備え、 上記要約作成手段は、上記要約の仕様に要約テンプレー
    トの指定情報が含まれるとき、上記データベースより指
    定された要約テンプレートを選択して用いることを特徴
    とする請求項3に記載の多言語情報処理システム。
  5. 【請求項5】 上記要約テンプレートのデータベースを
    さらに備え、 上記要約作成手段は、上記要約の仕様に要約テンプレー
    トの指定情報が含まれていないとき、上記データベース
    より上記入力文書に最適な要約テンプレートを選択して
    用いることを特徴とする請求項3に記載の多言語情報処
    理システム。
  6. 【請求項6】 上記要約作成手段は、規則および統計情
    報を用いて上記入力文書を要約することを特徴とする請
    求項1に記載の多言語情報処理システム。
  7. 【請求項7】 ユーザからの要約の仕様を受領する要約
    仕様受領手段をさらに備え、 上記要約作成手段は、上記要約の仕様に含まれる要約方
    法の情報に基づき、上記入力文書を規則および統計情報
    を用いて要約することを特徴とする請求項6に記載の多
    言語情報処理システム。
  8. 【請求項8】 上記要約作成手段は、上記要約の仕様に
    含まれる要約率または要約結果の長さの情報に適合する
    ように上記入力文書を要約することを特徴とする請求項
    7に記載の多言語情報処理システム。
  9. 【請求項9】 ユーザからの入力の仕様を受領する入力
    仕様受領手段をさらに備え、 上記文書受領手段は、上記入力の仕様に含まれる入手場
    所の指定情報で指定される入手場所からの上記入力文書
    を受領することを特徴とする請求項1に記載の多言語情
    報処理システム。
  10. 【請求項10】 多様な言語の文字認識手段をさらに備
    え、 上記文書受領手段は、上記入手場所がファクシミリであ
    って、上記入力文書をイメージデータで受領するとき、
    上記文字認識手段によって上記イメージデータをテキス
    トデータに変換することを特徴とする請求項9に記載の
    多言語情報処理システム。
  11. 【請求項11】 上記入力文書の分野を判定する分野判
    定手段をさらに備えることを特徴とする請求項1に記載
    の多言語情報処理システム。
  12. 【請求項12】 上記入力文書またはその要約を、他の
    自然言語に翻訳する翻訳手段をさらに備えることを特徴
    とする請求項1に記載の多言語情報処理システム。
  13. 【請求項13】 上記要約作成手段で作成された上記入
    力文書の要約を送信する情報送信手段をさらに備えるこ
    とを特徴とする請求項1に記載の多言語情報処理システ
    ム。
  14. 【請求項14】 上記翻訳手段で翻訳された結果を送信
    する情報送信手段をさらに備えることを特徴とする請求
    項12に記載の多言語情報処理システム。
  15. 【請求項15】 自然言語で書かれた入力文書を受領す
    る文書受領ステップと、 上記入力文書の言語を判定する言語判定ステップと、 上記言語判定ステップの言語判定結果を利用し、上記入
    力文書の要約を作成する要約作成ステップとを備えるこ
    とを特徴とする多言語情報処理方法。
  16. 【請求項16】 上記要約作成ステップでは、要約テン
    プレートを用いて上記入力文書を要約することを特徴と
    する請求項15に記載の多言語情報処理方法。
  17. 【請求項17】 ユーザからの要約の仕様を受領する要
    約受領ステップをさらに備え、 上記要約作成ステップでは、上記要約の仕様に含まれる
    要約方法の情報に基づき、上記入力文書を要約テンプレ
    ートを用いて要約することを特徴とする請求項16に記
    載の多言語情報処理方法。
  18. 【請求項18】 上記要約作成ステップでは、上記要約
    の仕様に要約テンプレートの指定情報が含まれるとき、
    要約テンプレートのデータベースより指定された要約テ
    ンプレートを選択して用いることを特徴とする請求項1
    7に記載の多言語情報処理方法。
  19. 【請求項19】 上記要約作成ステップでは、上記要約
    の仕様に要約テンプレートの指定情報が含まれていない
    とき、要約テンプレートのデータベースより上記入力文
    書に最適な要約テンプレートを選択して用いることを特
    徴とする請求項17に記載の多言語情報処理方法。
  20. 【請求項20】 上記要約作成ステップでは、規則およ
    び統計情報を用いて上記入力文書を要約することを特徴
    とする請求項15に記載の多言語情報処理方法。
  21. 【請求項21】 ユーザからの要約の仕様を受領する要
    約仕様受領ステップをさらに備え、 上記要約作成ステップでは、上記要約の仕様に含まれる
    要約方法の情報に基づき、上記入力文書を規則および統
    計情報を用いて要約することを特徴とする請求項20に
    記載の多言語情報処理方法。
  22. 【請求項22】 上記要約作成ステップでは、上記要約
    の仕様に含まれる要約率または要約結果の長さの情報に
    適合するように上記入力文書を要約することを特徴とす
    る請求項21に記載の多言語情報処理方法。
JP9191571A 1997-07-16 1997-07-16 多言語情報の処理システムおよび処理方法 Pending JPH1139306A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9191571A JPH1139306A (ja) 1997-07-16 1997-07-16 多言語情報の処理システムおよび処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9191571A JPH1139306A (ja) 1997-07-16 1997-07-16 多言語情報の処理システムおよび処理方法

Publications (1)

Publication Number Publication Date
JPH1139306A true JPH1139306A (ja) 1999-02-12

Family

ID=16276891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9191571A Pending JPH1139306A (ja) 1997-07-16 1997-07-16 多言語情報の処理システムおよび処理方法

Country Status (1)

Country Link
JP (1) JPH1139306A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339424A (ja) * 2000-05-26 2001-12-07 Nec Corp 電子メール処理システム、処理方法及び処理装置
JP2003134167A (ja) * 2001-10-24 2003-05-09 Oki Electric Ind Co Ltd 電子メール配送サーバ
JP2006504173A (ja) * 2002-10-22 2006-02-02 ノキア コーポレイション 規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定
JP2008140409A (ja) * 2001-02-22 2008-06-19 Worldlingo Automated Translations Llc 翻訳情報セグメント
JP2008243194A (ja) * 2007-02-27 2008-10-09 Digital Communications:Kk Rss素作成プログラム及びこれを用いたrss素による情報管理配信システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736896A (ja) * 1993-07-02 1995-02-07 Xerox Corp 文書を要約する方法および装置
JPH07160715A (ja) * 1993-12-07 1995-06-23 Sharp Corp 多言語翻訳装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH08272826A (ja) * 1995-03-31 1996-10-18 Hitachi Ltd 文書加工方法および装置
JPH0944504A (ja) * 1995-07-27 1997-02-14 Toshiba Corp 翻訳方法及び機械翻訳装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736896A (ja) * 1993-07-02 1995-02-07 Xerox Corp 文書を要約する方法および装置
JPH07160715A (ja) * 1993-12-07 1995-06-23 Sharp Corp 多言語翻訳装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH08272826A (ja) * 1995-03-31 1996-10-18 Hitachi Ltd 文書加工方法および装置
JPH0944504A (ja) * 1995-07-27 1997-02-14 Toshiba Corp 翻訳方法及び機械翻訳装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339424A (ja) * 2000-05-26 2001-12-07 Nec Corp 電子メール処理システム、処理方法及び処理装置
JP2008140409A (ja) * 2001-02-22 2008-06-19 Worldlingo Automated Translations Llc 翻訳情報セグメント
JP2012079341A (ja) * 2001-02-22 2012-04-19 Worldlingo Automated Translations Llc 翻訳情報セグメント
JP2014006913A (ja) * 2001-02-22 2014-01-16 Worldlingo Automated Translations Llc 翻訳情報セグメント
JP2003134167A (ja) * 2001-10-24 2003-05-09 Oki Electric Ind Co Ltd 電子メール配送サーバ
JP2006504173A (ja) * 2002-10-22 2006-02-02 ノキア コーポレイション 規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定
JP2009037633A (ja) * 2002-10-22 2009-02-19 Nokia Corp 規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定
JP2008243194A (ja) * 2007-02-27 2008-10-09 Digital Communications:Kk Rss素作成プログラム及びこれを用いたrss素による情報管理配信システム

Similar Documents

Publication Publication Date Title
US5963941A (en) Information collection system connected to a communication network for collecting desired information in a desired form
EP0810534B1 (en) Document display system and electronic dictionary
US6964014B1 (en) Method and system for localizing Web pages
US6029135A (en) Hypertext navigation system controlled by spoken words
JP4504555B2 (ja) 翻訳支援システム
JP4225703B2 (ja) 情報アクセス方法、情報アクセスシステムおよびプログラム
US6904429B2 (en) Information retrieval apparatus and information retrieval method
US20040205671A1 (en) Natural-language processing system
US20080133215A1 (en) Method and system of interpreting and presenting web content using a voice browser
JPH10326255A (ja) 言語から独立したメッセージの操作方法
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
JP2002513970A (ja) マシンアシスト翻訳ツール
JP3789614B2 (ja) ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体
JP2000148748A (ja) 仮名漢字変換及び画像検索表示システム
JPH1139306A (ja) 多言語情報の処理システムおよび処理方法
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
KR20080060690A (ko) 웹문서 스타일 변경 시스템 및 방법
JP2997469B2 (ja) 自然言語理解方法および情報検索装置
JP2003296327A (ja) 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム
KR20020013148A (ko) 연속어 음성 명령을 통한 인터넷 네비게이션 시스템 및 그방법
JP4187802B2 (ja) 文書作成装置
JP2002297667A (ja) 文書閲覧装置
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP7418761B2 (ja) 画像と文字との混在文章を生成する装置
JP2003345798A (ja) 翻訳制御方法,翻訳制御装置およびその処理プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060207