JPH08329105A - 文書処理方法及びその装置 - Google Patents

文書処理方法及びその装置

Info

Publication number
JPH08329105A
JPH08329105A JP7134226A JP13422695A JPH08329105A JP H08329105 A JPH08329105 A JP H08329105A JP 7134226 A JP7134226 A JP 7134226A JP 13422695 A JP13422695 A JP 13422695A JP H08329105 A JPH08329105 A JP H08329105A
Authority
JP
Japan
Prior art keywords
word
keyword
translation
document processing
prefix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7134226A
Other languages
English (en)
Inventor
Shogo Shibata
昇吾 柴田
Makoto Hirota
誠 廣田
Shiro Ito
史朗 伊藤
Takanari Ueda
隆也 上田
Yuji Ikeda
裕治 池田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7134226A priority Critical patent/JPH08329105A/ja
Priority to US08/657,042 priority patent/US6041293A/en
Publication of JPH08329105A publication Critical patent/JPH08329105A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 文書データのキーワードを取出し、所定の言
語に翻訳できる文書処理方法及びその装置を提供するこ
とを目的とする。 【構成】 文書保持部1に記憶されている文書データの
中から、単語切出し部3により単語を切り出し、前置語
・後置語切出し部4により、その単語の前後の前置語及
び後置語を切り出し、キーワード抽出部7により、統計
的手法を用いてその文書データのキーワードを抽出す
る。辞書引き部8は、キーワード抽出部7で抽出された
キーワードを、翻訳用辞書保持部9に保持されている翻
訳用辞書を参照し、前記前置語と後置毎の共起関係に基
づいて所定の言語に翻訳する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書データからキーワ
ードを取り出し、そのキーワードを他の言語に翻訳して
提供する文書処理方法及びその装置に関するものであ
る。
【0002】
【従来の技術】多くの文書情報をデータベースとして記
憶する場合、各文書情報にキーワードを付して記憶して
おき、そのキーワードを入力することにより、所望の文
書情報を検索して読み出すことができる文書処理システ
ムが知られている。このようなキーワードの付与は、オ
ペレータが各文書情報毎に作成して行なうか、或はアプ
リケーション・プログラム等により自動的に作成して付
与するのが一般的である。
【0003】コンピュータを用いて、文書情報にキーワ
ードを自動的に付与する場合、各文書情報からキーワー
ドとなる 単語を取り出して付与することが行われる。
このようなキーワードの付与方法としては、文書データ
中に出現する単語の出現頻度を調べ、その出現頻度を統
計的に処理することにより、キーワードを取り出す手法
が知られている。
【0004】
【発明が解決しようとする課題】いま、例えばある文書
データが日本語以外の言語で記述されている場合、その
文書データのキーワードを読み出して表示する場合、そ
のキーワードを日本語に変換して表示することが望まれ
る。このようなキーワードを翻訳する際に問題となるの
は、そのキーワードとして使用されている単語に複数の
訳語がある場合である。一般に、単語の訳語を選択する
ためには、文書全体において、その単語がどのような意
味で用いられているかが解らなければならない。従っ
て、そのキーワードの単語の意味を知るためには、その
単語の前後の単語や文脈といった情報が必要となる。
【0005】本発明は上記従来例に鑑みてなされたもの
で、文書データのキーワードを取出し、所定の言語に翻
訳できる文書処理方法及びその装置を提供することを目
的とする。
【0006】また本発明の目的は、文書データのキーワ
ードを正確に翻訳できる文書処理方法及びその装置を提
供することを目的とする。
【0007】また本発明の目的は、文書データの概要を
示すキーワードを抽出し、所望の言語に変換できる文書
処理方法及びその装置を提供することにある。
【0008】また本発明の他の目的は、キーワードを抽
出する際に、単語の訳語を選択する上で有効となる前後
の単語を保存し、キーワードを含む熟語や適切な訳語を
取り出すことができる文書処理方法及びその装置を提供
することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するため
に本発明の文書処理装置は以下のような構成を備える。
即ち、文書データの中から単語を切り出す単語切出し手
段と、前記単語切出し手段で切出された単語の前後の単
語を切り出す前置語・後置語切出し手段と、前記単語切
出し手段により切出された単語の出現頻度に基づいて前
記文書データのキーワードを抽出するキーワード抽出手
段と、前記キーワード抽出手段により抽出されたキーワ
ードを、前記前置語と後置語とに基づき翻訳用辞書を参
照して所定の言語に翻訳する翻訳手段とを有する。
【0010】上記目的を達成するために本発明の文書処
理方法は以下のような工程を備える。即ち、文書データ
の中から単語を切り出す工程と、切出された単語の前に
位置している前置語と、後に位置している後置語を切出
す工程と、前記切出された単語の出現頻度に基づいて前
記文書データのキーワードを抽出する抽出工程と、前記
抽出されたキーワードを前記前置語と後置語とに基づき
翻訳用辞書を参照して所定の言語に翻訳する翻訳工程と
を有する。
【0011】
【作用】以上の構成において、文書データの中から単語
を切り出し、その切出された単語の前後の単語を切り出
して前置語及び後置語を求め、その単語の出現頻度に基
づいて文書データのキーワードを抽出し、そのキーワー
ドを前記前置語と後置語とに基づいて翻訳用辞書を参照
して所定の言語に翻訳する。
【0012】更に、単語切出し手段により切りされた単
語と、前記前置語・後置語切出し手段により切出された
該単語の前置語及び後置語との共起関係を考慮して訳付
けする。
【0013】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0014】図1は、本発明の一実施例に係る文書処理
装置の機能構成を示す機能ブロック図である。
【0015】図1において、1は文書保持部で、入力さ
れた文書データを格納している。2は文切出し部で、処
理対象の文書データから文を切り出す。3は単語切出し
部で、文切出し部2で切り出した文から単語を切り出
す。4は前置語、後置語切出し部で、単語切出し部3で
切り出した単語の前後の単語を切り出す。5は単語抽出
リスト保持部で、単語切出し部3と前置語・後置語切出
し部4で切り出した単語を登録する。6は単語登録部
で、単語切出し部3で切り出した単語を単語抽出リスト
保持部5に登録する。7はキーワード抽出部で、単語抽
出リスト保持部5の単語抽出リストから統計的な手法で
キーワードを抽出する。8は辞書引き部で、キーワード
抽出部7で抽出されたキーワードの訳を付与するため
に、翻訳用辞書保持部9に記憶されている翻訳用辞書を
引く。10は出力部で、辞書引き部8で翻訳用辞書を参
照して翻訳されたキーワードをユーザに提示するために
表示或は印刷する。11は翻訳語指示部で、抽出された
キーワードを翻訳する言語を指示する。尚、本実施例の
翻訳辞書保持部9は、複数の言語の翻訳用辞書を備えて
おり、辞書引き部8はキーワード抽出部7で抽出された
キーワードを、翻訳語指示部11より指示された翻訳用
辞書を参照して、その指示された言語に翻訳することが
できる。但し、予め翻訳される言語が定められている時
は、この翻訳語指示部11はなくてもかまわない。
【0016】図2は、上述した機能を実行する本実施例
の文書処理装置のハードウェア構成を示すブロック図で
ある。
【0017】図2において、11は制御メモリで、図3
のフローチャートで示された制御手順を実施する制御プ
ログラムや各種データを記憶している。この制御メモリ
11は、例えばROMであっても、RAMであってもよ
い。12は中央処理装置(CPU)で、制御メモリ11
に記憶されている制御プログラムに従って後述する各種
処理を行う。13は、例えばRAMで構成されたメモリ
で、中央処理装置(CPU)12による制御処理の実行
時、各種データを一時的に記憶するワークメモリとして
も使用されるとともに、図1における文書保持部1、単
語抽出リスト保持部5としての機能も有している。14
はキーボードで、オペレータにより操作されて各種デー
タやコマンドなどを入力するのに使用され、例えば前述
の翻訳語指示部11における翻訳させたい言語を指示す
るのにも使用される。18はマウス等のポインティング
デバイスである。15はハードディスクで、文書データ
や翻訳用辞書等を記憶している。16ディスプレイ(表
示部)で、この表示部16は、例えばCRTであって
も、液晶ディスプレイであっても良く、この表示部16
には入力した文書データやキーワード等が表示される。
17は、上述した各構成要素同士を相互に接続するため
のシステムバスである。
【0018】図3及び図4は、本実施例の文書処理装置
における処理手順を示すフローチャートで、この処理を
実行する制御プログラムは図2の制御メモリ11に記憶
されており、CPU12の制御の下に実行される。以
下、これらフローチャートを参照して本実施例の文書処
理装置の動作を説明する。尚、本実施例では、英語の文
章を処理対象の文書データとし、キーワードを抽出して
日本語に翻訳して出力する場合で説明する。また、ここ
では「文」とは、1つ又は2つ以上の文節からなり、前
後に音の切れ目があり、最後の言い切りの文節となって
いるものを指すものとする。
【0019】まずステップS1で、例えばディスク15
から読み出されてメモリ13(文書保持部1)に記憶さ
れている文書データから1つの文を切り出し(文切出し
部2の機能に相当)、ステップS2で、その文より1つ
の単語を切り出す(単語切出し部3の機能に相当)。そ
の切り出した単語が変化形であればステップS3で原形
に戻す。ここでいう変化形とは、例えば、日本語であれ
ば活用形であり、英語であれば過去形や複数形、或は現
在形でも三人称単数に対する動詞のように「s」が付加
された単語等のことである。そしてステップS4に進
み、その単語が不要語であるかどうかを判断し、不要語
であればステップS2に戻り、その単語を無視して次の
単語について処理を行う。尚、ここでいう不要語とは、
どのような文章中でも多数現れてキーワードとならない
語のことであり、例えば日本語では「こと」「もの」、
英語では“the”,“do”などが該当する。
【0020】このステップS4における判定は、上述の
ように、予め不要語を登録しておいてCPU12が自動
的に判断するようにしても良く、或は表示部16に抽出
した単語を表示することにより、オペレータがキーボー
ド14やマウス18などを使用して、不要か否かを指示
するようにしても良い。
【0021】ステップS4で不要語でないと判断される
とステップS5に進み、その単語を単語抽出リストに登
録し(単語登録部6の機能に相当)、メモリ13の単語
抽出リスト保持部5に記憶する。更に、この単語の前後
の単語を切り出し(図1の前置語・後置語切り出し部4
に相当)て、ステップS6でメモリ13に登録する。こ
のような処理をメモリ13(文書保持部1)に記憶され
ている文書データの全単語に対して行う。
【0022】このようにして抽出され、メモリ13に記
憶された単語抽出リストの一例を図5に示す。
【0023】例えば、“increasing price level…”と
いう表現があった場合に、“price”を単語として抽出
し、その前置語として“increase”が有り、後置語とし
て“level”があることを単語抽出リストに記入する。
この単語抽出リストには、前置する単語とその単語が前
置した回数、後置する単語とその単語が後置した回数と
を列挙して記述する。
【0024】ステップS6で、メモリ13に記憶されて
いる文書データの全文に対する登録処理が終了するとス
テップS8に進み、メモリ13に記憶されている単語抽
出リストのデータを基に統計的手法を用いてキーワード
を抽出する。そしてステップS9に進んでキーワードの
1つに着目し、ステップS10では、ステップS9で着
目されたキーワードを、一語ずつ翻訳処理を行う。
【0025】次に図4のフローチャートを参照して、図
3のステップS10における翻訳処理を説明する。
【0026】まずステップS21で、ディスク15(翻
訳用辞書保持部9に相当)に記憶されている翻訳用辞書
を参照してキーワードの辞書引きをする(辞書引き部8
の機能に相当)。この例では、単語“price”をキーワ
ードとして辞書を引く。その結果、図6に示すような辞
書内容を検索することができる。
【0027】ここでは例えば図5に示す単語抽出リスト
の中から、前置または後置の出現回数が多いものから、
翻訳用辞書に熟語として登録されているものがあるかチ
ェックする。図5において、前置する回数が“3”で最
も多い“increase”が、このキーワードに付与された
“increase price”は、この翻訳用辞書にないので熟語
ではないことがわかる。次に、後置する回数が“2”の
“index”及び“level”について、キーワードにこれら
の後置語が後置された熟語“price index”及び“price
level”を辞書を調べると、図6に示す翻訳用辞書の2
行目と3行目のそれぞれに、対応する熟語があることが
わかる(ステップS23)。
【0028】こうして熟語表現がある時はステップS2
3よりステップS24に進み、キーワードとして、熟語
“price index”及び“price level”の訳語である「物
価指数」や「物価水準」を採用する。更に、このことか
ら、キーワードとして抽出した単語“price”の訳語が
「値段」ではなく、「物価」であることがわかる。従っ
てステップS25で、その旨を登録し、単語“price”
がキーワードである場合には、その訳語として「物価」
を出力することになる。
【0029】以上のような翻訳処理を、文書データより
抽出された全てのキーワードに対して施す。
【0030】図7は、翻訳対象言語が指示された時の処
理を示すフローチャートである。
【0031】ステップS31で、キーボード14或はマ
ウス18を使用して入力される、翻訳する言語の指示情
報の入力を待つ。これは例えば、「英語」より「日本
語」、「仏語」より「英語」などのような指示情報を入
力することにより指示される。尚、ここでは、単語の切
出しを行う文書データの言語が解っている場合は、単に
どの言語に翻訳するかだけを指示するようにしても良
い。次にステップS32に進み、ステップS31で指示
された言語に対応する翻訳用辞書を参照して、その時点
で抽出されているキーワードを、その指示された言語に
翻訳する。こうしてそのキーワードの訳語が見つかると
前述の図4のステップS23に進み、そのキーワードの
単語の前後の単語を含む熟語表現を参照して、そのキー
ワードに最適な訳語を求める。
【0032】尚、この図7のフローチャートで示す翻訳
語の指示情報を、図3のフローチャートの開始前に入力
することにより、これからキーワードを抽出しようとし
ている文書データが記述されている言語を予め決定する
ことができる。 (1)上記実施例では、英語で書かれた文書データを対
象としていたが英語以外の言語で記述された文書データ
でも良い。 (2)上記実施例では、キーワードの翻訳対象を日本語
としていたが日本語以外の言語でも良い。 (3)上記実施例では、抽出した単語と、その単語の前
後それぞれの1つの単語との共起関係に基づいて熟語を
抽出したが、前後それぞれ2つの単語または、それ以上
の数の単語との共起を考慮しても良い。 (4)上記実施例では、抽出された単語の前後の単語と
の共起関係から訳語を決定していたが、キーワード抽出
の際に、その文書データの関連分野(例えば、「コンピ
ュータ関連」といったもの)を特定できれば、その分野
情報から訳語を決定してもよいものとする。 (5)上記実施例では、単純に単語の前後関係で共起関
係を判断していたが、文の構文的な情報(例えば、名詞
なら連体修飾名詞との共起、動詞なら格成分)を用いて
訳語を決定しても良い。
【0033】更に、構文的な情報だけでなく、意味情報
などを考慮しても良い。
【0034】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置に本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できる。
【0035】以上説明したように本実施例によれば、元
の文章がどのような言語で記述されたものであっても、
ユーザが希望する言語でキーワードを抽出できる。
【0036】また、その文書データよりキーワードを抽
出して、そのキーワードを適正な訳語で表現できるの
で、その文書データの内容が、どのような内容であるか
を迅速に判断できるという効果がある。
【0037】
【発明の効果】以上説明したように本発明によれば、文
書データのキーワードを取出し、所定の言語に翻訳でき
るという効果がある。
【0038】また本発明によれば、文書データのキーワ
ードを正確に翻訳できる効果がある。
【0039】また本発明によれば、文書データの概要を
示すキーワードを抽出し、所望の言語に変換できるとい
う効果がある。
【0040】また本発明の他の目的は、キーワードを抽
出する際に、単語の訳語を選択する上で有効となる前後
の単語を保存し、キーワードを含む熟語や適切な訳語を
取り出すことができるという効果がある。
【0041】
【図面の簡単な説明】
【図1】本発明の一実施例に係る文書処理装置の機能構
成を示す機能ブロック図である。
【図2】本発明の一実施例に係る文書処理装置の概略構
成を示すブロック図である。
【図3】本実施例の文書処理装置における処理手順を示
すフローチャートである。
【図4】本実施例の文書処理装置におけるキーワードの
翻訳処理を示すフローチャートである。
【図5】本実施例の文書処理装置に係る単語抽出リスト
の一例を示す図である。
【図6】本発明の一実施例の文書処理装置に係る辞書デ
ータの一例を示す図である。
【図7】本発明の一実施例の文書処理装置における翻訳
語の指示情報の入力処理を示すフローチャートである。
【符号の説明】
1 文書保持部 2 文切り出し部 3 単語切り出し部 4 前置語・後置語切り出し部 5 単語抽出リスト保持部 6 単語登録部 7 キーワード抽出部 8 辞書引き部 9 翻訳用辞書保持部 10 出力部 11 制御メモリ 12 中央処理装置(CPU) 13 メモリ 14 キーボード 15 ディスク 16 ディスプレイ(表示部)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上田 隆也 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 文書データの中から単語を切り出す単語
    切出し手段と、 前記単語切出し手段で切出された単語の前後の単語を切
    り出す前置語・後置語切出し手段と、 前記単語切出し手段により切出された単語の出現頻度に
    基づいて前記文書データのキーワードを抽出するキーワ
    ード抽出手段と、 前記キーワード抽出手段により抽出されたキーワード
    を、前記前置語と後置語とに基づき翻訳用辞書を参照し
    て所定の言語に翻訳する翻訳手段と、を有することを特
    徴とする文書処理装置。
  2. 【請求項2】 前記翻訳手段は、前記単語切出し手段に
    より切りされた単語と、前記前置語・後置語切出し手段
    により切出された該単語の前置語及び後置語との共起関
    係を考慮して訳付けすることを特徴とする請求項1に記
    載の文書処理装置。
  3. 【請求項3】 前記翻訳手段により翻訳される言語を指
    定する指定手段を更に有することを特徴とする請求項1
    又は2項に記載の文書処理装置。
  4. 【請求項4】 前記翻訳用辞書は、少なくとも日本語と
    外国語とを関連付ける辞書を含むことを特徴とする請求
    項1に記載の文書処理装置。
  5. 【請求項5】 前記翻訳手段による翻訳結果を表示・出
    力する出力手段を更に有することを特徴とする請求項1
    乃至4項のいずれか1項に記載の文書処理装置。
  6. 【請求項6】 前記キーワード抽出手段は、前記文書デ
    ータ中に出現する単語の出現回数を計数する計数手段
    と、前記計数手段により計数された出現回数が多い単語
    をキーワードとして抽出することを特徴とする請求項1
    乃至5項のいずれか1項に記載の文書処理装置。
  7. 【請求項7】 前記キーワード抽出手段は、予めキーワ
    ードとして採用しないように定められている不要語を除
    く単語の出現回数を計数する単語計数手段と、前記単語
    計数手段により計数された出現回数が多い単語をキーワ
    ードとして抽出することを特徴とする請求項1乃至5項
    のいずれか1項に記載の文書処理装置。
  8. 【請求項8】 前記キーワード抽出手段は、前記文書デ
    ータ中に出現する単語に前置する前置語の出現回数を計
    数する前置計数手段と、前記単語に後置する後置語の出
    現回数を計数する後置計数手段と、前記前置計数手段及
    び前記後置計数手段のそれぞれにより計数された回数が
    最も多い前置語及び後置語を、前記単語切出し手段によ
    り切出された単語の前置語及び後置語と決定することを
    特徴とする請求項1乃至7項のいずれか1項に記載の文
    書処理装置。
  9. 【請求項9】 文書データの中から単語を切り出す工程
    と、 切出された単語の前に位置している前置語と、後に位置
    している後置語を切出す工程と、 前記切出された単語の出現頻度に基づいて前記文書デー
    タのキーワードを抽出する抽出工程と、 前記抽出されたキーワードを前記前置語と後置語とに基
    づき翻訳用辞書を参照して所定の言語に翻訳する翻訳工
    程と、を有することを特徴とする文書処理方法。
  10. 【請求項10】 前記翻訳工程は、前記切出された単語
    と、前記前置語及び前記後置語との共起関係を考慮して
    訳付けすることを特徴とする請求項9に記載の文書処理
    方法。
  11. 【請求項11】 前記翻訳工程において翻訳される言語
    を指定する工程を更に有することを特徴とする請求項9
    又は10項に記載の文書処理方法。
  12. 【請求項12】 前記翻訳用辞書は、少なくとも日本語
    と外国語とを関連付ける辞書を含むことを特徴とする請
    求項9に記載の文書処理方法。
  13. 【請求項13】 前記翻訳工程による翻訳結果を表示・
    出力する工程を更に有することを特徴とする請求項9乃
    至12項のいずれか1項に記載の文書処理方法。
  14. 【請求項14】 前記抽出工程において、前記文書デー
    タ中に出現する単語の出現回数を計数し、その計数され
    た出現回数が最も多い単語をキーワードとして抽出する
    ことを特徴とする請求項9乃至13項のいずれか1項に
    記載の文書処理方法。
  15. 【請求項15】 前記抽出工程において、前記文書デー
    タ中に出現する単語に前置する前置語の出現回数を計数
    し、前記単語に後置する後置語の出現回数を計数し、こ
    れら計数された出現回数のそれぞれが最も多い前置語及
    び後置語を、前記単語の前置語及び後置語として決定す
    ることを特徴とする請求項9乃至14項のいずれか1項
    に記載の文書処理方法。
JP7134226A 1995-05-31 1995-05-31 文書処理方法及びその装置 Pending JPH08329105A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7134226A JPH08329105A (ja) 1995-05-31 1995-05-31 文書処理方法及びその装置
US08/657,042 US6041293A (en) 1995-05-31 1996-05-29 Document processing method and apparatus therefor for translating keywords according to a meaning of extracted words

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7134226A JPH08329105A (ja) 1995-05-31 1995-05-31 文書処理方法及びその装置

Publications (1)

Publication Number Publication Date
JPH08329105A true JPH08329105A (ja) 1996-12-13

Family

ID=15123378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7134226A Pending JPH08329105A (ja) 1995-05-31 1995-05-31 文書処理方法及びその装置

Country Status (2)

Country Link
US (1) US6041293A (ja)
JP (1) JPH08329105A (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6516296B1 (en) * 1995-11-27 2003-02-04 Fujitsu Limited Translating apparatus, dictionary search apparatus, and translating method
JP3952216B2 (ja) * 1995-11-27 2007-08-01 富士通株式会社 翻訳装置及び辞書検索装置
CN1174332C (zh) * 2000-03-10 2004-11-03 松下电器产业株式会社 转换表达方式的方法和装置
JP2002157202A (ja) * 2000-11-17 2002-05-31 Square Co Ltd 情報処理装置、メッセージ通信方法、記録媒体およびコンピュータ・プログラム
US6885985B2 (en) * 2000-12-18 2005-04-26 Xerox Corporation Terminology translation for unaligned comparable corpora using category based translation probabilities
AU2003211086A1 (en) * 2002-02-15 2003-09-09 Emit, Inc. Legal document generating system
US20040012618A1 (en) * 2002-07-18 2004-01-22 Finney Randolph L. Legal document generating system
US20030158848A1 (en) * 2002-02-15 2003-08-21 Finney Randolph L. Divorce document generating and calculating system
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7356457B2 (en) 2003-02-28 2008-04-08 Microsoft Corporation Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words
JP2006276903A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 文書処理装置
WO2009084757A1 (en) * 2007-12-31 2009-07-09 Dki Technology Co., Ltd. Method and apparatus for extracting keyword data
US20100332215A1 (en) * 2009-06-26 2010-12-30 Nokia Corporation Method and apparatus for converting text input
US8484218B2 (en) * 2011-04-21 2013-07-09 Google Inc. Translating keywords from a source language to a target language
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
IL252071A0 (en) * 2017-05-03 2017-07-31 Google Inc Contextual language translation

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5953590B2 (ja) * 1979-09-14 1984-12-26 シャープ株式会社 翻訳装置
US4623985A (en) * 1980-04-15 1986-11-18 Sharp Kabushiki Kaisha Language translator with circuitry for detecting and holding words not stored in dictionary ROM
US5765131A (en) * 1986-10-03 1998-06-09 British Telecommunications Public Limited Company Language translation system and method
US5384701A (en) * 1986-10-03 1995-01-24 British Telecommunications Public Limited Company Language translation system
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
JPH01234975A (ja) * 1988-03-11 1989-09-20 Internatl Business Mach Corp <Ibm> 日本語文章分割装置
EP0366142B1 (en) * 1988-10-28 1997-08-06 Kabushiki Kaisha Toshiba Method and apparatus of machine translation
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH0567144A (ja) * 1991-09-07 1993-03-19 Hitachi Ltd 前編集支援方法およびその装置
US5267156A (en) * 1991-12-05 1993-11-30 International Business Machines Corporation Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
US5373442A (en) * 1992-05-29 1994-12-13 Sharp Kabushiki Kaisha Electronic translating apparatus having pre-editing learning capability
JP2583386B2 (ja) * 1993-03-29 1997-02-19 日本電気株式会社 キーワード自動抽出装置
JP3015223B2 (ja) * 1993-05-14 2000-03-06 シャープ株式会社 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置
JP3220885B2 (ja) * 1993-06-18 2001-10-22 株式会社日立製作所 キーワード付与システム
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
JP3356536B2 (ja) * 1994-04-13 2002-12-16 松下電器産業株式会社 機械翻訳装置

Also Published As

Publication number Publication date
US6041293A (en) 2000-03-21

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
JPH08329105A (ja) 文書処理方法及びその装置
JPH0644296A (ja) 機械翻訳装置
US7283949B2 (en) System, method and program product for bidirectional text translation
JP2815714B2 (ja) 翻訳装置
WO1997048058A9 (en) Automated translation of annotated text
WO1997048058A1 (en) Automated translation of annotated text
JP2719453B2 (ja) 機械翻訳装置
JP3244286B2 (ja) 翻訳処理装置
JPS62203266A (ja) 機械翻訳システム
JP2715875B2 (ja) 多言語要約生成装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JPH07200605A (ja) 翻訳装置
JPH1083399A (ja) 機械翻訳装置及び翻訳プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06162071A (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP3233800B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JP3267168B2 (ja) 自然言語変換システム
JPH05225232A (ja) テキスト自動前編集装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH05197752A (ja) 機械翻訳装置
JPH0816910B2 (ja) 言語解析装置
JPH04296969A (ja) 機械翻訳装置
JPH0635964A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050318

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050325

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050603