JP2002297632A - 用語抽出装置および方法ならびにコンピュータプログラム - Google Patents

用語抽出装置および方法ならびにコンピュータプログラム

Info

Publication number
JP2002297632A
JP2002297632A JP2001100318A JP2001100318A JP2002297632A JP 2002297632 A JP2002297632 A JP 2002297632A JP 2001100318 A JP2001100318 A JP 2001100318A JP 2001100318 A JP2001100318 A JP 2001100318A JP 2002297632 A JP2002297632 A JP 2002297632A
Authority
JP
Japan
Prior art keywords
term
information
extracted
field
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001100318A
Other languages
English (en)
Inventor
Masako Bosu
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001100318A priority Critical patent/JP2002297632A/ja
Publication of JP2002297632A publication Critical patent/JP2002297632A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 抽出された用語に抽出された文書の分野や出
典の情報を付与することで、より正しい用語抽出と情報
付与を可能にする。 【解決手段】 用語抽出部20では、形態素解析部10
から形態素解析された文書が入力されると、文書中の単
語すべてについて、パタン辞書のパタンを照合してい
く。そして、用語パタンルール21の全パタンを照合し
ているかどうか調べ(ステップ201)、照合していな
ければ照合のパタンを対象文書中で照合(走査)する
(ステップ202)。一致した単語並びがあれば(ステ
ップ203−yes)、それを抽出する(ステップ20
4)。用語パタンルールのすべてについて照合が終わっ
たら、抽出された用語に対して、分野の情報を付与する
(ステップ206)。分野情報の付与は、対象文書ある
いは文書集合のタイトルあるいは書誌情報を形態素解析
し(ステップ205)、分野テーブル23を検索し、分
野の情報を得ることにより行われる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書中から抽出さ
れた単語に対応づけて当該単語が抽出された文書の分野
の情報を抽出する用語抽出装置および方法ならびにコン
ピュータプログラムに関する。
【0002】
【従来の技術】昨今、文書中から専門用語や固有表現を
抽出する情報抽出技術に注目が集まっている。この情報
抽出技術では、現時点では、文書中から特定のパタンあ
るいは構文関係にある未知の語について抽出するものが
多い。例えば特開平11−272695号公報では、文
字列のパタンから未知の単語であっても抽出する方法
を、特開平7−85071号公報では構文関係を利用し
てその構文的役割にもとづいて意味を推定する方法が提
案されている。
【0003】
【発明が解決しようとする課題】しかし、これらの方法
では、抽出された用語について意味や関係に関する情報
は付与可能であるが、どのような分野の語であるかがわ
からない。用語は分野によって大きく変わるものであ
り、出典や分野の情報が重要である場合がある。例え
ば、「ECについて考える」といった場合、「エレクト
リックコマース」なのか「ヨーロッパ共同体」なのかは
文脈からはわからない。このようなアルファベットによ
る省略表現では特に分野が特定できない場合が多い。し
かし、「EC」の出典が経済誌なのか、歴史関係なのか
によってどちらの語なのかが推定できる。
【0004】また、非常に専門的な用語や特定の組織内
でしか使用されない単語の場合、抽出し、辞書等に登録
するとしてもどのような分野や用途の語なのかがわから
ない場合、辞書エントリのメンテナンスを考えると取捨
や検査が難しい。
【0005】本発明は、斯かる点に鑑みてなされたもの
で、その目的は、抽出された用語に抽出された文書の分
野や出典の情報を付与することで、より正しい用語抽出
と情報付与を可能にする用語抽出装置および方法ならび
にこの抽出方法を実現するコンピュータプログラムを提
供することにある。
【0006】
【課題を解決するための手段】前記目的を達成するた
め、本発明に係る用語抽出装置は、文書中から用語を抽
出する手段と、この抽出する手段によって抽出された用
語に対してその用語が使用される分野の情報を付与する
手段とを備えたことを特徴とする。
【0007】この場合、前記分野の情報としてタイトル
中の語を使用したり、書誌情報を使用することができ
る。また、前記抽出する手段によって抽出された単語と
同表記の語がすでに存在する場合に、抽出された単語の
分野あるいは書誌情報について、同表記の抽出済みの単
語の分野あるいは書誌情報と照合し、一致しない場合は
別の単語として抽出し、登録するようにする。さらに、
前記抽出する手段によって抽出された用語をユーザに提
示し、選択させる手段を設けることもできる。
【0008】また、本発明に係る用語抽出方法は、入力
された文書中の単語すべてについて、パタン辞書のパタ
ンを照合する工程と、照合により一致した単語並びがあ
れば抽出する工程と、抽出された用語に対して分野の情
報を付与する工程とを含んでなることを特徴とする。
【0009】さらに、本発明に係るコンピュータプログ
ラムは、入力された文書中の単語すべてについて、パタ
ン辞書のパタンを照合する手順と、照合により一致した
単語並びがあれば抽出する手順と、抽出された用語に対
して分野の情報を付与する手順とを備えたことを特徴と
する。
【0010】
【発明の実施の形態】以下、図面を参照し、本発明の実
施形態について説明する。
【0011】<第1の実施形態>図1は本発明の第1の
実施形態に係る用語抽出装置の構成を示すブロック図で
ある。本実施形態に係る用語抽出装置1は、図から分か
るように形態素解析部10と用語抽出部20とからな
る。形態素解析部10は、表記と品詞を記述した単語辞
書11と、品詞間の接続の可否を記述した接続表12と
を参照して解析を行う機能を備えている。形態素解析自
体は一般的な構成である。用語抽出部20は、抽出パタ
ンルール21を参照して用語抽出を行う機能を備えてい
る。
【0012】図2は用語抽出部20の処理の概要を示す
フローチャートである。用語抽出部20では、形態素解
析部10から形態素解析された文書が入力されると、文
書中の単語すべてについて、パタン辞書のパタンを照合
していく。そして、用語パタンルール21の全パタンを
照合しているかどうか調べ(ステップ201)、照合し
ていなければ照合のパタンを対象文書中で照合(走査)
する(ステップ202)。一致した単語並びがあれば
(ステップ203−yes)、それを抽出する(ステッ
プ204)。用語パタンルールのすべてについて照合が
終わったら、抽出された用語に対して、分野の情報を付
与する(ステップ206)。分野情報の付与は、対象文
書あるいは文書集合のタイトルあるいは書誌情報を形態
素解析し(ステップ205)、分野テーブル23を検索
し、分野の情報を得ることにより行われる。なお、用語
抽出部の処理は、図示しないCPUがROMに格納され
たプログラムにしたがって、図示しないRAMをワーク
エリアとして使用しながら実行される。
【0013】図3は抽出パタンルール21の例である。
このルールに基づいて処理することにより品詞あるいは
文字列を規定できる。
【0014】例(1)では、品詞が「未登録語」の語の
あとに、文字列「について」が位置し、その後に意味が
「検討」の語(「$」を頭に持つものはその意味の語で
あり、図1の意味辞書22を検索する)である。パタン
が照合された際には「処理」の欄に「抽出する」とある
語について用語として抽出する。ここでは、品詞以外に
表記、字種、文字長が指定可能である(例(2)、
(3))。図5は意味辞書22の例である。抽出パタン
ルール上で記述された「$」マークのある表現につい
て、この辞書によって実際の単語を得、照合に用いる。
【0015】図4は分野テーブルの一例を示す図であ
り、分野テーブル23は文書のタイトル、掲載誌等に含
まれる用語とその分野とを対応付けて記述したものであ
る。ここでは、ヨーロッパ、日本、歴史という文書のタ
イトルや用語に対して歴史という分野を対応付けし、コ
ンピュータ、情報というタイトルや用語に対して情報と
いう分野を対応付けし、コピーというタイトルや用語に
対しては複写機という分野を対応付けしている。
【0016】この対応付けに際しては、タイトル中の単
語で分野テーブルを検索し、書誌情報で分野テーブルを
検索するようにしてもよく、また、この分野テーブル2
3で分野情報を付与するが、例えばタイトルや書誌情報
そのものを分野情報として付与してもよい。
【0017】より具体的は、ある文書に「ECについて
検討している」という表現があった場合、パタンが照合
され、「EC」が用語として得られる。文書タイトルを
形態素解析し、分野テーブル23を検索する。文書のタ
イトルが例えば「情報化の進展」の場合、図4の分野テ
ーブルでは「情報」を含む場合は「情報」を付与する。
文書のタイトルが「ヨーロッパの歴史」の場合は、分野
テーブルにより「歴史」が得られる。ここでは分野テー
ブルを使用しているが、たとえば、タイトルを形態素解
析し、単語を付与してもよい。この例を図6に示す。
【0018】また、他の例として以下の文書の場
合。「」が形態素解析処理の切り出し単位である。
【0019】 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−− タイトル:「研修案内:複写機の仕組みを知る」 「複写機の仕組みを知ることは、当社においては必須の知識となります。」 「入社1年〜2年めの方を対象に講義を行ないます。」 「・撮像技術について」 「・手差しについて」 −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
【0020】以上を形態素解析すると、品詞の条件につ
いてパタンが一致するのは以下だが、 「撮|像|技術」品詞:名詞|名詞|名詞 「手|差し|」品詞:名詞|動詞連用形 「技術」は「1字」ではないので、この部分は一致しな
い。「撮像」「手差し」となる。これらについて、タイ
トル「研修案内:複写機の仕組みを知る」を形態素解析
し、分野テーブル23の語と一致するものをみると「複
写機」がある。そこで、抽出した語に分野として「複写
機」を付与する。この例を図6に示す。
【0021】タイトル以外の掲載誌や発行日時などの書
誌情報を直接付与する方法もある。すなわち、ある文書
に「ECについて検討している」という表現があった場
合、パタンが照合され、「EC」が用語として得られ
る。ここでは、書誌情報を形態素解析せずにそのまま付
与することもできる。この例を図7に示す。
【0022】このように文書中から抽出された単語に対
応づけて語が抽出された文書の分野の情報を付与するこ
とによりその語の意味を把握することができる。特に省
略語などで、概念は異なるが表記が同じ語があった場合
で文脈からも判定できない場合に、意味の判別を行なう
ことができる。また用語としての妥当性を確認でき、用
語のメンテナンスが容易になる。
【0023】また、文書の分野の情報としてタイトル中
の語を付与することにより、抽出された用語について分
野の情報を付与するができ、その語の意味を把握するこ
とができる。また、文書の分野の情報として書誌情報を
付与することにより、抽出された用語について分野の情
報を付与するができ、その語の意味を把握することがで
きる。
【0024】一方、抽出された単語と同表記の語がすで
に存在する場合に、抽出された単語の分野あるいは書誌
情報について、同表記の抽出済みの単語の分野あるいは
書誌情報と照合する。この照合により一致しない場合は
別の単語として抽出、登録する。この処理を図8のフロ
ーチャートに示す。この処理手順は、前述の場合と用語
抽出部20における処理内容は同じであるが、登録する
際の処理が異なる。
【0025】すなわち、この処理では、まず、用語抽出
部20で抽出された用語と同表記の語がすでに辞書にあ
るかどうかを調べる(ステップ801)。なければ形態
素解析部10でタイトルあるいは書誌情報を形態素解析
し(ステップ802)、分野テーブル23を検索して抽
出単語に分野情報を付与する(ステップ803)。一
方、ステップ801で同表記後があれば、登録済みの単
語の分野情報を調べ、新しく抽出した単語と同じである
かどうかを調べる(ステップ804)。同じであれば登
録しない(ステップ805)。同じでなければ、同表記
語であるが、別概念の語として、新たに登録する(ステ
ップ802,803)。
【0026】実際の処理としては、例えばある文書に
「ECについて検討している」という表現があった場
合、用語抽出部20で抽出パタンルールに基づいてパタ
ンが照合され、「EC」が用語として得られる。そし
て、形態素解析部10で文書タイトルを形態素解析し、
分野テーブル23を検索する。文書のタイトルが「情報
化の進展」の場合、図4の分野テーブルでは「情報」を
含む場合は「情報」を付与する。一方、すでに「EC」
という語が登録されているかどうかを調べると、図6に
示すようにすでに登録されている。これの分野情報を調
べると「歴史」となっており、新規に抽出された「情
報」とは異なることから、新規に抽出された「EC」と
分野情報「情報」を登録する。
【0027】このように処理すると、抽出された用語と
ともに記憶された分野の情報を調べることにより、抽出
された語がすでに登録済みの語と全く同じ概念なのかど
うかが分かり、用語の抽出洩れを防ぐことができる。
【0028】<第2の実施形態>図9は本発明の第2の
実施形態に係る用語抽出装置の構成を示すブロック図で
ある。本実施形態に係る用語抽出装置1は、第1の実施
形態に対してさらに用語提示選択部30を設けたもの
で、その他各部の構成は図1に示した第1の実施形態の
構成と同一である。以下、同等な各部には同一の参照符
号を付し、重複する説明は省略する。
【0029】この第2の実施形態は第1の実施形態に対
して用語抽出部20の概要は同じであるが、抽出後の処
理が異なり、抽出後の用語に対してユーザが選択するこ
とができる。この処理手順を図10のフローチャートに
示す。
【0030】この処理では、用語が抽出されると(ステ
ップ1001)、抽出された用語と分野の情報をユーザ
に提示し(ステップ1002)、ユーザは用語と分野の
情報をみて用語が登録されるべきかどうかの選択を行な
う(ステップ1003)。すなわち、用語抽出部20で
用語と分野が抽出される。その結果をユーザに提示す
る。図11が情報提示の例であり、「EC」という語に
対して、それぞれ分野情報「歴史」「情報」が提示され
ている。そして、用語提示選択部30で、ユーザが用語
として必要と判断した語を選択する。図12ではユーザ
が「情報」の意味の方だけを選択したことを示してい
る。
【0031】その他、特に説明しない各部は前述の第1
の実施形態と同等に構成され、同等に機能する。
【0032】このように構成すると、抽出された用語と
その分野の情報を提示することによって、ユーザは、抽
出された用語が必要なものかどうかを判断でき、ユーザ
の判断のもと用語として登録するかどうかを決定できる
のでより精度の高い用語データを得ることが可能とな
る。
【0033】
【発明の効果】以上のように本発明によれば、文書中か
ら用語を抽出する手段と、この抽出する手段によって抽
出された用語に対してその用語が使用される分野の情報
を付与する手段とを備えているので、抽出された用語に
ついて分野の情報を付与することができる。これによ
り、その語の意味を把握することが容易となる。特に省
略語などで、概念は異なるが表記が同じ語があった場合
で文脈からも判定できない場合に、意味の判別を行なう
ことができる。また用語としての妥当性を確認でき、用
語のメンテナンスが容易になる。
【0034】また、本発明によれば、分野の情報がタイ
トル中の語からなるので、タイトルを利用して簡単かつ
明確に分野情報を付与することができる。
【0035】また、本発明によれば、分野の情報が書誌
情報なので、書誌情報を利用して簡単かつ明確に分野情
報を付与することができる。
【0036】また、本発明によれば、抽出する手段によ
って抽出された単語と同表記の語がすでに存在する場合
に、抽出された単語の分野あるいは書誌情報について、
同表記の抽出済みの単語の分野あるいは書誌情報と照合
し、一致しない場合は別の単語として抽出し、登録する
ので、抽出された語がすでに登録済みの語と全く同じ概
念なのかどうかが分かり、用語の抽出洩れを防ぐことが
できる。
【0037】また、本発明によれば、抽出する手段によ
って抽出された用語をユーザに提示し、選択させる手段
をさらに備えているので、ユーザの判断のもとで用語と
して登録するかどうかを決定できるので、より精度の高
い用語データを得ることが可能となる。
【0038】また、本発明によれば、入力された文書中
の単語すべてについて、パタン辞書のパタンを照合する
工程と、照合により一致した単語並びがあれば抽出する
工程と、抽出された用語に対して分野の情報を付与する
工程とを含んでなるので、抽出された用語について分野
の情報を付与することができ、その語の意味を把握する
ことが容易となる。
【0039】さらに、本発明によれば、入力された文書
中の単語すべてについて、パタン辞書のパタンを照合す
る手順と、照合により一致した単語並びがあれば抽出す
る手順と、抽出された用語に対して分野の情報を付与す
る手順とを備えているので、コンピュータにインストー
ルし、インストールされたプログラムを実行することに
よって、抽出された用語について分野の情報を付与する
ことができ、その語の意味を把握することが容易に行え
る。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る用語抽出装置の
構成を示す機能ブロック図である。
【図2】本発明の第1の実施形態に係る用語抽出装置の
用語抽出部の処理手順を示すフローチャートである。
【図3】図1における抽出パターンルールの例を示す図
である。
【図4】図1における分野テーブルの例を示す図であ
る。
【図5】図1における意味辞書の例を示す図である。
【図6】抽出用語と分野の例を示す図である。
【図7】抽出用語の書誌情報付与の例を示す図である。
【図8】同表記語が存在する場合の第1の実施形態に係
る用語抽出装置の用語抽出部の登録の処理手順を示すフ
ローチャートである。
【図9】本発明の第2の実施形態に係る用語抽出装置の
構成を示す機能ブロック図である。
【図10】本発明の第2の実施形態に係る用語抽出装置
の用語抽出部の登録の処理手順を示すフローチャートで
ある。
【図11】本発明の第2の実施形態における用語抽出部
の情報提示の例を示す図である。
【図12】本発明の第2の実施形態における用語抽出部
の入力の例を示す図である。
【符号の説明】
10 形態素解析部 11 単語辞書 12 接続表 20 用語抽出部 21 抽出パタンルール 22 意味辞書 23 分野テーブル 30 用語提示選択部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文書中から用語を抽出する手段と、 この抽出する手段によって抽出された用語に対してその
    用語が使用される分野の情報を付与する手段と、を備え
    た用語抽出装置。
  2. 【請求項2】 前記分野の情報がタイトル中の語からな
    ることを特徴とする請求項1記載の用語抽出装置。
  3. 【請求項3】 前記分野の情報が書誌情報であることを
    特徴とする請求項1記載の用語抽出装置。
  4. 【請求項4】 前記抽出する手段によって抽出された単
    語と同表記の語がすでに存在する場合に、抽出された単
    語の分野あるいは書誌情報について、同表記の抽出済み
    の単語の分野あるいは書誌情報と照合し、一致しない場
    合は別の単語として抽出し、登録する手段を備えている
    ことを特徴とする請求項1記載の用語抽出装置
  5. 【請求項5】 前記抽出する手段によって抽出された用
    語をユーザに提示し、選択させる手段をさらに備えてい
    ることを特徴とする請求項1まはた4記載の用語抽出装
    置。
  6. 【請求項6】 入力された文書中の単語すべてについ
    て、パタン辞書のパタンを照合する工程と、 照合により一致した単語並びがあれば抽出する工程と、 抽出された用語に対して分野の情報を付与する工程と、
    を含んでなる用語抽出方法。
  7. 【請求項7】 入力された文書中の単語すべてについ
    て、パタン辞書のパタンを照合する手順と、 照合により一致した単語並びがあれば抽出する手順と、 抽出された用語に対して分野の情報を付与する手順と、
    を備えたコンピュータプログラム。
JP2001100318A 2001-03-30 2001-03-30 用語抽出装置および方法ならびにコンピュータプログラム Pending JP2002297632A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001100318A JP2002297632A (ja) 2001-03-30 2001-03-30 用語抽出装置および方法ならびにコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001100318A JP2002297632A (ja) 2001-03-30 2001-03-30 用語抽出装置および方法ならびにコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2002297632A true JP2002297632A (ja) 2002-10-11

Family

ID=18953768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001100318A Pending JP2002297632A (ja) 2001-03-30 2001-03-30 用語抽出装置および方法ならびにコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2002297632A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006508448A (ja) * 2002-11-28 2006-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ワードクラス情報を割り当てる方法
JP2013033367A (ja) * 2011-08-02 2013-02-14 Dainippon Printing Co Ltd 辞書作成装置、辞書作成方法、およびプログラム
US9430451B1 (en) 2015-04-01 2016-08-30 Inera, Inc. Parsing author name groups in non-standardized format

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006508448A (ja) * 2002-11-28 2006-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ワードクラス情報を割り当てる方法
US8032358B2 (en) 2002-11-28 2011-10-04 Nuance Communications Austria Gmbh Classifying text via topical analysis, for applications to speech recognition
US8612209B2 (en) 2002-11-28 2013-12-17 Nuance Communications, Inc. Classifying text via topical analysis, for applications to speech recognition
US8965753B2 (en) 2002-11-28 2015-02-24 Nuance Communications, Inc. Method to assign word class information
US9996675B2 (en) 2002-11-28 2018-06-12 Nuance Communications, Inc. Method to assign word class information
US10515719B2 (en) 2002-11-28 2019-12-24 Nuance Communications, Inc. Method to assign world class information
US10923219B2 (en) 2002-11-28 2021-02-16 Nuance Communications, Inc. Method to assign word class information
JP2013033367A (ja) * 2011-08-02 2013-02-14 Dainippon Printing Co Ltd 辞書作成装置、辞書作成方法、およびプログラム
US9430451B1 (en) 2015-04-01 2016-08-30 Inera, Inc. Parsing author name groups in non-standardized format

Similar Documents

Publication Publication Date Title
JP2006012168A (ja) 翻訳メモリシステムにおいてカバレージおよび質を改良する方法
JP2004118740A (ja) 質問応答システム、質問応答方法、質問応答プログラム
KR101507637B1 (ko) 오역의 검출을 지원하는 장치 및 방법
Mühlberger et al. User-driven correction of OCR errors: combining crowdsourcing and information retrieval technology
JP4935243B2 (ja) 検索プログラム、情報検索装置及び情報検索方法
JPH09198395A (ja) 文書検索装置
CN113157887A (zh) 知识问答意图识别方法、装置、及计算机设备
JP2002297632A (ja) 用語抽出装置および方法ならびにコンピュータプログラム
Pichler et al. From Concepts to Texts and Back: Operationalization as a Core Activity of Digital Humanities
JP2006227914A (ja) 情報検索装置、情報検索方法、プログラム、記憶媒体
Srikumar et al. Extraction of entailed semantic relations through syntax-based comma resolution
JP2006119697A (ja) 質問応答システム、質疑応答方法および質疑応答プログラム
JP3766406B2 (ja) 機械翻訳装置
JP2003303194A (ja) 慣用句辞書作成装置、検索用インデックス作成装置、文書検索装置、それらの方法、プログラム及び記録媒体
JPH06195371A (ja) 未登録語獲得方式
JP2600081B2 (ja) 自然言語対話装置
JP2004280316A (ja) 分野判定装置及び言語処理装置
JP4468608B2 (ja) 意味情報推定装置、意味情報推定方法、及びプログラム
JP2002278963A (ja) 事例翻訳装置
JP3752535B2 (ja) 訳語選択装置、及び翻訳装置
JP2002366556A (ja) 情報検索方法
JPH04257064A (ja) 要約情報抽出装置
JP4812811B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP4135467B2 (ja) 情報処理装置、システムおよびプログラム
Semmar et al. Integrating Specialized Bilingual Lexicons of Multiword Expressions for Domain Adaptation in Statistical Machine Translation