JP5995219B2 - 対訳辞書生成装置、方法、及びプログラム - Google Patents
対訳辞書生成装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5995219B2 JP5995219B2 JP2013155831A JP2013155831A JP5995219B2 JP 5995219 B2 JP5995219 B2 JP 5995219B2 JP 2013155831 A JP2013155831 A JP 2013155831A JP 2013155831 A JP2013155831 A JP 2013155831A JP 5995219 B2 JP5995219 B2 JP 5995219B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- attribute
- template
- name
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000000605 extraction Methods 0.000 claims description 78
- 238000013519 translation Methods 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 28
- 239000000284 extract Substances 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 19
- 230000014616 translation Effects 0.000 description 34
- 238000004519 manufacturing process Methods 0.000 description 5
- 235000010724 Wisteria floribunda Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Description
前記第1の言語の記事テンプレートを用いて記述している記事の集合を抽出し、前記第2の言語の記事テンプレートを用いて記述している記事の集合を抽出するテンプレート引用記事集合抽出部、前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合及び前記第2の言語の属性名の集合において、前記第1の言語の属性名と前記第2の言語の属性名とを対応付け、前記テンプレート引用記事集合抽出部によって抽出された前記第1の言語の記事の集合及び前記第2の言語の記事の集合に基づいて、前記第1の言語の記事の集合から抽出される、前記対応付けられた前記第1の言語の属性名に対する属性値の集合、及び前記第2の言語の記事の集合から抽出される、前記対応付けられた前記第2の言語の属性名に対する属性値の集合において、前記第1の言語の属性値と前記第2の言語の属性値とを対応付ける対応付け部、及び前記対応付け部によって対応付けられた前記第1の言語の属性名の文字列と前記第2の言語の属性名の文字列とのペアの各々、及び対応付けられた前記第1の言語の属性値の文字列と前記第2の言語の属性値の文字列とのペアの各々を、対訳ペアとして格納した前記対訳辞書を生成する対訳辞書生成部として機能させるためのプログラムである。
あるタイプτの実体に関して、そのタイプを持つ実体群に対する属性・属性値記述を行うために、言語ごとに、予め準備されている記事テンプレートを具体化することにより、ある具体的な実体εに対する記事が様々な言語により記述されているとき、当該のタイプτに対して準備されている原言語Xの記事テンプレートID:S、目的言語Yの記事テンプレートID:Tを入力とし、これらの記事テンプレートから属性名の言語間対応付けを行い、さらに、これらの記事テンプレートIDにより指定されるテンプレートを引用している記事群から属性値の言語間対応付けを行うことにより、この対応付け情報から対訳辞書を抽出する。
あるタイプの実体を記述する記事は、その実体のタイプを反映した記事テンプレートを引用することにより記述される。記事テンプレートには、当該のタイプの実体を記述するための属性が列挙されている。また、各記事には、記事が対象とする実体に対して、各属性に対する情報を与える属性値が記述されている。
本発明の第1の実施の形態に係る対訳辞書生成装置100は、原言語(第1の言語)の文字列(単語)と、目的言語(第2の言語)の文字列(単語)との対訳辞書を生成する。この対訳辞書生成装置100は、CPUと、RAMと、後述する対訳辞書生成処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。図2に示すように、対訳辞書生成装置100は、入力部1と、演算部2と、出力部4とを備えている。
具体的には、テンプレート属性集合抽出部20は、入力部1により受け付けた記事テンプレートIDの記事テンプレートのソースコードをインターネット5を介して取得・解析し、当該記事テンプレートに含まれる属性名のそれぞれに対し属性IDを付与し、これら属性IDの集合を抽出する。ここで、属性IDとは、同じ意味を持つ属性を表す属性名の集合(例:{名称、名前、通称})を識別するためのIDである。すなわち、例えば、属性名の集合{名称、名前、通称}に対して、同じ属性IDが付与される。なお、属性名が同じ意味を持つか否かは、従来既知の同義語の判定技術を用いればよいため、説明を省略する。
また、テンプレート属性集合抽出部20は、この過程において、属性IDと属性名文字列集合の対応関係を保持する内部テーブルである属性IDテーブルを生成し、後述する内部テーブルデータベース30に格納する。なお、テンプレート属性集合抽出部20は、入力部1により受け付けた記事テンプレートID:Sに対する属性ID集合αと、記事テンプレートID:Tに対する属性ID集合βとを抽出する。ここで、属性ID集合α={α1,α2,・・・,αM}であり、属性ID集合β={β1,β2,・・・}である。
具体的には、テンプレート引用記事集合抽出部22は、入力部1により受け付けた記事テンプレートIDに基づいて、当該記事テンプレートIDに対応する記事テンプレートを引用している記事群を求め、これらの記事の記事ID集合を抽出する。ここで、各記事は記事IDを持つ。各記事には、それが引用する記事テンプレートの記事テンプレートIDが明記されているものとする。このため、例えば、処理対象の記事群に対してテンプレートIDをキーとする検索を行うことにより、指定された記事テンプレートを引用する記事群の記事ID集合を抽出することができる。
(2)目的言語Yにおいて、ある属性IDにより表される属性名集合に要素である属性名文字列
また、対応付け部3は、内部テーブルデータベース30と、属性ID集合ソート部32と、第1属性値インスタンス集合抽出部34と、対応属性候補抽出部36と、第2属性値インスタンス集合抽出部38と、属性値インスタンス集合間類似度計算部40と、対応付け決定部42と、反復判定部44とを備えている。
(2)目的言語Yにおいてある属性IDにより表される属性名集合のいずれかの属性名に対して、ある記事において現れる属性値文字列
具体的には、第1属性値インスタンス集合抽出部34は、テンプレート引用記事集合抽出部22によって生成された目的言語Xの記事ID集合の各記事から、記事IDと、処理対象の原言語Xの属性名の属性値文字列とのペアの集合である属性値インスタンス集合V={v1,v2,・・・}を抽出する。より詳細には、第1属性値インスタンス集合抽出部34は、インターネット5を介して、記事のソースコードを取得・解析し、指定された属性IDにより表される属性が当該記事に含まれるとき、その属性に対して与えられている属性値文字列と当該記事IDのペアを抽出する。
具体的には、対応属性候補抽出部36は、属性ID集合ソート部32によって生成された属性ID集合のうち先頭に位置する原言語Xの属性ID:aと、テンプレート属性集合抽出部20によって抽出された目的言語Yの属性ID集合βとに基づいて、属性ID集合βの要素({β1,β2,・・・})の中から、属性ID:aの言語間対応付けの候補となる要素を選択し、これらの対応付け候補から構成されている属性ID集合β'(={β’1,β’2,・・・})を抽出する。例えば、対応属性候補抽出部36は、属性名類似度計算部28を用いて、属性ID:aと属性ID集合βの各要素βiとの属性名類似度を計算し、当該属性名類似度が予め定められた閾値θ0より大きい要素βiを、対応付け候補として選択する。さらに、得られた属性名類似度を、属性ID:a、属性ID:βi、原言語X、目的言語Yの属性名文字列ともに内部テーブルデータベース30に格納されている属性名類似度テーブルに記録する。なお、訳語決定フラグの値はFalseに設定する。
具体的には、第2属性値インスタンス集合抽出部38は、第1属性値インスタンス集合抽出部34と同様に、テンプレート引用記事集合抽出部22によって生成された目的言語Yの記事ID集合の各記事から、記事IDと、当該目的言語Yの属性名に対する属性値文字列とのペアの集合である属性値インスタンス集合W={w1,w2,・・・}を抽出する。
(2)目的言語Yにおいてある属性IDにより表される属性に対する属性値文字列の集合
具体的には、対訳辞書生成部50は、対応付け部3の各処理で得られ、内部テーブルデータベース30に格納された属性名類似度テーブル、及び属性値インスタンス類似度テーブルの各々のエントリのうち、訳語決定フラグがTrueとなっているエントリを、以下の7つ組の集合である対訳辞書テーブルの形式に変換し、これらを統合(マージ)することにより、対訳辞書を生成する。
(1)属性名類似度テーブルを対訳辞書形式に変換
属性名類似度テーブルにおけるエントリの中で訳語決定フラグがTrueとなっているエントリを抽出し、当該のエントリにおける原言語X、目的言語Yの属性IDをそれぞれ対訳辞書テーブルの原言語X、目的言語Yの属性にコピーする。また、原言語X、目的言語Yの属性名文字列をそれぞれ対訳辞書の言語X、Yの文字列にコピーする。さらに、属性名類似度を対訳辞書テーブルの訳語対応度にコピーする。
(2)属性値インスタンス類似度テーブルを対訳辞書形式に変換
属性値インスタンス類似度テーブルの中で訳語決定フラグがTrueとなっているエントリを抽出し、当該のエントリにおける原言語X、目的言語Yの属性IDをそれぞれ対訳辞書の原言語X、目的言語Yの属性にコピーする。また、原言語X、目的言語Yの属性値文字列をそれぞれ対訳辞書の原言語X、目的言語Yの文字列にコピーする。さらに、属性値類似度を対訳辞書の訳語対応度にコピーする。
次に、本実施の形態に係る対訳辞書生成装置100の作用について説明する。まず、記述対象の実体のタイプが対応している原言語Xの記事テンプレートIDと、目的言語Yの記事テンプレートIDとのペアが、対訳辞書生成装置100に入力されると、対訳辞書生成装置100によって、図3に示す対訳辞書生成処理ルーチンが実行される。
ステップS120において、上記ステップS118で算出された属性値インスタンス集合間類似度simiのうち、最大の属性値インスタンス集合間類似度simiを与える要素β’iを、β*とする。
2 演算部
3 対応付け部
4 出力部
5 インターネット
20 テンプレート属性集合抽出部
22 テンプレート引用記事集合抽出部
24 文字列翻訳部
26 文字列類似度計算部
28 属性名類似度計算部
30 内部テーブルデータベース
32 属性ID集合ソート部
34 第1属性値インスタンス集合抽出部
36 対応属性候補抽出部
38 第2属性値インスタンス集合抽出部
40 属性値インスタンス集合間類似度計算部
42 対応付け決定部
44 反復判定部
50 対訳辞書生成部
100 対訳辞書生成装置
Claims (4)
- 対訳となる第1の言語の文字列と、第2の言語の文字列との組み合わせである対訳ペアを格納した対訳辞書を生成する対訳辞書生成装置であって、
記述対象の実体についての記事を記述するための、前記実体に関する属性名が列挙された記事テンプレートであって、前記記述対象となる実体のタイプが対応する前記第1の言語の記事テンプレート及び前記第2の言語の記事テンプレートに基づいて、前記第1の言語の記事テンプレートに含まれる属性名の集合を抽出し、前記第2の言語の記事テンプレートに含まれる属性名の集合を抽出するテンプレート属性集合抽出部と、
前記第1の言語の記事テンプレートを用いて記述している記事の集合を抽出し、前記第2の言語の記事テンプレートを用いて記述している記事の集合を抽出するテンプレート引用記事集合抽出部と、
前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合及び前記第2の言語の属性名の集合において、前記第1の言語の属性名と前記第2の言語の属性名との各ペアについて、前記ペアの類似度を算出し、各ペアについて算出された前記類似度及び予め定められた第1閾値に基づいて、前記第1の言語の属性名と前記第2の言語の属性名とを対応付け、
前記テンプレート引用記事集合抽出部によって抽出された前記第1の言語の記事の集合及び前記第2の言語の記事の集合に基づいて、前記第1の言語の記事の集合から抽出される、前記対応付けられた前記第1の言語の属性名に対する属性値の集合、及び前記第2の言語の記事の集合から抽出される、前記対応付けられた前記第2の言語の属性名に対する属性値の集合において、前記第1の言語の属性値と前記第2の言語の属性値との各ペアについて、前記ペアの類似度を算出し、各ペアについて算出された前記類似度及び予め定められた第2閾値に基づいて、前記第1の言語の属性値と前記第2の言語の属性値とを対応付ける対応付け部と、
前記対応付け部によって対応付けられた前記第1の言語の属性名の文字列と前記第2の言語の属性名の文字列とのペアの各々、及び対応付けられた前記第1の言語の属性値の文字列と前記第2の言語の属性値の文字列とのペアの各々を、対訳ペアとして格納した前記対訳辞書を生成する対訳辞書生成部と、を含み、
前記対応付け部は、
前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合に含まれる各属性名について、予め定められた順番で、前記第1の言語の属性名を、処理対象とし、
前記処理対象の第1の言語の属性名について、前記第2の言語の属性名との対応付けを行い、前記処理対象の第1の言語の属性名の属性値について、前記第2の言語の属性値との対応付けを行うことを、前記処理対象の第1の言語の属性名毎に繰り返し、
前記処理対象の第1の言語の属性名について前記対応付けを行う毎に、前記第1閾値及び前記第2閾値を低減させる対訳辞書生成装置。 - 前記対応付け部は、
前記テンプレート引用記事集合抽出部によって抽出された前記第1の言語の記事の集合から、前記処理対象の第1の言語の属性名に対する属性値の集合を抽出する第1属性値インスタンス集合抽出部と、
前記テンプレート属性集合抽出部によって抽出された前記第2の言語の属性名の集合から、属性名の類似度に基づいて、前記処理対象の第1の言語の属性名に対応する前記第2の言語の属性名の候補の集合を抽出する対応属性候補抽出部と、
前記第2の言語の属性名の候補の集合に含まれる前記第2の言語の属性名の各々について、前記テンプレート引用記事集合抽出部によって抽出された前記第2の言語の記事の集合から、前記第2の言語の属性名に対する属性値の集合を抽出する第2属性値インスタンス集合抽出部と、
前記第2の言語の属性名の候補の集合に含まれる前記第2の言語の属性名の各々について、前記第2の言語の属性名について前記第2属性値インスタンス集合抽出部によって抽出された前記第2の言語の属性名に対する属性値の集合と、前記第1属性値インスタンス集合抽出部によって抽出された前記処理対象の第1の言語の属性名に対する属性値の集合との間の類似度である属性値インスタンス集合間類似度を計算する属性値インスタンス集合間類似度計算部と、
前記第2の言語の属性名の候補の集合に含まれる前記第2の言語の属性名の各々について、前記属性値インスタンス集合間類似度計算部によって計算された属性値インスタンス集合間類似度が、前記第1閾値以上であれば、前記処理対象の第1の言語の属性名と、前記第2の言語の属性名とを対応付け、
前記対応付けられた前記処理対象の第1の言語の属性名及び前記第2の言語の属性名の各々に対する属性値の集合における、前記第1の言語の属性値と前記第2の言語の属性値との各ペアについて、前記ペアの類似度が前記第2閾値以上であれば、前記ペアの前記第1の言語の属性値と前記第2の言語の属性値とを対応付ける対応付け決定部とを含む請求項1に記載の対訳辞書生成装置。 - テンプレート属性集合抽出部と、テンプレート引用記事集合抽出部と、対応付け部と、対訳辞書生成部とを含み、対訳となる第1の言語の文字列と、第2の言語の文字列との組み合わせである対訳ペアを格納した対訳辞書を生成する対訳辞書生成装置における対訳辞書生成方法であって、
前記テンプレート属性集合抽出部によって、記述対象の実体についての記事を記述するための、前記実体に関する属性名が列挙された記事テンプレートであって、前記記述対象となる実体のタイプが対応する前記第1の言語の記事テンプレート及び前記第2の言語の記事テンプレートに基づいて、前記第1の言語の記事テンプレートに含まれる属性名の集合を抽出し、前記第2の言語の記事テンプレートに含まれる属性名の集合を抽出するステップと、
前記テンプレート引用記事集合抽出部によって、前記第1の言語の記事テンプレートを用いて記述している記事の集合を抽出し、前記第2の言語の記事テンプレートを用いて記述している記事の集合を抽出するステップと、
前記対応付け部によって、前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合及び前記第2の言語の属性名の集合において、前記第1の言語の属性名と前記第2の言語の属性名との各ペアについて、前記ペアの類似度を算出し、各ペアについて算出された前記類似度及び予め定められた第1閾値に基づいて、前記第1の言語の属性名と前記第2の言語の属性名とを対応付け、
前記テンプレート引用記事集合抽出部によって抽出された前記第1の言語の記事の集合及び前記第2の言語の記事の集合に基づいて、前記第1の言語の記事の集合から抽出される、前記対応付けられた前記第1の言語の属性名に対する属性値の集合、及び前記第2の言語の記事の集合から抽出される、前記対応付けられた前記第2の言語の属性名に対する属性値の集合において、前記第1の言語の属性値と前記第2の言語の属性値との各ペアについて、前記ペアの類似度を算出し、各ペアについて算出された前記類似度及び予め定められた第2閾値に基づいて、前記第1の言語の属性値と前記第2の言語の属性値とを対応付けるステップと、
前記対訳辞書生成部によって、前記対応付け部によって対応付けられた前記第1の言語の属性名の文字列と前記第2の言語の属性名の文字列とのペアの各々、及び対応付けられた前記第1の言語の属性値の文字列と前記第2の言語の属性値の文字列とのペアの各々を、対訳ペアとして格納した前記対訳辞書を生成するステップと、を含み、
前記対応付け部が対応付けを行うステップは、
前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合に含まれる各属性名について、予め定められた順番で、前記第1の言語の属性名を、処理対象とし、
前記処理対象の第1の言語の属性名について、前記第2の言語の属性名との対応付けを行い、前記処理対象の第1の言語の属性名の属性値について、前記第2の言語の属性値との対応付けを行うことを、前記処理対象の第1の言語の属性名毎に繰り返し、
前記処理対象の第1の言語の属性名について前記対応付けを行う毎に、前記第1閾値及び前記第2閾値を低減させる対訳辞書生成方法。 - 対訳となる第1の言語の文字列と、第2の言語の文字列との組み合わせである対訳ペアを格納した対訳辞書を生成するためのプログラムであって、
コンピュータを、
記述対象の実体についての記事を記述するための、前記実体に関する属性名が列挙された記事テンプレートであって、前記記述対象となる実体のタイプが対応する前記第1の言語の記事テンプレート及び前記第2の言語の記事テンプレートに基づいて、前記第1の言語の記事テンプレートに含まれる属性名の集合を抽出し、前記第2の言語の記事テンプレートに含まれる属性名の集合を抽出するテンプレート属性集合抽出部、
前記第1の言語の記事テンプレートを用いて記述している記事の集合を抽出し、前記第2の言語の記事テンプレートを用いて記述している記事の集合を抽出するテンプレート引用記事集合抽出部、
前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合及び前記第2の言語の属性名の集合において、前記第1の言語の属性名と前記第2の言語の属性名との各ペアについて、前記ペアの類似度を算出し、各ペアについて算出された前記類似度及び予め定められた第1閾値に基づいて、前記第1の言語の属性名と前記第2の言語の属性名とを対応付け、
前記テンプレート引用記事集合抽出部によって抽出された前記第1の言語の記事の集合及び前記第2の言語の記事の集合に基づいて、前記第1の言語の記事の集合から抽出される、前記対応付けられた前記第1の言語の属性名に対する属性値の集合、及び前記第2の言語の記事の集合から抽出される、前記対応付けられた前記第2の言語の属性名に対する属性値の集合において、前記第1の言語の属性値と前記第2の言語の属性値との各ペアについて、前記ペアの類似度を算出し、各ペアについて算出された前記類似度及び予め定められた第2閾値に基づいて、前記第1の言語の属性値と前記第2の言語の属性値とを対応付ける対応付け部、及び
前記対応付け部によって対応付けられた前記第1の言語の属性名の文字列と前記第2の言語の属性名の文字列とのペアの各々、及び対応付けられた前記第1の言語の属性値の文字列と前記第2の言語の属性値の文字列とのペアの各々を、対訳ペアとして格納した前記対訳辞書を生成する対訳辞書生成部
として機能させるためのプログラムであって、
前記対応付け部は、
前記テンプレート属性集合抽出部によって抽出された前記第1の言語の属性名の集合に含まれる各属性名について、予め定められた順番で、前記第1の言語の属性名を、処理対象とし、
前記処理対象の第1の言語の属性名について、前記第2の言語の属性名との対応付けを行い、前記処理対象の第1の言語の属性名の属性値について、前記第2の言語の属性値との対応付けを行うことを、前記処理対象の第1の言語の属性名毎に繰り返し、
前記処理対象の第1の言語の属性名について前記対応付けを行う毎に、前記第1閾値及び前記第2閾値を低減させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013155831A JP5995219B2 (ja) | 2013-07-26 | 2013-07-26 | 対訳辞書生成装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013155831A JP5995219B2 (ja) | 2013-07-26 | 2013-07-26 | 対訳辞書生成装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015026281A JP2015026281A (ja) | 2015-02-05 |
JP5995219B2 true JP5995219B2 (ja) | 2016-09-21 |
Family
ID=52490874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013155831A Active JP5995219B2 (ja) | 2013-07-26 | 2013-07-26 | 対訳辞書生成装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5995219B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5317061B2 (ja) * | 2009-07-30 | 2013-10-16 | 独立行政法人情報通信研究機構 | 単語間の意味的関係の有無についての、複数言語での同時分類器及びそのためのコンピュータプログラム。 |
-
2013
- 2013-07-26 JP JP2013155831A patent/JP5995219B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015026281A (ja) | 2015-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100511215C (zh) | 多语种翻译存储器和翻译方法 | |
JP5661813B2 (ja) | セマンティックオブジェクトの特徴付けおよび検索 | |
TWI656450B (zh) | 從中文語料庫提取知識的方法和系統 | |
WO2005059771A1 (ja) | 対訳判断装置、方法及びプログラム | |
JP2010225135A (ja) | 多義性解消方法とそのシステム | |
CN111353306A (zh) | 基于实体关系和依存Tree-LSTM的联合事件抽取的方法 | |
JP6186198B2 (ja) | 学習モデル作成装置、翻訳装置、学習モデル作成方法、及びプログラム | |
JPWO2010109594A1 (ja) | 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法 | |
US7593844B1 (en) | Document translation systems and methods employing translation memories | |
Baraka et al. | Arabic text author identification using support vector machines | |
JP2010182238A (ja) | 引用検出装置、原典文書データベース生成装置、その方法、プログラム及び記録媒体 | |
Sangati et al. | Multiword expression identification with recurring tree fragments and association measures | |
US20140358522A1 (en) | Information search apparatus and information search method | |
JP4945015B2 (ja) | 文書検索システム、文書検索プログラム、および文書検索方法 | |
KR101663038B1 (ko) | 개체의 표면형 문자열 용례학습기반에 의한 텍스트에서의 개체 범위 인식 장치 및 그 방법 | |
JP2009277099A (ja) | 類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
Kumar et al. | An Efficient Approach to Query Reformulation in Web Search | |
WO2017146889A1 (en) | Systematic mass normalization of international titles | |
JP5995219B2 (ja) | 対訳辞書生成装置、方法、及びプログラム | |
Yosef et al. | AIDArabic A Named-Entity Disambiguation Framework for Arabic Text | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2008129662A (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム | |
Kasthuri et al. | An improved rule based iterative affix stripping stemmer for Tamil language using K-mean clustering | |
Gupta et al. | A new approach towards bibliographic reference identification, parsing and inline citation matching | |
JP6461832B2 (ja) | オラクル要約探索装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160719 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160816 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5995219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |