JP4803709B2 - 単語用法差異情報取得プログラム及び同装置 - Google Patents
単語用法差異情報取得プログラム及び同装置 Download PDFInfo
- Publication number
- JP4803709B2 JP4803709B2 JP2005203157A JP2005203157A JP4803709B2 JP 4803709 B2 JP4803709 B2 JP 4803709B2 JP 2005203157 A JP2005203157 A JP 2005203157A JP 2005203157 A JP2005203157 A JP 2005203157A JP 4803709 B2 JP4803709 B2 JP 4803709B2
- Authority
- JP
- Japan
- Prior art keywords
- difference
- node
- nodes
- directed graph
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Stefan Th. Griesand Anatol Stefanowitsch,"Extending collostructional analysys:A corpus-based perspective on alternations",International Journal ofCorpus Linguistics,9:1,2004
『|ncmod|については、RASPにより|ncmod|として抽出されるもののうち、形容詞と名詞の関係のみ、|ncmod|の関係として抽出した。ここで、形容詞は品詞がJJで始まる単語とし、名詞は品詞がNN、PN、VVG、PPのいずれかで始まる単語とする。また、品詞がNPで始まる単語は複合語の一部であることが多いため、品詞NPで始まる単語が、形容詞と|ncmod|の関係にあり、かつ、名詞とも|ncmod|の関係にある場合には、その品詞NPで始まる単語を介して形容詞と名詞の間にも|ncmod|の関係があるものとし、その形容詞と名詞を|ncmod|の関係にあるものとして抽出する。形容詞と名詞が前置詞で関係付けられている場合は、前置詞が「of」の場合のみ|ncmod|の関係として抽出する。|ncsubj|-|xcomp|については、『名詞と|ncsubj|の関係にある単語が、形容詞と|xcomp|の関係にある場合、その名詞と形容詞を|ncsubj|-|xcomp|の関係にあるものとして抽出する。ただし、このとき名詞と形容詞を仲介している単語は、次の単語に限定する。
<be, find, become, make, seem, appear, feel,
look, sound, smell, taste, remain, keep, stay, come, end-up, get, go, grow,
prove, turn, turn out, wind-up, burn, lie, loom, play, plead, rest, stand,
stand-up, blush, fall, fall-down, freeze, run, slam, spring, wax>
ただし、形容詞と名詞が前置詞で関係付けられている場合は抽出しない。また、形容詞の右が「that」の場合(it is [形容詞] that ...の場合)も抽出しない。』。なお、以上の他の文法関係の例には、|dobj|-|xcomp|(叙述用法、動詞・目的格関係)を挙げることができる。その場合のRASPにおける構文解析処理のルールとしては、次のようなものとすることができる。すなわち、『名詞と|dobj|の関係にある単語が、形容詞と|xcomp|の関係にある場合、その名詞と形容詞を|dobj|-|xcomp|の関係にあるものとして抽出する。品詞NPで始まる単語が、ある単語と|dobj|の関係にあり、かつ、名詞とも|ncmod|の関係にある場合には、その品詞NPで始まる単語を|ncmod|の関係にある名詞と置き換えたのち、上記の|dobj|-|xcomp|の関係を抽出する。ただし、このとき名詞と形容詞を仲介している単語は、次の単語に限定する。
<hold, keep, leave, call, confess, profess,
pronounce, report, like, prefer, want, wish, believe, consider, deem, find,
hold, imagine, judge, presume, rate, reckon, suppose, think, drive, get, make,
prove, render, send, turn, certify, declare, proclaim>
ただし、形容詞と名詞が前置詞で関係付けられている場合は抽出しない。また、形容詞の右がthatの場合(it is JJ that ...の場合)も抽出しない。』
DB1…コーパス
DB2…シソーラス
1…ターゲット単語入力手段
2…文抽出手段
3…名詞抽出手段
4…有向グラフ生成手段
5…差異抽出手段
6…差異出力手段
Claims (22)
- 同一又は類似の意味を有する複数のターゲット単語について、例文データベースであるコーパス、及び語と語の上位下位概念の関係が記述されたデータベースであるシソーラスを検索可能に備え又は接続したコンピュータに、各ターゲット単語の用法の違いに関する情報を抽出し出力させるためのプログラムであって、当該コンピュータに、
複数のターゲット単語の入力を受け付けるターゲット単語入力ステップと、
前記コーパスにアクセスして、前記ターゲット単語入力ステップで受け付けた各ターゲット単語で検索して当該ターゲット単語をそれぞれ含む文データを抽出する文抽出ステップと、
前記文抽出ステップで抽出した文データをそれぞれ構文解析し、各文データに含まれるターゲット単語と文法的関係にある名詞を抽出する名詞抽出ステップと、
前記シソーラスにアクセスして、前記名詞抽出ステップで抽出した名詞で検索し、この名詞及びその上位概念を表すノードを抽出するとともに、それらノードと、これらノード同士の上位下位概念のつながりを表すリンクとから構成される有向グラフを、対応するターゲット単語ごとに生成する有向グラフ生成ステップと、
前記有向グラフ生成ステップで生成した各有向グラフを比較して、異なるターゲット単語の有向グラフ間において異なるノードを抽出する差異抽出ステップと、
前記差異抽出ステップで抽出した有向グラフの差異を、前記ターゲット単語の用法の違いに関する情報として出力する差異出力ステップと、
を実行させることを特徴とする単語用法差異情報取得プログラム。 - 前記差異抽出ステップにおいて、前記コンピュータに、
各有向グラフにおいて、同一のノード又は同一のノード及びリンクを有する部分を共有化させて各有向グラフを重ね合わせることによって、異なるノードを抽出する処理を実行させる、請求項1に記載の単語用法差異情報取得プログラム。 - 前記ターゲット単語入力ステップで受け付けたターゲット単語が3つ以上の場合、
前記差異抽出ステップにおいて、前記コンピュータに、
特定の一のターゲット単語以外の複数のターゲット単語について前記有向グラフ生成ステップで生成した各有向グラフを合成して共通の有向グラフを生成し、この共通の有向グラフと前記特定の一のターゲット単語の有向グラフとを比較して、これら有向グラフ間において異なるノードを抽出し、この工程を各ターゲット単語ごとに繰り返し行う処理を実行させる、請求項1又は2に記載の単語用法差異情報取得プログラム。 - 前記コンピュータに、
前記名詞抽出ステップにおいて、各文データに含まれるターゲット単語と文法的関係にある名詞を、当該名詞が前記ターゲット単語と共に文データに出現する頻度に関するデータと併せて抽出する処理を実行させ、
前記有向グラフ生成ステップにおいて、生成する有向グラフの各ノードに前記頻度に関するデータによる重み付けする処理を実行させ、
前記差異抽出ステップにおいて、前記有向グラフ生成ステップで生成した重み付けが施された有向グラフを利用して、各有向グラフを比較して、異なるターゲット単語の有向グラフ間において異なるノードを抽出する処理を実行させる、請求項1乃至3の何れかに記載の単語用法差異情報取得プログラム。 - 前記名詞抽出ステップにおいて、頻度に関するデータとして対応するターゲット単語に対して抽出された全名詞に占める当該名詞の頻度の割合を表す頻度比率を適用し、
前記コンピュータに、
前記有向グラフ生成ステップにおいて、生成する有向グラフにおいて前記名詞に対応するノードに前記頻度を付与するとともに当該ノードの上位概念のノードにその下位のノードの頻度の合計値を付与し、全ノードに個々の頻度を正規化した頻度比率を付与することで、有向グラフにこの頻度比率に基づく重み付けする処理を実行させ、
前記差異抽出ステップにおいて、前記有向グラフ生成ステップで生成した重み付けが施された比較対象となる2つの有向グラフにおいて同一のノードの頻度比率の比を各々算出し、この比の値が所定値以上であればそのノードを前記異なるノードである差異ノードに組み入れ、当該差異ノードを抽出する処理を実行させる、請求項4に記載の単語用法差異情報取得プログラム。 - 前記差異抽出ステップにおいて、前記コンピュータに、
比較対象となる2つの有向グラフにおいて同一のノードの頻度比率の比を各々算出し、この比の値が所定値以上であればそのノードを暫定的に差異ノードとして有向グラフの差異部分に組み入れ、当該差異部分のうち各最上位ノードを各ターゲット単語について頻度比率が大きい方から順に所定数ずつ抽出し、その抽出したノードのうち共通するノードの割合を算出する工程を、前記頻度比率を逓減させながら繰り返すことで、各々の工程で得られた共通するノードの割合が一定値以上である場合、その共通するノードの割合を前回の工程で得られた共通するノードの割合と比較して、その比較した値が一定値以上である場合に、当該工程で暫定的に差異ノードと決定したノードを差異ノードとして決定し、当該差異ノードを抽出する処理を実行させる、請求項5に記載の単語用法差異情報取得プログラム。 - 前記頻度に関するデータとして、前記頻度比率に代えて、頻度の値自体を適用している請求項5又は6に記載の単語用法差異情報取得プログラム。
- 前記コンピュータに、
前記差異抽出ステップにおいて、抽出した異なるノードを、頻度に基づく重みの大きい方から順に所定数のノードをさらに抽出する処理を実行させ、
前記差異出力ステップにおいて、前記所定数のノードを前記用法の違いに関する情報として出力する処理を実行させる、請求項4乃至7の何れかに記載の単語用法差異情報取得プログラム。 - 前記コンピュータに、
前記差異出力ステップにおいて、前記異なるノードのうち最上位のノードを前記用法の違いに関する情報として出力する処理を実行させる、請求項1乃至8の何れかに記載の単語用法差異情報取得プログラム。 - 前記コンピュータに、
前記差異出力ステップにおいて、異なるノードのうち最上位のノードに加えて又はそれに代えて共通のノードの最下位のノードを前記用法の違いに関する情報として出力する処理を実行させる、請求項1乃至8の何れかに記載の単語用法差異情報取得プログラム。 - 前記ターゲット単語入力ステップにおいて入力受付可能なターゲット単語の品詞を、形容詞又は動詞に制限している、請求項1乃至10の何れかに記載の単語用法差異情報取得プログラム。
- プログラムに従って作動するコンピュータにより構成され、入力された同一又は類似の意味を有する複数のターゲット単語について、各ターゲット単語の用法の違いに関する情報を抽出し出力させる単語用法差異情報取得装置であって、前記コンピュータは、例文データベースであるコーパス、及び語と語の上位下位概念の関係が記述されたデータベースであるシソーラスを検索可能に備え又は接続しており、
複数のターゲット単語の入力を受け付けるターゲット単語入力手段と、
前記コーパスにアクセスして、前記ターゲット単語入力手段で受け付けた各ターゲット単語で検索して当該ターゲット単語をそれぞれ含む文データを抽出する文抽出手段と、
前記文抽出手段で抽出した文データをそれぞれ構文解析し、各文データに含まれるターゲット単語と文法的関係にある名詞を抽出する名詞抽出手段と、
前記シソーラスにアクセスして、前記名詞抽出手段で抽出した名詞で検索し、この名詞及びその上位概念を表すノードを抽出するとともに、それらノードと、これらノード同士の上位下位概念のつながりを表すリンクとから構成される有向グラフを、対応するターゲット単語ごとに生成する有向グラフ生成手段と、
前記有向グラフ生成手段で生成した各有向グラフを比較して、異なるターゲット単語の有向グラフ間において異なるノードを抽出する差異抽出手段と、
前記差異抽出手段で抽出した有向グラフの差異を、前記ターゲット単語の用法の違いに関する情報として出力する差異出力手段と、
を具備してなることを特徴とする単語用法差異情報取得装置。 - 前記差異抽出手段において、
各有向グラフにおいて、同一のノード又は同一のノード及びリンクを有する部分を共有化させて各有向グラフを重ね合わせることによって、異なるノードを抽出する処理を実行する、請求項12に記載の単語用法差異情報取得装置。 - 前記ターゲット単語入力手段で受け付けたターゲット単語が3つ以上の場合、
前記差異抽出手段において、特定の一のターゲット単語以外の複数のターゲット単語について前記有向グラフ生成ステップで生成した各有向グラフを合成して共通の有向グラフを生成し、この共通の有向グラフと前記特定の一のターゲット単語の有向グラフとを比較して、これら有向グラフ間において異なるノードを抽出し、この工程を各ターゲット単語ごとに繰り返し行う処理を実行する、請求項12又は13に記載の単語用法差異情報取得装置。 - 前記名詞抽出手段において、各文データに含まれるターゲット単語と文法的関係にある名詞を、当該名詞が前記ターゲット単語と共に文データに出現する頻度に関するデータと併せて抽出する処理を実行し、
前記有向グラフ生成手段において、生成する有向グラフの各ノードに前記頻度に関するデータによる重み付けする処理を実行し、
前記差異抽出手段において、前記有向グラフ生成手段で生成した重み付けが施された有向グラフを利用して、各有向グラフを比較して、異なるターゲット単語の有向グラフ間において異なるノードを抽出する処理を実行する、請求項12乃至14の何れかに記載の単語用法差異情報取得装置。 - 前記名詞抽出手段において、頻度に関するデータとして対応するターゲット単語に対して抽出された全名詞に占める当該名詞の頻度の割合を表す頻度比率を適用し、
前記有向グラフ生成手段において、生成する有向グラフにおいて前記名詞に対応するノードに前記頻度を付与するとともに当該ノードの上位概念のノードにその下位のノードの頻度の合計値を付与し、全ノードに個々の頻度を正規化した頻度比率を付与することで、有向グラフにこの頻度比率に基づく重み付けする処理を実行し、
前記差異抽出手段において、前記有向グラフ生成手段で生成した重み付けが施された比較対象となる2つの有向グラフにおいて同一のノードの頻度比率の比を各々算出し、この比の値が所定値以上であればそのノードを前記異なるノードである差異ノードに組み入れ、当該差異ノードを抽出する処理を実行する、請求項15に記載の単語用法差異情報取得装置。 - 前記差異抽出手段において、比較対象となる2つの有向グラフにおいて同一のノードの頻度比率の比を各々算出し、この比の値が所定値以上であればそのノードを暫定的に差異ノードとして有向グラフの差異部分に組み入れ、当該差異部分のうち各最上位ノードを各ターゲット単語について頻度比率が大きい方から順に所定数ずつ抽出し、その抽出したノードのうち共通するノードの割合を算出する工程を、前記頻度比率を逓減させながら繰り返すことで、各々の工程で得られた共通するノードの割合が一定値以上である場合、その共通するノードの割合を前回の工程で得られた共通するノードの割合と比較して、その比較した値が一定値以上である場合に、当該工程で暫定的に差異ノードと決定したノードを差異ノードとして決定し、当該差異ノードを抽出する処理を実行する、請求項16に記載の単語用法差異情報取得装置。
- 前記頻度に関するデータとして、前記頻度比率に代えて、頻度の値自体を適用している請求項16又は17に記載の単語用法差異情報取得装置。
- 前記差異抽出手段において、抽出した異なるノードを、頻度に基づく重みの大きい方から順に所定数のノードをさらに抽出する処理を実行し、
前記差異出力手段において、前記所定数のノードを前記用法の違いに関する情報として出力する処理を実行する、請求項15乃至18の何れかに記載の単語用法差異情報取得装置。 - 前記差異出力手段において、前記異なるノードのうち最上位のノードを前記用法の違いに関する情報として出力する処理を実行する、請求項12乃至19の何れかに記載の単語用法差異情報取得装置。
- 前記差異出力手段において、異なるノードのうち最上位のノードに加えて又はそれに代えて共通のノードの最下位のノードを前記用法の違いに関する情報として出力する処理を実行する、請求項12乃至19の何れかに記載の単語用法差異情報取得装置。
- 前記ターゲット単語入力手段において入力受付可能なターゲット単語の品詞を、形容詞又は動詞に制限している、請求項12乃至21の何れかに記載の単語用法差異情報取得装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005203157A JP4803709B2 (ja) | 2005-07-12 | 2005-07-12 | 単語用法差異情報取得プログラム及び同装置 |
US11/995,413 US8010342B2 (en) | 2005-07-12 | 2006-07-10 | Word usage analyzer |
PCT/JP2006/313666 WO2007007702A1 (ja) | 2005-07-12 | 2006-07-10 | 単語用法差異情報取得プログラム及び同装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005203157A JP4803709B2 (ja) | 2005-07-12 | 2005-07-12 | 単語用法差異情報取得プログラム及び同装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007025788A JP2007025788A (ja) | 2007-02-01 |
JP4803709B2 true JP4803709B2 (ja) | 2011-10-26 |
Family
ID=37637092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005203157A Expired - Fee Related JP4803709B2 (ja) | 2005-07-12 | 2005-07-12 | 単語用法差異情報取得プログラム及び同装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8010342B2 (ja) |
JP (1) | JP4803709B2 (ja) |
WO (1) | WO2007007702A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8037086B1 (en) * | 2007-07-10 | 2011-10-11 | Google Inc. | Identifying common co-occurring elements in lists |
KR101194635B1 (ko) | 2007-07-24 | 2012-10-29 | 에스케이텔레콤 주식회사 | 패러프레이즈를 이용하여 언어 학습 서비스를 제공하는방법과 그를 위한 시스템, 서버 및 컴퓨터로 읽을 수 있는기록매체 |
US8280886B2 (en) * | 2008-02-13 | 2012-10-02 | Fujitsu Limited | Determining candidate terms related to terms of a query |
JP5382651B2 (ja) * | 2009-09-09 | 2014-01-08 | 独立行政法人情報通信研究機構 | 単語対取得装置、単語対取得方法、およびプログラム |
US8954893B2 (en) * | 2009-11-06 | 2015-02-10 | Hewlett-Packard Development Company, L.P. | Visually representing a hierarchy of category nodes |
US9378202B2 (en) * | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US8676565B2 (en) | 2010-03-26 | 2014-03-18 | Virtuoz Sa | Semantic clustering and conversational agents |
US8694304B2 (en) * | 2010-03-26 | 2014-04-08 | Virtuoz Sa | Semantic clustering and user interfaces |
US8977538B2 (en) | 2010-09-13 | 2015-03-10 | Richard Salisbury | Constructing and analyzing a word graph |
US9524291B2 (en) * | 2010-10-06 | 2016-12-20 | Virtuoz Sa | Visual display of semantic information |
JP5315368B2 (ja) * | 2011-02-28 | 2013-10-16 | 株式会社日立製作所 | 文書処理装置 |
US8782058B2 (en) * | 2011-10-12 | 2014-07-15 | Desire2Learn Incorporated | Search index dictionary |
US8909516B2 (en) * | 2011-10-27 | 2014-12-09 | Microsoft Corporation | Functionality for normalizing linguistic items |
US9275044B2 (en) | 2012-03-07 | 2016-03-01 | Searchleaf, Llc | Method, apparatus and system for finding synonyms |
US20140180695A1 (en) * | 2012-12-25 | 2014-06-26 | Microsoft Corporation | Generation of conversation to achieve a goal |
US9575958B1 (en) * | 2013-05-02 | 2017-02-21 | Athena Ann Smyros | Differentiation testing |
US9652499B1 (en) * | 2013-08-21 | 2017-05-16 | Athena Ann Smyros | Search-based recommendation engine |
US10089765B2 (en) * | 2014-10-20 | 2018-10-02 | Bernardo Jose Martinez-Avalos | Methods and computer programs to create images and information based in texts |
JP6680472B2 (ja) * | 2015-06-10 | 2020-04-15 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
US10586168B2 (en) | 2015-10-08 | 2020-03-10 | Facebook, Inc. | Deep translations |
US9990361B2 (en) * | 2015-10-08 | 2018-06-05 | Facebook, Inc. | Language independent representations |
US11222266B2 (en) | 2016-07-15 | 2022-01-11 | Intuit Inc. | System and method for automatic learning of functions |
US10725896B2 (en) | 2016-07-15 | 2020-07-28 | Intuit Inc. | System and method for identifying a subset of total historical users of a document preparation system to represent a full set of test scenarios based on code coverage |
US10140277B2 (en) | 2016-07-15 | 2018-11-27 | Intuit Inc. | System and method for selecting data sample groups for machine learning of context of data fields for various document types and/or for test data generation for quality assurance systems |
US11049190B2 (en) | 2016-07-15 | 2021-06-29 | Intuit Inc. | System and method for automatically generating calculations for fields in compliance forms |
US20180018311A1 (en) * | 2016-07-15 | 2018-01-18 | Intuit Inc. | Method and system for automatically extracting relevant tax terms from forms and instructions |
US20180018322A1 (en) * | 2016-07-15 | 2018-01-18 | Intuit Inc. | System and method for automatically understanding lines of compliance forms through natural language patterns |
US10579721B2 (en) | 2016-07-15 | 2020-03-03 | Intuit Inc. | Lean parsing: a natural language processing system and method for parsing domain-specific languages |
CN110168544A (zh) * | 2016-12-27 | 2019-08-23 | 夏普株式会社 | 应答装置、应答装置的控制方法、及控制程序 |
JP6435467B1 (ja) * | 2018-03-05 | 2018-12-12 | 株式会社テンクー | 検索システム及び検索システムの動作方法 |
US11163956B1 (en) | 2019-05-23 | 2021-11-02 | Intuit Inc. | System and method for recognizing domain specific named entities using domain specific word embeddings |
US11783128B2 (en) | 2020-02-19 | 2023-10-10 | Intuit Inc. | Financial document text conversion to computer readable operations |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5649221A (en) * | 1995-09-14 | 1997-07-15 | Crawford; H. Vance | Reverse electronic dictionary using synonyms to expand search capabilities |
US20050154690A1 (en) * | 2002-02-04 | 2005-07-14 | Celestar Lexico-Sciences, Inc | Document knowledge management apparatus and method |
US7363213B2 (en) * | 2003-02-11 | 2008-04-22 | Fuji Xerox Co., Ltd. | System and method for dynamically determining the function of a lexical item based on discourse hierarchy structure |
JP2004272678A (ja) * | 2003-03-10 | 2004-09-30 | Casio Comput Co Ltd | 情報表示制御装置及びプログラム |
US20050171760A1 (en) * | 2003-10-08 | 2005-08-04 | Marc Tinkler | Visual thesaurus |
EP1779263A1 (de) * | 2004-08-13 | 2007-05-02 | Swiss Reinsurance Company | Sprach- und textanalysevorrichtung und entsprechendes verfahren |
-
2005
- 2005-07-12 JP JP2005203157A patent/JP4803709B2/ja not_active Expired - Fee Related
-
2006
- 2006-07-10 US US11/995,413 patent/US8010342B2/en not_active Expired - Fee Related
- 2006-07-10 WO PCT/JP2006/313666 patent/WO2007007702A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2007025788A (ja) | 2007-02-01 |
US8010342B2 (en) | 2011-08-30 |
WO2007007702A1 (ja) | 2007-01-18 |
US20090089046A1 (en) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4803709B2 (ja) | 単語用法差異情報取得プログラム及び同装置 | |
JP4654745B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
DE102008040739B4 (de) | Verfahren und System zum Berechnen oder Bestimmen von Vertrauens- bzw. Konfidenzauswertungen für Syntaxbäume auf allen Ebenen | |
US7587389B2 (en) | Question answering system, data search method, and computer program | |
McDonald | Discriminative sentence compression with soft syntactic evidence | |
US10496756B2 (en) | Sentence creation system | |
CN109783806B (zh) | 一种利用语义解析结构的文本匹配方法 | |
JPH1125129A (ja) | テキスト・データベース内の情報の検索方法 | |
JP2005216126A (ja) | 他言語のテキスト生成方法及びテキスト生成装置 | |
KR20070088687A (ko) | 문서의 질을 자동으로 향상시키는 시스템 및 방법 | |
KR101860472B1 (ko) | 오픈 디렉터리 프로젝트 기반의 텍스트 분류기, 및 텍스트 분류기의 생성 및 분류 방법 | |
JP4278090B2 (ja) | 単語の使用を訂正または改善させる装置および方法、コンピュータプログラム、並びに格納媒体 | |
Albilali et al. | Constructing arabic reading comprehension datasets: Arabic wikireading and kaiflematha | |
Lee et al. | Detection of non-native sentences using machine-translated training data | |
JP5214985B2 (ja) | テキストセグメンテーション装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
Cherry et al. | Discriminative substring decoding for transliteration | |
Lloret et al. | Are better summaries also easier to understand? analyzing text complexity in automatic summarization | |
Barros et al. | Improving the naturalness and expressivity of language generation for Spanish | |
KR950013129B1 (ko) | 기계번역장치 및 방법 | |
JP4074687B2 (ja) | 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4812811B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
Gazali | The Parametric Variations of English and Kanuri Noun Phrases: A Minimalist Approach | |
Blanchon et al. | Towards fairer evaluations of commercial MT systems on Basic Travel Expressions Corpora | |
Bhowmik et al. | Development of A Word Based Spell Checker for Bangla Language | |
Perera et al. | Intelligent News Reader |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080611 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110721 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110805 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |