JP5447862B2 - 単語分類システム、方法およびプログラム - Google Patents
単語分類システム、方法およびプログラム Download PDFInfo
- Publication number
- JP5447862B2 JP5447862B2 JP2010505983A JP2010505983A JP5447862B2 JP 5447862 B2 JP5447862 B2 JP 5447862B2 JP 2010505983 A JP2010505983 A JP 2010505983A JP 2010505983 A JP2010505983 A JP 2010505983A JP 5447862 B2 JP5447862 B2 JP 5447862B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- classification
- words
- pair
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 56
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 230000010365 information processing Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
山田、工藤、松本、「Support Vector Machinesを用いた日本語固有表現抽出」、情報処理学会研究報告−自然言語処理、Vol.2001, No.20, 121-128ページ
2 文書群データベース
3 単語間パターンデータベース
4 単語間パターン学習部
5 単語間パターン適用部
6 分類判定部
7 入力部
8 出力部
<第1の実施の形態>
第1の実施の形態を説明する。
正例の単語対の適用データ数(分類)は、ある分類既知単語と分類未知単語との単語対の適用データで正例になった数である。また、単語対の全適用データ数(分類)は、分類既知単語と分類未知単語との単語対の全適用データ数である。
分類スコアが閾値以上ではない場合、分類不明とする。
<第2の実施の形態>
第2の実施の形態を説明する。
<第3の実施の形態>
第3の実施の形態を説明する。
Claims (26)
- 記憶されている文書で共出現する分類既知単語間の関係をもとに、共出現する分類既知単語間の単語間表層文字列、単語間品詞、単語間文字種、及び単語間の形態素数のいずれかである文脈情報及び単語間の縦又は横の並び位置、単語間の文字の大きさ、及び構造化文書における木構造の深さのいずれかを示すレイアウト情報の少なくともいずれかから成る前記分類既知単語の組である単語対の学習データを作成し、単語の組である単語対のデータが、同分類単語の組である同分類単語対のデータなのか、異分類単語の組である異分類単語対のデータなのかを示す単語間パターンを前記学習データに基づいて作成する単語間パターン学習部と、
入力された分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と分類既知単語との間の文脈情報及びレイアウト情報の少なくともいずれから成る前記分類未知単語と前記分類既知単語との組である単語対の適用データを生成し、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する単語間パターン適用部と、
前記単語間パターン適用部の判断結果に基づいて、前記単語対の分類未知単語の分類を判定する分類判定部と
を有する単語分類システム。 - 前記単語間パターン学習部は、
文書で共出現する同分類単語間の関係をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データと、文書で共出現する異分類既知単語間の関係をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データとを作成する学習データ作成部と、
前記学習データに基づいて、入力された分類未知単語を含む単語対のデータが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する為の単語間パターンを作成する単語間パターン作成部と
を有する請求項1に記載の単語分類システム。 - 前記学習データ作成部は、同分類既知単語対又は異分類既知単語対が共出現する文書の出現位置毎に学習データを作成する請求項2に記載の単語分類システム。
- 前記学習データ作成部は、同分類既知単語対毎、又は異分類既知単語対毎に学習データを作成する請求項2に記載の単語分類システム。
- 前記学習データ作成部は、同分類既知単語対の学習データを正例の学習データとし、異分類既知単語対の学習データを負例の学習データとする請求項2から請求項4のいずれかに記載の単語分類システム。
- 前記学習データ作成部は、異分類単語対の学習データのうち、単語間の共出現頻度が所定の値よりも高いこと、共起確率が所定の値よりも高いこと、又は相互情報量が所定の値よりも高いことのいずれかであることを満たす単語対の学習データを負例の学習データとする請求項5に記載の単語分類システム。
- 前記単語間パターン適用部は、
前記分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と前記分類既知単語との組である単語対の文脈情報及びレイアウト情報の少なくともいずれから成る適用データを作成する適用データ作成部と、
前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断するパターン適用部と
を有する請求項1に記載の単語分類システム。 - 前記単語間パターン学習部は、
文書で共出現する同分類単語間の関係をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データと、文書で共出現する異分類既知単語間の関係をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データとを作成する学習データ作成部と、
前記学習データに基づいて、入力された分類未知単語を含む単語対のデータが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する為の単語間パターンを作成する単語間パターン作成部と
を有する請求項7に記載の単語分類システム。 - 前記パターン適用部は、前記単語対の適用データが正例又は負例であるかを出力する請求項7又は請求項8に記載の単語分類システム。
- 前記単語間パターン作成部は、Support Vector Machinesである請求項2から請求項6、又は、請求項8のいずれかに記載の単語分類システム。
- 前記パターン適用部は、Support Vector Machinesである請求項7から請求項9のいずれかに記載の単語分類システム。
- 前記分類判定部は、分類未知単語と分類既知単語との単語対が同分類単語の単語対である確率に基づいて、分類未知単語の分類を判定する請求項1、又は、請求項7から請求項11のいずれかに記載の単語分類システム。
- 文書で共出現する同分類既知単語間の文脈情報及びレイアウト情報をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報から成る正例の学習データと、文書で共出現する異分類既知単語間の文脈情報及びレイアウト情報をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報から成る負例の学習データとを作成し、前記学習データに基づいて、入力された分類未知単語と分類既知単語との組である単語対のデータが正例であるか負例であるかを示す単語間パターンを作成する単語間パターン学習部と、
前記作成された単語間パターンが格納される単語間パターン記憶部と、
入力された分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と前記分類既知単語との組である単語対の文脈情報及びレイアウト情報から成る適用データを作成し、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが正例であるか負例であるかを出力する単語間パターン適用部と、
前記単語対の適用データの正例又は負例の数と、前記単語対の分類既知単語の分類とに基づいて、前記単語対の分類未知単語の分類を判定する分類判定部と
を有し、
前記文脈情報は単語間表層文字列、単語間品詞、単語間文字種、及び単語間の形態素数のいずれかであり、前記レイアウト情報は単語間の縦又は横の並び位置、単語間の文字の大きさ、及び構造化文書における木構造の深さのいずれかを示す
単語分類システム。 - 単語間パターン学習部が、記憶されている文書で共出現する分類既知単語間の関係をもとに、共出現する分類既知単語間の単語間表層文字列、単語間品詞、単語間文字種、及び単語間の形態素数のいずれかである文脈情報及び単語間の縦又は横の並び位置、単語間の文字の大きさ、及び構造化文書における木構造の深さのいずれかを示すレイアウト情報の少なくともいずれかから成る前記分類既知単語の組である単語対の学習データを作成し、単語の組である単語対のデータが、同分類単語の組である同分類単語対のデータなのか、異分類単語の組である異分類単語対のデータなのかを示す単語間パターンを作成し、
適用データ作成部が、入力された分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と分類既知単語との間の文脈情報及びレイアウト情報の少なくともいずれから成る前記分類未知単語と前記分類既知単語との組である単語対の適用データを生成し、
分類判定部が、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断し、
前記判断結果に基づいて、前記分類未知単語の分類を判定する
単語分類方法。 - 前記単語間パターン学習部が、文書で共出現する同分類単語間の関係をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データと、文書で共出現する異分類既知単語間の関係をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データとを作成し、
前記単語間パターン学習部が、前記学習データに基づいて、入力された分類未知単語を含む単語対のデータが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する為の単語間パターンを作成する
請求項14に記載の単語分類方法。 - 前記学習データ作成部が、同分類既知単語対又は異分類既知単語対が共出現する文書の出現位置毎に学習データを作成する請求項15に記載の単語分類方法。
- 前記学習データ作成部が、同分類既知単語対毎、又は異分類既知単語対毎に学習データを作成する請求項15に記載の単語分類方法。
- 前記学習データ作成部が、同分類既知単語対の学習データを正例の学習データとして作成し、異分類既知単語対の学習データを負例の学習データとして作成する請求項15から請求項17のいずれかに記載の単語分類方法。
- 前記学習データ作成部が、異分類単語対の学習データのうち、単語間の共出現頻度が所定の値よりも高いこと、共起確率が所定の値よりも高いこと、又は相互情報量が所定の値よりも高いことのいずれかである特定の条件を満たす単語対の学習データを負例の学習データとする請求項18に記載の単語分類方法。
- 適用データ作成部が、前記分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と前記分類既知単語との組である単語対の文脈情報及びレイアウト情報の少なくともいずれから成る適用データを作成し、
パターン適用部が、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する
請求項14に記載の単語分類方法。 - 前記単語間パターン学習部が、文書で共出現する同分類単語間の関係をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データと、文書で共出現する異分類既知単語間の関係をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報の少なくともいずれから成る学習データとを作成し、
前記単語間パターン学習部が、前記学習データに基づいて、入力された分類未知単語を含む単語対のデータが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する為の単語間パターンを作成する
請求項20に記載の単語分類方法。 - 前記パターン適用部が、前記適用データを解析し、前記単語対の適用データが正例又は負例であるかを出力する請求項20又は請求項21に記載の単語分類方法。
- 前記分類判定部が、分類未知単語と分類既知単語との単語対が同分類単語の単語対である確率に基づいて、分類未知単語の分類を判定する請求項14、又は、請求項20から請求項22のいずれかに記載の単語分類方法。
- 単語間パターン学習部が、文書で共出現する同分類既知単語間の文脈情報及びレイアウト情報をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報から成る正例の学習データと、文書で共出現する異分類既知単語間の文脈情報及びレイアウト情報をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報から成る負例の学習データとを作成し、
単語間パターン学習部が、前記学習データに基づいて、入力された分類未知単語と分類既知単語との組である単語対のデータが正例であるか負例であるかを示す単語間パターンを作成し、
単語間パターン適用部が、分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と前記分類既知単語との組である単語対の文脈情報及びレイアウト情報から成る適用データを作成し、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが正例であるか負例であるかを判別し、
分類判定部が、前記単語対の適用データの正例又は負例の数と、前記単語対の分類既知単語の分類とに基づいて、前記単語対の分類未知単語の分類を判定し、
前記文脈情報は単語間表層文字列、単語間品詞、単語間文字種、及び単語間の形態素数のいずれかであり、前記レイアウト情報は単語間の縦又は横の並び位置、単語間の文字の大きさ、及び構造化文書における木構造の深さのいずれかを示す
単語分類方法。 - 単語間パターン学習部が、文書で共出現する分類既知単語間の関係をもとに、共出現する分類既知単語間の単語間表層文字列、単語間品詞、単語間文字種、及び単語間の形態素数のいずれかである文脈情報及び単語間の縦又は横の並び位置、単語間の文字の大きさ、及び構造化文書における木構造の深さのいずれかを示すレイアウト情報の少なくともいずれかに基づいて、単語の組である単語対のデータが、同分類単語の組である同分類単語対のデータなのか、異分類単語の組である異分類単語対のデータなのかを示す単語間パターンを作成する単語間パターン学習処理と、
適用データ作成部が、入力された分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と分類既知単語との間の文脈情報及びレイアウト情報の少なくともいずれから成る前記分類未知単語と前記分類既知単語との組である単語対の適用データを生成し、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが、同分類単語対のデータなのか、異分類単語対のデータなのかを判断する単語間パターン適用処理と、
分類判定部が、前記判断結果に基づいて、前記分類未知単語の分類を判定する単語間パターン学習処理と
を情報処理装置に実行させるプログラム。 - 単語間パターン学習部が、記憶されている文書で共出現する同分類既知単語間の単語間表層文字列、単語間品詞、単語間文字種、及び単語間の形態素数のいずれかである文脈情報及び単語間の縦又は横の並び位置、単語間の文字の大きさ、及び構造化文書における木構造の深さのいずれかを示すレイアウト情報をもとに、その同分類既知単語の組である同分類既知単語対の文脈情報及びレイアウト情報から成る正例の学習データと、文書で共出現する異分類既知単語間の文脈情報及びレイアウト情報をもとに、その異分類既知単語の組である異分類既知単語対の文脈情報及びレイアウト情報から成る負例の学習データとを作成する処理と、
単語間パターン学習部が、前記学習データに基づいて、入力された分類未知単語と分類既知単語との組である単語対のデータが正例であるか負例であるかを示す単語間パターンを作成する処理と、
適用データ作成部が、分類未知単語と文書で共出現する分類既知単語との関係をもとに、前記分類未知単語と前記分類既知単語との組である単語対の文脈情報及びレイアウト情報から成る適用データを作成する処理と、
単語間パターン適用部が、前記単語間パターンを参照して前記単語対の適用データを解析し、前記単語対の適用データが正例であるか負例であるかを判別する処理と、
分類判定部が、前記単語対の適用データの正例又は負例の数と、前記単語対の分類既知単語の分類とに基づいて、前記単語対の分類未知単語の分類を判定する処理と
を情報処理装置に実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010505983A JP5447862B2 (ja) | 2008-04-03 | 2009-04-02 | 単語分類システム、方法およびプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008097520 | 2008-04-03 | ||
JP2008097520 | 2008-04-03 | ||
JP2010505983A JP5447862B2 (ja) | 2008-04-03 | 2009-04-02 | 単語分類システム、方法およびプログラム |
PCT/JP2009/056900 WO2009123288A1 (ja) | 2008-04-03 | 2009-04-02 | 単語分類システム、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009123288A1 JPWO2009123288A1 (ja) | 2011-07-28 |
JP5447862B2 true JP5447862B2 (ja) | 2014-03-19 |
Family
ID=41135655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010505983A Expired - Fee Related JP5447862B2 (ja) | 2008-04-03 | 2009-04-02 | 単語分類システム、方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8504356B2 (ja) |
JP (1) | JP5447862B2 (ja) |
WO (1) | WO2009123288A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5405507B2 (ja) * | 2011-02-17 | 2014-02-05 | 日本電信電話株式会社 | 具体主題の有無判定装置、方法、及びプログラム |
JP5419906B2 (ja) * | 2011-02-17 | 2014-02-19 | 日本電信電話株式会社 | 主題抽出装置、方法、及びプログラム |
US10339214B2 (en) * | 2011-11-04 | 2019-07-02 | International Business Machines Corporation | Structured term recognition |
KR101508059B1 (ko) * | 2013-06-26 | 2015-04-07 | 숭실대학교산학협력단 | 단어의 쾌-불쾌 지수 예측 장치 및 방법 |
US20150309987A1 (en) | 2014-04-29 | 2015-10-29 | Google Inc. | Classification of Offensive Words |
KR101567789B1 (ko) * | 2014-08-26 | 2015-11-11 | 숭실대학교산학협력단 | 상대적 감정 유사도를 이용한 단어의 쾌-불쾌 지수 예측 장치 및 방법 |
US9529898B2 (en) * | 2014-08-26 | 2016-12-27 | Google Inc. | Clustering classes in language modeling |
JP2017134693A (ja) * | 2016-01-28 | 2017-08-03 | 富士通株式会社 | 意味情報登録支援プログラム、情報処理装置および意味情報登録支援方法 |
JP2018010532A (ja) * | 2016-07-14 | 2018-01-18 | 株式会社レトリバ | 情報処理装置、プログラム及び情報処理方法 |
JP6729232B2 (ja) * | 2016-09-20 | 2020-07-22 | 富士通株式会社 | メッセージ振り分けプログラム、メッセージ振り分け装置、およびメッセージ振り分け方法 |
US11270082B2 (en) | 2018-08-20 | 2022-03-08 | Verint Americas Inc. | Hybrid natural language understanding |
US11217226B2 (en) * | 2018-10-30 | 2022-01-04 | Verint Americas Inc. | System to detect and reduce understanding bias in intelligent virtual assistants |
WO2020144736A1 (ja) * | 2019-01-08 | 2020-07-16 | 三菱電機株式会社 | 意味関係学習装置、意味関係学習方法、及び意味関係学習プログラム |
US11604927B2 (en) | 2019-03-07 | 2023-03-14 | Verint Americas Inc. | System and method for adapting sentiment analysis to user profiles to reduce bias |
EP3980989A1 (en) | 2019-06-06 | 2022-04-13 | Verint Americas Inc. | Automated conversation review to surface virtual assistant misunderstandings |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08147307A (ja) * | 1994-11-22 | 1996-06-07 | Gijutsu Kenkyu Kumiai Shinjoho Shiyori Kaihatsu Kiko | 意味知識獲得装置 |
JP2007004458A (ja) * | 2005-06-23 | 2007-01-11 | National Institute Of Information & Communication Technology | 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6311152B1 (en) * | 1999-04-08 | 2001-10-30 | Kent Ridge Digital Labs | System for chinese tokenization and named entity recognition |
US7299180B2 (en) * | 2002-12-10 | 2007-11-20 | International Business Machines Corporation | Name entity extraction using language models |
JP3847273B2 (ja) | 2003-05-12 | 2006-11-22 | 沖電気工業株式会社 | 単語分類装置、単語分類方法及び単語分類プログラム |
US20110246076A1 (en) * | 2004-05-28 | 2011-10-06 | Agency For Science, Technology And Research | Method and System for Word Sequence Processing |
US8280719B2 (en) * | 2005-05-05 | 2012-10-02 | Ramp, Inc. | Methods and systems relating to information extraction |
US9135238B2 (en) * | 2006-03-31 | 2015-09-15 | Google Inc. | Disambiguation of named entities |
CN101075228B (zh) * | 2006-05-15 | 2012-05-23 | 松下电器产业株式会社 | 识别自然语言中的命名实体的方法和装置 |
US20080052262A1 (en) * | 2006-08-22 | 2008-02-28 | Serhiy Kosinov | Method for personalized named entity recognition |
-
2009
- 2009-04-02 WO PCT/JP2009/056900 patent/WO2009123288A1/ja active Application Filing
- 2009-04-02 JP JP2010505983A patent/JP5447862B2/ja not_active Expired - Fee Related
- 2009-04-02 US US12/920,920 patent/US8504356B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08147307A (ja) * | 1994-11-22 | 1996-06-07 | Gijutsu Kenkyu Kumiai Shinjoho Shiyori Kaihatsu Kiko | 意味知識獲得装置 |
JP2007004458A (ja) * | 2005-06-23 | 2007-01-11 | National Institute Of Information & Communication Technology | 二項関係抽出装置,二項関係抽出処理を用いた情報検索装置,二項関係抽出処理方法,二項関係抽出処理を用いた情報検索処理方法,二項関係抽出処理プログラム,および二項関係抽出処理を用いた情報検索処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20110029303A1 (en) | 2011-02-03 |
WO2009123288A1 (ja) | 2009-10-08 |
JPWO2009123288A1 (ja) | 2011-07-28 |
US8504356B2 (en) | 2013-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5447862B2 (ja) | 単語分類システム、方法およびプログラム | |
Malheiro et al. | Emotionally-relevant features for classification and regression of music lyrics | |
US7877383B2 (en) | Ranking and accessing definitions of terms | |
JP5008024B2 (ja) | 風評情報抽出装置及び風評情報抽出方法 | |
JP6466952B2 (ja) | 文章生成システム | |
JP4911599B2 (ja) | 風評情報抽出装置及び風評情報抽出方法 | |
Zheng et al. | Dynamic knowledge-base alignment for coreference resolution | |
Tschuggnall et al. | Enhancing authorship attribution by utilizing syntax tree profiles | |
JP2007047974A (ja) | 情報抽出装置および情報抽出方法 | |
Graovac et al. | NgramSPD: Exploring optimal n-gram model for sentiment polarity detection in different languages | |
El Bakly et al. | Using ontology for revealing authorship attribution of Arabic text | |
Jha et al. | Hsas: Hindi subjectivity analysis system | |
CN111259661B (zh) | 一种基于商品评论的新情感词提取方法 | |
JP4005343B2 (ja) | 情報検索システム | |
JP6689466B1 (ja) | 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
Hellwig | Morphological disambiguation of classical Sanskrit | |
Batanović et al. | Sentiment classification of documents in Serbian: The effects of morphological normalization | |
Heidary et al. | Automatic Persian text summarization using linguistic features from text structure analysis | |
JP2007122525A (ja) | 言い換え処理方法及び装置 | |
Kyjánek et al. | Constructing a lexical resource of Russian derivational morphology | |
Pinzhakova et al. | Feature Similarity-based Regression Models for Authorship Verification. | |
Manjula | Identification of languages from the text document using natural language processing system | |
JP5506482B2 (ja) | 固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム | |
JP4341077B2 (ja) | 文書処理装置、文書処理方法、および、文書処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5447862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |