JP6675474B2 - 文章解析システム及びプログラム - Google Patents
文章解析システム及びプログラム Download PDFInfo
- Publication number
- JP6675474B2 JP6675474B2 JP2018506686A JP2018506686A JP6675474B2 JP 6675474 B2 JP6675474 B2 JP 6675474B2 JP 2018506686 A JP2018506686 A JP 2018506686A JP 2018506686 A JP2018506686 A JP 2018506686A JP 6675474 B2 JP6675474 B2 JP 6675474B2
- Authority
- JP
- Japan
- Prior art keywords
- tag
- type
- attribute
- phrase
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 claims description 68
- 230000014509 gene expression Effects 0.000 claims description 66
- 230000035945 sensitivity Effects 0.000 claims description 19
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 description 22
- 238000011156 evaluation Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 238000000605 extraction Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 238000010206 sensitivity analysis Methods 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 7
- 230000008451 emotion Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000002932 luster Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Description
例えば、特許文献1にあっては、所定の対象に対する情動表現を含む文章に対して形態素処理や構文解析処理を施した後、多数の情動表現が登録されたアフェクトターム辞書を参照して、当該文章から情動表現を抽出すると共に、各情動表現の属性(ネガ/ポジ等)を集計し、その結果を外部に出力する技術が開示されている。この結果、「口紅」という評価対象に関し、色つや、におい、付け心地、パッケージといった複数の評価軸毎に、否定的評価と肯定的評価の分布状況を提示することが可能となる。
そして、この構文木に対して多数のルールを所定の順番で当てはめていくことにより、各文の意味内容等が抽出される仕組みを備えているため、文章の構造が複雑になるに従い、ルール適用の可否判定に膨大な処理時間を要することとなる。
実際、自然言語で記述された複雑な文章から、作成者の意図や評価といった意味内容等を正確に抽出するには文節間の係り受け構造を考慮することが重要であり、それ抜きで確定できる方が例外的であるため、特許文献2の技術を適用したとしても、処理速度の劇的な向上は期待できないといわざるを得ない。
また、上記の設定ファイル17、システム辞書記憶部18、感性主題辞書記憶部19、ユーザ辞書記憶部20、解析モデル記憶部21、意味属性ルール記憶部22及び感性分析ルール記憶部23は、同コンピュータの記憶装置内に設けられている。
「意味属性辞書」とは、図2に示すように、特定の表現パターンと、その意味属性の種類(発言の意図を表す否定/肯定/疑問/要望/予想外/不満等の類型)との対応関係を規定したものである。
また「大小表現辞書」とは、図3(a)に示すように、事物の大小を示す表現パターンと、大小表現の種類(大/小の区分)との対応関係を規定したものである。
また「感性表現辞書」とは、図3(b)に示すように、事物に対する評価を示す表現パターンと、感性表現の種類(ポジティブ/ネガティブの類型)との対応関係を規定したものである。
図4は、ホテルや旅館といった宿泊サービス分野に係る感性主題辞書の登録例を示すものであり、「価格」の評価軸については、「価格」の他に、「料金」、「値段」、「宿泊料」、「宿代」等の類義語や関連語が類似表現として格納されている。これらの類似表現は、一般的な類義語辞書等を参照し、また個々の業界の特性を考慮しつつ、業界毎に編纂されたものである。
このため、「価格」の評価軸について、「価格」や「料金」、「値段」といった一般的な呼び名の他に、「宿泊料」、「宿代」のようにホテル・旅館業界に特有の呼び名が列記されている。
また、飲食業界に属するユーザに対してサービスを提供する場合には、「宿泊料」や「宿代」の代わりに「飲食代」や「飲み代」等の類似表現が列記された、飲食業界用の評価軸類似表現辞書が適用されることとなる。
ユーザは、このシステム10の利用に際し、どの辞書を適用すべきかについて、予め設定ファイル17中に指定しておく。
テキストファイル24は、例えば、多数のエンドユーザから集めたアンケートの回答文を列記したものよりなる。
図5においては、「効果」の形態素について「効能」の感性主題タグが付与されている。
意味属性とは、上記のように、当該文章を作成した者の意図や評価、価値判断を示す形態素の類型であり、「否定」や「疑問」、「要望」、「予想外」等の種類に対応したタグが該当の形態素に関連付けられる。
ただし、この時点では構文解析が完了していないため、あくまでも暫定的な「意味候補」に過ぎず、確定的なものではない。
図5においては、「ない」の形態素について「否定」の意味候補タグが付与されている。
なお、大小表現や感性表現は構文解析を待つまでもなく、その表現自体から内容が自明であるため、「大小候補」や「感性候補」ではなく、この時点で確定される。
例えば、「エレガントな」という言葉が特定の商品分野において使用された場合、「感性主題=デザイン」、「感性表現の種類=ポジティブ」であることが特定できるため、予め感性主題辞書等に定義しておく。
この結果、図6に示すように、「エレガントなシルエット」という文章が入力された際には、「エレガントな」の形態素解析結果中に、「デザイン」の感性主題タグと並んで、「ポジティブ」の感性表現タグが付与される。
この結果、図7に示すように、「高品質な製品」という文章が入力された際には、「高品質」の形態素解析結果中に「品質」の感性主題タグと並んで、「ポジティブ」の感性表現タグが付与される。
これを受けた構文解析部13は、各形態素を文節単位に結合させた後、各文節間の係り受け関係を特定する。
この際、構文解析部13は、解析モデル記憶部21に格納された統計モデルを参照することにより、精度の高い構文解析を行うことができる。
図8においては、感性主題の「効能」がChunk0(文節0)に関連付けられていることを示す情報と、意味候補の「否定」がChunk1(文節1)に関連付けられていることを示す情報を含むインデックス40が生成されている。
なお、文節中に大小表現タグや感性表現タグが付与された形態素が含まれている場合、構文解析部13はその存在を示す情報(タグの設定された文節及びタグの種類)もインデックス40中に記述する。
例えば、図10に示すように、「野村総合研究所は」の文節(Chunk0)には、「野村」、「総合」、「研究」、「所」の4つの名詞が連続的に存在しているため、複合名詞マージ部14により、「野村総合研究所(のむらそうごうけんきゅうしょ)」という一つの形態素に結合される。
ここで「意味属性抽出処理」とは、意味候補タグが設定された形態素を含む文節について意味属性ルールを適用することにより、「意味候補」が真に「意味属性」に値するか否かを確定することを意味している。
ここでは、文節1(Chunk1)に「否定」の意味候補タグが設定されている。
すなわち、意味属性ルールには「適用条件」と「適用効果」の組合せが優先順位に従って多数登録されており、意味属性抽出部15は、意味候補タグが設定された形態素を含む文節と、各意味属性ルールの適用条件とを上から順番に比較していき、マッチした時点で当該意味属性ルールの適用効果に規定された処理を実行する。
すなわち、この「NO.001」のルールの場合、適用条件は「掛かり先としての文節が、形容詞としての『ない(基本形)』を含んでいること」であるため、文節1(Chunk1)の「ないと」にマッチしている。
同時に意味属性抽出部15は、インデックス40にも「否定」の意味属性タグが文節0に付与された旨の情報を追加する。
なお、意味候補タグの設定された文節や当該文節と他の文節との係り受け構造が何れの意味属性ルールにもマッチしない場合には、意味候補のまま残されることとなる。
因みに、図11の「NO.001」のルールの場合、基準チャンク(否定の意味候補タグを含む文節)をインデックスから検索すること、適用条件として基準チャンク中に形容詞としての「ない」が含まれていること、適用効果として子チャンク(係り元の文節)に「否定」の意味属性タグを追加することが、JSONフォーマットに則って記述されている。
このように、各ルールを実行可能なバイナリデータにし、プログラムのコードとして取り込むようにすることにより、ルールの適合性判定処理の高速化を図ることができる。
ここで「感性分析処理」とは、構文木に含まれる個々の文節または文節間の係り受け構造に対して感性分析ルールを適用することにより、当該文章の感性主題についてポジティブ(肯定的)またはネガティブ(否定的)の感性属性を特定する処理を意味している。
ここでは、文節0(Chunk0)に「効能」の感性主題が設定されている。
すなわち、感性分析ルールには「適用条件」と「適用効果」の組合せが優先順位に従って多数登録されている。
また「適応効果」としては、ポジティブまたはネガティブの感性属性タグを付与すべき文節を指定する情報が規定されている。
図においては、上から6番目の感性分析ルールにマッチした例が示されている。
すなわち、この「NO.006」のルールの場合、適用条件は「効能の感性主題タグが設定されると共に、否定の意味属性タグが設定されている文節」であるため、文節0(Chunk0)にマッチしている。
同時に感性分析部16は、インデックス40にも「ネガティブ」の感性属性タグが文節0に付与された旨の情報を追加する。
すなわち、文節0(Chunk0)は「効能」の感性主題タグを備えた形態素を含んでおり、当該文節0には「ネガティブ」の感性属性タグが設定されているため、「効果がないと思う」という文章について、「効能についてネガティブな意見の文章である」という分析結果が示されたことを表している。
多数の文章(アンケート文等)についてこのような感性分析を施すことにより、特定の商品やサービスに対するエンドユーザの意見や評価を集計することが可能となる。
図示の通り、インデックス40には「操作性」の感性主題タグが文節0(Chunk0)に設定されている旨と、「疑問」の意味候補タグが文節2(Chunk2)に設定されている旨が記述されている。
因みに、この意味属性ルールの適用条件及び適用効果は、以下の通りである。
[適用条件]:
(1) 副詞の「どう」に「意味候補:疑問」が設定されていること。
(2) 「どう」の後に動詞の「する(基本形)」が続くこと。
[適用効果]:
当該文節に「疑問」の意味属性タグを付与する。
このため、図16に示したものが、「設定を変更するにはどうしたらよいか」の文章に対する最終的な分析結果となる。
図示の通り、インデックス40には「感性主題:操作性」が文節0(Chunk0)に設定されている旨と、「困難」の意味候補タグが文節1(Chunk1)に設定されている旨が記述されている。
この意味属性ルールの適用条件及び適用効果は、例えば以下の通りである。
[適用条件]:
(1) 動詞の形態素が存在すること。
(2) 動詞の後に「にくい(基本形の読み)」が続くこと。
[適用効果]:
当該文節に「困難」の意味属性タグを付与する。
ここでは、ある感性分析ルールの適用条件がマッチした結果、図19に示すように、その適用効果に従い、文節0(Chunk0)に「ネガティブ」の感性属性タグが設定されている。
[適用条件]:
「わかる(基本形の読み)」の形態素が存在すること。
[適用効果]:
係り元の文節(child chunk)に「ネガティブ」の感性属性タグを付与する。
そのためには、各言語対応の形態素解析部12、構文解析部13、複合名詞マージ部14、単語辞書24、意味属性辞書25、大小表現辞書26、感性表現辞書27、感性主題辞書、ユーザ辞書、解析モデル、意味属性ルール、感性分析ルールを予め準備しておく。
以下においては、英語で記述された文章の解析例を示す。
図示の通り、インデックス(index)40には、「操作性(operability)」の感性主題(Sentimental theme)タグが文節3(Chunk3)に設定されている旨と、「疑問(question)」の意味候補(Meaning-candidate)タグが文節0(Chunk0)に設定されている旨が記述されている。
この意味属性ルールの適用条件及び適用効果は、例えば以下の通りである。
[適用条件]:
Wh-adberb(pos:WRB)がVerb(Cat:V)に係っていること。
[適用効果]:
係り元に疑問の意味属性タグを付与する。
このため、図21に示したものが、「How can I change the settings?」の英文に対する最終的な分析結果となる。
図示の通り、インデックス(index)40には「操作性(operability)」の感性主題(Sentimental theme)タグが文節3(Chunk3)に設定されている旨と、「困難(difficult)」の意味候補(Meaning-candidate)タグが文節2(Chunk2)に設定されている旨が記述されている。
この意味属性ルールの適用条件及び適用効果は、例えば以下の通りである。
[適用条件]:
「難しい」を表す形容詞(JJ)が存在すること。
[適用条件]:
当該チャンクに困難の意味属性タグを付与する。
ここでは、ある感性分析ルールの適用条件がマッチした結果、図24に示すように、その適用効果に従い、文節3(Chunk3)に「否定(Negative)」の感性属性タグが設定されると共に、インデックス40にもその旨の情報が追加されている。
この感性分析ルールの適用条件及び適用効果は、例えば以下の通りである。
[適用条件]:
(1) 親Chunkに困難(difficult)の意味属性タグが存在すること。
(2) 子ChunkにTo+動詞(VB)があること。
[適用効果]:
子Chunkにネガティブの感性属性タグを付与する。
12 形態素解析部
13 構文解析部
14 複合名詞マージ部
15 意味属性抽出部
16 感性分析部
17 設定ファイル
18 システム辞書記憶部
19 感性主題辞書記憶部
20 ユーザ辞書記憶部
21 解析モデル記憶部
22 意味属性ルール記憶部
23 感性分析ルール記憶部
24 単語辞書
25 意味属性辞書
26 大小表現辞書
27 感性表現辞書
28 テキストファイル
29 分析結果
40 インデックス
Claims (6)
- 入力された文章を形態素単位に分解する手段と、
特定の形態素と属性の種類との対応関係を規定した属性辞書を参照して、該当の形態素に事前タグを設定する事前タグ設定手段と、
各形態素を文節単位に集約させると共に、各文節間の係り受け関係を特定する構文解析手段と、
事前タグを含む文節の特定情報と当該事前タグの種類との組合せが記録されたインデックスを生成するインデックス生成手段と、
特定種類の事前タグを含む文節を少なくとも指定する適用条件と、属性タグ設定先の文節及び設定する属性タグの種類を指定する適用効果との組合せからなる判定ルールを、複数格納した判定ルール記憶手段と、
上記インデックス及び上記判定ルール記憶手段を参照し、適用条件が上記構文解析手段によって集約された各文節及び特定された文節間の係り受け構造にマッチする判定ルールが存在する場合には、その適用効果で指定された文節に指定された種類の属性タグを設定する判定手段と、
を備えたことを特徴とする文章解析システム。 - 上記属性辞書の少なくとも一つが、特定の形態素と意味属性の種類との対応関係を規定した意味属性辞書であり、
上記事前タグ設定手段により、該当の形態素に事前タグとしての意味候補タグが設定され、
上記インデックスには、上記インデックス生成手段により、意味候補タグを含む文節の特定情報と当該意味候補タグの種類との組合せが記録され、
上記判定ルール記憶手段には、特定種類の意味候補タグを含む文節を少なくとも指定する適用条件と、意味属性タグ設定先の文節及び設定する意味属性タグの種類を指定する適用効果との組合せからなる判定ルールが格納されており、
上記判定手段は、上記インデックス及び上記判定ルール記憶手段を参照し、適用条件が当該文章にマッチする判定ルールが存在する場合には、その適用効果で指定された文節に指定された種類の意味属性タグを設定することを特徴とする請求項1に記載の文章解析システム。 - 上記属性辞書の少なくとも一つが、特定の形態素と感性主題の種類との対応関係を規定した感性主題辞書であり、
上記事前タグ設定手段により、該当の形態素に事前タグとしての感性主題タグが設定され、
上記インデックスには、上記インデックス生成手段により、感性主題タグを含む文節の特定情報と当該感性主題タグの種類との組合せが記録され、
上記判定ルール記憶手段には、特定種類の感性主題タグを含む文節、及び当該文節または他の文節に含まれる意味属性タグの種類を指定する適用条件と、感性属性タグ設定先の文節及び設定する感性属性タグの種類を指定する適用効果との組合せからなる判定ルールが格納されており、
上記判定手段は、上記インデックス及び上記判定ルール記憶手段を参照し、適用条件が当該文章にマッチする判定ルールが存在する場合には、その適用効果で指定された文節に指定された種類の感性属性タグを設定することを特徴とする請求項2に記載の文章解析システム。 - 上記属性辞書として、特定の形態素と感性主題の種類との対応関係を規定した感性主題辞書と、特定の形態素と大小表現の種類との対応関係を規定した大小表現辞書を少なくとも備えており、
上記事前タグ設定手段により、該当の形態素に事前タグとしての感性主題タグ及び大小表現タグが設定され、
上記インデックスには、上記インデックス生成手段により、感性主題タグを含む文節の特定情報と当該感性主題タグの種類との組合せと、大小表現タグを含む文節の特定情報と当該大小表現の種類との組合せが記録され、
上記判定ルール記憶手段には、特定種類の感性主題タグを含む文節、及び当該文節または他の文節に含まれる大小表現タグの種類を指定する適用条件と、感性属性タグ設定先の文節及び設定する感性属性タグの種類を指定する適用効果との組合せからなる判定ルールが格納されており、
上記判定手段は、上記インデックス及び上記判定ルール記憶手段を参照し、適用条件が当該文章にマッチする判定ルールが存在する場合には、その適用効果で指定された文節に指定された種類の感性属性タグを設定することを特徴とする請求項1に記載の文章解析システム。 - 上記属性辞書として、特定の形態素と感性主題の種類との対応関係を規定した感性主題辞書と、特定の形態素と感性表現の種類との対応関係を規定した感性表現辞書を少なくとも備えており、
上記事前タグ設定手段により、該当の形態素に事前タグとしての感性主題タグ及び感性表現タグが設定され、
上記インデックスには、上記インデックス生成手段により、感性主題タグを含む文節の特定情報と当該感性主題タグの種類との組合せと、感性表現タグを含む文節の特定情報と当該感性表現タグの種類との組合せが記録され、
上記判定ルール記憶手段には、特定種類の感性主題タグを含む文節、及び当該文節または他の文節に含まれる感性表現タグの種類を指定する適用条件と、感性属性タグ設定先の文節及び設定する感性属性タグの種類を指定する適用効果との組合せからなる判定ルールが格納されており、
上記判定手段は、上記インデックス及び上記判定ルール記憶手段を参照し、適用条件が当該文章にマッチする判定ルールが存在する場合には、その適用効果で指定された文節に指定された種類の感性属性タグを設定することを特徴とする請求項1または4に記載の文章解析システム。 - コンピュータを、
入力された文章を形態素単位に分解する手段、
特定の形態素と属性の種類との対応関係を規定した属性辞書を参照して、該当の形態素に事前タグを設定する事前タグ設定手段、
各形態素を文節単位に集約させると共に、各文節間の係り受け関係を特定する構文解析手段、
事前タグを含む文節の特定情報と当該事前タグの種類との組合せが記録されたインデックスを生成するインデックス生成手段、
特定種類の事前タグを含む文節を少なくとも指定する適用条件と、属性タグ設定先の文節及び設定する属性タグの種類を指定する適用効果との組合せからなる判定ルールを、複数格納した判定ルール記憶手段、
上記インデックス及び上記判定ルール記憶手段を参照し、適用条件が上記構文解析手段によって集約された各文節及び特定された文節間の係り受け構造にマッチする判定ルールが存在する場合には、その適用効果で指定された文節に指定された種類の属性タグを設定する判定手段、
として機能させることを特徴とする文章解析プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/059241 WO2017163346A1 (ja) | 2016-03-23 | 2016-03-23 | 文章解析システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017163346A1 JPWO2017163346A1 (ja) | 2018-11-22 |
JP6675474B2 true JP6675474B2 (ja) | 2020-04-01 |
Family
ID=59900062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018506686A Active JP6675474B2 (ja) | 2016-03-23 | 2016-03-23 | 文章解析システム及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10839155B2 (ja) |
JP (1) | JP6675474B2 (ja) |
CN (1) | CN108885617B (ja) |
WO (1) | WO2017163346A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280063B (zh) * | 2018-01-19 | 2021-04-20 | 中国科学院软件研究所 | 基于半监督学习的语义分析方法及系统 |
CN109753651B (zh) * | 2018-12-14 | 2022-05-17 | 昆明理工大学 | 一种针对体现用户意图的app软件用户评论挖掘方法 |
JP7464240B2 (ja) * | 2019-04-26 | 2024-04-09 | Necソリューションイノベータ株式会社 | 予測モデル生成装置、旅行適合度予測装置、予測モデル生産方法、旅行適合度予測方法、プログラム及び記録媒体 |
CN110349477B (zh) * | 2019-07-16 | 2022-01-07 | 长沙酷得网络科技有限公司 | 一种基于历史学习行为的编程错误修复方法、系统及服务器 |
CN111177186B (zh) * | 2019-12-20 | 2024-04-23 | 北京淇瑀信息科技有限公司 | 基于问题检索的单句意图识别方法、装置和系统 |
CN113254815B (zh) * | 2020-02-08 | 2023-11-10 | 钉钉控股(开曼)有限公司 | 文档处理、页面处理方法及设备 |
JP7519793B2 (ja) * | 2020-03-19 | 2024-07-22 | 株式会社野村総合研究所 | 自然言語処理装置およびプログラム |
US11487936B2 (en) * | 2020-05-27 | 2022-11-01 | Capital One Services, Llc | System and method for electronic text analysis and contextual feedback |
CN112100388B (zh) * | 2020-11-18 | 2021-02-23 | 南京华苏科技有限公司 | 一种长文本新闻舆情的情感极性的分析方法 |
CN112908487B (zh) * | 2021-04-19 | 2023-09-22 | 中国医学科学院医学信息研究所 | 一种临床指南更新内容的自动识别方法及系统 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129469A (ja) * | 1989-10-14 | 1991-06-03 | Canon Inc | 自然言語処理装置 |
JPH03188566A (ja) * | 1989-12-18 | 1991-08-16 | Fujitsu Ltd | 辞書連動テキストベース装置 |
US5418716A (en) * | 1990-07-26 | 1995-05-23 | Nec Corporation | System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases |
JP3009215B2 (ja) * | 1990-11-30 | 2000-02-14 | 株式会社日立製作所 | 自然語処理方法および自然語処理システム |
JP2765665B2 (ja) * | 1991-08-01 | 1998-06-18 | 富士通株式会社 | タイポグラフィカル情報付き文書の翻訳装置 |
US5774845A (en) * | 1993-09-17 | 1998-06-30 | Nec Corporation | Information extraction processor |
JP3738011B2 (ja) | 2001-11-20 | 2006-01-25 | 株式会社ジャストシステム | 情報処理装置、情報処理方法、及び情報処理プログラム |
EP1551007A4 (en) * | 2002-10-08 | 2008-05-21 | Matsushita Electric Ind Co Ltd | LANGUAGE MODEL CREATION / CREATION DEVICE, VOICE RECOGNITION DEVICE, LANGUAGE MODEL CREATION METHOD, AND VOICE RECOGNITION METHOD |
KR100515641B1 (ko) * | 2003-04-24 | 2005-09-22 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
JPWO2005010789A1 (ja) * | 2003-07-24 | 2006-09-14 | 株式会社Cskホールディングス | 能力評価装置、能力評価方法および能力評価プログラム |
JP4033088B2 (ja) | 2003-09-11 | 2008-01-16 | 富士ゼロックス株式会社 | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム |
KR100542755B1 (ko) * | 2003-09-15 | 2006-01-20 | 한국전자통신연구원 | 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체 |
JP4654745B2 (ja) * | 2005-04-13 | 2011-03-23 | 富士ゼロックス株式会社 | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2006331246A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 意見分析処理方法、意見分析処理装置およびプログラム |
JP2007287134A (ja) * | 2006-03-20 | 2007-11-01 | Ricoh Co Ltd | 情報抽出装置、及び情報抽出方法 |
JP2008287406A (ja) * | 2007-05-16 | 2008-11-27 | Sony Corp | 情報処理装置および情報処理方法、プログラム、並びに、記録媒体 |
JP4359787B2 (ja) * | 2007-07-02 | 2009-11-04 | ソニー株式会社 | 情報処理装置、コンテンツの評判検索方法およびコンテンツの評判検索システム |
WO2009110550A1 (ja) * | 2008-03-06 | 2009-09-11 | 日本電気株式会社 | 属性抽出方法、システム及びプログラム |
KR101498331B1 (ko) * | 2008-10-02 | 2015-03-03 | 인터내셔널 비지네스 머신즈 코포레이션 | 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템 |
KR101042515B1 (ko) * | 2008-12-11 | 2011-06-17 | 주식회사 네오패드 | 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 |
US8762131B1 (en) * | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates |
JP4768882B2 (ja) * | 2009-06-26 | 2011-09-07 | 楽天株式会社 | 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体 |
JP2012003572A (ja) * | 2010-06-18 | 2012-01-05 | Nomura Research Institute Ltd | 感性分析システム及びプログラム |
EP2653981A4 (en) * | 2010-12-17 | 2018-01-17 | Rakuten, Inc. | Natural language processing device, method, and program |
JP2013242781A (ja) * | 2012-05-22 | 2013-12-05 | Nippon Telegr & Teleph Corp <Ntt> | 要望文抽出装置、方法、及びプログラム |
CN102866989B (zh) * | 2012-08-30 | 2016-09-07 | 北京航空航天大学 | 基于词语依存关系的观点抽取方法 |
JP2014067179A (ja) * | 2012-09-25 | 2014-04-17 | Toshiba Corp | 文書処理装置及び文書処理プログラム |
CN104685493A (zh) * | 2012-09-27 | 2015-06-03 | 日本电气株式会社 | 用于监视文本信息的字典创建装置、用于监视文本信息的字典创建方法和用于监视文本信息的字典创建程序 |
KR20140078312A (ko) * | 2012-12-17 | 2014-06-25 | 한국전자통신연구원 | 텍스트 기반 감성 분석 결과를 제공하기 위한 장치, 시스템 및 그 방법 |
CN103440252B (zh) * | 2013-07-25 | 2016-11-16 | 北京师范大学 | 一种中文句子中并列信息提取方法及装置 |
JP2016035688A (ja) * | 2014-08-04 | 2016-03-17 | 日本電気株式会社 | テキスト分析装置、テキスト分析方法、テキスト分析プログラムおよび記録媒体 |
JP6614152B2 (ja) * | 2014-09-05 | 2019-12-04 | 日本電気株式会社 | テキスト処理システム、テキスト処理方法、及び、コンピュータ・プログラム |
US9767193B2 (en) * | 2015-03-27 | 2017-09-19 | Fujitsu Limited | Generation apparatus and method |
JP7139728B2 (ja) * | 2018-06-29 | 2022-09-21 | 富士通株式会社 | 分類方法、装置、及びプログラム |
-
2016
- 2016-03-23 WO PCT/JP2016/059241 patent/WO2017163346A1/ja active Application Filing
- 2016-03-23 JP JP2018506686A patent/JP6675474B2/ja active Active
- 2016-03-23 CN CN201680084010.5A patent/CN108885617B/zh active Active
-
2018
- 2018-09-21 US US16/138,387 patent/US10839155B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108885617A (zh) | 2018-11-23 |
US20190026264A1 (en) | 2019-01-24 |
CN108885617B (zh) | 2022-05-31 |
WO2017163346A1 (ja) | 2017-09-28 |
US10839155B2 (en) | 2020-11-17 |
JPWO2017163346A1 (ja) | 2018-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6675474B2 (ja) | 文章解析システム及びプログラム | |
Schneider et al. | A corpus and model integrating multiword expressions and supersenses | |
US9588962B2 (en) | System and method for generating and using user ontological models for natural language processing of user-provided text | |
US9727553B2 (en) | System and method for generating and using user semantic dictionaries for natural language processing of user-provided text | |
Donato et al. | Investigating redundancy in emoji use: Study on a twitter based corpus | |
Diamantini et al. | A negation handling technique for sentiment analysis | |
Al-Kabi et al. | Arabic/English sentiment analysis: an empirical study | |
RU2601166C2 (ru) | Разрешение анафоры на основе технологии глубинного анализа | |
Bender et al. | Towards creating precision grammars from interlinear glossed text: Inferring large-scale typological properties | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
Saxena et al. | Epie dataset: A corpus for possible idiomatic expressions | |
Simon et al. | Automatically generated NE tagged corpora for English and Hungarian | |
Roth et al. | Parsing software requirements with an ontology-based semantic role labeler | |
JP6409071B2 (ja) | 文の並び替え方法および計算機 | |
Wong et al. | iSentenizer‐μ: Multilingual Sentence Boundary Detection Model | |
JP5599073B2 (ja) | 感性分析システム及びプログラム | |
Murauer et al. | DT-grams: Structured dependency grammar stylometry for cross-language authorship attribution | |
Žitnik et al. | SkipCor: Skip-mention coreference resolution using linear-chain conditional random fields | |
Ackermann et al. | Model [nl] generation: natural language model extraction | |
JP2004272352A (ja) | 類似度計算方法、装置、プログラムおよび該プログラムを格納した記録媒体 | |
Umber et al. | A Step Towards Ambiguity Less Natural Language Software Requirements Specifications. | |
Rahat et al. | A recursive algorithm for open information extraction from Persian texts | |
US11017172B2 (en) | Proposition identification in natural language and usage thereof for search and retrieval | |
Trandabăţ | Mining Romanian texts for semantic knowledge | |
Munir et al. | Dependency parsing using the URDU. KON-TB treebank |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180724 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6675474 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |