JP4129987B2 - テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム - Google Patents

テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム Download PDF

Info

Publication number
JP4129987B2
JP4129987B2 JP2004351370A JP2004351370A JP4129987B2 JP 4129987 B2 JP4129987 B2 JP 4129987B2 JP 2004351370 A JP2004351370 A JP 2004351370A JP 2004351370 A JP2004351370 A JP 2004351370A JP 4129987 B2 JP4129987 B2 JP 4129987B2
Authority
JP
Japan
Prior art keywords
opinion
computer
word
positive
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004351370A
Other languages
English (en)
Other versions
JP2005174330A (ja
JP2005174330A5 (ja
Inventor
クリシュナ・プラサド・チトラプラ
サミット・ネジ
ショーリャ・ロイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005174330A publication Critical patent/JP2005174330A/ja
Publication of JP2005174330A5 publication Critical patent/JP2005174330A5/ja
Application granted granted Critical
Publication of JP4129987B2 publication Critical patent/JP4129987B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、テキスト・ドキュメントからのオピニオンの抽出およびグループ化に関する。より詳細に述べれば、本発明は、関心のあるトピックに関係するオピニオンを表出するフレーズの抽出およびグループ化を行うためのテキスト・ドキュメントの自然言語処理に関係する。
この数年にわたってワールド・ワイド・ウェブ(WWW)上におけるオンライン討議グループおよびレビュー・サイトが急激に伸びている。消費者指向フォーラムへの『投稿』の内容は、概して、その投稿の中に表出されているオピニオンに関連する。個人、グループ、もしくは組織によって著された各種のトピックについてのオピニオンは、会社がその会社の製品もしくはライバル会社の製品に対する市場の反応を調査するための貴重な資源である。
これに関して、市場の情報として貴重なものとなり得る情報には2つのタイプがある。特定の製品に対する肯定的、否定的、あるいは中立の感情を含む『話』がウェブ上にどの程度あるかに関する統計、およびその種の感情を表出するために使用されている的確なフレーズである。ここで『自動車‐モデルDE』に関する仮説的な例を取り上げる。関連する統計情報は、この自動車に関するオピニオンの40%が肯定的、20%が否定的、残りの40%が中立というステートメントからなるとする。一例として、肯定的な表現を『an economical car(経済的な自動車)』および『smooth drive(滑らかな推進力)』、否定的な表現を『poor performer on freeways(高速道路でのパフォーマンス不足)』および『glitchy gear box(ギアの調子が悪い)』、中立の表現を『German car(ドイツ車)』および『compact car(コンパクト・カー)』とすることができる。
すべてのウェブ・ドキュメントから特定のトピックに関するオピニオンをマニュアルで追跡するタスクは面倒である。特定の製品に関係するオピニオンを探す場合に、それらが表れるかも知れない関連ドキュメントを識別することは困難なものとなり得る。このタスクは、識別済みドキュメントからオピニオンを抽出しようとするとき、さらに労働集約的なものとなる。オピニオンは、ドキュメント内に散在しており、微妙な形で表出されていることもある。
非特許文献1および非特許文献2は、それぞれ管理された分類方法を使用して関心のある所定のトピックへ向けられた所定のドキュメントの全体的な感情を決定する方法を記述している。
非特許文献1および非特許文献2は、いずれも分類のための特徴としてドキュメントから抽出されるユニグラムおよびバイグラムの使用を述べている。しかしながら、オピニオンを識別するためのドキュメント・レベルの感情の分析は、情報の損失を招く可能性がある。一例を述べれば、オンライン・レビュー・サイトからの映画「ラーンスロット・オブ・ザ・レイク(Lancelot of the Lake)」のレビューを考える。この映画について『a fascinating cinematic experience boldly made by a master filmmaker(映画製作の巨匠が大胆に作り上げた魅惑の映画体験)』、『something rare in the modern cinema(最近の映画ではまれに見る傑作)』、および『a truly personal film(これこそが私の映画)』といった好意的なコメントがある。したがって、このレビューがこの映画を『よい』映画として評価していると結論づけることができるが、この方法によるドキュメントの分析は、誤りを導くことがあり、また必ずしも実際にその中に表出された見解の多様性が反映されていないこともある。
この点を例証するために述べれば、同じドキュメントは『non‐professional actors who recite the dialogue in emotionless flat voices(気持ちのこもっていない声でせりふを棒読みする素人役者)』といった俳優に関する酷評、および『is a series of clumsy, disjointed fights amongst anonymous knights(わけのわからない騎士の中に埋もれた不体裁で支離滅裂な戦いの羅列』といった始まりの場面に関する好意的でない意見をいくつか含んでいる。
B.パング(B.Pang)、L.リー(L.Lee)、およびS.バイシアナサン(S.Vaithyanathan)著『サムズ・アップ? センティメント・クラシフィケーション・ユージング・マシン・ラーニング・テクニックス(Thumbs up? Sentiment Classification using Machine Learning Techniques)』、2002年コンファレンス・オン・エンピリカル・メソッズ・イン・ナチュラル・ランゲージ・プロセッシング(2002 Conference on Empirical Methods in Natural Language Processing)(EMNLP)会報、p.79‐86 P.D.ターニー(P.D.Turney)著『サムズ・アップ・オア・サムズ・ダウン? セマンティック・オリエンテーション・アプライド・ツー・アンスーパーバイズド・クラシフィケーション・オブ・レビューズ(Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews)』、第40回アニュアル・ミーティング・オブ・ジ・アソシエーション・フォア・コンピュテーショナル・リングィスティックス(40th Annual Meeting of the Association for Computational Linguistics)(ACL’02)会報、ペンシルバニア州フィラデルフィア、p.417‐424 ユニバーシティ・オブ・ペンシルバニア(University of Pennsylvania)/コンピュータ・アンド・インフォメーション・サイエンス・デパートメント(Computer and Information Science)/LINCラボラトリ(LINC laboratory)/ペン・ツリーバンク・プロジェクト(Penn Treebank project)[online]インターネット<http://www.cis.upenn.edu/〜linc/home.html> ジェネラル・インクワイアラーのホーム・ページ(General Inquirer Home Page)[online]インターネット<http://www.wjh.harvard.edu/〜inquirer/> ワードネットのホーム・ページ(WordNet)[online]インターネット<http://www.cogsci.princeton.edu/〜wn/>
自動化された方法で本文の内容に表出された感情を評価するための改良された方法に対するニーズが存在することは明らかである。
ここでは、トピックについてのオピニオンをテキスト・ドキュメントから抽出するためのテクニックを開示する。オピニオンは、それらのセマンティック・オリエンテーションに応じてグループ化される。ここでは感情を表出しているフレーズもしくは特定の内包を有しているフレーズを『オピニオン』と呼ぶ。オピニオンが関係するトピックは、たとえば商品から映画、さらには政治的な事象まで広範にわたることができる。オピニオンが抽出されるテキスト・ドキュメントは、討議フォーラム、ニュースグループ、オンライン・ニュース記事、およびそのほかのアクセス可能な内容とすることができる。
オピニオンは、品詞タグに関する正規表現に対して定義される規則に基づいて抽出される。3つのオピニオンのカテゴリを、好ましくは:肯定的な意味においてトピックについて述べているオピニオン、否定的な意味においてそれを述べているオピニオン、および本質的に中立のオピニオンとする。この知識を使用し、ドキュメントの全体的なトーンを、特定のトピックに関して評価することができる。より細かい粒状度のレベルにおいてドキュメントを分析し、センテンスもしくはフレーズのレベルにおいてオピニオンを抽出することは、トピックに対する感情のバランスのとれた的確な評価を形成する上で実質的な利点を提供する。
品詞(POS)タグ付けおよび正規表現(RE)規則エンジンは、オピニオンのフレーズを抽出する。抽出されたオピニオンは、それぞれのセマンティック・オリエンテーションを基礎として3つの関連クラス、すなわち肯定的、否定的、または中立のクラスにグループ化される。オピニオンを構成する用語の意味に基づいて行うオピニオンのグループ化には、自然言語データベースおよび語彙リファレンスが使用される。
ここで述べているテクニックの追加の貢献は、オピニオンをそれらのセマンティック・オリエンテーションを基礎としてグループ化することである。極性、すなわち自然言語の中で使用される形容詞の意味する『良い』または『悪い』を決定するための、かなりの量の研究が存在する。
図1は、ここで述べているテクニックを実施するためのシステムを表している。まず、このシステムのコンポーネントおよびその動作を、概要を示す形で紹介し、その後、より詳細にその説明を行う。キーボード、ディスク・ドライブ、またはインターネット・リンク等の入力デバイス105が、プレーン・テキスト・ドキュメントをプロセッサ110へ提供し、それが『ノイズのない』テキストをPOS(品詞)タガー115へ提供する。タグ付きテキストがフレーズ・エキストラクタ120へ渡され、それが、プロトタイプの正規表現の規則を使用して、オピニオン・フィルタ125への入力のためのフレーズを構築する。オピニオン・グルーパ(Opinion Grouper)140は、ディスプレイ・デバイス145上における表示のために、自然言語辞書130および語彙リファレンス135を調べてオピニオンを、好意的、非好意的、および中立のカテゴリに類別する。
POS(品詞)タグ付け
最初に、ドキュメントの本文もしくはコーパスからのすべてのドキュメントがプリプロセッサに通され、それが、すべてのHTMLタグおよびすべてのメタ‐タグを除去する。この段階においては、いくつかのドメイン固有の前処理を組み込むこともできる。このほかの必要となった任意の前処理を行うことが可能である。
続いてドキュメント内の各単語に、それぞれの関連する品詞(POS)のタグ付けが行われる。このプロセスは、ドキュメントのタグ付けまたは解剖と呼ばれる。この段階の出力は、拡張マークアップ言語(XML)ドキュメントであり、XMLタグとして品詞タグを、その値としてそれぞれの単語を伴う。必要であれば、任意の類似の非XMLフォーマットを採用することができる。次のセクションの中で紹介する例に、一例のドキュメントおよびタグ付け後の対応部を示す。
ブラウン・ペン・スタイルに従ってタグ付けを行うことのできる任意のPOSタガーを使用することができる。ブラウン・ペン・スタイルは、単語の品詞タグを用いてテキストに注釈を付けるスタイルである。これは、ペンシルバニア大学コンピュータおよび情報科学部のLINCラボラトリのペン・ツリーバンク(Penn Treebank)プロジェクトの一部であり、その詳細は、非特許文献3から入手することができる。このほかにも、インターナショナル・コーパス・オブ・イングリッシュ・タグセット(International Corpus of English Tagset)、CLAWS1、CLAWS2、...CLAWS5タグセットといったタグ・スタイルがある。しかしながらブラウン・ペン・スタイルは、もっとも広く使用されているタグセットである。タグ付けを使用することができる。インターナショナル・ビジネス・マシーンズ(International Business Machines)(IBM)コーポレーションによって作られたJTALENTは、1つの好適なタガーの例であり、それを使用することもできる。必要な場合には、このほかの一般的なタガーを使用することも可能である。
オピニオンの抽出
オピニオンの抽出は、オピニオンのPOSタグ・シーケンスが規則的なパターンに従うという観察結果を基礎としている。特定のタグ・シーケンス・パターンが、オピニオンのPOSタグ・シーケンス内に規則的に現れる。頻繁に現れるパターンをカバーするPOSタグの正規表現の規則の集合が構築される。正規表現は、記号(この場合はPOSタグ)および3つのオペレータ、Concatenation(コンケートネーション)、Or(オア)およびClosure(クロージャ)の組み合わせから組み立てられたパターンの任意の記述である。
これらの正規表現と、ドキュメント内の単語のPOSタグ・シーケンスのマッチングが行われる。POSタグ・シーケンスのすべての最大マッチについてオリジナルのドキュメントから対応する単語が抽出され、オピニオンとしてレポートされる。この段階の入力は、POSタグ付きのドキュメント、および可能性のあるオピニオンを描写する正規表現(RE)規則である。続いてシステムは、RE規則と入力テキスト・ドキュメント内のPOSタグ・シーケンス・パターンのマッチングを行い、オピニオンを出力する。次に示す例は、正規表現の規則に基づいたテキストからのオピニオンの抽出を例示している。
次の表1は、この例の中で使用されているPOSタグの一部である。表2は、ブラウン・ペン・スタイルに従ってこれらの段階のいくつかを使用してタグ付けされたテキストの一部の例を示している。
表1
タグ タグの意味
CC 等位接続詞
CD 基数
DT 限定詞
EX 存在
FW 外来単語
IN 前置詞または従位接続詞
JJ 形容詞
JJR 形容詞、比較級
JJS 形容詞、最上級
LS リスト・アイテム・マーカ
MD 叙法
NN 名詞、単数または集合
NNS 名詞、複数
NNP 固有名詞、単数
NNPS 固有名詞、複数
PDT 前決定詞
POS 所有格語尾
PRP 人称代名詞
PRP$ 所有代名詞
RB 副詞
RBR 副詞、比較級
RBS 副詞、最上級
RP 小辞
SYM 記号
TO To
UH 感嘆詞
VB 動詞、基本形
VBD 動詞、過去形
VBG 動詞、動名詞または現在分詞
表2
正規表現の規則:‐(is|are)*(<JJ>|<JJR>|<JJS>)+(<NN>|<NNS>)+(<IN>|<TO>)*(<NN>|<NNS>)*
オリジナルのテキスト:Rescuing it from total destruction are good performances by Bridges who is convincing in his pain and obsessions.
テキストのPOSタグ:‐<VBG>Rescuing</><PP>it</><IN>from</><JJ>total</><NN>destruction</>are<JJ>good</><NNS>performances</><IN>by</><NNS>Bridges</><WP>who</>is<JJ>convincing</><IN>in</><PP$>his</><NN>pain</><CC>and</><NNS>obsessions</>.
調和したパターン:‐are<JJ>good</><NNS>performances</><IN>by</><NNS>Bridges</>
抽出されたオピニオン:‐are good performances by Bridges.
自然言語辞書および語彙リファレンス
ここで説明したように、自然言語辞書および語彙リファレンスが使用されて、テキスト・オピニオンを表出するために用いられている単語の意味および感情または内包が決定される。
ジェネラル・インクワイアラー(General Inquirer)データベースは、使用することのできる適切な自然言語辞書の一例である。このインクワイアラー(Inquirer)データベースの詳細は、非特許文献4からアクセスすることができる。インクワイアラー(Inquirer)データベースは、4,000を超える重複のない単語を含み、そのほとんどが形容詞であり、各単語について約200のブール属性がデータベースに定義されている。属性のいくつかの例を次に示す:isPositive(肯定的である)、isNegative(否定的である)、isHostile(敵意がある)、isRelatedToPleasure(喜びに関係がある)、およびisRelatedToPain(苦痛に関係がある)。必要に応じて、このほかの多くの属性を使用することができる。この単語‐属性マトリクスはまばらであり、各単語に関するわずかな属性しか値「真」を有していない。クラスタリングの第1ステップにおいては、これらの属性が使用されて、オピニオンが肯定的であるか、あるいは否定的であるかの決定がなされる。これらの属性は、その単語が肯定的なセンテンスまたは否定的なセンテンス内において支配的に使用されているか否かについて決定することができる。
ワードネット(WordNet)データベースは、オンライン語彙データベースの一例である。ワードネット(WordNet)データベースは、人間の語彙記憶に関する現在の言語心理学的理論を取り入れて設計されたオンライン語彙リファレンス・システムである。ほぼ20,000の英語の名詞、動詞、および形容詞が、それぞれが1つの基本をなす概念を表す類義語の集合に整理されている。ワードネット(WordNet)データベースの詳細は、非特許文献5からアクセスすることができる。
インクワイアラー(Inquirer)データベースおよびワードネット(WordNet)データベースは、データベースの例として示されたものであり、このほかの適切なデータベースも必要に応じて使用することができる。さらに、ここで説明しているテクニックを実施するために必要な関連情報を含む結合されたデータベースが好ましいこともある。
オピニオンのグループ化
オピニオンを抽出した後の次のステップは、オピニオンの性質に従ってそれらを異なるクラスタにグループ化することである。オピニオンは、3つのクラスタ、すなわち肯定的、否定的、および中立のクラスタにグループ化される。それを達成するために、前述した自然言語辞書およびオンライン語彙リファレンスが使用される。
一例として、「able」は肯定的な内包を有し、「deformed」は否定的な内包を有している。ここで述べているテクニックは、オピニオンの単語が肯定的または否定的意味において使用されているかについての決定を自然言語辞書から行う。オピニオン内にある単語のほとんどが肯定的である場合に、ここで述べているテクニックは、そのオピニオンを肯定的なオピニオンとして分類する。帰属されている意味の大半が否定的な内包を有している場合には、否定的なオピニオンとして分類される。これら以外の場合には、そのオピニオンは中立であると見なされる。オピニオンの感情を決定する間に、このテクニックは、ほかの関連ファクタも考慮する。たとえば、単語「not」がオピニオン内に存在するときには、クラスタリングが肯定から否定へ、またはその逆の変更が行われる。
前述したインクワイアラー(Inquirer)データベース等の自然言語データベースは、単語の性質に関する多くの情報をデータベース内にストアしているが、その種のデータベースが頻用単語のすべての類義語を含んでいないこともあり得る。このことは特に、慣用表現について、あるいは現在の流行における局所的な使用について当てはまる。その結果、肯定的または否定的として分類することのできるオピニオンの数は、比較的低くなる可能性がある。利用可能な肯定的および否定的単語の集合を豊富にするためには、語彙リファレンスを調べることが望ましい。ここで再び、適切な例としてワードネット(WordNet)データベースが挙げられる。
オピニオンのクラスタリングについてここで述べたテクニックにおいて、自然言語データベース内に単語が見つからない場合には、その単語のすべての類義語が語彙リファレンスから抽出される。その類義語のほとんどが自然言語辞書に従って肯定的(または否定的)となるときは、オリジナルの単語が肯定的(または否定的)であるとしてマークされ、それに応じてオピニオンのタグ付けが行われる。
これらのアクションの過程のいずれもが単語の性質を決定できない場合には、自然言語辞書を調べるときに語形論的な語幹を通じてその単語の規範的な形式が求められる。単語の規範的な形式は、自然言語辞書内において求められ、その単語の語根形式についての情報をデータベースが含んでいるか否かが調べられる。
最後に、ドキュメントの集合から抽出されたオピニオンが、それぞれの分類に応じた異なるタグを用いてオリジナルのテキスト内にマークされる。
オピニオンおよびグループの表示
図3は、円グラフ形式300および棒グラフ形式300’を用いて対応する情報を示している。円グラフ300は、与えられたトピックについての肯定的、否定的、および中立のオピニオンの全体的な分配をまとめている。棒グラフ300’は、重要なオピニオンのフレーズにランク付けし、観察する上で有用である。このほかの任意の適切なグラフまたは表による表現を必要に応じて採用することもできる。
コンピュータ・ハードウエアおよびソフトウエア
図4は、ここで説明したようなテキスト処理を行うために使用することのできるタイプのコンピュータ・システム400を略図的に示している。コンピュータ・ソフトウエアは、コンピュータ・システム400上にインストールされた適切なオペレーティング・システムの下に実行され、ここで説明したテクニックの実行を援助する。このコンピュータ・ソフトウエアは、任意の適切なコンピュータ・プログラミング言語を使用してプログラムされ、特定のステップを達成するための各種のソフトウエア・コード手段を包含しているものと考えることができる。
コンピュータ・システム400のコンポーネントには、コンピュータ420、キーボード410ならびにマウス415、およびビデオ・ディスプレイ490が含まれる。コンピュータ420は、プロセッサ440、メモリ450、入力/出力(I/O)インターフェース460、465、ビデオ・インターフェース445、およびストレージ・デバイス455を含む。
プロセッサ440は、オペレーティング・システムならびにオペレーティング・システムの下に実行されるコンピュータ・ソフトウエアを実行する中央処理ユニット(CPU)である。メモリ450は、ランダム・アクセス・メモリ(RAM)および読み出し専用メモリ(ROM)を含み、プロセッサ440の管理の下に使用される。
ビデオ・インターフェース445は、ビデオ・ディスプレイ490に接続されており、ビデオ・ディスプレイ490上における表示のためのビデオ信号を提供する。コンピュータ420を操作するためのユーザ入力は、キーボード410ならびにマウス415から提供される。ストレージ・デバイス455は、ディスク・ドライブまたはそのほかの任意の適切なストレージ・メディアを含むことができる。
コンピュータ420のコンポーネントのそれぞれは、データ・バス、アドレス・バス、およびコントロール・バスを含む内部バス430に接続されており、コンピュータ420のコンポーネントは、バス430を介して相互に通信することができる。
コンピュータ・システム400は、入力/出力(I/O)インターフェース465を介し、インターネット480として示されているネットワークへ向かう通信チャンネル485を使用して、1ないしは複数のほかの類似のコンピュータへ接続することができる。
コンピュータ・ソフトウエアは、ポータブル・ストレージ・メディア上への記録が可能であり、その場合には、コンピュータ・ソフトウエアがストレージ・デバイス455からコンピュータ・システム400によってアクセスされる。それに代えてコンピュータ・ソフトウエアが、インターネット480からコンピュータ420によって直接アクセスされるようにすることも可能である。いずれの場合においてもユーザは、キーボード410ならびにマウス415を使用してコンピュータ・システム400とインタラクションを行い、コンピュータ420上において実行中のプログラムされたコンピュータ・ソフトウエアを操作することができる。
このほかの構成もしくはタイプのコンピュータ・システムについても同様に、ここで説明したテクニックの具体化に使用することができる。上記のコンピュータ・システム400は、ここで説明したテクニックの具体化に適している特定タイプのシステムの単なる例として説明されているに過ぎない。
応用
ここで述べたテクニックは、多くの応用を有している。一例を述べると、会社は、その会社の製品について、あるいはライバル会社の製品について消費者が何を『言っているか』の決定を望むことがある。各種のソースからのオピニオンのマニュアル調査は、極めて時間の掛かる退屈な作業であり、しかも実際的でない。しかしながら、肯定的または否定的なオピニオンの統計を示す円グラフまたはヒストグラムとしてオピニオンが要約され、かつオピニオンの中に使用されている代表的な表現が決定できれば、その種の情報は、ビジネス戦略に関する情報に基づいた決定を行う上で有用なものとなり得る。この種の『オピニオン・マイナ』としての用途は、ビジネス・インテリジェンス応用において、あるいは推奨システムとしても有用となり得る。さらにこのテクニックを使用して、自然言語で与えられた調査の回答を処理することができる。
結論
当業者には明らかであろうが、ここで説明したテクニックならびに構成に対して各種の変更および修正を行うことができる。
テキスト・ドキュメントの本文からオピニオン・フレーズを抽出するためのシステムを示した概略ブロック図である。 自然言語データベースおよび語彙リファレンスから拡充される用語辞書の作成を表した概略ブロック図である。 ここで説明したテキスト処理テクニックの例に関係するオピニオンの分類の結果を示した円グラフおよび棒グラフである。 ここで説明したようなテキスト処理において使用するためのコンピュータ・システムの概略図である。
符号の説明
105 入力デバイス
110 プロセッサ
115 POS(品詞)タガー
120 フレーズ・エキストラクタ
125 オピニオン・フィルタ
130 自然言語辞書
135 語彙リファレンス
140 オピニオン・グルーパ
145 ディスプレイ・デバイス
300 円グラフ
300’ 棒グラフ
400 コンピュータ・システム
410 キーボード
415 マウス
420 コンピュータ
430 バス
440 プロセッサ
445 ビデオ・インターフェース
450 メモリ
455 ストレージ・デバイス
460 入力/出力(I/O)インターフェース
465 入力/出力(I/O)インターフェース
480 インターネット
485 通信チャンネル
490 ビデオ・ディスプレイ

Claims (7)

  1. 表出されたオピニオンを分析する方法であって、
    コンピュータ
    入力デバイスから取得した少なくとも1つのテキスト‐ベースのドキュメントの単語を品詞としてタグ付けしてPOSタグ・シーケンスを生成する第1のステップと、
    前記POSタグ・シーケンスのパターンに規則的に現れる特定のタグ・シーケンス・パターンをカバーするPOSタグの正規表現の集合を構築する第2のステップと、
    前記正規表現と前記ドキュメント内の単語にかかるPOSタグ・シーケンスとのマッチングを行って、該マッチングの結果に応じて前記ドキュメントから対応する単語を抽出してオピニオンとする第3のステップと、
    前記オピニオンの単語について自然言語データベースを用いて解析する第4のステップと、
    前記第4のステップにおいて前記自然言語データベースで前記単語が検出されないと、当該単語の全ての類義語を語彙リファレンスから抽出して解析する第5のステップと、
    前記第5のステップで前記類義語が前記語彙リファレンスで検出されないと、語形論的な語幹を介して前記単語の規範的な形式を得て当該単語の語幹形式が前記自然言語データベースに含まれているか否かを調べる第6のステップと、
    前記単語に関してセマンティック・オリエンテーションの典型的なカテゴリに類別する第7のステップとを実行させる方法。
  2. 抽出されたオピニオンが、少なくとも肯定及び否定のカテゴリに分かれるそれらの感情の極性によって特徴づけられる請求項1に記載の方法。
  3. 前記典型的なカテゴリが、好意的、非好意的、及び中立として識別され請求項1に記載の方法。
  4. さらに、コンピュータ、異なって類別された表現の相対的な特性をグラフィカルに表示するステップを実行させる請求項1に記載の方法。
  5. さらに、コンピュータ、表出されたオピニオンを示す正規表現規則の集合をストアするステップを実行させる請求項1に記載の方法。
  6. さらに、コンピュータ、表出されたオピニオンと、その表出されたオピニオンが関係するトピックを関連付けするステップを実行させる請求項1に記載の方法。
  7. 請求項1〜6のいずれか1項に記載の方法の各ステップをコンピュータに実行させるためコンピュータ・プログラム。
JP2004351370A 2003-12-05 2004-12-03 テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム Expired - Fee Related JP4129987B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/729,165 US7865354B2 (en) 2003-12-05 2003-12-05 Extracting and grouping opinions from text documents

Publications (3)

Publication Number Publication Date
JP2005174330A JP2005174330A (ja) 2005-06-30
JP2005174330A5 JP2005174330A5 (ja) 2007-04-12
JP4129987B2 true JP4129987B2 (ja) 2008-08-06

Family

ID=34633872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004351370A Expired - Fee Related JP4129987B2 (ja) 2003-12-05 2004-12-03 テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム

Country Status (2)

Country Link
US (1) US7865354B2 (ja)
JP (1) JP4129987B2 (ja)

Families Citing this family (220)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271316B2 (en) * 1999-12-17 2012-09-18 Buzzmetrics Ltd Consumer to business data capturing system
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7185065B1 (en) * 2000-10-11 2007-02-27 Buzzmetrics Ltd System and method for scoring electronic messages
US7197470B1 (en) 2000-10-11 2007-03-27 Buzzmetrics, Ltd. System and method for collection analysis of electronic discussion methods
US7725414B2 (en) 2004-03-16 2010-05-25 Buzzmetrics, Ltd An Israel Corporation Method for developing a classifier for classifying communications
FR2875988A1 (fr) * 2004-09-24 2006-03-31 France Telecom Representation visuelle et vocale d'un document multimedia
WO2006039566A2 (en) * 2004-09-30 2006-04-13 Intelliseek, Inc. Topical sentiments in electronically stored communications
US7788086B2 (en) * 2005-03-01 2010-08-31 Microsoft Corporation Method and apparatus for processing sentiment-bearing text
US7788087B2 (en) * 2005-03-01 2010-08-31 Microsoft Corporation System for processing sentiment-bearing text
US9158855B2 (en) 2005-06-16 2015-10-13 Buzzmetrics, Ltd Extracting structured data from weblogs
US20070100779A1 (en) * 2005-08-05 2007-05-03 Ori Levy Method and system for extracting web data
US20080221868A1 (en) * 2005-09-05 2008-09-11 Melnick Einat H Digital universal language
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070067320A1 (en) * 2005-09-20 2007-03-22 International Business Machines Corporation Detecting relationships in unstructured text
US8209335B2 (en) * 2005-09-20 2012-06-26 International Business Machines Corporation Extracting informative phrases from unstructured text
US20070143122A1 (en) * 2005-12-06 2007-06-21 Holloway Lane T Business method for correlating product reviews published on the world wide Web to provide an overall value assessment of the product being reviewed
US7831928B1 (en) 2006-06-22 2010-11-09 Digg, Inc. Content visualization
US8862591B2 (en) 2006-08-22 2014-10-14 Twitter, Inc. System and method for evaluating sentiment
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8296168B2 (en) * 2006-09-13 2012-10-23 University Of Maryland System and method for analysis of an opinion expressed in documents with regard to a particular topic
US7660783B2 (en) * 2006-09-27 2010-02-09 Buzzmetrics, Inc. System and method of ad-hoc analysis of data
US20080167879A1 (en) * 2006-10-16 2008-07-10 Du Bois Denis D Speech delimiting processing system and method
US7761287B2 (en) * 2006-10-23 2010-07-20 Microsoft Corporation Inferring opinions based on learned probabilities
US20080249764A1 (en) * 2007-03-01 2008-10-09 Microsoft Corporation Smart Sentiment Classifier for Product Reviews
US20080215571A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Product review search
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080249762A1 (en) * 2007-04-05 2008-10-09 Microsoft Corporation Categorization of documents using part-of-speech smoothing
US7996210B2 (en) * 2007-04-24 2011-08-09 The Research Foundation Of The State University Of New York Large-scale sentiment analysis
US8548996B2 (en) * 2007-06-29 2013-10-01 Pulsepoint, Inc. Ranking content items related to an event
US7987188B2 (en) 2007-08-23 2011-07-26 Google Inc. Domain-specific sentiment classification
US20090063470A1 (en) 2007-08-28 2009-03-05 Nogacom Ltd. Document management using business objects
US8417713B1 (en) 2007-12-05 2013-04-09 Google Inc. Sentiment detection as a ranking signal for reviewable entities
US8347326B2 (en) 2007-12-18 2013-01-01 The Nielsen Company (US) Identifying key media events and modeling causal relationships between key events and reported feelings
US20090164266A1 (en) * 2007-12-21 2009-06-25 Microsoft Corporation Category aggregated opinion data
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8799773B2 (en) * 2008-01-25 2014-08-05 Google Inc. Aspect-based sentiment summarization
US8010539B2 (en) 2008-01-25 2011-08-30 Google Inc. Phrase based snippet generation
WO2009105277A1 (en) * 2008-02-22 2009-08-27 Socialrep, Llc System and method for measuring and managing distributed online conversations
US8239189B2 (en) * 2008-02-26 2012-08-07 Siemens Enterprise Communications Gmbh & Co. Kg Method and system for estimating a sentiment for an entity
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8731995B2 (en) * 2008-05-12 2014-05-20 Microsoft Corporation Ranking products by mining comparison sentiment
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8219397B2 (en) * 2008-06-10 2012-07-10 Nuance Communications, Inc. Data processing system for autonomously building speech identification and tagging data
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
CN102033880A (zh) * 2009-09-29 2011-04-27 国际商业机器公司 基于结构化数据集合的标注方法和装置
US8682649B2 (en) * 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8356025B2 (en) * 2009-12-09 2013-01-15 International Business Machines Corporation Systems and methods for detecting sentiment-based topics
US8725717B2 (en) * 2009-12-23 2014-05-13 Palo Alto Research Center Incorporated System and method for identifying topics for short text communications
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
CN102163187B (zh) * 2010-02-21 2014-11-26 国际商业机器公司 文档标记方法和装置
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8782046B2 (en) 2010-03-24 2014-07-15 Taykey Ltd. System and methods for predicting future trends of term taxonomies usage
US9946775B2 (en) 2010-03-24 2018-04-17 Taykey Ltd. System and methods thereof for detection of user demographic information
US9183292B2 (en) 2010-03-24 2015-11-10 Taykey Ltd. System and methods thereof for real-time detection of an hidden connection between phrases
US10600073B2 (en) 2010-03-24 2020-03-24 Innovid Inc. System and method for tracking the performance of advertisements and predicting future behavior of the advertisement
US9613139B2 (en) 2010-03-24 2017-04-04 Taykey Ltd. System and methods thereof for real-time monitoring of a sentiment trend with respect of a desired phrase
US8725494B2 (en) * 2010-03-31 2014-05-13 Attivio, Inc. Signal processing approach to sentiment analysis for entities in documents
US8874727B2 (en) 2010-05-31 2014-10-28 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to rank users in an online social network
US20120041955A1 (en) * 2010-08-10 2012-02-16 Nogacom Ltd. Enhanced identification of document types
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20130073480A1 (en) 2011-03-22 2013-03-21 Lionel Alberti Real time cross correlation of intensity and sentiment from social media messages
WO2012134180A2 (ko) * 2011-03-28 2012-10-04 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
CN102760264A (zh) * 2011-04-29 2012-10-31 国际商业机器公司 为互联网上的评论生成摘录的计算机实现的方法和系统
US8838438B2 (en) * 2011-04-29 2014-09-16 Cbs Interactive Inc. System and method for determining sentiment from text content
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8798995B1 (en) 2011-09-23 2014-08-05 Amazon Technologies, Inc. Key word determinations from voice data
US9009024B2 (en) * 2011-10-24 2015-04-14 Hewlett-Packard Development Company, L.P. Performing sentiment analysis
US20130173254A1 (en) * 2011-12-31 2013-07-04 Farrokh Alemi Sentiment Analyzer
US9208139B2 (en) * 2012-01-05 2015-12-08 Educational Testing Service System and method for identifying organizational elements in argumentative or persuasive discourse
US8838435B2 (en) 2012-01-11 2014-09-16 Motorola Mobility Llc Communication processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8515828B1 (en) * 2012-05-29 2013-08-20 Google Inc. Providing product recommendations through keyword extraction from negative reviews
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US20140164417A1 (en) * 2012-07-26 2014-06-12 Infosys Limited Methods for analyzing user opinions and devices thereof
US20140067370A1 (en) * 2012-08-31 2014-03-06 Xerox Corporation Learning opinion-related patterns for contextual and domain-dependent opinion detection
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2014047725A1 (en) * 2012-09-28 2014-04-03 Alkis Papadopoullos Method and system for analysing sentiments
US9278255B2 (en) 2012-12-09 2016-03-08 Arris Enterprises, Inc. System and method for activity recognition
US10212986B2 (en) 2012-12-09 2019-02-26 Arris Enterprises Llc System, apparel, and method for identifying performance of workout routines
JP5676552B2 (ja) * 2012-12-17 2015-02-25 日本電信電話株式会社 デイリーワード抽出装置、方法、及びプログラム
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US9860337B1 (en) * 2013-03-14 2018-01-02 Amazon Technologies, Inc. Machine-based identification of content with differing opinions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
US11928606B2 (en) 2013-03-15 2024-03-12 TSG Technologies, LLC Systems and methods for classifying electronic documents
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9298814B2 (en) 2013-03-15 2016-03-29 Maritz Holdings Inc. Systems and methods for classifying electronic documents
US9189540B2 (en) * 2013-04-05 2015-11-17 Hewlett-Packard Development Company, L.P. Mobile web-based platform for providing a contextual alignment view of a corpus of documents
US9432325B2 (en) 2013-04-08 2016-08-30 Avaya Inc. Automatic negative question handling
US20140358523A1 (en) * 2013-05-30 2014-12-04 Wright State University Topic-specific sentiment extraction
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
KR101508059B1 (ko) * 2013-06-26 2015-04-07 숭실대학교산학협력단 단어의 쾌-불쾌 지수 예측 장치 및 방법
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9311467B2 (en) * 2013-08-20 2016-04-12 International Business Machines Corporation Composite propensity profile detector
US9715492B2 (en) 2013-09-11 2017-07-25 Avaya Inc. Unspoken sentiment
US20150073774A1 (en) * 2013-09-11 2015-03-12 Avaya Inc. Automatic Domain Sentiment Expansion
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10614100B2 (en) * 2014-06-19 2020-04-07 International Business Machines Corporation Semantic merge of arguments
US9317566B1 (en) 2014-06-27 2016-04-19 Groupon, Inc. Method and system for programmatic analysis of consumer reviews
US11250450B1 (en) 2014-06-27 2022-02-15 Groupon, Inc. Method and system for programmatic generation of survey queries
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9880997B2 (en) * 2014-07-23 2018-01-30 Accenture Global Services Limited Inferring type classifications from natural language text
US10878017B1 (en) 2014-07-29 2020-12-29 Groupon, Inc. System and method for programmatic generation of attribute descriptors
KR101567789B1 (ko) * 2014-08-26 2015-11-11 숭실대학교산학협력단 상대적 감정 유사도를 이용한 단어의 쾌-불쾌 지수 예측 장치 및 방법
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10977667B1 (en) 2014-10-22 2021-04-13 Groupon, Inc. Method and system for programmatic analysis of consumer sentiment with regard to attribute descriptors
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
EP3029607A1 (en) * 2014-12-05 2016-06-08 PLANET AI GmbH Method for text recognition and computer program product
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US10050921B2 (en) 2015-03-27 2018-08-14 International Business Machines Corporation Analyzing email threads
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10140646B2 (en) * 2015-09-04 2018-11-27 Walmart Apollo, Llc System and method for analyzing features in product reviews and displaying the results
US11164223B2 (en) 2015-09-04 2021-11-02 Walmart Apollo, Llc System and method for annotating reviews
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US20180260860A1 (en) 2015-09-23 2018-09-13 Giridhari Devanathan A computer-implemented method and system for analyzing and evaluating user reviews
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
CN105528410B (zh) * 2015-12-05 2019-03-26 浙江大学 一种对医院的在线评论进行归纳和分类的方法
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10372714B2 (en) * 2016-02-05 2019-08-06 International Business Machines Corporation Automated determination of document utility for a document corpus
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP2017167433A (ja) * 2016-03-17 2017-09-21 株式会社東芝 サマリ生成装置、サマリ生成方法及びサマリ生成プログラム
CN107203542A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 词组提取方法及装置
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
CN107767195A (zh) * 2016-08-16 2018-03-06 阿里巴巴集团控股有限公司 描述信息的展示系统和展示、生成方法及电子设备
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10114815B2 (en) 2016-10-25 2018-10-30 International Business Machines Corporation Core points associations sentiment analysis in large documents
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10373278B2 (en) 2017-02-15 2019-08-06 International Business Machines Corporation Annotation of legal documents with case citations
US10452780B2 (en) 2017-02-15 2019-10-22 International Business Machines Corporation Tone analysis of legal documents
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10839157B2 (en) * 2017-10-09 2020-11-17 Talentful Technology Inc. Candidate identification and matching
US10380260B2 (en) * 2017-12-14 2019-08-13 Qualtrics, Llc Capturing rich response relationships with small-data neural networks
US11087089B2 (en) * 2018-10-05 2021-08-10 Sap Se Aspect-driven multi-document summarization
US10909328B2 (en) * 2019-01-04 2021-02-02 International Business Machines Corporation Sentiment adapted communication
CN109902230A (zh) * 2019-02-13 2019-06-18 北京航空航天大学 一种新闻数据的处理方法及装置
US11082454B1 (en) * 2019-05-10 2021-08-03 Bank Of America Corporation Dynamically filtering and analyzing internal communications in an enterprise computing environment
US11200415B2 (en) 2019-08-20 2021-12-14 International Business Machines Corporation Document analysis technique for understanding information
US10878174B1 (en) * 2020-06-24 2020-12-29 Starmind Ag Advanced text tagging using key phrase extraction and key phrase generation
US11551674B2 (en) * 2020-08-18 2023-01-10 Bank Of America Corporation Multi-pipeline language processing platform
US11379763B1 (en) 2021-08-10 2022-07-05 Starmind Ag Ontology-based technology platform for mapping and filtering skills, job titles, and expertise topics
US20230054480A1 (en) * 2021-08-19 2023-02-23 International Business Machines Corporation Viewpoint analysis of video data

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9806085D0 (en) * 1998-03-23 1998-05-20 Xerox Corp Text summarisation using light syntactic parsing
US6332143B1 (en) * 1999-08-11 2001-12-18 Roedy Black Publishing Inc. System for connotative analysis of discourse
US6418435B1 (en) * 1999-08-11 2002-07-09 Connotative Reference Corporation System for quantifying intensity of connotative meaning
US6721734B1 (en) * 2000-04-18 2004-04-13 Claritech Corporation Method and apparatus for information management using fuzzy typing
JP3372532B2 (ja) 2000-10-11 2003-02-04 日本電信電話株式会社 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
US7027974B1 (en) * 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US6910004B2 (en) * 2000-12-19 2005-06-21 Xerox Corporation Method and computer system for part-of-speech tagging of incomplete sentences
JP2002304401A (ja) 2001-04-05 2002-10-18 Toshiba Corp アンケート処理装置及びアンケート処理方法並びにプログラム
US6859771B2 (en) * 2001-04-23 2005-02-22 Microsoft Corporation System and method for identifying base noun phrases
JP3677006B2 (ja) 2002-02-22 2005-07-27 日本ユニシス株式会社 情報処理装置およびその方法
JP4213900B2 (ja) 2002-03-13 2009-01-21 株式会社リコー 文書分類装置と記録媒体
GB2390704A (en) * 2002-07-09 2004-01-14 Canon Kk Automatic summary generation and display
US7552051B2 (en) * 2002-12-13 2009-06-23 Xerox Corporation Method and apparatus for mapping multiword expressions to identifiers using finite-state networks

Also Published As

Publication number Publication date
JP2005174330A (ja) 2005-06-30
US7865354B2 (en) 2011-01-04
US20050125216A1 (en) 2005-06-09

Similar Documents

Publication Publication Date Title
JP4129987B2 (ja) テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム
d'Sa et al. Bert and fasttext embeddings for automatic detection of toxic speech
Ghosh et al. Fracking sarcasm using neural network
Joseph et al. Natural language processing: A review
Danisman et al. Feeler: Emotion classification of text using vector space model
MXPA04010820A (es) Sistema para identificar parafrasis utilizando tecnicas de traduccion de maquina.
Rahate et al. Feature selection for sentiment analysis by using svm
Choudhury et al. The structure and dynamics of linguistic networks
Varaprasad et al. Applications and Techniques of Natural Language Processing: An Overview.
Das et al. The 5w structure for sentiment summarization-visualization-tracking
Jha et al. Hsas: Hindi subjectivity analysis system
Vīksna et al. Sentiment analysis in Latvian and Russian: A survey
Zinn Utilising corpus linguistic tools for analysing social change in risk
del-Hoyo et al. Hybrid text affect sensing system for emotional language analysis
Mamta A real-time twitter sentiment analysis and visualization system: TwiSent
Akkineni et al. Hybrid Method for Framing Abstractive Summaries of Tweets.
Tanantong et al. A Survey of Automatic Text Classification Based on Thai Social Media Data
Abdelwahab et al. Arabic Text Summarization using Pre-Processing Methodologies and Techniques.
Hrešková et al. Michiko: Poem models used in automated haiku poetry generation
Zafar et al. Analyzing adverbs impact for sentiment analysis using hadoop
Kushwaha et al. Artificial Intelligence based Chatbot: A Case Study
Selamat et al. Arabic script language identification using letter frequency neural networks
Karunathilake et al. Feature Extraction from Online User Reviews
JP2008204010A (ja) 質問内容抽出装置と質問内容抽出方法
Valdez-Valenzuela et al. Heterogeneous-Graph Convolutional Network for Authorship Verification

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070914

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20070914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080228

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080519

R150 Certificate of patent or registration of utility model

Ref document number: 4129987

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees