JP2011170786A - 文書分類システムおよび文書分類プログラムならびに文書分類方法 - Google Patents
文書分類システムおよび文書分類プログラムならびに文書分類方法 Download PDFInfo
- Publication number
- JP2011170786A JP2011170786A JP2010036402A JP2010036402A JP2011170786A JP 2011170786 A JP2011170786 A JP 2011170786A JP 2010036402 A JP2010036402 A JP 2010036402A JP 2010036402 A JP2010036402 A JP 2010036402A JP 2011170786 A JP2011170786 A JP 2011170786A
- Authority
- JP
- Japan
- Prior art keywords
- classification
- text document
- document
- category
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
【解決手段】各テキスト文書に対して言語処理を行って単語に分解する言語処理部10と、ユーザからの指示に基づいて教師データとするテキスト文書を指定する手動分類部30と、教師データに基づいて機械学習により単語毎に学習モデルを算出する学習部40と、学習モデルと分類対象のテキスト文書に含まれる各単語に基づいて、分類対象のテキスト文書について、カテゴリ毎に分類スコアを算出し、分類スコアが最大となるカテゴリに分類対象のテキスト文書を分類する自動分類部50と、各テキスト文書の各カテゴリへの分類結果、および各テキスト文書についてのカテゴリ毎の分類スコアをユーザに提示するインタフェース部60とを有する。
【選択図】図1
Description
以下では本発明の実施の形態1である文書分類システムについて説明する。本発明の実施の形態1である文書分類システムは、テキスト文書を取り込み、これらを内容に応じて予めユーザが設定した分類用のカテゴリに自動分類する機能を有するコンピュータシステムである。この文書分類システムは、例えば、コールセンターにおける応対履歴(コールログ)などのテキスト文書を取り込み、キーワードやユーザの属性などの種々の条件により分類したり、トピックやキーワードを抽出したり、ユーザの属性や時系列等による因果関係を分析したり等、多様な分析を行うことによって蓄積されたテキスト文書を活用することを目的とするシステムの一部として実装することが可能である。
図1は、本発明の実施の形態1である文書分類システムの構成例の概要について示した図である。文書分類システム1は、例えば、サーバやPC(Personal Computer)等によって構成され、ソフトウェアプログラムによって実装された言語処理部10、ノード管理部20、手動分類部30、学習部40、自動分類部50およびインタフェース部60の各部と、データベースやファイルテーブル等からなるテキスト管理71、単語管理72、ノード管理73、パラメータ管理74および学習モデル管理75の各テーブルを有する。
図2は、上記のような構成を有する文書分類システム1により、テキスト文書を各カテゴリに自動分類する際の処理の流れの例を示した図である。まず、ユーザによる手動、もしくは他のシステム(例えばコールセンターシステム等)との連携により、インタフェース部60を介して分類の対象となるテキスト文書(例えばコールログや、新聞記事・ニュース等)を文書分類システム1に取り込む(S100)。このとき、言語処理部10によって各テキスト文書を単語に分解する言語処理を行っておく。
図3は、図2のステップS100のテキストの取り込み処理の際に行う言語処理の流れの例を示したフローチャートである。まず、言語処理部10が分類対象の各テキスト文書を読み込んで、テキスト文書を形態素の列に分解して品詞を判別するいわゆる形態素解析を行う(S101)。次に、形態素解析の結果に基づいて、テキスト文書の構文を解析するいわゆる構文解析を行い(S102)、言語処理を終了する。なお、形態素解析、構文解析の各解析処理については自然言語処理における公知の技術やアルゴリズムを適宜利用することができ、一般的な形態素解析エンジンや構文解析エンジンを言語処理部10に組み込んで用いることも可能である。
図6は、図2のステップS200のノード(自動分類ノード)の作成処理の流れの例を示したフローチャートである。まず、インタフェース部60を介したユーザからの指示により、ノード管理部20が、作成対象の自動分類ノードにおける分類処理に係る各種パラメータ(N、M、X)の値を事前に設定する(S201)。ここで、N、Mは、後述する教師データの学習処理において、学習対象とする単語の足切りを行う際に使用する数値であり、Xは、後述する自動分類処理において、カテゴリにテキスト文書を分類する際に用いる閾値である。これらについては、デフォルト値を定義しておき、ユーザからの指定が特になければデフォルト値を用いるようにするのが望ましい。設定されたパラメータの値は自動分類ノード毎にパラメータ管理74のテーブルに格納する。
図9は、図2のステップS300の教師データの作成処理の際に行う手動分類処理の流れの例を示したフローチャートである。まず、未分類ノード(もしくは各カテゴリの分類ノード)に紐付けられた各テキスト文書について、インタフェース部60を介したユーザからの未読/既読の状態更新の指示に基づいて、手動分類部30がテキスト管理71の未読フラグの更新を行う(S301)。これにより、後述する自動分類処理において分類対象を未読のテキスト文書のみに限定することが可能となる。なお、未読のテキスト文書を既読にしたり、既読のテキスト文書を未読に戻したりは自由に行えるようにしておく。
図10は、図2のステップS400の教師データの学習処理の流れを示したフローチャートである。ここでは、各カテゴリの教師データとして教師ノードに紐付けられたテキスト文書に含まれる単語に基づいて学習処理を行うことで学習モデルを算出するが、その際にテキスト文書に含まれる全ての単語を学習対象とするのではなく、学習対象の単語を足切りにより最適化することで学習処理の際の処理時間の低減やノイズの除去による精度の向上を可能とする。
図14は、図2のステップS500の自動分類処理の流れを示したフローチャートである。ここでは、インタフェース部60を介したユーザからの自動分類実行の指示をトリガとして、分類対象の各テキスト文書について、自動分類部50が、テキストに含まれる単語と学習モデル管理75に保持する学習データ(尤度係数)に基づいて、CNBにより分類すべきカテゴリを判定し、対象のカテゴリの分類ノードにテキスト文書を紐付ける。
以下では本発明の実施の形態2である文書分類システムについて説明する。本発明の実施の形態2である文書分類システムは、上述した実施の形態1の文書分類システム1の機能に加えて、さらに自動分類処理における分類精度を向上させる機能を有するものである。
分類対象のテキスト文書の例、およびこれに対して言語処理部10にて言語処理を行った結果の単語管理72に保持されたデータの例を示している。ここで、予め設定された値として、品詞による重み付け係数が、名詞:1.2、動詞:1.0、形容詞:0.8、副詞:0.5であり、文番号・文中順序の重み付け設定値がそれぞれLS=1.2、LW=0.5であった場合に、テキスト文書中で最初に出現する単語"bravo"についての重み付け値Wt("bravo")を数5〜数7に示した式に基づいて算出した場合を示している。
10…言語処理部、20…ノード管理部、30…手動分類部、40…学習部、50…自動分類部、60…インタフェース部、
71…テキスト管理、72…単語管理、73…ノード管理、74…パラメータ管理、75…学習モデル管理。
Claims (11)
- テキスト文書群を取り込み、取り込んだ前記各テキスト文書を内容に応じて予めユーザが設定した複数の分類用のカテゴリに分類する文書分類システムであって、
前記各テキスト文書に対して言語処理を行って、前記各テキスト文書を単語に分解する言語処理部と、
前記ユーザからの指示に基づいて、前記各テキスト文書を前記各カテゴリに分類する際の学習モデルを得るための教師データとする前記テキスト文書を指定する手動分類部と、
前記教師データとして指定した前記テキスト文書に基づいて、機械学習により単語毎に前記学習モデルを算出する学習部と、
前記学習モデルと、分類対象の前記テキスト文書に含まれる各単語に基づいて、分類対象の前記テキスト文書について、前記カテゴリ毎に、分類対象の前記テキスト文書が前記カテゴリに分類されるべき尤度である分類スコアを算出し、前記分類スコアが最大となる前記カテゴリに分類対象の前記テキスト文書を分類する自動分類部と、
前記自動分類部による前記各テキスト文書の前記各カテゴリへの分類結果、および前記各テキスト文書についての前記カテゴリ毎の前記分類スコアを前記ユーザに提示するインタフェース部とを有することを特徴とする文書分類システム。 - 請求項1に記載の文書分類システムにおいて、
前記自動分類部は、分類対象の前記テキストを前記分類スコアが最大となる前記カテゴリに分類する際に、前記分類スコアが上位の二つの前記カテゴリ間での前記分類スコアの差分値を優位度として算出し、前記優位度が所定の閾値以上の場合は前記分類スコアが最大となる前記カテゴリに分類し、前記優位度が前記閾値未満の場合は未分類とすることを特徴とする文書分類システム。 - 請求項2に記載の文書分類システムにおいて、
前記インタフェース部は、前記各テキスト文書についての前記カテゴリ毎の前記分類スコアを前記ユーザに提示する際に、さらに、前記各テキスト文書の前記優位度についての、前記各テキスト文書に含まれる単語毎の内訳を前記ユーザに提示することを特徴とする文書分類システム。 - 請求項1〜3のいずれか1項に記載の文書分類システムにおいて、
前記学習部は、前記教師データとして指定された前記テキスト文書に含まれる各単語について、前記各単語を含む前記テキスト文書がいずれの前記カテゴリに分類されるべきかを判定するための尤度を、前記教師データとして指定された前記テキスト文書に含まれる前記各単語の前記カテゴリ毎の出現状況に基づいて算出して、前記学習モデルとすることを特徴とする文書分類システム。 - 請求項4に記載の文書分類システムにおいて、
前記学習部は、前記学習モデルを算出する際に、前記教師データとして指定された前記テキスト文書に含まれる各単語について、前記カテゴリ全体での累積での出現頻度が所定の基準より低いもの、および/または、前記カテゴリ間での出現頻度の偏りが所定の基準より小さいものを除外することを特徴とする文書分類システム。 - 請求項4または5に記載の文書分類システムにおいて、
前記学習部は、前記学習モデルにおける、前記各単語を含む前記テキスト文書がいずれの前記カテゴリに分類されるべきかを判定するための尤度を、対象の前記カテゴリ以外の他の前記カテゴリに分類されるべき尤度として算出することを特徴とする文書分類システム。 - 請求項1〜6のいずれか1項に記載の文書分類システムにおいて、
前記自動分類部は、分類対象の前記テキスト文書についての前記カテゴリ毎の前記分類スコアを算出する際に、分類対象の前記テキスト文書に含まれる各単語の属性に応じて重み付けを行って算出することを特徴とする文書分類システム。 - 請求項7に記載の文書分類システムにおいて、
前記自動分類部は、分類対象の前記テキスト文書についての前記カテゴリ毎の前記分類スコアを算出する際に、分類対象の前記テキスト文書に含まれる各単語の品詞に応じて重み付けを行って算出することを特徴とする文書分類システム。 - 請求項7または8に記載の文書分類システムにおいて、
前記自動分類部は、分類対象の前記テキスト文書についての前記カテゴリ毎の前記分類スコアを算出する際に、分類対象の前記テキスト文書に含まれる各単語の文中および/または分類対象の前記テキスト文書中における出現位置に応じて重み付けを行って算出することを特徴とする文書分類システム。 - テキスト文書群を取り込み、取り込んだ前記各テキスト文書を内容に応じて予めユーザが設定した複数の分類用のカテゴリに分類する文書分類システムとしてコンピュータを機能させる文書分類プログラムであって、
前記各テキスト文書に対して言語処理を行って、前記各テキスト文書を単語に分解する言語処理部と、
前記ユーザからの指示に基づいて、前記各テキスト文書を前記各カテゴリに分類する際の学習モデルを得るための教師データとする前記テキスト文書を指定する手動分類部と、
前記教師データとして指定した前記テキスト文書に基づいて、機械学習により単語毎に前記学習モデルを算出する学習部と、
前記学習モデルと、分類対象の前記テキスト文書に含まれる各単語に基づいて、前記カテゴリ毎に、分類対象の前記テキスト文書が前記カテゴリに分類されるべき尤度である分類スコアを算出し、前記分類スコアが最大となる前記カテゴリに分類対象の前記テキスト文書を分類する自動分類部と、
前記自動分類部による前記各テキスト文書の前記各カテゴリへの分類結果、および前記各テキスト文書についての前記カテゴリ毎の前記分類スコアを前記ユーザに提示するインタフェース部とを有することを特徴とする文書分類プログラム。 - コンピュータシステムにより、テキスト文書群を取り込み、取り込んだ前記各テキスト文書を内容に応じて予めユーザが設定した複数の分類用のカテゴリに分類する文書分類方法であって、
前記コンピュータシステムが、
前記テキスト文書群を取り込み、前記各テキスト文書に対して言語処理を行って、前記各テキスト文書を単語に分解する第1ステップと、
前記ユーザからの指示に基づいて、分類用の前記カテゴリを作成する第2ステップと、
前記ユーザからの指示に基づいて、前記各テキスト文書を前記各カテゴリに分類する際の学習モデルを得るための教師データとする前記テキスト文書を指定する第3ステップと、
前記教師データとして指定した前記テキスト文書に基づいて、機械学習により単語毎に前記学習モデルを算出する第4ステップと、
前記学習モデルと、分類対象の前記テキスト文書に含まれる各単語に基づいて、前記カテゴリ毎に、分類対象の前記テキスト文書が前記カテゴリに分類されるべき尤度である分類スコアを算出し、前記分類スコアが最大となる前記カテゴリに分類対象の前記テキスト文書を分類する第5ステップと、
前記自動分類部による前記各テキスト文書の前記各カテゴリへの分類結果、および前記各テキスト文書についての前記カテゴリ毎の前記分類スコアを前記ユーザに提示する第6ステップと、
前記ユーザに提示した前記分類結果および前記分類スコアの情報に基づく前記ユーザからの指示に基づいて、前記教師データとする前記テキスト文書の指定を補正する第7ステップとを実行し、
さらに前記第4ステップから前記第7ステップの処理を繰り返し実行することを特徴とする文書分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010036402A JP5346841B2 (ja) | 2010-02-22 | 2010-02-22 | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010036402A JP5346841B2 (ja) | 2010-02-22 | 2010-02-22 | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170786A true JP2011170786A (ja) | 2011-09-01 |
JP5346841B2 JP5346841B2 (ja) | 2013-11-20 |
Family
ID=44684816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010036402A Active JP5346841B2 (ja) | 2010-02-22 | 2010-02-22 | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5346841B2 (ja) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013061744A (ja) * | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
CN103473262A (zh) * | 2013-07-17 | 2013-12-25 | 北京航空航天大学 | 一种基于关联规则的Web评论观点自动分类系统及分类方法 |
JP2014056516A (ja) * | 2012-09-13 | 2014-03-27 | Canon Marketing Japan Inc | 文書集合からの知識構造の抽出装置、方法、およびプログラム |
JP5572252B1 (ja) * | 2013-09-11 | 2014-08-13 | 株式会社Ubic | デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム |
JP2014167835A (ja) * | 2014-06-18 | 2014-09-11 | Ubic:Kk | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
JP5603468B1 (ja) * | 2013-07-31 | 2014-10-08 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
JP2014211870A (ja) * | 2013-04-19 | 2014-11-13 | パロ・アルト・リサーチ・センター・インコーポレーテッドPaloAlto ResearchCenterIncorporated | ビジュアル検索の構築、文書のトリアージおよびカバレッジの追跡 |
JP2015032321A (ja) * | 2014-08-21 | 2015-02-16 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
JP2015172952A (ja) * | 2015-05-07 | 2015-10-01 | 株式会社Ubic | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
JP2016012195A (ja) * | 2014-06-27 | 2016-01-21 | Kddi株式会社 | 原因推定装置、プログラムおよび原因推定方法 |
JP2016027510A (ja) * | 2015-11-19 | 2016-02-18 | 株式会社Ubic | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
WO2016063403A1 (ja) * | 2014-10-23 | 2016-04-28 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
JP5942052B1 (ja) * | 2014-12-26 | 2016-06-29 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
US9552570B2 (en) | 2012-02-29 | 2017-01-24 | Ubic, Inc. | Document classification system, document classification method, and document classification program |
JPWO2016147276A1 (ja) * | 2015-03-13 | 2017-04-27 | 株式会社Ubic | データ分析システム、データ分析方法、データ分析のためのプログラム、及び、このプログラムの記録媒体 |
CN106919551A (zh) * | 2015-12-28 | 2017-07-04 | 株式会社理光 | 一种情感词极性的分析方法、装置及设备 |
JP2017151933A (ja) * | 2016-02-26 | 2017-08-31 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | データ分類装置、データ分類方法、及びプログラム |
JP2017531243A (ja) * | 2014-08-18 | 2017-10-19 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 取り込みコンテンツに関連するコンテンツ構造化ノードの階層ビューを表示して取り込みコンテンツの構造化識別子を決定するシステム及び方法 |
JP2017535007A (ja) * | 2015-08-19 | 2017-11-24 | シャオミ・インコーポレイテッド | 分類器トレーニング方法、種類認識方法及び装置 |
JP2017535000A (ja) * | 2014-11-19 | 2017-11-24 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 文書内の潜在的重要事実を自動識別するシステム及び方法 |
WO2018003115A1 (ja) * | 2016-07-01 | 2018-01-04 | 株式会社日立製作所 | 分析支援装置、分析支援方法、および分析支援プログラム |
KR102011870B1 (ko) * | 2018-10-29 | 2019-08-20 | 박혁재 | 동영상 기반 구인구직 매칭 서버 및 방법 |
JP2020013521A (ja) * | 2018-07-20 | 2020-01-23 | カーベーセー グループ エンフェーKBC Groep NV | 改善された要求ハンドリング |
WO2020028109A1 (en) * | 2018-08-03 | 2020-02-06 | Intuit Inc. | Automated document extraction and classification |
JP2020091857A (ja) * | 2018-12-03 | 2020-06-11 | 富士通株式会社 | 電子文書の分類 |
JP2020113035A (ja) * | 2019-01-11 | 2020-07-27 | 株式会社東芝 | 分類支援システム、分類支援装置、学習装置、分類支援方法、及びプログラム |
CN112632286A (zh) * | 2020-09-21 | 2021-04-09 | 北京合享智慧科技有限公司 | 一种文本属性特征的识别、分类及结构分析方法及装置 |
CN112711940A (zh) * | 2019-10-08 | 2021-04-27 | 台达电子工业股份有限公司 | 信息处理系统、信息处理法及非暂态电脑可读取记录媒体 |
JP2021157282A (ja) * | 2020-03-25 | 2021-10-07 | 株式会社日立製作所 | ラベル付与モデル生成装置、及びラベル付与モデル生成方法 |
JP2021189889A (ja) * | 2020-06-02 | 2021-12-13 | Kddi株式会社 | 評価装置、評価方法及び評価プログラム |
CN116737935A (zh) * | 2023-06-20 | 2023-09-12 | 青海师范大学 | 基于提示学习的藏文文本分类方法、装置及存储介质 |
US11972490B2 (en) | 2018-07-20 | 2024-04-30 | Kbc Groep Nv | Determining a category of a request by word vector representation of a natural language text string with a similarity value |
JP7484141B2 (ja) | 2018-12-03 | 2024-05-16 | 富士通株式会社 | 電子文書の分類 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250100A (ja) * | 1998-02-27 | 1999-09-17 | Nec Corp | 階層型文章分類装置およびプログラムを記録した機械読み取り可能な記録媒体 |
JP2003141129A (ja) * | 2001-11-07 | 2003-05-16 | Just Syst Corp | 文書分類装置、文書分類方法、その方法をコンピュータに実行させるプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2007025868A (ja) * | 2005-07-13 | 2007-02-01 | Fujitsu Ltd | カテゴリ設定支援方法及び装置 |
JP2007172249A (ja) * | 2005-12-21 | 2007-07-05 | Fujitsu Ltd | 文書分類プログラム、文書分類装置、および文書分類方法 |
JP2009098809A (ja) * | 2007-10-15 | 2009-05-07 | Toshiba Corp | 技術文献分類システム |
JP2009129279A (ja) * | 2007-11-26 | 2009-06-11 | Yahoo Japan Corp | 機械学習装置及び機械学習方法 |
-
2010
- 2010-02-22 JP JP2010036402A patent/JP5346841B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250100A (ja) * | 1998-02-27 | 1999-09-17 | Nec Corp | 階層型文章分類装置およびプログラムを記録した機械読み取り可能な記録媒体 |
JP2003141129A (ja) * | 2001-11-07 | 2003-05-16 | Just Syst Corp | 文書分類装置、文書分類方法、その方法をコンピュータに実行させるプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2007025868A (ja) * | 2005-07-13 | 2007-02-01 | Fujitsu Ltd | カテゴリ設定支援方法及び装置 |
JP2007172249A (ja) * | 2005-12-21 | 2007-07-05 | Fujitsu Ltd | 文書分類プログラム、文書分類装置、および文書分類方法 |
JP2009098809A (ja) * | 2007-10-15 | 2009-05-07 | Toshiba Corp | 技術文献分類システム |
JP2009129279A (ja) * | 2007-11-26 | 2009-06-11 | Yahoo Japan Corp | 機械学習装置及び機械学習方法 |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013061744A (ja) * | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
US10445357B2 (en) | 2012-02-29 | 2019-10-15 | Fronteo, Inc. | Document classification system, document classification method, and document classification program |
US9552570B2 (en) | 2012-02-29 | 2017-01-24 | Ubic, Inc. | Document classification system, document classification method, and document classification program |
JP2014056516A (ja) * | 2012-09-13 | 2014-03-27 | Canon Marketing Japan Inc | 文書集合からの知識構造の抽出装置、方法、およびプログラム |
JP2014211870A (ja) * | 2013-04-19 | 2014-11-13 | パロ・アルト・リサーチ・センター・インコーポレーテッドPaloAlto ResearchCenterIncorporated | ビジュアル検索の構築、文書のトリアージおよびカバレッジの追跡 |
CN103473262A (zh) * | 2013-07-17 | 2013-12-25 | 北京航空航天大学 | 一种基于关联规则的Web评论观点自动分类系统及分类方法 |
KR101780807B1 (ko) | 2013-07-31 | 2017-10-10 | 가부시키가이샤 프론테오 | 문서 분별 시스템과 문서 분별 방법 및 문서 분별 프로그램 |
JP5603468B1 (ja) * | 2013-07-31 | 2014-10-08 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
WO2015015826A1 (ja) * | 2013-07-31 | 2015-02-05 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
JP5572252B1 (ja) * | 2013-09-11 | 2014-08-13 | 株式会社Ubic | デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム |
WO2015037263A1 (ja) * | 2013-09-11 | 2015-03-19 | 株式会社Ubic | デジタル情報分析システム、デジタル情報分析方法およびデジタル情報分析プログラム |
JP2014167835A (ja) * | 2014-06-18 | 2014-09-11 | Ubic:Kk | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
JP2016012195A (ja) * | 2014-06-27 | 2016-01-21 | Kddi株式会社 | 原因推定装置、プログラムおよび原因推定方法 |
JP2017531243A (ja) * | 2014-08-18 | 2017-10-19 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 取り込みコンテンツに関連するコンテンツ構造化ノードの階層ビューを表示して取り込みコンテンツの構造化識別子を決定するシステム及び方法 |
JP2015032321A (ja) * | 2014-08-21 | 2015-02-16 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
WO2016063403A1 (ja) * | 2014-10-23 | 2016-04-28 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
JP6043460B2 (ja) * | 2014-10-23 | 2016-12-14 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
JPWO2016063403A1 (ja) * | 2014-10-23 | 2017-04-27 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
JP2017535000A (ja) * | 2014-11-19 | 2017-11-24 | レクシスネクシス ア ディヴィジョン オブ リード エルザヴィア インコーポレイテッド | 文書内の潜在的重要事実を自動識別するシステム及び方法 |
JP5942052B1 (ja) * | 2014-12-26 | 2016-06-29 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
WO2016103519A1 (ja) * | 2014-12-26 | 2016-06-30 | 株式会社Ubic | データ分析システム、データ分析方法、およびデータ分析プログラム |
JPWO2016147276A1 (ja) * | 2015-03-13 | 2017-04-27 | 株式会社Ubic | データ分析システム、データ分析方法、データ分析のためのプログラム、及び、このプログラムの記録媒体 |
JP2015172952A (ja) * | 2015-05-07 | 2015-10-01 | 株式会社Ubic | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
JP2017535007A (ja) * | 2015-08-19 | 2017-11-24 | シャオミ・インコーポレイテッド | 分類器トレーニング方法、種類認識方法及び装置 |
JP2016027510A (ja) * | 2015-11-19 | 2016-02-18 | 株式会社Ubic | 文書分別システム、文書分別システムの制御方法、および文書分別システムの制御プログラム |
CN106919551A (zh) * | 2015-12-28 | 2017-07-04 | 株式会社理光 | 一种情感词极性的分析方法、装置及设备 |
JP2017120634A (ja) * | 2015-12-28 | 2017-07-06 | 株式会社リコー | 情感語極性の分析方法及び装置 |
CN106919551B (zh) * | 2015-12-28 | 2020-08-18 | 株式会社理光 | 一种情感词极性的分析方法、装置及设备 |
JP2017151933A (ja) * | 2016-02-26 | 2017-08-31 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | データ分類装置、データ分類方法、及びプログラム |
JPWO2018003115A1 (ja) * | 2016-07-01 | 2018-07-05 | 株式会社日立製作所 | 分析支援装置、分析支援方法、および分析支援プログラム |
WO2018003115A1 (ja) * | 2016-07-01 | 2018-01-04 | 株式会社日立製作所 | 分析支援装置、分析支援方法、および分析支援プログラム |
JP7206072B2 (ja) | 2018-07-20 | 2023-01-17 | カーベーセー グループ エンフェー | 改善された要求ハンドリング |
JP2020013521A (ja) * | 2018-07-20 | 2020-01-23 | カーベーセー グループ エンフェーKBC Groep NV | 改善された要求ハンドリング |
US11972490B2 (en) | 2018-07-20 | 2024-04-30 | Kbc Groep Nv | Determining a category of a request by word vector representation of a natural language text string with a similarity value |
WO2020028109A1 (en) * | 2018-08-03 | 2020-02-06 | Intuit Inc. | Automated document extraction and classification |
KR102011870B1 (ko) * | 2018-10-29 | 2019-08-20 | 박혁재 | 동영상 기반 구인구직 매칭 서버 및 방법 |
JP2020091857A (ja) * | 2018-12-03 | 2020-06-11 | 富士通株式会社 | 電子文書の分類 |
JP7484141B2 (ja) | 2018-12-03 | 2024-05-16 | 富士通株式会社 | 電子文書の分類 |
JP2020113035A (ja) * | 2019-01-11 | 2020-07-27 | 株式会社東芝 | 分類支援システム、分類支援装置、学習装置、分類支援方法、及びプログラム |
CN112711940A (zh) * | 2019-10-08 | 2021-04-27 | 台达电子工业股份有限公司 | 信息处理系统、信息处理法及非暂态电脑可读取记录媒体 |
JP7364512B2 (ja) | 2020-03-25 | 2023-10-18 | 株式会社日立製作所 | ラベル付与モデル生成装置、及びラベル付与モデル生成方法 |
JP2021157282A (ja) * | 2020-03-25 | 2021-10-07 | 株式会社日立製作所 | ラベル付与モデル生成装置、及びラベル付与モデル生成方法 |
JP2021189889A (ja) * | 2020-06-02 | 2021-12-13 | Kddi株式会社 | 評価装置、評価方法及び評価プログラム |
JP7282715B2 (ja) | 2020-06-02 | 2023-05-29 | Kddi株式会社 | 評価装置、評価方法及び評価プログラム |
CN112632286A (zh) * | 2020-09-21 | 2021-04-09 | 北京合享智慧科技有限公司 | 一种文本属性特征的识别、分类及结构分析方法及装置 |
CN116737935A (zh) * | 2023-06-20 | 2023-09-12 | 青海师范大学 | 基于提示学习的藏文文本分类方法、装置及存储介质 |
CN116737935B (zh) * | 2023-06-20 | 2024-05-03 | 青海师范大学 | 基于提示学习的藏文文本分类方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5346841B2 (ja) | 2013-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5346841B2 (ja) | 文書分類システムおよび文書分類プログラムならびに文書分類方法 | |
CN108647205B (zh) | 细粒度情感分析模型构建方法、设备及可读存储介质 | |
JP3571408B2 (ja) | 文書加工方法および装置 | |
US8630989B2 (en) | Systems and methods for information extraction using contextual pattern discovery | |
JP5744228B2 (ja) | インターネットにおける有害情報の遮断方法と装置 | |
US7870141B2 (en) | Method and system for finding a focus of a document | |
US20160328467A1 (en) | Natural language question answering method and apparatus | |
CN108874878A (zh) | 一种知识图谱的构建系统及方法 | |
CN109844742B (zh) | 分析系统 | |
WO2016162879A1 (en) | Text mining system and tool | |
MX2009000591A (es) | Clasificacion temporal de resultados de busqueda. | |
US10949418B2 (en) | Method and system for retrieval of data | |
US20210157977A1 (en) | Display system, program, and storage medium | |
KR20040102330A (ko) | 명명된 엔티티 인식의 향상을 위한 사용자 모델링용 방법및 명명된 엔티티 목록 생성기 | |
JP2007052744A (ja) | 分類ルール作成支援方法 | |
JP2005352888A (ja) | 表記揺れ対応辞書作成システム | |
JP6729095B2 (ja) | 情報処理装置及びプログラム | |
CN111460158B (zh) | 一种基于情感分析的微博话题公众情感预测方法 | |
CN110222194A (zh) | 基于自然语言处理的数据图表生成方法和相关装置 | |
WO2023010427A1 (en) | Systems and methods generating internet-of-things-specific knowledge graphs, and search systems and methods using such graphs | |
JP2004021445A (ja) | テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム | |
US20190065965A1 (en) | System and method of providing news analysis using artifical intelligence | |
US20220292127A1 (en) | Information management system | |
WO2022234273A1 (en) | Project data processing method and apparatus | |
EP3318987B1 (en) | Method and system for retrieval of data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130813 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5346841 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |