JP2009223809A - 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法 - Google Patents

仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法 Download PDF

Info

Publication number
JP2009223809A
JP2009223809A JP2008070075A JP2008070075A JP2009223809A JP 2009223809 A JP2009223809 A JP 2009223809A JP 2008070075 A JP2008070075 A JP 2008070075A JP 2008070075 A JP2008070075 A JP 2008070075A JP 2009223809 A JP2009223809 A JP 2009223809A
Authority
JP
Japan
Prior art keywords
category
same
data
attribute value
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008070075A
Other languages
English (en)
Inventor
Tadashi Hoshiai
忠 星合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008070075A priority Critical patent/JP2009223809A/ja
Publication of JP2009223809A publication Critical patent/JP2009223809A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成する仕訳条件作成装置において、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することを課題とする。
【解決手段】仕訳条件作成装置は、勘定科目カテゴリの十分条件となる属性カテゴリを抽出して、抽出された勘定科目カテゴリと属性カテゴリとのそれぞれに属する要素に含まれる特徴語と当該特徴語の特徴量を算出するとともに、関連度を算出して、算出された関連度の高い組み合わせを上位にした分類ルールを出力する。
【選択図】 図1

Description

この発明は、データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成する仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法に関する。
従来より、膨大なデータを特定のカテゴリに分類するための分類ルールを作成する技術において、分類済みデータに基づいて分類ルールを学習して分類する技術がある。この膨大なデータを所定の分類カテゴリに分類するための分類ルールは、人手作業と機械処理とによる作成がある。
人手作業による分類ルール作成は、対象データの分野に関する専門家が個々の分類カテゴリの定義を定めて、当該定義に従って人手により分類される。この人手作業による分類の場合は、カテゴリ定義自体、または、カテゴリ定義を客観的および具体的に書き下したものが分類ルールとなる。
また、機械処理による分類ルール作成は、特許文献1(特公平7−43722号公報)によれば、分類ルールに積和標準形を用いて、データの一つずつを積和標準形の複数の基本積に対応付ける場合に、当該複数の基本積を一つの基本積にまとめることにより分類ルールを作成する。例えば、特許文献1における帰納推論装置は、属性値「X」、「Y」、「Z」であるインスタンスを積和標準形の基本積である「X∧Y∧Z」とする(「∧」は、「および」を意味する)。そして、帰納推論装置は、「X∨W∨・・・∨X」などのように、基本積をまとめた分類先カテゴリ「Cat.」への分類ルールを作成する(「∨」は、「または」を意味する)。
特公平7−43722号公報
しかしながら、上記した従来技術は、膨大なデータを分類するための分類ルールを作成するのに際して、複雑で妥当性の低い分類ルールを生成してしまうという課題があった。
例えば、特許文献1では、基本積の粒度が非常に細かいので、分類ルールの数は大量になりユーザにとって目を通すのが困難になる上、個々の分類ルールの条件部も長く複雑になるため、非常に理解しづらい分類ルールとなる。この結果、メンテナンスが困難になるという課題があった。また、例えば、会計の勘定科目への分類では、専門知識が必要な上に、通常の統計的アプローチによる自動分類システムとは異なり、1件の分類ミスも許されないので、人手で分類ルールを作成するが、大規模な会計システムにおいては分類先カテゴリの数が大量になるために、分類ルールを作成する人手作業の工数が膨大になるという課題があった。
そこで、この発明は、上述した従来技術の課題を解決するためになされたものであり、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することが可能である仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本願の開示する仕訳条件作成装置は、データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成する仕訳条件作成装置であって、前記分類ルールを作成するために必要なパラメタが入力された場合に、当該パラメタにより特定されたフィールドであるカテゴリを分類先カテゴリとし、前記データベースにおいて当該分類先カテゴリのデータが同一の識別子を、前記分類カテゴリのデータそれぞれに対応付けた同一カテゴリデータとして抽出する同一カテゴリ抽出手段と、前記入力されたパラメタにより特定されたフィールドである属性値のデータが同一であるレコードの識別子を、前記属性値のデータそれぞれに対応付けた同一属性値データとして、前記データベースから抽出する同一属性値抽出手段と、前記同一カテゴリ抽出手段により抽出された同一カテゴリデータと、前記同一属性値抽出手段により抽出された同一属性値データとに基づいて、前記同一カテゴリデータの十分条件となる同一属性値データを全て抽出する十分条件抽出手段と、前記十分条件抽出手段により抽出された同一カテゴリデータと、同一属性値データとのそれぞれに属するレコードに含まれる特徴語を抽出して統計的特徴量を算出し、算出された前記同一カテゴリデータと同一属性値データとの統計的特徴量に基づいて、前記同一カテゴリデータと同一属性値データとの関連度を算出する関連度算出手段と、前記関連度算出手段により算出された同一カテゴリデータと同一属性値データとの組み合わせのうち、高い関連度を有する組み合わせを上位にした分類ルールを作成して所定の表示部に表示する分類ルール表示手段と、を備えたことを要件とする。
本願の開示する仕訳条件作成装置によれば、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することが可能であるという効果を奏する。
以下に添付図面を参照して、この発明に係る仕訳条件作成装置の実施例を詳細に説明する。なお、以下では、本発明に係る仕訳条件作成装置の概要および特徴、仕訳条件作成装置の構成および処理の流れを順に説明し、最後に本実施例による効果を説明する。
[概要および特徴]
まず最初に、図1を用いて、実施例1に係る仕訳条件作成装置の概要および特徴を説明する。図1は、実施例1に係る仕訳条件作成装置の概要および特徴を示す図である。
この仕訳条件作成装置は、データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、当該データベースに記憶される各データを分類する分類ルールを作成する。例えば、仕訳条件作成装置は、伝票識別番号に対応付けて、勘定科目名やその他複数の伝票属性などが格納される日々の会計伝票の集まりである会計データベースに基づいて、分類ルールを作成する。
このような構成において、仕訳条件作成装置は、データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成することを概要とするものであり、特に、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することが可能である点を主たる特徴とする。
この主たる特徴について具体的に説明すると、仕訳条件作成装置は、分類ルールを作成するために必要なパラメタが入力された場合に、当該パラメタの分類先カテゴリと属性値が同一であるカテゴリを示す属性カテゴリとを比較して、分類先カテゴリの十分条件となる属性カテゴリを全て算出する(図1の(1)参照)。
具体的に例を挙げると、仕訳条件作成装置は、分類ルールを作成するために必要なパラメタである分類先カテゴリに相当するフィールド名である「勘定科目」と、データベースのレコードを一意に識別するフィールド名である「識別子」と、分類する分析対象となる属性を示す属性値のフィールド名である「属性名1」とが入力された場合に、当該パラメタの分類先カテゴリ「普通預金/未収入金」や「未払金/本支店勘定」などの識別子「ID1,ID5,・・・」、「ID2,ID16,・・・」と、当該分類先カテゴリに対応する属性名1「属性値1」が同一であるカテゴリを示す属性カテゴリ「属性カテゴリ名1−1」や「属性カテゴリ名1−2」などの識別子「ID37,ID91,・・・」、「ID23,ID57,・・・」とを比較する。そして、仕訳条件作成装置は、分類先カテゴリ「普通預金/未収入金」の十分条件(部分集合)を満たす属性カテゴリを全て算出する。
そして、仕訳条件作成装置は、算出された分類先カテゴリと属性カテゴリとの関連度を算出する(図1の(2)参照)。上記した例で具体的に例を挙げると、仕訳条件作成装置は、算出された勘定科目「普通預金/未収入金」と属性カテゴリ「属性カテゴリ名1−1」や「属性カテゴリ名1−2」などとに特有の特徴語「飲食接待」や「営業費用仮払」など、および、当該特徴語の出現特徴量「0.2929」や「0.0978」などを抽出する。そして、仕訳条件作成装置は、抽出された特徴語および当該特徴語の出現特徴量に基づいて、各分類先カテゴリの特徴ベクトルを生成し、分類先カテゴリ「普通預金/未収入金」と属性カテゴリ「属性カテゴリ名1−1」との関連度「0.8387」を算出する。
続いて、仕訳条件作成装置は、算出された分類先カテゴリと属性カテゴリとのうち、高い関連度を有する組み合わせを取得して分類ルール候補を提示する(図1の(3)参照)。上記した例で具体的に例を挙げると、仕訳条件作成装置は、関連度「0.8387」を算出された分類先カテゴリと属性カテゴリとのうち、高い関連度を有する組み合わせを取得して分類ルール候補を提示する。なお、ユーザは、提示された分類ルール候補に基づいて、分類ルール候補を修正(例えば、下位分類ルールを上位にするなど)したり、分類ルールを用いて最終的な分類ルールを決定したりする。
このようなことから、実施例1に係る仕訳条件作成装置は、分類するカテゴリを示す分類先カテゴリと、分類する分析対象となる属性の値を示す一つまたは複数の属性値とが、識別子に対応付けて格納されているデータベースに基づいて、分類ルールを作成する場合に、分類先カテゴリの十分条件を、分析対象属性の属性値によって定まる属性カテゴリが分類先カテゴリの部分集合となるものを算出して、十分条件が複数個存在する場合に、分類先カテゴリと関連度の高い条件項目を優先して分類ルールを生成することができる結果、簡潔で妥当性の高い分類ルールを作成することが可能である。
つまり、仕訳条件作成装置は、条件項目と分類カテゴリとから抽出された特徴素の関連度の高いものを優先して分類ルールを作成するので、ユーザによって考えられる論理条件に近い分類ルールを作成することができる結果、簡潔で妥当性の高い分類ルールを作成することが可能である。
[実施例1に係る仕訳条件作成装置の構成]
次に、図2を用いて、実施例1に係る仕訳条件作成装置の構成を説明する。図2は、実施例1に係る仕訳条件作成装置の構成を示す図である。
図2に示すように、仕訳条件作成装置10は、入力部11と、表示部12と、記憶部13と、制御部14とを有し、分類するカテゴリを示す分類先カテゴリと、分類する分析対象となる属性の値を示す一つまたは複数の属性値とが、識別子に対応付けて格納されているデータベースに基づいて、分類ルールを作成する。なお、本実施例では、伝票識別番号に対応付けて、勘定科目名やその他複数の伝票属性などが格納される会計伝票の集まりである会計データベースを例に挙げて仕訳条件作成装置10による処理を説明する。
入力部11は、分類ルールの作成に必要となるパラメタやユーザによる処理実行開始の指示などを受け付ける。例えば、入力部11は、分類ルールの作成に必要となるパラメタである分類先カテゴリを示す「勘定科目」と、分析対象の属性を示す「属性名1」・・・「属性名n」と、データベースのレコードを一意に識別する「識別子」とを受け付けたり、ユーザによる処理実行開始の指示などを受け付けたりする。
表示部12は、仕訳条件作成装置10によって出力される分類ルール候補をユーザに提示したり、ユーザに対する入力要求を表示したりする。例えば、表示部12は、仕訳条件作成装置10によって出力される処理結果である分類ルール候補を表示したり、パラメタや処理実行開始指示などの入力指示要求の旨を表示したりする。
記憶部13は、制御部14による各種処理に必要なデータや、制御部14による各種処理結果を記憶し、特に本発明に密接に関連するものとしては、会計データベース13aと、勘定科目カテゴリ所属要素テーブル13bと、属性カテゴリ所属要素テーブル13cと、勘定科目カテゴリ十分条件テーブル13dと、勘定科目カテゴリ特徴量データベース13eと、属性カテゴリ特徴量データベース13fと、勘定科目/属性関連度データベース13gとを有する。
会計データベース13aは、分類するカテゴリを示す分類先カテゴリと、分類する分析対象となる属性の値を示す一つまたは複数の属性値とを、識別子に対応付けて記憶する。例えば、会計データベース13aは、図3に示すように、分類するカテゴリを示す分類先カテゴリ「勘定科目:普通預金/未収入金」と、分類する分析対象となる属性の値を示す一つまたは複数の属性値「属性名1:属性値1−1」(図示していないが、「属性名2:属性値2−1」や「属性名3:属性値3−1」など)とを、当該会計データベース13aの各レコードを一意に識別する「識別子:ID1」に対応付けて記憶する。なお、図3は、実施例1に係る会計データベース13aの例を示す図である。
勘定科目カテゴリ所属要素テーブル13bは、分類先カテゴリと、当該分類先カテゴリに属する要素の識別子とを対応付けて記憶する。例えば、勘定科目カテゴリ所属要素テーブル13bは、図4に示すように、分類先カテゴリ「普通預金/未収入金」と、当該分類先カテゴリに属する要素の識別子「ID1,ID5,・・・」とを対応付けて記憶する。なお、図4は、実施例1に係る勘定科目カテゴリ所属要素テーブル13bの例を示す図である。
属性カテゴリ所属要素テーブル13cは、属性名が同一であるカテゴリを示す属性カテゴリと、当該属性カテゴリに属する要素の識別子とを対応付けて記憶する。例えば、属性カテゴリ所属要素テーブル13cは、図5に示すように、属性名「属性名1」が同一であるカテゴリを示す属性カテゴリ「属性カテゴリ名1−1」や「属性カテゴリ名1−2」などと、当該属性カテゴリに属する要素の識別子「ID37,ID91,・・・」や「ID23,ID57,・・・」などとを対応付けて記憶する。なお、図5は、実施例1に係る属性カテゴリ所属要素テーブル13cの例を示す図である。
勘定科目カテゴリ十分条件テーブル13dは、分類先カテゴリと、当該分類先カテゴリに含まれる属性カテゴリとを対応付けて記憶する。例えば、勘定科目カテゴリ十分条件テーブル13dは、図6に示すように、分類先カテゴリ「普通預金/未収入金」と、当該分類先カテゴリに含まれる属性カテゴリ「属性カテゴリ名2−2,属性カテゴリ名3−1,・・・」とを対応付けて記憶する。なお、図6は、実施例1に係る勘定科目カテゴリ十分条件テーブル13dの例を示す図である。
勘定科目カテゴリ特徴量データベース13eは、分類先カテゴリごとに、当該分類先カテゴリにおける特徴語と当該特徴語の出現特性値を示す特徴量とを対応付けて記憶する。例えば、勘定科目カテゴリ特徴量データベース13eは、図7に示すように、分類先カテゴリ「交際費/未払金」ごとに、当該分類先カテゴリにおける特徴語「飲食接待」や「交際費」などと、当該特徴語の特徴量「0.2929」や「0.2740」などとを対応付けて記憶する。なお、図7は、実施例1に係る勘定科目カテゴリ特徴量データベース13eの例を示す図である。
属性カテゴリ特徴量データベース13fは、属性カテゴリごとに、当該属性カテゴリにおける特徴語と当該特徴語の出現特性値を示す特徴量とを対応付けて記憶し、属性1カテゴリ特徴量データベース13f−1〜属性nカテゴリ特徴量データベース13f−nを有する。例えば、属性カテゴリ特徴量データベース13fは、図8に示すように、属性カテゴリ「諸口/営業費用仮払」ごとに、当該属性カテゴリにおける特徴語「営業費用仮払」や「従業員仮払金」などと、当該特徴語の出現特性値「0.0978」や「0.0898」などとを対応付けて記憶する。なお、図8は、実施例1に係る属性カテゴリ特徴量データベース13fの例を示す図である。
勘定科目/属性関連度データベース13gは、分類先カテゴリごとに、当該分類先カテゴリに含まれる属性カテゴリと、分類先カテゴリおよび属性カテゴリの関連度とを対応付けて記憶する。例えば、勘定科目/属性関連度データベース13gは、図9に示すように、分類先カテゴリ「普通預金/未収入金」や「未払金/本支店勘定」などごとに、当該分類先カテゴリに含まれる属性カテゴリ「属性カテゴリ名2−2」や「属性カテゴリ名3−1」などと、分類先カテゴリおよび属性カテゴリの関連度「0.8387」や「0.1045」などとを対応付けて記憶する。なお、図9は、実施例1に係る勘定科目/属性関連度データベース13gの例を示す図である。
制御部14は、制御プログラム、各種の処理手順などを規定したプログラムおよび所要データを格納するための内部メモリを有するとともに、特に本発明に密接に関連するものとしては、勘定科目カテゴリ生成部14aと、属性カテゴリ生成部14bと、十分条件判定部14cと、カテゴリ特徴抽出部14dと、分類ルール候補提示部14eとを有し、これらによって種々の処理を実行する。
勘定科目カテゴリ生成部14aは、分類ルールを作成するために必要なパラメタが入力された場合に、当該パラメタに基づいて、分類先カテゴリと識別子とを会計データベース13aから取得して、分類先カテゴリと所属要素とを対応付けて勘定科目カテゴリ所属要素テーブル13bに格納する。
具体的に例を挙げると、勘定科目カテゴリ生成部14aは、入力部11において受け付けた分類ルールを作成するために必要なパラメタである「勘定科目フィールド名:勘定科目」および「識別子フィールド名:識別子」に基づいて、勘定科目フィールドの値である勘定科目名(例えば、「普通預金/未収入金」など)が同じものを同一のカテゴリに所属する要素(例えば、「ID1」や「ID5」など)として抽出する。そして、勘定科目カテゴリ生成部14aは、勘定科目名と、抽出された全ての要素に対応する識別子(例えば、「ID1,ID5,・・・」など)とを対応付けて勘定科目カテゴリ所属要素テーブル13bに格納する。
属性カテゴリ生成部14bは、入力されたパラメタの一つである分析対象属性名に基づいて、当該分析対象属性名に該当する属性カテゴリ名と、当該属性カテゴリ名に属する要素の識別子とを会計データベース13aから取得して、取得された属性カテゴリ名と識別子とを対応付けて属性カテゴリ所属要素テーブル13cに格納する。
上記した例で具体的に例を挙げると、属性カテゴリ生成部14bは、属性カテゴリ所属要素テーブル13cに親テーブル(図5に示した左図参照)を作成し、複数の分析対象の属性フィールド名に合わせて、分析対象の属性名と所属要素表アドレスの対応関係を格納する。そして、属性カテゴリ生成部14bは、入力されたパラメタの一つである分析対象属性フィールド名である「属性フィールド名:属性名1」に基づいて、当該属性フィールドの値である属性名が同じ要素を同一のカテゴリに所属する要素(例えば、「ID37」や「ID91」などの識別子)として抽出する。続いて、属性カテゴリ生成部14bは、抽出された属性カテゴリ「属性カテゴリ名1−1」と当該属性カテゴリに所属する全ての要素に対応する識別子(例えば、「ID37,ID91,・・・」など)とを対応付けて子テーブル(図5に示した右図参照)に格納する。なお、属性カテゴリ生成部14bは、上記した処理を分析対象の属性数分繰り返す。
十分条件判定部14cは、生成された分類先カテゴリに所属する要素の集合と、生成された属性カテゴリに所属する要素の集合とを比較して、分類先カテゴリの部分集合となるような属性カテゴリを全て抽出して勘定科目カテゴリ十分条件テーブル13dに格納する。
上記した例で具体的に例を挙げると、十分条件判定部14cは、勘定科目カテゴリ生成部14aと属性カテゴリ生成部14bとに生成された勘定科目に所属する要素の集合と、属性カテゴリに所属する要素の集合とを比較して、勘定科目カテゴリ「普通預金/未収入金」や「未払金/本支店勘定」などの部分集合(十分条件)となるような属性カテゴリ「属性カテゴリ名2−2,属性カテゴリ名3−1,・・・」や「属性カテゴリ名1−2,属性カテゴリ名1−4,・・・」などを勘定科目カテゴリ所属要素テーブル13bと属性カテゴリ所属要素テーブル13cとに基づいて、全て抽出して勘定科目カテゴリ十分条件テーブル13dに格納する。
ここで、十分条件となる属性カテゴリとは、勘定科目カテゴリの部分集合となる属性カテゴリであり、部分集合となるためには、属性カテゴリの要素が全て勘定科目カテゴリの所属要素になっていればよい。また、部分集合であるか否かの判定についての詳細な例を挙げると、十分条件判定部14cは、勘定科目カテゴリ所属要素テーブル13bから所定の勘定科目名と、当該勘定科目名に対応する所属要素とを読み込んで集合Sとする。そして、十分条件判定部14cは、属性カテゴリの所属要素の集合が集合Sの部分集合になっている場合の属性カテゴリを、勘定科目カテゴリの十分条件とする。続いて、十分条件判定部14cは、属性カテゴリの要素が全て勘定科目カテゴリの所属要素になっているか否かを判定し、所属要素になっている場合に、勘定科目カテゴリ十分条件テーブル13dの対応する場所に格納する。なお、十分条件判定部14cは、上記した処理を全ての属性カテゴリに対して繰り返す。
カテゴリ特徴抽出部14dは、判定されて抽出された分類先カテゴリと、属性カテゴリとのそれぞれに属する要素に含まれる特徴語を抽出して統計的特徴量を算出し、それぞれ勘定科目カテゴリ特徴量データベース13eと属性カテゴリ特徴量データベース13fとに格納して、算出された分類先カテゴリと属性カテゴリとの統計的特徴量に基づいて、分類先カテゴリと属性カテゴリとの関連度を算出して勘定科目/属性関連度データベース13gに格納する。なお、特徴語抽出における特徴量の算出は、公知技術を利用して算出する。
上記した例で具体的に例を挙げると、カテゴリ特徴抽出部14dは、十分条件判定部14cにより判定されて抽出された全ての勘定科目カテゴリ「交際費/未払金」などと、属性カテゴリ「諸口/営業費用仮払」などとに特有の特徴語「飲食接待」や「営業費用仮払」など、および、当該特徴語の出現特徴量「0.2929」や「0.0978」などを抽出する。そして、カテゴリ特徴抽出部14dは、勘定科目カテゴリに対する特徴語および出現特徴量を勘定科目カテゴリ特徴量データベース13eに格納し、属性カテゴリに対する特徴語および出現特徴量を属性カテゴリ特徴量データベース13fに格納する。続いて、カテゴリ特徴抽出部14dは、各カテゴリの特徴ベクトルを生成して勘定科目カテゴリ「普通預金/未収入金」と属性カテゴリ「属性カテゴリ名2−2」や「属性カテゴリ名3−1」などとのベクトルの関連度「0.8387」や「0.1045」などを算出して、勘定科目/属性関連度データベース13gに格納する。
ここで、上記した勘定科目カテゴリと属性カテゴリとの関連度を算出する例について、図10および図11を用いて説明する。なお、図10は、実施例1に係る勘定科目カテゴリと属性カテゴリとの関連度の算出について説明するための図であり、図11は、実施例1に係る勘定科目カテゴリと属性カテゴリとの関連度の例を示す図である。
図10に示すように、カテゴリ特徴抽出部14dは、条件B「勘定科目カテゴリ」の部分集合である条件A「属性カテゴリ」が存在する場合に、条件Aを満たす集合の特徴素と、条件Bを満たす集合の特徴素とを抽出する。そして、カテゴリ特徴抽出部14dは、抽出された特徴素に基づいて特徴ベクトルを生成し、特徴空間における条件Aと条件Bとが成す「θ」を用いて、当該特徴ベクトル同士の類似度を関連度「条件Aと条件Bとの関連度=cosθ」として算出する。この結果、カテゴリ特徴抽出部14dは、図11に示すように、条件B「旅費交通費:従業員仮払金」と、当該条件Bに属する条件A「業務分類」との関連度を全ての属性カテゴリについて算出する。なお、図11においては、関連度cosθの代わりに角度距離θを示している。
分類ルール候補提示部14eは、抽出されて算出された分類先カテゴリと属性カテゴリとのうち、高い関連度を有する組み合わせを上位にして分類ルール候補を出力する。上記した例で具体的に例を挙げると、分類ルール候補提示部14eは、カテゴリ特徴抽出部14dにより抽出されて算出された各勘定科目カテゴリと当該各勘定科目カテゴリの十分条件となる属性カテゴリとの関連度を勘定科目/属性関連度データベース13gから読み込む。そして、分類ルール候補提示部14eは、勘定科目カテゴリの所属要素を集合Sとして、当該勘定科目カテゴリに対応する勘定科目/属性関連度データベース13gから属性カテゴリ名と当該属性カテゴリ名の関連度とを取得する。続いて、分類ルール候補提示部14eは、取得した関連度が高い順に属性カテゴリ名をソートし、当該ソート順に属性カテゴリの所属要素の和集合Xを逐次的に生成する。
ここで、全ての属性カテゴリは、集合Sの部分集合であるために、集合Xは、集合Sの部分集合のまま所属要素数が増加(同一または単調増加)していくことになるので、和集合を更新する毎に、集合Xが集合Sと同一の集合か、または、部分集合かを確認して、集合Sと同一になった時点で和集合の作成を終了して、残りの属性カテゴリをルール作成の候補に利用しなくてもよい。
その後、分類ルール候補提示部14eは、生成された分類ルール候補を図12に示すように、表示部12に出力する。また、ユーザは、表示部12により表示される分類ルールに基づいて、分類ルールを採用したり、分類ルールを修正したりする。また、分類ルール候補提示部14eは、上記した処理を各勘定科目カテゴリに対して繰り返す。なお、図12は、実施例1に係る表示部12により表示される画面の例を示す図である。
[実施例1に係る仕訳条件作成処理]
次に、図13を用いて、実施例1に係る仕訳条件作成装置10による仕訳条件作成処理を説明する。図13は、実施例1に係る仕訳条件作成装置10による仕訳条件作成処理を説明するためのフローチャートである。
図13に示すように、仕訳条件作成装置10は、ユーザによって分類ルールを作成するために必要なパラメタである「勘定科目フィールド名」と「識別子フィールド名」とが入力されると(ステップS101肯定)、勘定科目フィールドの値である勘定科目名「普通預金/未収入金」が同じ要素を同一のカテゴリに所属する要素として抽出して、勘定科目名と、抽出された全ての要素に対応する識別子「ID1,ID5,・・・」とを対応付けて勘定科目カテゴリ所属要素テーブル13bに格納する(ステップS102)。
そして、仕訳条件作成装置10は、入力された分析対象である属性フィールド名に合わせて、分析対象の属性名と所属要素、および、属性フィールド名「属性名1」に基づいて、当該属性名が同じ要素を同一のカテゴリに所属する要素「属性カテゴリ名1−1」として抽出し、抽出された属性カテゴリと当該属性カテゴリに所属する全ての要素に対応する識別子「ID37,ID91,・・・」とを対応付けて属性カテゴリ所属要素テーブル13cに格納する(ステップS103)。
続いて、仕訳条件作成装置10は、勘定科目カテゴリ所属要素テーブル13bと属性カテゴリ所属要素テーブル13cとに格納された勘定科目に所属する要素の集合と、属性カテゴリに所属する要素の集合とを比較して、勘定科目カテゴリ「普通預金/未収入金」の部分集合(十分条件)となるような属性カテゴリ「属性カテゴリ名2−2」などを全て抽出して勘定科目カテゴリ十分条件テーブル13dに格納する(ステップS104)。
その後、仕訳条件作成装置10は、勘定科目カテゴリ「交際費/未払金」と、属性カテゴリ「諸口/営業費用仮払」とに特有の特徴語「飲食接待」や「営業費用仮払」など、および、当該特徴語の出現特徴量「0.2929」や「0.0978」などを算出してそれぞれ勘定科目カテゴリ特徴量データベース13eと、属性カテゴリ特徴量データベース13fとに格納する。そして、仕訳条件作成装置10は、各カテゴリの特徴ベクトルを生成して勘定科目カテゴリ「普通預金/未収入金」と属性カテゴリ「属性カテゴリ名2−2」とのベクトルの関連度「0.8387」を算出して、勘定科目/属性関連度データベース13gに格納する(ステップS105)。
続いて、仕訳条件作成装置10は、関連度を算出された勘定科目カテゴリと属性カテゴリとの組み合わせのうち、高い関連度を有する組み合わせを上位にして分類ルールを作成して表示部12に表示する(ステップS106)。なお、ユーザは、表示部12において表示される分類ルールに基づいて、分類ルールを採用したり、分類ルールを修正したりする。
[実施例1による効果]
このようにして、実施例1によれば、仕訳条件作成装置10は、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することが可能である。つまり、仕訳条件作成装置10は、条件項目と分類カテゴリとから抽出された特徴素の関連度の高いものを優先して分類ルールを作成するので、利用するユーザによって考えられる論理条件に近い分類ルールを作成することができる結果、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することが可能である。
例えば、仕訳条件作成装置10は、勘定科目カテゴリの十分条件となる属性カテゴリを抽出して、抽出された勘定科目カテゴリと属性カテゴリとのそれぞれに属する要素に含まれる特徴語と当該特徴語の特徴量を算出するとともに、勘定科目カテゴリと属性カテゴリとの関連度を算出して、算出された関連度の高い勘定科目カテゴリと属性カテゴリとの組み合わせを上位にした分類ルールを出力する。この結果、仕訳条件作成装置10は、膨大なデータを分類するための分類ルールを作成するのに際して、簡潔で妥当性の高い分類ルールを作成することが可能である。
また、仕訳条件作成装置10は、分類ルールを作成する場合に、分類対象の分類カテゴリが成立するための十分条件を求めているので、分類の誤りを前提とし、十分条件という制限が設けられていない従来技術と比較して、分類の誤りを抑制した分類ルールを生成することが可能である。
また、仕訳条件作成装置10は、上記したように、簡潔で妥当性の高い分類ルールを作成し、分類の誤りを抑制した分類ルールを生成することができる結果、人手作業の工数を削減することが可能である。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも
種々の異なる形態にて実施されてよいものである。そこで、(1)関連度閾値を用いた分類ルール候補の提示、(2)仕訳条件作成装置の構成、(3)プログラムにおいて異なる実施例を説明する。
(1)関連度閾値を用いた分類ルール候補の提示
上記実施例1では、算出された関連度の高い勘定科目カテゴリと属性カテゴリとの組み合わせを上位とした分類ルールを出力する場合を説明したが、本発明はこれに限定されるものではなく、算出された関連度が所定の閾値より高いものを抽出し、抽出された勘定科目カテゴリと属性カテゴリとの組み合わせのうち、関連度の高い組み合わせを上位とした分類ルールを出力することもできる。
この関連度の所定の閾値は、例えば、入力部11においてユーザにより入力され、当該入力された閾値が「0.8」である場合に、「0.8」以上である関連度の組み合わせとして、図9に示した「普通預金/未収入金」および「属性カテゴリ名2−2(関連度:0.8387)」や、「未払金/本支店勘定」および「属性カテゴリ名1−2(関連度:0.9039)、属性カテゴリ名1−4(関連度0.9834)」などの組み合わせを抽出して、さらに、抽出された中で関連度の高い組み合わせを上位とした分類ルールを出力する。この結果、より精度が高くなるとともに、より簡潔で妥当性の高い分類ルールを作成することが可能である。
(2)仕訳条件作成装置の構成
また、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメタを含む情報(例えば、図2に示したような「勘定科目/属性関連度データベース13g」が記憶している項目や数値など)については、特記する場合を除いて任意に変更することができ、図14に示すように、そのデータ構成を変更してもよい。また、上記実施例においては、仕訳条件作成装置による処理に利用されるデータベースとして会計データベースを例にして説明したが、当該データベースは、会計データベースに限られるものではなく、分類先となるカテゴリと分析対象となるカテゴリが保持されているような通常の分類済みデータベースであれば何であってもよい。なお、図14は、実施例2に係る勘定科目/属性関連度データベース13gの例を示す図である。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、例えば、カテゴリ特徴抽出部14dを、勘定科目カテゴリと属性カテゴリとのそれぞれの特徴語を抽出して特徴量を算出するカテゴリ特徴抽出部と、勘定科目カテゴリと属性カテゴリとの関連度を算出するカテゴリ関連度算出部として分散するなど、その全部または一部を、各種の負担や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
(3)プログラム
ところで、上記の実施例では、ハードウェアロジックによって各種の処理を実現する場合を説明したが、本発明はこれに限定されるものではなく、あらかじめ用意されたプログラムをコンピュータで実行することによって実現するようにしてもよい。そこで、以下では、図15を用いて、上記の実施例に示した仕訳条件作成装置と同様の機能を有する仕訳条件作成プログラムを実行するコンピュータの一例を説明する。図15は、仕訳条件作成プログラムを実行するコンピュータを示す図である。
図15に示すように、仕訳条件作成装置としてのコンピュータ110は、HDD130、CPU140、ROM150およびRAM160をバス180などで接続される。
ROM150には、上記の実施例1に示した仕訳条件作成装置10と同様の機能を発揮する仕訳条件作成プログラム、つまり、図15に示すように十分条件算出プログラム150aと、関連度算出プログラム150bと、分類ルール表示プログラム150cとが、あらかじめ記憶されている。なお、これらのプログラム150a〜プログラム150cについては、図2に示した仕訳条件作成装置10の各構成要素と同様、適宜統合または、分散してもよい。
そして、CPU140がこれらのプログラム150a〜プログラム150cをROM150から読み出して実行することで、図15に示すように、プログラム150a〜プログラム150cは、十分条件算出プロセス140aと、関連度算出プロセス140bと、分類ルール表示プロセス140cとして機能するようになる。なお、プロセス140a〜プロセス140cは、図2に示した、勘定科目カテゴリ生成部14aと、属性カテゴリ生成部14bと、十分条件判定部14cと、カテゴリ特徴抽出部14dと、分類ルール候補提示部14eとに対応する。
そして、CPU140はRAM160に記録されたデータに基づいて仕訳条件作成プログラムを実行する。
なお、上記した各プログラム150a〜プログラム150cについては、必ずしも最初からROM150に記憶させておく必要はなく、例えば、コンピュータ110に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」、またはコンピュータ110の内外に備えられるHDDなどの「固定用の物理媒体」、さらには公衆回線、インターネット、LAN、WANなどを介してコンピュータ110に接続される「他のコンピュータ(またはサーバ)」などに各プログラムを記憶させておき、コンピュータ110がこれから各プログラムを読み出して実行するようにしてもよい。
実施例1に係る仕訳条件作成装置の概要および特徴を示す図である。 実施例1に係る仕訳条件作成装置の構成を示す図である。 実施例1に係る会計データベースの例を示す図である。 実施例1に係る勘定科目カテゴリ所属要素テーブルの例を示す図である。 実施例1に係る属性カテゴリ所属要素テーブルの例を示す図である。 実施例1に係る勘定科目カテゴリ十分条件テーブルの例を示す図である。 実施例1に係る勘定科目カテゴリ特徴量データベースの例を示す図である。 実施例1に係る属性カテゴリ特徴量データベースの例を示す図である。 実施例1に係る勘定科目/属性関連度データベースの例を示す図である。 実施例1に係る勘定科目カテゴリと属性カテゴリとの関連度の算出について説明するための図である。 実施例1に係る勘定科目カテゴリと属性カテゴリとの関連度の例を示す図である。 実施例1に係る表示部により表示される画面の例を示す図である。 実施例1に係る仕訳条件作成装置による仕訳条件作成処理を説明するためのフローチャートである。 実施例2に係る勘定科目/属性関連度データベースの例を示す図である。 仕訳条件作成プログラムを実行するコンピュータを示す図である。
符号の説明
10 仕訳条件作成装置
11 入力部
12 表示部
13 記憶部
13a 会計データベース
13b 勘定科目カテゴリ所属要素テーブル
13c 属性カテゴリ所属要素テーブル
13d 勘定科目カテゴリ十分条件テーブル
13e 勘定科目カテゴリ特徴量データベース
13f 属性カテゴリ特徴量データベース
13g 勘定科目/属性関連度データベース
14 制御部
14a 勘定科目カテゴリ生成部
14b 属性カテゴリ生成部
14c 十分条件判定部
14d カテゴリ特徴抽出部
14e 分類ルール候補提示部

Claims (5)

  1. データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成することをコンピュータに実行させる仕訳条件作成プログラムであって、
    前記分類ルールを作成するために必要なパラメタが入力された場合に、当該パラメタにより特定されたフィールドであるカテゴリを分類先カテゴリとし、前記データベースにおいて当該分類先カテゴリのデータが同一の識別子を、前記分類カテゴリのデータそれぞれに対応付けた同一カテゴリデータとして抽出する同一カテゴリ抽出手順と、
    前記入力されたパラメタにより特定されたフィールドである属性値のデータが同一であるレコードの識別子を、前記属性値のデータそれぞれに対応付けた同一属性値データとして、前記データベースから抽出する同一属性値抽出手順と、
    前記同一カテゴリ抽出手順により抽出された同一カテゴリデータと、前記同一属性値抽出手順により抽出された同一属性値データとに基づいて、前記同一カテゴリデータの十分条件となる同一属性値データを全て抽出する十分条件抽出手順と、
    前記十分条件抽出手順により抽出された同一カテゴリデータと同一属性値データとのそれぞれに属するレコードに含まれる特徴語を抽出して統計的特徴量を算出し、算出された前記同一カテゴリデータと同一属性値データとの統計的特徴量に基づいて、前記同一カテゴリデータと同一属性値データとの関連度を算出する関連度算出手順と、
    前記関連度算出手順により算出された同一カテゴリデータと同一属性値データとの組み合わせのうち、高い関連度を有する組み合わせを上位にした分類ルールを作成して所定の表示部に表示する分類ルール表示手順と、
    をコンピュータに実行させることを特徴とする仕訳条件作成プログラム。
  2. 前記分類ルール表示手順は、前記関連度算出手順により算出された同一カテゴリデータと同一属性値データとの組み合わせのうち、前記パラメタにより特定される所定の閾値よりも高い関連度を有する組み合わせのみを取得して、取得された組み合わせのうち、高い関連度を有する組み合わせを上位にした分類ルールを作成して所定の表示部に表示することを特徴とする請求項1に記載の仕訳条件作成プログラム。
  3. 前記分類ルール表示手順は、前記関連度算出手順により算出された同一カテゴリデータと同一属性値データとの組み合わせにおいて、同一属性値データが同一カテゴリデータとの識別子の数が同一になった時点で、高い関連度を有する組み合わせを上位にした分類ルールを作成して所定の表示部に表示することを特徴とする請求項1に記載の仕訳条件作成プログラム。
  4. データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成する仕訳条件作成装置であって、
    前記分類ルールを作成するために必要なパラメタが入力された場合に、当該パラメタにより特定されたフィールドであるカテゴリを分類先カテゴリとし、前記データベースにおいて当該分類先カテゴリのデータが同一の識別子を、前記分類カテゴリのデータそれぞれに対応付けた同一カテゴリデータとして抽出する同一カテゴリ抽出手段と、
    前記入力されたパラメタにより特定されたフィールドである属性値のデータが同一であるレコードの識別子を、前記属性値のデータそれぞれに対応付けた同一属性値データとして、前記データベースから抽出する同一属性値抽出手段と、
    前記同一カテゴリ抽出手段により抽出された同一カテゴリデータと、前記同一属性値抽出手段により抽出された同一属性値データとに基づいて、前記同一カテゴリデータの十分条件となる同一属性値データを全て抽出する十分条件抽出手段と、
    前記十分条件抽出手段により抽出された同一カテゴリデータと、同一属性値データとのそれぞれに属するレコードに含まれる特徴語を抽出して統計的特徴量を算出し、算出された前記同一カテゴリデータと同一属性値データとの統計的特徴量に基づいて、前記同一カテゴリデータと同一属性値データとの関連度を算出する関連度算出手段と、
    前記関連度算出手段により算出された同一カテゴリデータと同一属性値データとの組み合わせのうち、高い関連度を有する組み合わせを上位にした分類ルールを作成して所定の表示部に表示する分類ルール表示手段と、
    を備えたことを特徴とする仕訳条件作成装置。
  5. データを識別するカテゴリと、当該カテゴリが属する属性を示す一つまたは複数の属性値とをそれぞれフィールドとするレコードを複数有し、それぞれのレコードが当該レコードを一意に識別する識別子に対応付けて記憶されるデータベースに対して、前記データベースに記憶される各データを分類する分類ルールを作成する仕訳条件作成装置に適した仕訳条件作成方法であって、
    前記分類ルールを作成するために必要なパラメタが入力された場合に、当該パラメタにより特定されたフィールドであるカテゴリを分類先カテゴリとし、前記データベースにおいて当該分類先カテゴリのデータが同一の識別子を、前記分類カテゴリのデータそれぞれに対応付けた同一カテゴリデータとして抽出する同一カテゴリ抽出工程と、
    前記入力されたパラメタにより特定されたフィールドである属性値のデータが同一であるレコードの識別子を、前記属性値のデータそれぞれに対応付けた同一属性値データとして、前記データベースから抽出する同一属性値抽出工程と、
    前記同一カテゴリ抽出工程により抽出された同一カテゴリデータと、前記同一属性値抽出工程により抽出された同一属性値データとに基づいて、前記同一カテゴリデータの十分条件となる同一属性値データを全て抽出する十分条件抽出工程と、
    前記十分条件抽出工程により抽出された同一カテゴリデータと、同一属性値データとのそれぞれに属するレコードに含まれる特徴語を抽出して統計的特徴量を算出し、算出された前記同一カテゴリデータと同一属性値データとの統計的特徴量に基づいて、前記同一カテゴリデータと同一属性値データとの関連度を算出する関連度算出工程と、
    前記関連度算出工程により算出された同一カテゴリデータと同一属性値データとの組み合わせのうち、高い関連度を有する組み合わせを上位にした分類ルールを作成して所定の表示部に表示する分類ルール表示工程と、
    を含んだことを特徴とする仕訳条件作成方法。
JP2008070075A 2008-03-18 2008-03-18 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法 Withdrawn JP2009223809A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008070075A JP2009223809A (ja) 2008-03-18 2008-03-18 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008070075A JP2009223809A (ja) 2008-03-18 2008-03-18 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法

Publications (1)

Publication Number Publication Date
JP2009223809A true JP2009223809A (ja) 2009-10-01

Family

ID=41240480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008070075A Withdrawn JP2009223809A (ja) 2008-03-18 2008-03-18 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法

Country Status (1)

Country Link
JP (1) JP2009223809A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011040307A1 (ja) 2009-09-29 2011-04-07 三菱化学株式会社 非水系電解液電池及び非水系電解液
JP2016129053A (ja) * 2016-02-26 2016-07-14 Profit Cube 株式会社 金融機関経営支援システム及びプログラム
JP2017016695A (ja) * 2013-03-18 2017-01-19 フリー株式会社 会計処理装置、会計処理方法及び会計処理プログラム
JP2019021118A (ja) * 2017-07-19 2019-02-07 弥生株式会社 仕訳ルール生成装置及びプログラム
WO2021038801A1 (ja) * 2019-08-29 2021-03-04 富士通株式会社 パターン抽出プログラム、装置、及び方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011040307A1 (ja) 2009-09-29 2011-04-07 三菱化学株式会社 非水系電解液電池及び非水系電解液
JP2017016695A (ja) * 2013-03-18 2017-01-19 フリー株式会社 会計処理装置、会計処理方法及び会計処理プログラム
JP2016129053A (ja) * 2016-02-26 2016-07-14 Profit Cube 株式会社 金融機関経営支援システム及びプログラム
JP2019021118A (ja) * 2017-07-19 2019-02-07 弥生株式会社 仕訳ルール生成装置及びプログラム
JP6996892B2 (ja) 2017-07-19 2022-01-17 弥生株式会社 仕訳ルール生成装置及びプログラム
WO2021038801A1 (ja) * 2019-08-29 2021-03-04 富士通株式会社 パターン抽出プログラム、装置、及び方法
JPWO2021038801A1 (ja) * 2019-08-29 2021-03-04
CN114287017A (zh) * 2019-08-29 2022-04-05 富士通株式会社 模式提取程序、装置以及方法
JP7168095B2 (ja) 2019-08-29 2022-11-09 富士通株式会社 パターン抽出プログラム、装置、及び方法

Similar Documents

Publication Publication Date Title
US9898526B2 (en) Computer-implemented system and method for inclusion-based electronically stored information item cluster visual representation
US9489446B2 (en) Computer-implemented system and method for generating a training set for use during document review
US7444325B2 (en) Method and system for information extraction
US20150032708A1 (en) Database analysis apparatus and method
KR101048540B1 (ko) 연관 키워드에 따른 클러스터를 이용하여 검색 키워드를 분류하는 장치 및 방법
CN108875072A (zh) 文本分类方法、装置、设备以及存储介质
JP2019503541A (ja) 電子データ構造から属性を抽出するための注釈システム
JP2009223809A (ja) 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法
WO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
CN111190880A (zh) 一种数据库检测方法、装置和计算机可读存储介质
KR102358357B1 (ko) 시장규모추정장치 및 그 동작 방법
CN113836434B (zh) 一种基于数据库的web页面数据处理方法
CN115795036A (zh) 一种实时对长文本去重聚类的方法
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
Aher et al. A comparative study for selecting the best unsupervised learning algorithm in e-learning system
CN111930824A (zh) 一种基于推荐模型的数据综合态势展现方法
JP4128033B2 (ja) プロファイルデータ検索装置及びプログラム
WO2018003115A1 (ja) 分析支援装置、分析支援方法、および分析支援プログラム
CN109492214B (zh) 属性词识别及其层次构建方法、装置、设备及存储介质
KR20210023453A (ko) 리뷰 광고 매칭 장치 및 방법
JP2016035688A (ja) テキスト分析装置、テキスト分析方法、テキスト分析プログラムおよび記録媒体
Žárský et al. Explainability of Text Clustering Visualizations—Twitter Disinformation Case Study
CN117453805B (zh) 一种不确定性数据的可视化分析方法
CN106303719A (zh) 一种按顺序推荐视频的方法及装置
Röder et al. 9 DICE, Paderborn University, Paderborn, Germany michael. roeder@ uni-paderborn. de

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110607