JP2015088067A - マイニング分析装置、方法及びプログラム - Google Patents

マイニング分析装置、方法及びプログラム Download PDF

Info

Publication number
JP2015088067A
JP2015088067A JP2013227685A JP2013227685A JP2015088067A JP 2015088067 A JP2015088067 A JP 2015088067A JP 2013227685 A JP2013227685 A JP 2013227685A JP 2013227685 A JP2013227685 A JP 2013227685A JP 2015088067 A JP2015088067 A JP 2015088067A
Authority
JP
Japan
Prior art keywords
mining
analysis
term
dictionary
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013227685A
Other languages
English (en)
Other versions
JP6407516B2 (ja
Inventor
俊樹 遠藤
Toshiki Endo
俊樹 遠藤
昭 木村
Akira Kimura
昭 木村
康 安部
Yasushi Abe
康 安部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013227685A priority Critical patent/JP6407516B2/ja
Publication of JP2015088067A publication Critical patent/JP2015088067A/ja
Application granted granted Critical
Publication of JP6407516B2 publication Critical patent/JP6407516B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果を効率よく、かつ、迅速に作成するマイニング分析装置、方法及びプログラムを提供すること。【解決手段】マイニング分析装置10は、テキストデータを取得し、取得したテキストデータをマイニング分析し、マイニング分析した結果であるマイニング結果をマイニング結果記憶部41に記憶させ、マイニング分析されるテキストデータに用いられる用語と、その用語に関連する語句とを対応付けて記憶する用語対応辞書DB31に基づいて、マイニング結果において抽出された単語について、互いに対応するか否かを判断し、互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合する。【選択図】図1

Description

本発明は、マイニング分析装置、方法及びプログラムに関する。
従来より、文章を自然言語処理によって解析処理し、文章の傾向や特徴を分析するテキストマイニングが知られている。このテキストマイニングの技術は、膨大に蓄積された文書情報から有益な情報を抽出し、抽出された情報は、マーケティング等に有効活用されている。
このようなテキストマイニングの技術を開示する特許文献1が知られている。特許文献1のテキストマイニング装置は、複数のソースから取得した関連する2つ以上の文章データのそれぞれから言語の要素を抽出し、抽出した要素を文書データ間で対比し、各要素に対して同一、類似、同義、類義のいずれかの関係にある要素同士を対応付け、対応付けにおいて対応する対の要素を持たなかった要素を差分要素として抽出し、関連ある複数の文書データ間の差異に関する解析を行う。
国際公開第2009/113457号
しかしながら、特許文献1に開示された技術では、適切な解析を行うために、マイニング分析前のテキストデータに対して辞書を用いて用語の補正処理を行い、用語の統一を図ったテキストデータに対してマイニング分析を行う。このような用語の統一をその都度図ってマイニング分析を行うと、処理に時間を要してしまう。
また、マイニング分析の結果を時系列的に分析する際には、用語の整合性をとるために、過去にマイニング分析済みのテキストデータについても、再度マイニング分析する必要があり、その処理に多大な時間を要してしまう。
さらに、辞書を更新して、マイニング結果を試しに得たい場合であっても、長い遅延時間が発生してしまう。
そこで、テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果を効率よく、かつ、迅速に作成する装置が求められている。
本発明は、テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果を効率よく、かつ、迅速に作成するマイニング分析装置、方法及びプログラムを提供することを目的とする。
本願発明は、マイニング分析の結果を閲覧中に、用語対応辞書に同義語を新規に仮登録すると、リアルタイムにマイニング分析の結果を補正し、即座に暫定的な分析結果を出力し、ユーザが表記ゆれ補正の効果を確認することを可能にする。
また、本願発明は、同結果を確認して、仮登録した同義語を本登録すると、バックグラウンドで過去に遡り入力データの表記ゆれの補正処理を行い、マイニング分析を行うことで、最終的に正確なマイニング分析の結果を出力することができる。
なお、バックグラウンドのマイニング処理は、予めスケジューリングされているマイニング処理の合間に行う。
具体的には、以下のような解決手段を提供する。
(1) テキストデータを取得するテキスト取得手段と、前記テキスト取得手段によって取得されたテキストデータをマイニング分析するマイニング分析手段と、前記マイニング分析手段によってマイニング分析された結果であるマイニング結果をマイニング結果記憶手段に記憶させるマイニング結果記憶制御手段と、前記マイニング分析手段によってマイニング分析されるテキストデータに用いられる用語と、その用語に関連する語句とを対応付けて記憶する用語対応辞書と、前記マイニング結果において抽出された単語について、互いに対応するか否かを前記用語対応辞書に基づいて判断する用語判断手段と、前記用語判断手段によって互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合するマイニング結果統合手段と、を備えるマイニング分析装置。
(1)の構成によれば、(1)に係るマイニング分析装置は、テキストデータを取得し、取得したテキストデータをマイニング分析し、マイニング分析した結果であるマイニング結果をマイニング結果記憶手段に記憶させ、マイニング分析されるテキストデータに用いられる用語と、その用語に関連する語句とを対応付けて記憶する用語対応辞書に基づいて、マイニング結果において抽出された単語について、互いに対応するか否かを判断し、互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合する。
すなわち、(1)に係るマイニング分析装置は、マイニング結果において抽出された単語について、用語対応辞書に基づいて互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合する。
したがって、(1)に係るマイニング分析装置は、テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果を効率よく、かつ、迅速に作成することができる。
(2) 前記用語対応辞書を作成するための入力を受け付ける辞書入力受付手段と、前記辞書入力受付手段によって受け付けられた入力に基づいて、前記用語対応辞書を作成する辞書作成手段と、前記辞書作成手段によって前記用語対応辞書が作成されると、作成された前記用語対応辞書に基づいて、前記マイニング結果統合手段による前記マイニング結果の統合を行うように制御するマイニング結果統合制御手段と、をさらに備える(1)に記載のマイニング分析装置。
すなわち、(2)に係るマイニング分析装置は、用語対応辞書が作成されると、作成された用語対応辞書に基づいて、マイニング結果の統合を行うように制御する。
したがって、(2)に係るマイニング分析装置は、テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果をさらに効率よく、かつ、迅速に作成することができる。
(3) 前記辞書作成手段によって作成された前記用語対応辞書に基づいて、前記テキストデータを補正するテキスト補正手段と、前記テキスト補正手段によって補正されたテキストデータを、前記マイニング分析手段によってマイニング分析するように制御するマイニング分析制御手段と、をさらに備える(2)に記載のマイニング分析装置。
すなわち、(3)に係るマイニング分析装置は、作成された用語対応辞書に基づいて、テキストデータを補正し、補正されたテキストデータを、マイニング分析する。
したがって、(3)に係るマイニング分析装置は、統合的なマイニング結果を効率よく作成することができる。
(4) 前記用語対応辞書が作成されるごとに、作成された内容を表わす版情報を記憶する用語対応管理テーブルをさらに備え、前記辞書作成手段は、前記用語対応辞書を作成すると、作成した前記用語対応辞書に対応した前記版情報を前記用語対応管理テーブルに記憶させ、前記マイニング分析制御手段は、前記用語対応管理テーブルに記憶されている前記版情報に対応する前記用語対応辞書に基づいて、前記テキストデータが補正され、補正された前記テキストデータがマイニング分析されるように制御する、(3)に記載のマイニング分析装置。
すなわち、(4)に係るマイニング分析装置は、版情報に対応する用語対応辞書に基づいて、テキストデータを補正し、補正したテキストデータをマイニング分析する。
したがって、(4)に係るマイニング分析装置は、統合的なマイニング結果をさらに効率よく作成することができる。
(5) 前記用語対応辞書の版情報と、前記テキストデータとを対応付けて記憶するテキスト管理テーブルをさらに備え、前記テキスト補正手段は、前記用語対応管理テーブルに基づいて、前記テキストデータを補正し、補正した前記テキストデータと前記用語対応辞書の版情報とを対応付けて前記テキスト管理テーブルに記憶させる、(4)に記載のマイニング分析装置。
したがって、(5)に係るマイニング分析装置は、統合的なマイニング結果をさらに効率よく作成することができる。
(6) 前記マイニング分析手段によってマイニング分析される時間を記憶するマイニング管理テーブルと、マイニング分析する予定を設定するマイニング分析スケジュール手段と、をさらに備え、前記マイニング分析手段は、マイニング分析ごとにマイニング分析した時間を前記マイニング管理テーブルに記憶させ、前記マイニング分析スケジュール手段は、前記マイニング管理テーブルに基づいて、前記マイニング分析手段によるマイニング分析の予定を設定する、(3)から(5)のいずれかに記載のマイニング分析装置。
したがって、(6)に係るマイニング分析装置は、統合的なマイニング結果をさらに効率よく、かつ、迅速に作成することができる。
(7) 前記用語対応辞書は、用語を具体的な対応語に対応付けるための条件を、対応語に対応付けてさらに記憶する、(2)から(6)のいずれかに記載のマイニング分析装置。
したがって、(7)に係るマイニング分析装置は、統合的なマイニング結果をさらに効率よく作成することができる。
(8) (1)に記載のマイニング分析装置が実行する方法であって、前記テキスト取得手段が、テキストデータを取得するテキスト取得ステップと、前記マイニング分析手段が、前記テキスト取得ステップによって取得されたテキストデータをマイニング分析するマイニング分析ステップと、前記マイニング結果記憶制御手段が、前記マイニング分析ステップによってマイニング分析された結果であるマイニング結果をマイニング結果記憶手段に記憶させるマイニング結果記憶制御ステップと、前記用語判断手段が、前記マイニング結果において抽出された単語について、互いに対応するか否かを前記用語対応辞書に基づいて判断する用語判断ステップと、前記マイニング結果統合手段が、前記用語判断ステップによって互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合するマイニング結果統合ステップと、を備える方法。
したがって、(8)に係る方法は、テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果を効率よく、かつ、迅速に作成することができる。
(9) コンピュータに、(8)に記載の方法の各ステップを実行させるためのプログラム。
したがって、(9)に係るプログラムは、コンピュータに、テキストデータについてのマイニング分析の結果に基づいて、統合的なマイニング結果を効率よく、かつ、迅速に作成するように、実行させることができる。
本発明によれば、マイニング分析装置は、用語の表記ゆれ情報が新規に登録された場合に、新規に登録された表記ゆれ情報に基づいて補正した暫定のマイニング分析結果を表示することで、おおよその分析結果を即座に提示することができる。
本発明の一実施形態に係るマイニング分析装置の構成を示す図である。 本発明の一実施形態に係るマイニング分析装置が備える用語対応辞書の例を示す図である。 本発明の一実施形態に係るマイニング分析装置が備える用語対応管理テーブルの例を示す図である。 本発明の一実施形態に係るマイニング分析装置が備えるテキスト管理テーブルの例を示す図である。 本発明の一実施形態に係るマイニング分析装置が備えるマイニング管理テーブルの例を示す図である。 本発明の一実施形態に係るマイニング分析装置が、関連語情報を含むマイニング結果を統合する例を示す図である。 本発明の一実施形態に係るマイニング分析装置が、ネガポジ判定情報を含むマイニング結果を統合する例を示す図である。 本発明の一実施形態に係るマイニング分析装置のマイニング分析処理を示すフローチャートである。 本発明の一実施形態に係るマイニング分析装置のマイニング結果統合処理を示すフローチャートである。 本発明の一実施形態に係るマイニング分析装置のテキストデータの補正処理とマイニング分析処理とを示すフローチャートである。 本発明の一実施形態に係るマイニング分析装置のマイニング分析スケジューリング処理を示すフローチャートである。 本発明の一実施形態に係るマイニング分析装置のマイニング分析スケジューリングを説明する図である。
以下、本発明の実施形態について、図を参照しながら説明する。図1は、本発明の一実施形態に係るマイニング分析装置10の構成を示す図である。
マイニング分析装置10が、テキスト取得手段11と、マイニング分析手段12と、用語対応辞書DB31と、マイニング結果記憶制御手段13と、用語判断手段14と、マイニング結果統合手段15と、を備える場合について、手段ごとに詳述する。
テキスト取得手段11は、テキストデータを取得する。具体的には、テキスト取得手段11は、キーボード等からテキスト入力されたテキストデータ、音声入力された音声データをテキストデータに変換した音声テキスト、ネットワークから取得した(例えば、インターネットをクローリングすることによって得られた)ネットワークテキストを取得する。
マイニング分析手段12は、テキスト取得手段11によって取得されたテキストデータをマイニング分析する。具体的には、マイニング分析手段12は、テキストデータについて、形態素解析と構文解析との自然言語処理を行い、例えば、急増、急減キーワードを抽出したり、トピック分類をしたり、ネガポジ判定等のマイニング分析を行う。
マイニング結果記憶制御手段13は、マイニング分析手段12によってマイニング分析された結果であるマイニング結果をマイニング結果記憶部41に記憶させる。
用語対応辞書DB31は、マイニング分析手段12によってマイニング分析されるテキストデータに用いられる用語と、その用語に関連する語句とを対応付けて記憶するデータベースである。具体的には、用語対応辞書DB31は、ある特定の用語とその同義語である対応語の組み合わせをリスト化したものである。
用語は、単語やフレーズを含む。その用語に関連する語句は、その用語と同義語の単語やフレーズを含む。後述する図2のように、例として、用語対応辞書DB31には、「バッテリー」、「バッテリー電池」、「電源」が用語として記憶されている。この場合、用語に対応付けて、「電池」が対応語として記憶されている。
用語対応辞書DB31は、予め手作業で用語と対応語とを対応付けて記憶させてもよい。
用語判断手段14は、マイニング結果において抽出された単語について、互いに対応するか否かを用語対応辞書に基づいて判断する。具体的には、用語判断手段14は、マイニング分析によって抽出された単語(例えば、バッテリー)と、抽出された単語に関連して抽出された単語(例えば、電源)とが対応するか否かを、用語対応辞書DB31に基づいて判断する。すなわち、用語判断手段14は、抽出された単語について、用語対応辞書DB31を検索して、用語と対応語とに対応するか否かを判断する。
マイニング結果統合手段15は、用語判断手段14によって互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合する。
例えば、後述する図6で示すように、マイニング結果において単語「A」及び抽出された関連語「β」の出現頻度が82であり、単語「A」及び抽出された関連語「ββ」の出現頻度が35である場合であって、用語対応辞書DB31において「β」と「ββ」とが対応語として対応付けられている場合、マイニング結果統合手段15は、単語「A」について、出現頻度が117(82+35)として統合し、統合的なマイニング結果とする。
マイニング結果統合手段15は、統合したマイニング結果を統合結果記憶部42に記憶する。
次に、マイニング分析装置10が、辞書入力受付手段16と、辞書作成手段17と、マイニング結果統合制御手段18とをさらに備える場合について、詳述する。
辞書入力受付手段16は、用語対応辞書を作成するための入力を受け付ける。具体的には、辞書入力受付手段16は、用語に対応する対応語を受け付けて、対応語を追加したり、新たな用語及び対応語を受け付けて、用語及び対応語を追加する。辞書入力受付手段16は、用語や対応語の削除を受け付けることもできる。
なお、辞書入力受付手段16は、表示されたマイニング結果上でのマウス操作等により、用語及び対応語の追加や削除を受け付けるとしてもよい。
辞書作成手段17は、辞書入力受付手段16によって受け付けられた入力、例えば、用語及び対応語の追加や削除に基づいて、用語対応辞書を作成する。
すなわち、辞書作成手段17は、受け付けられた入力に基づいて、新たな用語対応辞書DB31を作成したり、既存の用語対応辞書DB31を更新したりする。
マイニング結果統合制御手段18は、辞書作成手段17によって用語対応辞書が作成されると、作成された用語対応辞書に基づいて、マイニング結果統合手段15によるマイニング結果の統合を行うように制御する。具体的には、マイニング結果統合制御手段18は、既にマイニング分析された記憶されているマイニング結果に対し、新たに作成された用語対応辞書に基づいて、マイニング結果統合手段15によるマイニング結果の統合を行うように、用語判断手段14及びマイニング結果統合手段15の処理を制御する。
次に、マイニング分析装置10が、テキスト補正手段19と、マイニング分析制御手段20とをさらに備える場合について、詳述する。
テキスト補正手段19は、辞書作成手段17によって作成された用語対応辞書に基づいて、テキストデータを補正(例えば、表記ゆれ補正)する。具体的には、テキスト補正手段19は、用語対応辞書に対応付けられた用語と対応語とに基づいて、テキストデータに用いられている用語を対応語に置き換える。
テキスト補正手段19は、テキストデータを補正するための用語対応辞書を、ユーザによって指定されるとしてもよい。
さらに、テキスト補正手段19は、後述する用語対応管理テーブル32に記憶されている版番号による版情報に対応する用語対応辞書、例えば、ユーザによって指定された版情報に対応する用語対応辞書、に基づいてテキストデータを補正するとしてもよい。
マイニング分析制御手段20は、テキスト補正手段19によって補正されたテキストデータを、マイニング分析手段12によってマイニング分析するように制御する。具体的には、マイニング分析制御手段20は、テキスト補正手段19によって補正されたテキストデータ、例えば、後述するようにテキスト管理テーブル43に記憶されているテキストデータを、マイニング分析手段12によってマイニング分析するように制御する。
次に、マイニング分析装置10が、用語対応管理テーブル32をさらに備える場合について詳述する。
用語対応管理テーブル32は、用語対応辞書が作成されるごとに、作成された内容を表わす版情報を記憶する。具体的には、用語対応管理テーブル32は、後述する図3で示すように、用語対応辞書DB31において更新されることによって識別する必要がある用語の範囲(ペア情報)と、登録状態と、登録日情報とを含む版情報に、版番号を付して記憶する。
用語の範囲(ペア情報)は、例えば、用語と対応語との対を示す番号によって示される範囲であってよい。登録状態は、用語対応辞書DB31に記憶された用語の登録状態を示す情報である。登録日は、版情報を用語対応管理テーブル32に記憶させた時刻を表わす。
例えば、テキスト補正手段19は、用語対応管理テーブル32を参照し、登録日が最新の用語と対応語とのペア情報を取得して、テキストデータの用語の補正処理を行うとしてもよい。
テキスト補正手段19は、登録状態が「本登録」であることを示している場合のみ、版情報のペア情報を取得し、取得したペア情報に基づいて取得した用語対応辞書DB31の用語及び対応語(例えば、ペア情報が1〜3の場合、用語対応辞書DB31の番号1〜3の用語及び対応語)によって、テキストデータの用語の補正処理を行う。テキスト補正手段19は、登録状態が「仮登録」であることを示している場合、テキストデータの用語の補正処理を行わない。
マイニング結果統合制御手段18は、マイニング結果の表示について期間の条件を入力されて要求された場合に、用語対応管理テーブル32の登録日であって入力された期間内の登録日、に対応する版情報に基づいて、マイニング結果統合手段15によるマイニング結果の統合を行うように制御する。
辞書作成手段17は、用語対応辞書を作成すると、作成した用語対応辞書に対応した版情報を用語対応管理テーブル32に記憶させる。辞書作成手段17は、版情報の補正を受け付けてもよい。
マイニング分析制御手段20は、用語対応管理テーブル32に記憶されている版情報に対応する用語対応辞書に基づいて、テキストデータが補正(例えば、表記ゆれ補正)され、補正されたテキストデータがマイニング分析されるように制御する。
次に、マイニング分析装置10が、テキスト管理テーブル43をさらに備える場合について詳述する。
テキスト管理テーブル43は、用語対応辞書の版情報と、テキストデータとを対応付けて記憶する。テキスト管理テーブル43の例は、後述される図4において示されるように、テキスト管理テーブル43は、テキストデータと、そのテキストデータを補正した場合に、適用した用語対応辞書DB31についての情報を示す適用規則版情報とを対応付けて記憶する。
テキスト補正手段19は、用語対応管理テーブル32に基づいて、テキストデータを補正し、補正したテキストデータと用語対応辞書の版情報とを対応付けてテキスト管理テーブル43に記憶させる。すなわち、テキスト管理テーブル43に記憶されているテキストデータは、対応付けて記憶された版情報に基づいて補正されている。
次に、マイニング分析装置10が、マイニング管理テーブル44と、マイニング分析スケジュール手段21とをさらに備える場合について詳述する。
マイニング管理テーブル44は、マイニング分析手段12によってマイニング分析される時間を記憶する。マイニング管理テーブル44の例は、後述される図5において示されるように、マイニング管理テーブル44は、テキストデータをマイニング分析したときのログ情報を記憶する。
マイニング分析手段12は、マイニング分析ごとにマイニング分析した時間をマイニング管理テーブル44に記憶させる。具体的には、マイニング分析手段12は、マイニング分析するごとに、マイニング分析に関する情報、例えば、処理時刻、版情報、処理時間等に、マイニングIDを対応付けてマイニング管理テーブル44に記憶させる。
マイニング分析スケジュール手段21は、マイニング管理テーブル44に基づいて、マイニング分析手段12によるマイニング分析の予定を設定する。具体的には、マイニング分析スケジュール手段21は、マイニング管理テーブル44から過去のマイニング分析処理に掛かった時間を算出し、テキストデータのマイニング分析処理を実行する予約時刻を設定する。
マイニング分析装置10は、マイニング結果表示手段22をさらに備える。マイニング結果表示手段22は、マイニング結果の表示の要求に基づいて、マイニング結果記憶部41に記憶されたマイニング結果や、統合結果記憶部42に記憶されたマイニング結果をディスプレイに表示する。
図2は、本発明の一実施形態に係るマイニング分析装置10が備える用語対応辞書DB31の例を示す図である。
図2(a)は、用語対応辞書DB31が、用語に対応語を対応付けている例である。
図2(a)が示すように、用語対応辞書DB31は、「電池」という用語に対し、「バッテリー」や、表記ゆれの表現である「バッテリー電池」、上位概念である「電源」という対応語を記憶している。また、例えば、話し言葉における「壊れた」という用語に対し、同義語の書き言葉である「破損」という対応語を、記憶している。
図2(b)は、用語対応辞書DB31が、用語に、対応語と、条件1と、条件2と、登録ユーザとを対応付けている例である。
図2(b)が示すように、用語対応辞書DB31は、同じ文章に含まれるキーワードを条件用語として記憶してもよい。これにより、用語対応辞書DB31は、同じ用語であっても異なる対応語を記憶することができる。例えば、テキストデータにキーワードとして「最新機種」という用語が用いられている場合、テキストデータに「N社」という会社名が含まれる場合、「最新機種」は条件1に対応付けられた「機種N」及び「機種M」に対応し、「A社」という別の会社名が含まれている場合、「最新機種」は条件1に対応付けられた「機種A」に対応するように、記憶する。このような記憶をすることにより、マイニング分析装置10は、テキストデータに用いられている曖昧な用語を正確な用語に対応させて補正することにより、正確にマイニング分析することができる。
この条件用語は、マイニング結果の統合結果の中から、急増・急減したキーワードとしてユーザによって確認され、キーワードの関連用語として選択されることにより、用語対応辞書DB31に記憶されるとしてもよい。
さらに、用語対応辞書DB31は、用語の使われている期日を条件として記憶するとしてもよい。例えば、「最新機種」という用語は「N社」という会社名が含まれた場合、条件2で指定されている期日によって、「最新機種」を「機種M」と、「機種N」との異なる機種に対応付けることが可能となる。
また、用語対応辞書DB31は、その他の付随情報として「登録ユーザ」を記憶してもよい。登録ユーザは、ペア単語を登録したユーザ(又はその所属チーム等)を表わし、そのペア情報を反映する対象ユーザを規定できる。例えば、用語対応辞書DB31は、ユーザ2にとっての「最新機種」を「機種B」に、ユーザ3にとっての「最新機種」を「機種C」に対応付けることができる。
図3は、本発明の一実施形態に係るマイニング分析装置が備える用語対応管理テーブル32の例を示す図である。用語対応管理テーブル32は、用語対応辞書DB31で記憶されている用語と対応語とのペア情報と、登録状態と、登録日情報とを含む版情報に、版番号を付して記憶する。ペア情報、登録状態、及び登録日情報は、上述のように利用される。
用語対応管理テーブル32は、直接テキストで入力されてもよく、表示するマイニング分析結果上でのマウス操作等により、追加や編集されてもよい。
図4は、本発明の一実施形態に係るマイニング分析装置が備えるテキスト管理テーブル43の例を示す図である。
テキスト管理テーブル43は、マイニング分析の対象であるテキストデータの補正情報を記憶する。テキスト管理テーブル43は、補正処理済みのテキストIDに対応付けて、オリジナルのテキストIDと、適用した用語対応規則の版情報(適用規則版情報)と、更新日時と、オリジナルテキストの登録日時情報と、サイズとを記憶する。テキストID、及びオリジナルテキストIDは、テキストの識別子である。適用規則版情報は、用語対応管理テーブル32に記憶されている版情報を示す。更新日時は、テキストデータが補正されて更新された日時を表わし、オリジナルテキストの登録日時情報は、補正される前の最初のテキストデータが登録された日時を表わし、サイズは、テキストIDで示されるテキストデータの容量を表わしている。なお、オリジナルテキストは、入力されたテキストを保存するテキストデータベース(図示せず)に、テキストIDと共に保存されている。
図5は、本発明の一実施形態に係るマイニング分析装置が備えるマイニング管理テーブル44の例を示す図である。マイニング管理テーブル44は、マイニング分析処理のログ情報として、マイニングID、処理時刻、処理モード、処理対象時間、適用規則版情報、処理時間を記憶する。
マイニングIDは、マイニング分析結果の識別子であり、処理時刻は、マイニング分析の処理を完了した時刻である。
処理モードは、時間分析、日次分析、週次処理、月次処理等、テキストデータをマイニング分析する期間を表わし、それぞれ、時間ごと、日ごと、週ごと、月ごとにマイニング分析することに対応する。
処理対象時間は、マイニング分析で扱うデータの時間帯を表わす。処理モードが時間分析では、「2013−08−27 13h」等と時間帯を指定し、日次分析では、「2013−08−27」のように日を指定し、週次分析では「2013−08−26」のように分析対象の週の開始日を指定し、月次分析では「2013−08」のように月を指定する。
適用規則版情報は、用語対応管理テーブル32にある版情報を示す。
処理時間は、マイニング分析にかかった処理時間である。
図6は、本発明の一実施形態に係るマイニング分析装置10が、関連語情報を含むマイニング結果を統合する例を示す図である。
マイニング分析装置10は、関連情報を含むマイニング結果を、(1)及び(2)のように統合する。
(1)各マイニング結果において、抽出した単語と抽出した関連語とが対応語である(用語対応辞書DB31に対応語として登録されている)場合には、各マイニング結果から削除する。
(2)各マイニング結果において、抽出した単語が同じで、関連語同士が対応語である場合、又は関連語が同じで抽出した単語同士が対応語である場合に、抽出した単語のマイニング結果(例えば、頻度情報)を加算する(対応語を同じ用語に置換し、マイニング結果を統合する)。なお、マイニング結果同士を比較して、抽出した単語が同じで、関連語が同じである場合、時刻情報が同一のもの(時刻情報の差が所定の時間範囲内のものを同一のものとしてよい)に対して、頻度情報を加算するとしてもよい。
図6の例は、「A」と「α」、「B」と「BB」、及び「β」と「ββ」がそれぞれ対応語である場合に、頻度情報を加算して統合する例である。図6の例において、抽出単語「A」及び関連語「α」のマイニング結果と、抽出単語「B」及び関連語「β」のマイニング結果とは、(1)の対応語の条件により統合されない。
なお、(1)及び(2)のいずれでもない(例えば、抽出した単語がユニークで対応語がない)場合、マイニング結果を統合結果記憶部42にマージして記憶する。
図7は、本発明の一実施形態に係るマイニング分析装置10が、ネガポジ判定情報を含むマイニング結果を統合する例を示す図である。
マイニング分析装置10は、ネガポジ判定情報を含むマイニング結果を、(1)及び(2)のように統合する。
(1)各マイニング結果において、抽出した単語同士が対応語であり(用語対応辞書DB31に用語と、対応語として登録されている)、時刻情報が同一のもの(時刻情報の差が所定の時間範囲内のものを同一のものとしてよい)である場合には、各マイニング結果を統合する。
(2)(1)の場合において、各マイニング結果において抽出した単語同士のマイニング結果(ネガティブ頻度、ポジティブ頻度、頻度総数)を加算する(すなわち、対応語を同じ用語に置換し、マイニング結果を統合する)。
マイニング分析装置10は、対応しないと判断した単語についてのマイニング結果を、統合結果記憶部42にマージして記憶する。
統合する方法は、ネガティブ頻度、ポジティブ頻度、又は頻度総数のそれぞれについて、(a)加算する、(b)平均する、又は(c)重み付け加算する、としてもよい。
図7の例は、「A」と「AA」、「B」と「BB」がそれぞれ対応語であり、(a)加算して、統合する例である。
図8は、本発明の一実施形態に係るマイニング分析装置10のマイニング分析処理を示すフローチャートである。マイニング分析装置10は、コンピュータ及びその周辺装置が備えるハードウェア並びに該ハードウェアを制御するソフトウェアによって構成され、以下の処理は、制御部(例えば、CPU)が所定のソフトウェアに従い実行する処理である。
ステップS101において、CPU(テキスト取得手段11)は、テキストデータを取得する。より具体的には、CPUは、入力されたテキストデータや、インターネットをクローリングすることによって得られたテキストデータ等を取得する。
ステップS102において、CPU(マイニング分析手段12)は、取得したテキストデータをマイニング分析する。より具体的には、CPUは、ステップS101において入力したテキストデータについて、形態素解析と構文解析との自然言語処理を行い、マイニング分析する。
ステップS103において、CPU(マイニング結果記憶制御手段13)は、マイニング結果を格納する。より具体的には、CPUは、マイニング分析したマイニング結果をマイニング結果記憶部41に格納する。
図9は、本発明の一実施形態に係るマイニング分析装置10のマイニング結果統合処理を示すフローチャートである。マイニング分析装置10は、ステップS103において格納したマイニング結果について処理する。本処理は、用語対応辞書DB31又は用語対応管理テーブル32の更新や、マイニング結果がマイニング結果記憶部41に格納されることにより起動される。
ステップS201において、CPUは、統合する対象のマイニング結果の指定を受け付ける。より具体的には、CPUは、テキストデータの識別情報を受け付ける。
ステップS202において、CPU(用語判断手段14、マイニング結果統合手段15)は、用語対応辞書DB31に基づいてマイニング結果を統合する。より具体的には、CPUは、ステップS201で指定されたマイニング結果について、用語判断手段14によって対応すると判断された単語についてのそれぞれのマイニング結果について、例えば、頻度を加算して統合し、統合結果記憶部42に記憶する。
ステップS203において、CPUは、統合結果を出力する。より具体的には、CPUは、ステップS204で統合結果記憶部42に記憶した統合結果を表示装置に表示する。
ステップS204において、CPU(マイニング結果統合制御手段18)は、用語対応辞書DB31の更新を受け付ける。より具体的には、CPUは、ステップS203で表示された統合結果に対応する用語対応辞書DB31又は用語対応管理テーブル32の更新を受け付ける。
ステップS205において、CPU(マイニング結果統合制御手段18)は、用語対応辞書DB31が更新されたか否かを判断する。この判断がYESの場合、CPUは処理をステップS202に移し、この判断がNOの場合、CPUは処理を終了する。
図10は、本発明の一実施形態に係るマイニング分析装置10のテキストデータの補正処理とマイニング分析処理とを示すフローチャートである。本処理は、用語対応辞書DB31又は用語対応管理テーブル32の更新により起動される。
ステップS301において、CPU(テキスト補正手段19)は、用語対応管理テーブル32における登録状態が本登録であるか否かを判断する。この判断がYESの場合、CPUは処理をステップS302に移し、この判断がNOの場合、CPUは処理を終了する。
ステップS302において、CPU(テキスト補正手段19)は、用語対応辞書DB31に基づいてテキストデータを補正する。より具体的には、CPUは、用語対応管理テーブル32の登録状態が本登録に対応するペア情報に基づいてテキストデータを補正する。
ステップS303において、CPU(マイニング分析手段12)は、補正されたテキストデータをマイニング分析する。
ステップS304において、CPU(マイニング結果記憶制御手段13)は、マイニング結果を格納する。
図11は、本発明の一実施形態に係るマイニング分析装置のマイニング分析スケジューリング処理を示すフローチャートである。本処理は、テキストデータの補正により起動される。
ステップS401において、CPU(マイニング分析スケジューリング手段)は、マイニング分析のスケジュールにおいて、既に予約済みのマイニング分析処理の時刻を取得し、空き時間を算出する。
ステップS402において、CPU(マイニング分析スケジューリング手段)は、新規に予約するマイニング分析の予測時間を算出する。より具体的には、CPUは、マイニング分析するテキストデータのデータ量(テキスト管理テーブル43)と過去の処理時間(マイニング管理テーブル44)とから予測時間を算出する。
ステップS403において、CPU(マイニング分析スケジューリング手段)は、新規なマイニング分析処理を予約する。
ステップS404において、CPU(マイニング分析手段12)は、予約された時刻にマイニング分析する。
ステップS405において、CPU(マイニング結果記憶制御手段13)は、マイニング結果を格納する。
図12は、本発明の一実施形態に係るマイニング分析装置10のマイニング分析スケジューリングを説明する図である。
予約済分析予定101〜105は、予約済みのマイニング分析のスケジュールを示している。更新301は、用語対応辞書DB31が更新されたことを示している。
分析予定201〜205は、用語対応辞書DB31の更新に伴って、補正(例えば、表記ゆれ補正)されたテキストデータを新たにマイニング分析するための予定を示している。
分析予定201と分析予定202とによって示される例は、過去において時刻0時にマイニング分析したテキストデータについてのマイニング分析の予測時間と、時刻0時以降の空き時間とに基づいて、予約済分析予定103を許容時刻までずらして、予約済分析予定102の次に組み入れた例である。
予測時間は、例えば、新規に予約するマイニング分析の入力データの詳細情報(入力時間帯やサイズ等)と、マイニング管理テーブル44に蓄積された過去のマイニング分析処理時間と、直前のマイニング分析処理で用いる用語対応辞書が共通かどうかの情報等とから計算される、マイニング分析処理に掛かる時間である。
分析予定203と分析予定204とによって示される例は、同様に、マイニング分析の予測時間と、時刻0時以降の空き時間とに基づいて、予約済分析予定104を許容時刻までずらして、ずらした予約済分析予定103の次に組み入れた例である。
分析予定205によって示される例は、マイニング分析の予測時間と、時刻0時以降の空き時間とに基づいて、ずらした予約済分析予定104と、予約済分析予定105との間に組み入れた例である。
マイニング分析装置10は、予約済みのマイニング分析処理時刻を許容時刻まで後にずらすことを許容して、過去の入力データで、直前のマイニング分析処理と共通の用語対応辞書DB31であるものを優先的に予約割り当てする。また、マイニング分析装置10は、マイニング分析処理に長時間が予想されるものを、入力データが少ないと予想される深夜に割り当ててもよい。
本実施形態によれば、マイニング分析装置10は、テキストデータを取得し、取得したテキストデータをマイニング分析し、マイニング分析した結果であるマイニング結果をマイニング結果記憶部41に記憶させ、マイニング分析されるテキストデータに用いられる用語と、その用語に関連する語句とを対応付けて記憶する用語対応辞書DB31に基づいて、マイニング結果において抽出された単語について、互いに対応するか否かを判断し、互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合する。
また、マイニング分析装置10は、用語対応管理テーブル32と、テキスト管理テーブル43と、マイニング管理テーブル44とを備え、新規の表記ゆれ情報の登録(仮登録)を、本登録するかの判断ができるほか、共通して含まれる単語や対象データの期間等の条件追加等の高度な表記ゆれ補正をすることができる。
また、マイニング分析装置10は、新規の表記ゆれ情報を本登録した用語対応管理テーブル32に基づいて、テキストデータを表記ゆれ補正し、補正したテキストデータのマイニング分析をスケジューリングし、正確なマイニング分析結果を、既存の分析処理への影響を極力抑えつつ、最終的に提示することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
10 マイニング分析装置
11 テキスト取得手段
12 マイニング分析手段
13 マイニング結果記憶制御手段
14 用語判断手段
15 マイニング結果統合手段
16 辞書入力受付手段
17 辞書作成手段
18 マイニング結果統合制御手段
19 テキスト補正手段
20 マイニング分析制御手段
21 マイニング分析スケジュール手段
22 マイニング結果表示手段
31 用語対応辞書DB
32 用語対応管理テーブル
41 マイニング結果記憶部
42 統合結果記憶部
43 テキスト管理テーブル
44 マイニング管理テーブル

Claims (9)

  1. テキストデータを取得するテキスト取得手段と、
    前記テキスト取得手段によって取得されたテキストデータをマイニング分析するマイニング分析手段と、
    前記マイニング分析手段によってマイニング分析された結果であるマイニング結果をマイニング結果記憶手段に記憶させるマイニング結果記憶制御手段と、
    前記マイニング分析手段によってマイニング分析されるテキストデータに用いられる用語と、その用語に関連する語句とを対応付けて記憶する用語対応辞書と、
    前記マイニング結果において抽出された単語について、互いに対応するか否かを前記用語対応辞書に基づいて判断する用語判断手段と、
    前記用語判断手段によって互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合するマイニング結果統合手段と、
    を備えるマイニング分析装置。
  2. 前記用語対応辞書を作成するための入力を受け付ける辞書入力受付手段と、
    前記辞書入力受付手段によって受け付けられた入力に基づいて、前記用語対応辞書を作成する辞書作成手段と、
    前記辞書作成手段によって前記用語対応辞書が作成されると、作成された前記用語対応辞書に基づいて、前記マイニング結果統合手段による前記マイニング結果の統合を行うように制御するマイニング結果統合制御手段と、
    をさらに備える請求項1に記載のマイニング分析装置。
  3. 前記辞書作成手段によって作成された前記用語対応辞書に基づいて、前記テキストデータを補正するテキスト補正手段と、
    前記テキスト補正手段によって補正されたテキストデータを、前記マイニング分析手段によってマイニング分析するように制御するマイニング分析制御手段と、
    をさらに備える請求項2に記載のマイニング分析装置。
  4. 前記用語対応辞書が作成されるごとに、作成された内容を表わす版情報を記憶する用語対応管理テーブルをさらに備え、
    前記辞書作成手段は、前記用語対応辞書を作成すると、作成した前記用語対応辞書に対応した前記版情報を前記用語対応管理テーブルに記憶させ、
    前記マイニング分析制御手段は、前記用語対応管理テーブルに記憶されている前記版情報に対応する前記用語対応辞書に基づいて、前記テキストデータが補正され、補正された前記テキストデータがマイニング分析されるように制御する、
    請求項3に記載のマイニング分析装置。
  5. 前記用語対応辞書の版情報と、前記テキストデータとを対応付けて記憶するテキスト管理テーブルをさらに備え、
    前記テキスト補正手段は、前記用語対応管理テーブルに基づいて、前記テキストデータを補正し、補正した前記テキストデータと前記用語対応辞書の版情報とを対応付けて前記テキスト管理テーブルに記憶させる、
    請求項4に記載のマイニング分析装置。
  6. 前記マイニング分析手段によってマイニング分析される時間を記憶するマイニング管理テーブルと、
    マイニング分析する予定を設定するマイニング分析スケジュール手段と、をさらに備え、
    前記マイニング分析手段は、マイニング分析ごとにマイニング分析した時間を前記マイニング管理テーブルに記憶させ、
    前記マイニング分析スケジュール手段は、前記マイニング管理テーブルに基づいて、前記マイニング分析手段によるマイニング分析の予定を設定する、
    請求項3から5のいずれかに記載のマイニング分析装置。
  7. 前記用語対応辞書は、用語を具体的な対応語に対応付けるための条件を、対応語に対応付けてさらに記憶する、
    請求項2から6のいずれかに記載のマイニング分析装置。
  8. 請求項1に記載のマイニング分析装置が実行する方法であって、
    前記テキスト取得手段が、テキストデータを取得するテキスト取得ステップと、
    前記マイニング分析手段が、前記テキスト取得ステップによって取得されたテキストデータをマイニング分析するマイニング分析ステップと、
    前記マイニング結果記憶制御手段が、前記マイニング分析ステップによってマイニング分析された結果であるマイニング結果をマイニング結果記憶手段に記憶させるマイニング結果記憶制御ステップと、
    前記用語判断手段が、前記マイニング結果において抽出された単語について、互いに対応するか否かを前記用語対応辞書に基づいて判断する用語判断ステップと、
    前記マイニング結果統合手段が、前記用語判断ステップによって互いに対応すると判断された単語についてのそれぞれのマイニング結果を統合するマイニング結果統合ステップと、
    を備える方法。
  9. コンピュータに、請求項8に記載の方法の各ステップを実行させるためのプログラム。
JP2013227685A 2013-10-31 2013-10-31 マイニング分析装置、方法及びプログラム Expired - Fee Related JP6407516B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013227685A JP6407516B2 (ja) 2013-10-31 2013-10-31 マイニング分析装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013227685A JP6407516B2 (ja) 2013-10-31 2013-10-31 マイニング分析装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2015088067A true JP2015088067A (ja) 2015-05-07
JP6407516B2 JP6407516B2 (ja) 2018-10-17

Family

ID=53050755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013227685A Expired - Fee Related JP6407516B2 (ja) 2013-10-31 2013-10-31 マイニング分析装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6407516B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019185495A (ja) * 2018-04-12 2019-10-24 株式会社コアコンセプト・テクノロジー プロフィールデータベース構築システム

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265775A (ja) * 1992-03-19 1993-10-15 Hitachi Ltd ジョブ実行予測制御方法およびジョブ実行状況表示方法
JPH10149368A (ja) * 1996-11-20 1998-06-02 Fuji Xerox Co Ltd 文書検索装置
JPH10254883A (ja) * 1997-03-10 1998-09-25 Mitsubishi Electric Corp 文書自動分類方法
JPH11203311A (ja) * 1998-01-13 1999-07-30 Fujitsu Ltd 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体
JP2000222427A (ja) * 1999-02-02 2000-08-11 Mitsubishi Electric Corp 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体
JP2001318947A (ja) * 2000-05-12 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 情報統合システムおよび情報統合方法、ならびにそのプログラムを記録した記録媒体
US20020099730A1 (en) * 2000-05-12 2002-07-25 Applied Psychology Research Limited Automatic text classification system
JP2003157271A (ja) * 2001-11-20 2003-05-30 Mitsubishi Electric Corp テキストマイニング装置および方法
JP2003303190A (ja) * 2002-04-12 2003-10-24 Chishiki System Kenkyusho:Kk 文書情報共用システム
US20040044950A1 (en) * 2002-09-04 2004-03-04 Sbc Properties, L.P. Method and system for automating the analysis of word frequencies
JP2006146802A (ja) * 2004-11-24 2006-06-08 Mitsubishi Electric Corp テキストマイニング装置およびテキストマイニング方法
JP2011232855A (ja) * 2010-04-26 2011-11-17 Nec Software Kyushu Ltd 文字変換装置、文字変換システム、文字変換方法およびプログラム
JP2012099001A (ja) * 2010-11-04 2012-05-24 Toshiba Corp ニュース情報分析装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265775A (ja) * 1992-03-19 1993-10-15 Hitachi Ltd ジョブ実行予測制御方法およびジョブ実行状況表示方法
JPH10149368A (ja) * 1996-11-20 1998-06-02 Fuji Xerox Co Ltd 文書検索装置
JPH10254883A (ja) * 1997-03-10 1998-09-25 Mitsubishi Electric Corp 文書自動分類方法
JPH11203311A (ja) * 1998-01-13 1999-07-30 Fujitsu Ltd 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体
JP2000222427A (ja) * 1999-02-02 2000-08-11 Mitsubishi Electric Corp 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体
JP2001318947A (ja) * 2000-05-12 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 情報統合システムおよび情報統合方法、ならびにそのプログラムを記録した記録媒体
US20020099730A1 (en) * 2000-05-12 2002-07-25 Applied Psychology Research Limited Automatic text classification system
JP2003157271A (ja) * 2001-11-20 2003-05-30 Mitsubishi Electric Corp テキストマイニング装置および方法
JP2003303190A (ja) * 2002-04-12 2003-10-24 Chishiki System Kenkyusho:Kk 文書情報共用システム
US20040044950A1 (en) * 2002-09-04 2004-03-04 Sbc Properties, L.P. Method and system for automating the analysis of word frequencies
JP2006146802A (ja) * 2004-11-24 2006-06-08 Mitsubishi Electric Corp テキストマイニング装置およびテキストマイニング方法
JP2011232855A (ja) * 2010-04-26 2011-11-17 Nec Software Kyushu Ltd 文字変換装置、文字変換システム、文字変換方法およびプログラム
JP2012099001A (ja) * 2010-11-04 2012-05-24 Toshiba Corp ニュース情報分析装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石嶋 秀太、外1名: "単語共起関係を用いた求人情報の分析事例について", 第75回(平成25年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベース, JPN6017020703, 6 March 2013 (2013-03-06), JP, pages 1 - 513, ISSN: 0003730114 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019185495A (ja) * 2018-04-12 2019-10-24 株式会社コアコンセプト・テクノロジー プロフィールデータベース構築システム

Also Published As

Publication number Publication date
JP6407516B2 (ja) 2018-10-17

Similar Documents

Publication Publication Date Title
US20160062981A1 (en) Methods and apparatus related to determining edit rules for rewriting phrases
CN102467498A (zh) 翻译方法及装置
US20230074284A1 (en) Generating RTSM Systems for Clinical Trials
US20200372218A1 (en) Data-driven automated selection of profiles of translation professionals for translation tasks
US11256409B2 (en) Systems, methods, devices, and computer readable media for facilitating distributed processing of documents
US9952962B2 (en) Increasing accuracy of traceability links and structured data
US9665413B2 (en) Shared job scheduling in electronic notebook
CN110222047A (zh) 一种动态表单生成方法和装置
JP6407516B2 (ja) マイニング分析装置、方法及びプログラム
US8229934B2 (en) System and program for collecting documents
RU2546064C1 (ru) Распределенная система и способ языкового перевода
US20230401484A1 (en) Data processing method and apparatus, electronic device, and storage medium
CN113051262B (zh) 一种数据质检方法、装置、设备及存储介质
CN115495440A (zh) 异构数据库的数据迁移方法、装置、设备及存储介质
JP2008134840A (ja) 情報処理装置およびその方法
JP6297835B2 (ja) マイニング分析装置、方法及びプログラム
JP6150664B2 (ja) マイニング分析装置、方法及びプログラム
KR102308521B1 (ko) 정보 업데이트 방법 및 장치
JP7065473B2 (ja) 会話文からの業務構築システム
US20240152511A1 (en) Transliteration of machine interpretable languages for enhanced compaction
Noor et al. Development of Waw Mdp Client Record Management System
JP2009070299A (ja) 文書処理装置、プログラムおよび文書処理方法
JP2007219586A (ja) ソースコード解析装置
US20140316851A1 (en) Predicting customer receptivity for commercial engagement
CN106855842A (zh) 一种基于正则表达式的程序静态分析方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180919

R150 Certificate of patent or registration of utility model

Ref document number: 6407516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees