JP7432974B1 - データ生成システム - Google Patents

データ生成システム Download PDF

Info

Publication number
JP7432974B1
JP7432974B1 JP2023143585A JP2023143585A JP7432974B1 JP 7432974 B1 JP7432974 B1 JP 7432974B1 JP 2023143585 A JP2023143585 A JP 2023143585A JP 2023143585 A JP2023143585 A JP 2023143585A JP 7432974 B1 JP7432974 B1 JP 7432974B1
Authority
JP
Japan
Prior art keywords
data
output data
specific
unit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023143585A
Other languages
English (en)
Inventor
力 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2023143585A priority Critical patent/JP7432974B1/ja
Application granted granted Critical
Publication of JP7432974B1 publication Critical patent/JP7432974B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】労働生産性を上げて人的資本のレベルを向上させるデータ生成システムを提供する。【解決手段】データ生成システム100は、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集するデータ収集部110と、ターゲットデータのうち、第1のAI処理により、特定要素を含む固定概念データを抽出するデータ判別部120と、固定概念データから、第2のAI処理により、特定要素を除外して特定要素除外データを生成する特定要素除外部130と、固定概念データを除くターゲットデータ及び特定要素除外データを含むデータをアウトプットデータとして生成するアウトプットデータ生成部140と、を有する。【選択図】 図2

Description

本発明は、データ生成システムに関する。
従来から、労働生産性を向上するためのシステムが提供されている。例えば、特許文献1には、ネットワークによって接続された複数のユーザ端末と管理サーバによって構成され、業績成果を示唆するファイルへの書き込みをユーザ端末で行い、この書き込みデータ量の累計を計算して、複数のユーザ間で累計を算出、比較して、当該累計の大小に基づいてユーザごとに相対評価値を決定する評価支援システムが開示されている。このシステムによれば、企業の従業員の評価を適切に行うことができ、労働生産性を向上することができる。
特開2004-164344号公報
適正な評価を受けることで、従業員のモチベーションが向上することはある。しかしながら、評価が適正であっても、従業員の作業環境、特に、提供される情報を含む従業員を取り巻く環境が変化していない状況下においては、現状の能力以上の能力が発揮され難い。また、従業員は、会社等に雇われているものであって、自営等も含めた広い意味での労働者にとっては、上記の従来技術は有効に作用し難いことがある。よって、労働者の潜在的な能力や未だ引き出されていない能力等を発揮することができれば、更なる労働生産性の向上が期待できる。
本発明は、労働生産性を上げて人的資本のレベルを向上させるデータ生成システムを提供することを目的とする。
本発明に係るデータ生成システムは、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集するデータ収集部と、前記ターゲットデータのうち、第1のAI処理により、特定要素を含む固定概念データを抽出するデータ判別部と、前記固定概念データから、第2のAI処理により、前記特定要素を除外して特定要素除外データを生成する特定要素除外部と、前記固定概念データを除く前記ターゲットデータ及び前記特定要素除外データを含むデータをアウトプットデータとして生成するアウトプットデータ生成部と、を有する。
本発明によれば、労働生産性を上げて人的資本のレベルを向上させるデータ生成システムを提供することができる。
本発明の実施形態に係るデータ生成システムの構成を示すブロック図である。 本発明の実施形態に係るデータ生成システムの制御部の構成を示す機能ブロック図である。 本発明の実施形態に係るデータ生成システムのデータ生成の対象となる特定分野、特定分野を特定するアウトプットデータ設定値を説明するための図である。 本発明の実施形態に係るデータ生成システムのデータ判別部がターゲットデータから抽出する固定概念データを説明するための図である。 本発明の実施形態に係るデータ生成システムにおける第1のAI処理及び第2のAI処理を説明するための図である。 本発明の実施形態に係るデータ生成システムが(a)、(b)、(c)の順でアウトプットデータを生成する工程を説明するための図である。 本発明の実施形態に係るデータ生成システムのフロー図である。
本発明の実施形態を図に基づいて説明する。図1は、データ生成システム100の構成を示すブロック図である。データ生成システム100は、記憶部101、制御部102、表示部103、通信部104、操作部105を有する。データ生成システム100は、例えば、学術分野や教育分野等の特定分野において活用することができるデータ(アウトプットデータ)を生成することができる。
記憶部101は、例えば、少なくとも1つのメモリとしてのフラッシュメモリ、EEPROM(Electrically Erasable Programmable ROM)及びSSD(Solid State Drive)等の記憶装置等で構成される。記憶部101は、制御プログラムや、生成された各種データを一時的又は継続的に保存し、記憶させておくことができる。
制御部102は、少なくとも1つのプロセッサとしてのCPU(Central Processing Unit)により構成され、記憶部101に記憶される制御プログラムを読み出し、各種の処理を実行する。制御部102は、システムバスSBを介して、記憶部101、表示部103、通信部104、操作部105と接続し、各部を制御する。
表示部103は、例えばディスプレイにより構成される。通信部104は、例えばネットワークインタフェースコントローラ(NIC)であり、インターネットと接続して各種の情報を送受信することができる。
図2は、記憶部101に記憶される制御プログラムが実行されることにより制御部102のCPUが機能する機能ブロック図である。データ生成システム100の制御部102は、データ収集部110、データ判別部120、特定要素除外部130、アウトプットデータ生成部140及びAI処理部150を含む。ここで、「AI」とは「人工知能」である。
データ収集部110は、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集する。ここで、データ生成の対象となる特定分野とは、生成したアウトプットデータを活用する分野であって、図3に示すように、例えば、学術分野、教育分野、医療分野、産業分野、宇宙工学分野等をいう。アウトプットデータ設定値は、特定分野を特定するデータであり、キーワード(テキストデータ)、数詞や記号、画像、音声データ等を含むことができる。なお、以下で説明するターゲットデータ、特定要素、固定概念データ、特定要素除外データ、アウトプットデータについても、テキストデータ、数値、画像、音声データ等を含むことができる。
アウトプットデータ設定値は、階層構造とすることもできる。例えば、図3に示すように、特定分野を「学術分野」としたとき、上位の第1のアウトプットデータ設定値は、社会科学、人文科学、自然科学等を特定するデータとすることができる。更に、下位の第2のアウトプットデータ設定値は、各分野における専門用語(例えば、社会科学における法学、そして法学における法律用語)や、公表される論文の執筆者名、情報を発信している大学名等のデータとすることができる。
データ収集部110は、図3に例示するアウトプットデータ設定値(第1のアウトプットデータ設定値、第2のアウトプットデータ設定値)に基づいて、インターネットを介して情報を収集する。ターゲットデータとは、データ収集部110において収集したデータをいう。より具体的には、例えば、社会科学分野の法学におけるA大学が発信する情報をターゲットデータとして収集する。
データ判別部120は、データ収集部110により収集されたターゲットデータのうち、第1のAI処理により、固定概念データを抽出する。固定概念データとは、図4に示すように、特定要素を含むデータである。特定要素とは、不変な固定的要素、例えば、性別、身体的・精神的障がい、年齢等を含むデータである。例えば、「女児はお人形を与えると喜ぶ」というデータは、「女児」という性別、年齢からなる特定要素を含むデータである。よって、「女児はお人形を与えると喜ぶ」というデータは、固定概念データに該当する可能性が高い。固定概念データに該当するか否かは、従来からの思考や思い込みであるか否かに基づいて、第1のAI処理にて判断する。
同様に、例えば、「男らしさ≒強い」は「男」という性別からなる特定要素を含むデータである。データ判別部120では、ターゲットデータから、このような固定概念データを抽出する。なお、ここでいう「抽出」は、「特定」することも含まれる。換言すれば、データ判別部120は、多数のターゲットデータについて、固定概念データに属するデータと、固定概念データに属しないデータに判別することができる。
固定概念データの抽出は、AI処理部150による第1のAI処理により行うことができる。固定概念データの事例を機械学習させたAI処理部150が行う第1のAI処理により、直接的なキーワードからの抽出だけではなく、データ(テキストデータ、数値、画像、音声データ等を含む)の意味内容を把握して固定概念データを抽出することができる。
また、第1のAI処理は、固定概念データとして抽出する条件を設定することもできる。例えば、同一内容のデータが閾値以上の個数存在することを条件とすることができる。データが同一内容か否かは、データ内容をAI処理により解析して判断することができる。また、同一内容のデータが存在する年代を条件とすることもできる。ある年代(特定の年であってもよいし、年代の境界を厳密に設定していなくてもよい)以前からあるデータは古くからある概念として、固定概念データと判別することができる。また、設定した発信者(又は、所定条件を満たす者として抽出された発信者)が情報源であることを条件とすることができる。所定の思想を持つ発信者(個人又は組織(団体等)であってもよい)が情報源となるデータは固定概念データと判別することができる場合がある。
特定要素除外部130は、データ判別部120で抽出した固定概念データから、AI処理部150が行う第2のAI処理により、特定要素を除外して特定要素除外データを生成する。具体的には、図5に示すように、例えば、データ生成の対象となる特定分野が学術分野において、第1のAI処理により「機械工学は女性に向かない」といったデータ(固定概念データ)が抽出された場合に、この「機械工学は女性に向かない」という固定概念データに対して、第2のAI処理により削除する。つまり、第2のAI処理により行われる、固定概念データにおける特定要素の除外には、当該固定概念データそのものの削除も含まれる。
更に図5の例のうち、「発達障がい者が向く学術分野」に関するデータがある場合には、第2のAI処理により、「発達障がい者の特性を持つ者が向く学術分野」に変換する。AI処理部150は、「発達障がい者の特性」、例えば、高い集中力を備える等の特性を機械学習し、第2のAI処理を行うことができる。ここで、「発達障がい」は、特定要素である。また、「特定要素を除外」には、データの変換も含まれる。同様に、「50歳以上はIT研究できない」というデータについても変換して「50歳以上」の条件を能力的条件に置き換えることができる。
アウトプットデータ生成部140は、固定概念データを除くターゲットデータ及び特定要素除外データを含むデータをアウトプットデータとして生成する。アウトプットデータが生成される工程は、図6(a),(b),(c)の順で行われる。図6(a)に示すように、データ収集部110が収集したターゲットデータは、データ判別部120が第1のAI処理を用いて抽出した固定概念データを含むものである。そして、図6(b)に示すように、固定概念データは、特定要素除外部130が第2のAI処理を用いて、特定要素除外データに変換(生成)される。図6(c)に示すように、アウトプットデータ生成部140は、特定要素除外部130で生成された特定要素除外データとターゲットデータを組み合わせて、アウトプットデータを生成する。
データ生成システム100のデータ生成方法は、図7のフロー図に示す工程を含む。
ターゲットデータ収集工程;ステップS10において、データ収集部110は、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集する。なお、アウトプットデータ設定値は、第1のアウトプットデータ設定値、第2のアウトプットデータ設定値を含む階層構造とすることもでき、階層毎にターゲットデータを収集することもできる。
固定概念データ抽出工程;ステップS20において、データ判別部120は、データ収集部110が収集したターゲットデータのうち、第1のAI処理により、特定要素を含む固定概念データを抽出する。
特定要素除外データ生成工程;ステップS30において、特定要素除外部130は、ステップS20で抽出した固定概念データから、第2のAI処理により特定要素を除外して特定要素除外データを生成する。
アウトプットデータ生成工程;ステップS40において、アウトプットデータ生成部140は、固定概念データを除くターゲットデータ及び特定要素除外データを含むデータをアウトプットデータとして生成する。なお、アウトプットデータは、ターゲットデータのすべてが固定概念データであった場合には、特定要素除外データのみからなるデータとなることもある。
生成したアウトプットデータは、特定分野に応じたビッグデータとして利用することができる。生成したアウトプットデータは、性別や年齢、障がいの有無に由来する思い込み、思考が取り除かれたデータとされることから、従来のビッグデータを活用したアウトプットから脱却したアウトプットとなる。これにより、性別や年齢、障がいの有無により、従来は引き出されなかった能力を引き出すことができ、労働生産性を上げて人的資本のレベルを向上させることができる。
例えば、特定分野を産業分野として生成したアウトプットデータは、企業における社内制度の制定や仕事のやり方の改善、商品開発、製造工程の改善等に利用することができる。生成されたアウトプットデータを利用したこれらの成果物は、ビッグデータとされる当該アウトプットデータをAI処理することで得ることもできる。生成したアウトプットデータは、特定要素を含む固定概念データが除外されているので、今までの、例えば「女性らしさ」、「男性らしさ」、「障がい者は」といった思考や思い込みから脱却した成果を得ることができる。ここで得られる成果、例えば、企業の社内制度であれば、性別や年齢、障がいの有無に関係なく、気付かなかった才能や能力を引き出すような制度を制定することができる。
または、精神的な障がい者が働く福祉作業所の改善では、福祉作業所で生産するのに適した商品開発や、作業方法、勤務時間等の制度の策定等に利用することができる。本発明に係るデータ生成システムにより生成されたアウトプットデータを利用することで、人々のウェルビーイングが向上し、個人らしさや発想力が創出され、生産性が向上される。
以上、本発明の実施形態を説明したが、本発明は本実施形態によって限定されることはなく、種々の変更を加えて実施することができる。
100 データ生成システム 101 記憶部
102 制御部 103 表示部
104 通信部 105 操作部
110 データ収集部 120 データ判別部
130 特定要素除外部 140 アウトプットデータ生成部
150 AI処理部

Claims (3)

  1. データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介して前記特定された特定分野に関するターゲットデータを収集するデータ収集部と、
    前記ターゲットデータのうち、第1のAI処理により、性別や年齢、障がいの有無に由来する思い込み、思考に関するいずれかの特定要素を含む固定概念データを抽出するデータ判別部と、
    前記固定概念データから、第2のAI処理により、前記特定要素を除外して特定要素除外データを生成する特定要素除外部と、
    前記固定概念データを除く前記ターゲットデータ及び前記特定要素除外データを含むデータをアウトプットデータとして生成するアウトプットデータ生成部と、
    を有するデータ生成システム。
  2. 前記第1のAI処理は、同一内容のデータが閾値以上の個数存在すること、同一内容のデータが存在する年代、所定条件を満たす発信者が情報源であること、の条件を含む、請求項1に記載のデータ生成システム。
  3. 前記アウトプットデータ生成部は、前記特定分野の異なる第1の前記アウトプットデータと第2の前記アウトプットデータを生成し、前記第1の前記アウトプットデータと前記第2の前記アウトプットデータから新たな第3の前記アウトプットデータを生成する、請求項1又は請求項2に記載のデータ生成システム。
JP2023143585A 2023-09-05 2023-09-05 データ生成システム Active JP7432974B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023143585A JP7432974B1 (ja) 2023-09-05 2023-09-05 データ生成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023143585A JP7432974B1 (ja) 2023-09-05 2023-09-05 データ生成システム

Publications (1)

Publication Number Publication Date
JP7432974B1 true JP7432974B1 (ja) 2024-02-19

Family

ID=89904349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023143585A Active JP7432974B1 (ja) 2023-09-05 2023-09-05 データ生成システム

Country Status (1)

Country Link
JP (1) JP7432974B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013080375A (ja) 2011-10-04 2013-05-02 Hitachi Ltd 個人情報匿名化装置及び方法
JP2022545049A (ja) 2020-01-06 2022-10-25 エスエヌピーラボ インコーポレイテッド 個人情報管理装置、個人情報管理システム、その個人情報の管理方法及びこれを記録したコンピューター判読可能記録媒体
WO2022249390A1 (ja) 2021-05-27 2022-12-01 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013080375A (ja) 2011-10-04 2013-05-02 Hitachi Ltd 個人情報匿名化装置及び方法
JP2022545049A (ja) 2020-01-06 2022-10-25 エスエヌピーラボ インコーポレイテッド 個人情報管理装置、個人情報管理システム、その個人情報の管理方法及びこれを記録したコンピューター判読可能記録媒体
WO2022249390A1 (ja) 2021-05-27 2022-12-01 日本電気株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム

Similar Documents

Publication Publication Date Title
CN111651751B (zh) 安全事件的分析报告生成方法、装置、存储介质及设备
WO2015093540A1 (ja) フレーズペア収集装置、及びそのためのコンピュータプログラム
CN106650799A (zh) 一种电子证据分类提取方法及系统
CN111930948B (zh) 一种信息收集和分级方法、装置、计算机设备及存储介质
CN112185586A (zh) 一种传染病监测预警方法及装置
JP2022530868A (ja) 機械学習に基づくターゲットオブジェクト属性予測方法、関連機器及びコンピュータプログラム
Suresh et al. Understanding potential sources of harm throughout the machine learning life cycle
CN108647229B (zh) 基于人工智能的虚拟人模型构建方法
CN115497616A (zh) 一种感染性疾病辅助决策的方法、系统、设备及存储介质
CN108027824B (zh) 未来脚本生成装置和方法、以及计算机可读存储介质
CN112148946A (zh) 基于微博的分析及视图展示方法与系统
CN111460144A (zh) 基于时序切分与融合的谣言早期检测算法
KR101655948B1 (ko) 관계 써클 프로세싱 방법 및 시스템, 그리고 컴퓨터 저장 매체
JP2019020882A (ja) ライフログ活用システム、方法及びプログラム
JP7432974B1 (ja) データ生成システム
CN112214602B (zh) 基于幽默度的文本分类方法、装置、电子设备及存储介质
CN112233747A (zh) 一种基于个人数字孪生网络数据分析方法及系统
Luo et al. Region-based active learning with hierarchical and adaptive region construction
Tesfaye Developing a Learning Knowledge-Based System For Diagnosis And Treatment Of Malaria
Aminuddin et al. A sentiment analysis framework on COVID-19 in major cities of Malaysia based on tweets using machine learning classification model
Paez et al. Chronic patients monitoring using wireless sensors and big data processing
Garcia-Mancilla et al. Characterizing negative sentiments in at-risk populations via crowd computing: a computational social science approach
Buruzs et al. Using Fuzzy Cognitive Maps approach to identify integrated waste management system characteristics
Alhashem et al. Diabetes Detection and Forecasting using Machine Learning Approaches: Current State-of-the-art
Wang et al. Mood disorder patients' language features on their microblogs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230920

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240130

R150 Certificate of patent or registration of utility model

Ref document number: 7432974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150