JP2021177285A - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP2021177285A
JP2021177285A JP2020082018A JP2020082018A JP2021177285A JP 2021177285 A JP2021177285 A JP 2021177285A JP 2020082018 A JP2020082018 A JP 2020082018A JP 2020082018 A JP2020082018 A JP 2020082018A JP 2021177285 A JP2021177285 A JP 2021177285A
Authority
JP
Japan
Prior art keywords
chunk
scene
image
information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020082018A
Other languages
English (en)
Other versions
JP6800453B1 (ja
Inventor
聡 黒田
Satoshi Kuroda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information System Engineering Inc
Original Assignee
Information System Engineering Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information System Engineering Inc filed Critical Information System Engineering Inc
Priority to JP2020082018A priority Critical patent/JP6800453B1/ja
Application granted granted Critical
Publication of JP6800453B1 publication Critical patent/JP6800453B1/ja
Priority to CN202180005310.0A priority patent/CN114424183A/zh
Priority to DE112021000030.6T priority patent/DE112021000030T5/de
Priority to US17/610,215 priority patent/US11900301B2/en
Priority to PCT/JP2021/017204 priority patent/WO2021225118A1/ja
Publication of JP2021177285A publication Critical patent/JP2021177285A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06398Performance of employee with respect to a job function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/02Electrically-operated educational appliances with visual presentation of the material to be studied, e.g. using film strip
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B9/00Simulators for teaching or training purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Educational Technology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】使用者が必要な際に、使用者が必要な量の情報を使用者に提示する情報処理装置及び情報処理方法を提供する。【解決手段】対応者の行う作業に関する情報である作業情報を出力する情報処理装置に要る方法であって、対応者が被対応者と複数の被対応物とを含む画像である元画像を取得し、元画像を分割し被対応者が撮像された被対応者画像とそれぞれの被対応物が撮像された複数の被対応物画像とに分割し、被対応者画像と、対応者が行う状況であるシーンを一意に示すシーンIDとの間における連関性が記憶されている第1の学習済みモデルを使用して、シーンを推定し、複数の被対応物画像と、作業情報を分割又は示唆した情報であるチャンクを一意に示すチャンクIDと、1対1に対応付けられた1又は複数のチャンク用メタIDと、の間における連関性が記憶されている複数の第2の学習済みモデルのうちの1つを使用して、チャンクを推定し、出力する。【選択図】図1

Description

本発明は、情報処理装置及び情報処理方法に関する。
例えば特許文献1の作業支援システムでは、作業の手順、内容、留意点又はその他の事項を記述したマニュアルに基づいて、作業の対象又は作業の状況の判定条件を記述したルールを生成し、作業者が装着した機器からのセンサ情報に基づいて作業の対象及び作業の状況を認識し、生成したルール及び認識手段の認識結果に基づいて作業支援情報を出力する。
特開2019−109844号公報
しかしながら特許文献1に記載されたような従来の手法においては、マニュアルなどの文書として蓄積されている情報は、文書単位の検索しかできない。例えば段落単位での検索を文書に対して行う場合には、文書を構造化された情報に再構築する必要がある。検索対象となる全ての文書の再構築は費用対効果を考慮すると現実的ではないことが多く、また文書単位での情報では不要な情報を多分に閲覧してしまい、文書の閲覧者が迅速な対応ができないことがあるという課題がある。
本発明の実施の形態の一態様は、大規模な情報の再構築をせずに、使用者が必要な際に、使用者が必要な量の情報を、使用者に提示する情報処理装置を提供することを目的とする。
対応者の行う作業に関する情報である作業情報を出力する情報処理装置であって、対応者が対応する被対応者と前記対応者が対応する複数の被対応物とを含む画像である元画像を取得する画像取得部と、元画像を分割し被対応者が撮像された被対応者画像とそれぞれの被対応物が撮像された複数の被対応物画像とに分割する画像分割部と、被対応者画像と、対応者が行う状況であるシーンを一意に示すシーンIDと、の間における連関性が記憶されている第1の学習済みモデルを使用して、シーンを推定するシーン推定部と、複数の被対応物画像と、作業情報を分割又は示唆した情報であるチャンクを一意に示すチャンクIDと、1対1に対応付けられた1又は複数のチャンク用メタIDと、の間における連関性が記憶されている複数の第2の学習済みモデルのうちの1つを使用して、チャンクを推定するチャンク推定部と、チャンクを出力する出力部と、を備え、チャンク推定部は、複数の第2の学習済みモデルのうちの1つを、シーンIDと1対1に対応付けられたモデルIDを用いて選定し、チャンク用メタIDは被対応物の性質に関する情報であるチャンク用メタ値を一意に示す、情報処理装置を提供する。
対応者の行う作業に関する情報である作業情報を出力する情報処理装置が行う情報処理方法であって、対応者が被対応者と複数の被対応物とを含む画像である元画像を取得する第1のステップと、元画像を分割し被対応者が撮像された被対応者画像とそれぞれの被対応物が撮像された複数の被対応物画像とに分割する第2のステップと、被対応者画像と、対応者が行う状況であるシーンを一意に示すシーンIDと、の間における連関性が記憶されている第1の学習済みモデルを使用して、シーンを推定する第3のステップと、複数の被対応物画像と、作業情報を分割又は示唆した情報であるチャンクを一意に示すチャンクIDと、1対1に対応付けられた1又は複数のチャンク用メタIDと、の間における連関性が記憶されている複数の第2の学習済みモデルのうちの1つを使用して、チャンクを推定する第4のステップと、チャンクを出力する第5のステップと、を備え、複数の第2の学習済みモデルのうちの1つはシーンIDと1対1に対応付けられたモデルIDを用いて選定され、チャンク用メタIDは被対応物の性質に関する情報であるチャンク用メタ値を一意に示す、情報処理方法を提供する。
本発明の実施の形態の一態様によれば大規模な情報の再構築をせずに、使用者が必要な際に、使用者が必要な量の情報を、使用者に提示する情報処理装置を実現できる。
図1は、本実施の形態による利用段階における情報処理装置の構成を示すブロック図である。 図2は、本実施の形態による学習段階における情報処理装置の構成を示すブロック図である。 図3は、本実施の形態による元画像、被対応者画像及び複数の被対応物画像を示す図である。 図4は、本実施の形態による被対応者画像及び複数の被対応物画像の関係である木構造を示す図である。 図5は、本実施の形態による第1の学習済みモデル及び第2の学習済みモデルを示す図である。 図6は、本実施の形態による補助記憶装置に記憶されている情報を示す図である。 図7は、本実施の形態によるシーン推定機能、チャンク推定機能及びチャンク出力機能の説明に供するシーケンス図である。 図8は、本実施の形態による第1の学習済みモデル生成機能及び第2の学習済みモデル生成機能の説明に供するシーケンス図である。 図9は、本実施の形態による利用段階における情報処理の処理手順を示すフローチャートである。 図10は、本実施の形態による学習段階における情報処理の処理手順を示すフローチャートである。
以下図面を用いて、本発明の実施の形態の一態様を詳述する。例えば、大学の窓口や薬局の窓口において、学生及び学生の保護者などや患者などである被対応者の対応を行う作業者である対応者が参照する被対応物の情報について説明する。被対応物とは、例えば大学の窓口の場合は書類であって、薬局の窓口の場合は薬とする。
(本実施の形態)
まず図1を用いて利用段階における情報処理装置1について説明する。図1は、本実施の形態による利用段階における情報処理装置1の構成を示すブロック図である。情報処理装置1は、中央演算装置2、主記憶装置3及び補助記憶装置11を備える。
中央演算装置2は、例えばCPU(Central Processing Unit)であって、主記憶装置3に記憶されたプログラムを呼び出すことで処理を実行する。主記憶装置3は、例えばRAM(Random Access Memory)であって、後述の画像取得部4、画像分割部5、シーン推定部6、チャンク推定部7、チャンク出力部8、第1の学習済みモデル生成部9、第2の学習済みモデル生成部10及びレコメンド画像出力部13といったプログラムを記憶する。
なお画像取得部4、画像分割部5、シーン推定部6、チャンク推定部7、チャンク出力部8及びレコメンド画像出力部13を含むプログラムを制御部15と呼んでもよく、第1の学習済みモデル生成部9及び第2の学習済みモデル生成部10を含むプログラムを学習済みモデル生成部16と呼んでもよい。
補助記憶装置11は、例えばSSD(Solid State Drive)やHDD(Hard Disk Drive)であって、後述の第1の学習済みモデルDB1や第1の学習モデルDB1’や第2の学習済みモデルDB2や第2の学習モデルDB2’といったデータベースやシーンテーブルTB1やモデルテーブルTB2やコンテンツテーブルTB3やシーン・コンテンツテーブルTB4やコンテンツ・チャンクテーブルTB5やチャンク・メタテーブルTB6やチャンクテーブルTB7やチャンク用メタテーブルTB8といったテーブルを記憶する。
図1に示すように対応者の行う作業に関する情報である作業情報を出力する情報処理装置1は、利用段階において、画像取得部4と、画像分割部5と、シーン推定部6と、チャンク推定部7と、作業情報を分割又は示唆した情報であるチャンクを出力するチャンク出力部8と、を備える。ここで作業情報をコンテンツと呼んでもよく、コンテンツIDは作業情報を一意に示すものとする。
画像取得部4は、対応者が対応する被対応者21(図3)と対応者が対応する複数の被対応物22〜25(図3)とを含む画像である元画像20(図3)を、カメラを備えたパーソナルコンピュータなどのユーザ端末12から取得する。画像分割部5は、元画像20を分割し前記被対応者21が撮像された被対応者画像30とそれぞれの被対応物22〜25が撮像された複数の被対応物画像40〜43とに分割する。
シーン推定部6は、対応者が行う状況であるであるシーンを推定する。具体的にはシーン推定部6は、被対応者画像30(35)を取得し、被対応者画像30(35)とシーンを一意に示すシーンIDと、の間における連関性が記憶されている第1の学習済みモデルDB1を使用して、シーンを推定する。
シーン推定部6は、シーンIDとシーンの名称であるシーン名とが1対1で紐づけられたテーブルであるシーンテーブルTB1から、シーンIDを検索キーとしてシーン名を取得してユーザ端末12に送信する。ユーザ端末12はシーン推定部6から受信したシーン名を使用者に提示する。
チャンク推定部7は、作業に関係する被対応物22(23〜25)の画像である被対応物画像40〜43を取得し、被対応物画像40(41〜43)と、チャンクを一意に示すチャンクIDと1対1に対応付けられた1又は複数のチャンク用メタIDと、の間における連関性が記憶されている複数の第2の学習済みモデルDB2のうちの1つを使用して、チャンクを推定する。
チャンク推定部7は、複数の第2の学習済みモデルDB2のうちの1つを、シーンIDと1対1に対応付けられたモデルIDを用いて選定する。またチャンク用メタIDは被対応物22〜25の性質に関する情報であるチャンク用メタ値を一意に示す。
チャンク推定部7は、モデルIDとシーンIDとが1対1で紐づけられたテーブルであるモデルテーブルTB2からシーンIDを検索キーとしてモデルIDを取得する。またチャンク推定部7は、チャンクIDとチャンク用メタIDとが1対1又は1対複数で紐づけられたテーブルであるチャンク・メタテーブルTB6からチャンク用メタIDを検索キーとしてチャンクIDを取得する。
またチャンク推定部7は、チャンクテーブルTB7からチャンクIDを検索キーとしてチャンクの概要を示すチャンクサマリを取得して、チャンクサマリをユーザ端末12に送信する。ユーザ端末12は、チャンク推定部7から受信したチャンクサマリを使用者に提示する。
またチャンク推定部7は、チャンクテーブルTB7からチャンクIDを検索キーとしてチャンクを取得して、チャンクをユーザ端末12に送信する。ユーザ端末12は、チャンク推定部7から受信したチャンクを使用者に提示する。
なおチャンクテーブルTB7は、チャンクIDにチャンクとチャンクサマリとハッシュ値とがそれぞれ1対1で紐づけられたテーブルである。なおハッシュ値は例えばチャンクが変更されたか否かを確認するために用いられる。
情報処理装置1はさらにレコメンド画像出力部13を備えてもよく、補助記憶装置11はさらにレコメンドテーブルTB9を備えてもよい。レコメンド画像出力部13は、モデルIDと1又は複数のチャンク用メタIDの組み合わせとを検索キーとして、レコメンドテーブルTB9を用いて推奨被対応物画像を検索する。
レコメンド画像出力部13は、検索した推奨被対応物画像をユーザ端末12に出力する。推奨被対応物画像は、元画像20には撮像されていないが、本来は必要であると推測される被対応物の画像を指す。なおレコメンドテーブルTB9は、モデルIDとチャンク用メタIDの組み合わせと推奨被対応物画像とが1対1対1で紐づけられたテーブルである。
次に図2を用いて学習段階における情報処理装置1について説明する。例えば学習段階においては図示せぬ入力装置から入力される被対応者画像30(35)と1又は複数の被対応物画像40〜43とを1組として学習させる。ここで学習は、例えば教師あり学習を指すものとする。
図2は、本実施の形態による学習段階における情報処理装置1の構成を示すブロック図である。学習段階においては、情報処理装置1は、第1の学習済みモデル生成部9と、第2の学習済みモデル生成部10と、を備える。
第1の学習済みモデル生成部9は、シーンIDと、被対応者画像30(35)と、を1対として第1の学習モデルDB1’に学習させることで第1の学習済みモデルDB1を生成するプログラムである。
第1の学習済みモデル生成部9は、被対応者画像30(35)に関してシーンテーブルTB1からシーンIDを取得し、シーンIDに対応するモデルIDをモデルテーブルTB2から取得する。
第2の学習済みモデル生成部10は、モデルIDを指定して1又は複数のチャンク用メタIDと被対応物画像40(41〜43)とを1対として第2の学習モデルDB2’に学習させることで第2の学習済みモデルDB2を生成するプログラムである。
第2の学習済みモデル生成部10は、シーンIDとコンテンツIDとが1対多で紐づけられたテーブルであるシーン・コンテンツテーブルTB4からシーンIDを検索キーとしてコンテンツIDを取得する。なおここで検索キーとなるシーンIDは、処理の対象となる被対応物画像40(41〜43)と対になっている被対応者画像30(35)と紐づくものである。
第2の学習済みモデル生成部10は、コンテンツIDとコンテンツとが1対1で紐づけられたテーブルであるコンテンツテーブルTB3からコンテンツIDを検索キーとしてコンテンツを取得する。
第2の学習済みモデル生成部10は、コンテンツIDとチャンクIDとが1対1又は多で紐づけられたテーブルであるコンテンツ・チャンクテーブルTB5からコンテンツIDを検索キーとしてチャンクIDを取得する。
第2の学習済みモデル生成部10は、チャンクテーブルTB7からチャンクIDを検索キーとしてチャンクを取得し、チャンク・メタテーブルTB6からチャンクIDを検索キーとしてチャンク用メタIDを取得する。
第2の学習済みモデル生成部10は、チャンク用メタテーブルTB8からチャンク用メタIDを検索キーとしてチャンク用メタ値を取得する。チャンク用メタテーブルTB8は、チャンク用メタIDにチャンク用カテゴリIDとチャンク用カテゴリ名とチャンク用メタ値とがそれぞれ1対1で結び付けられたテーブルである。
チャンク用カテゴリIDはチャンク用メタ値が属するカテゴリの名前であるチャンク用カテゴリ名を一意に示す。なお第2の学習済みモデル生成部10は、被対応物画像40(41〜43)を参照したうえで、取得したチャンク、コンテンツ及びチャンク用メタ値に問題がないことを確認する。
問題がある値を異常値と判断し教師あり学習の学習には使用しないことで、第2の学習済みモデル生成部10は、精度の高い学習済みモデルDB2を生成することが可能となり、利用段階において情報処理装置1は、精度の高い処理を行うことができる。
次に図3を用いてユーザ端末12が取得し、情報処理装置1が情報として処理する元画像20と元画像20が分割されて生成された被対応者画像30及び被対応物画像40〜43とについて説明する。図3は、本実施の形態による本実施の形態による元画像20、被対応者画像30及び複数の被対応物画像40〜43を示す図である。
元画像20、被対応者画像30及び複数の被対応物画像40〜43は例えばユーザ端末12に表示される。図3においては同時に表示されている例を示しているが、元画像20、被対応者画像30及び複数の被対応物画像40〜43は別々にユーザ端末12に表示されてもよい。
元画像20には被対応者21及び被対応物22〜25が撮像される。被対応物22〜25は、例えば机などのブース内のシーン毎には変化しない情報を基に大きさなどが推定される。また被対応物22〜25は、被対応物24のように、添付写真26や内部のテキスト27や署名28などいった内容の情報が取得されてもよい。
次に図4を用いて被対応者21及び複数の被対応物22〜25の関係について説明する。図4は、本実施の形態による被対応者21及び複数の被対応物22〜25の関係である木構造を示す図である。
図4に示すように、画像分割部5は、被対応者21を根ノードとし、複数の被対応物22〜25を葉ノード又は内部ノードとした木構造として、被対応者21と、複数の被対応物22〜25とを関連付ける。
また画像分割部5は、さらに被対応物22〜25の少なくとも1つに含まれる情報である添付写真26やテキスト27や署名28といった情報などを取得して葉ノードとして前記木構造に関連付けてもよい。
次に図5を用いて第1の学習済みモデルDB1及び第2の学習済みモデルDB2について説明する。図5は、本実施の形態による第1の学習済みモデルDB1及び第2の学習済みモデルDB2を示す。
第1の学習済みモデルDB1は、と、シーンIDと、を1対の学習データとして複数用いた機械学習により生成された、複数の被対応者画像30(35)と、複数のシーンIDと、の間における連関性が記憶されている。ここで機械学習とは例えば畳み込みニューラルネットワーク(CNN:Convolution Neural Network)とする。
被対応者画像30(35)と、シーンIDと、の間における連関性は、具体的には、図5に丸で示すノードと矢印で示すエッジとエッジに設定される重み係数とによってあらわされる畳み込みニューラルネットワークによって表すことができる。なお図5に示すように第1の学習済みモデルDB1への被対応者画像30(35)の入力は、例えば画素p1,p2といった画素ごととする。
第2の学習済みモデルDB2は、モデルIDと1対1で紐づけられ、複数とする。それぞれの第2の学習済みモデルDB2は、被対応物画像40(41〜43)と、1又は複数のチャンク用メタIDと、を1対の学習データとして複数用いた機械学習により生成された、複数の被対応物画像40(41〜43)と、複数の1又は複数のチャンク用メタIDと、の間における連関性が記憶されている。ここで機械学習とは例えば畳み込みニューラルネットワーク(CNN:Convolution Neural Network)とする。
複数の被対応物画像40(41〜43)と、複数の1又は複数のチャンク用メタIDと、の間における連関性は、具体的には、図5に丸で示すノードと矢印で示すエッジとエッジに設定される重み係数とによってあらわされる畳み込みニューラルネットワークによって表すことができる。なお図5に示すように第2の学習済みモデルDB2への被対応物画像40(41〜43)の入力は、例えば画素p1,p2といった画素ごととする。
次に図6を用いて補助記憶装置11に記憶されている情報であるシーンテーブルTB1、モデルテーブルTB2、コンテンツテーブルTB3、シーン・コンテンツテーブルTB4、コンテンツ・チャンクテーブルTB5、チャンク・メタテーブルTB6、チャンクテーブルTB7、チャンク用メタテーブルTB8及びレコメンドテーブルTB9について説明する。図6は、本実施の形態による補助記憶装置11に記憶されている情報を示す図である。
シーンテーブルTB1などに格納されるシーンIDは例えば0FDなどの3桁の16進数とする。またシーンテーブルTB1などに格納されるシーン名は、例えば成績照会や進路相談などとする。
モデルテーブルTB2などに格納されるモデルIDは、例えばMD1のように2文字の英字と1桁の10進数で表される。コンテンツテーブルTB3などに格納されるコンテンツIDは、例えば1B827−01のように5桁の16進数と2桁の10進数とで表される。コンテンツテーブルTB3などに格納されるコンテンツは、例えば1B827−01.txtのようにコンテンツIDであるファイル名が拡張子付きで示され、コンテンツの実体へのポインタなどが格納される。
コンテンツ・チャンクテーブルTB5などに格納されるチャンクIDは、例えば82700−01のように5桁と2桁の10進数で表される。チャンク・メタテーブルTB6などに格納されるチャンク用メタIDは、例えば24FDのように4桁の16進数とする。
チャンクテーブルTB7に格納されるチャンクは、例えば1B827−01.txt_0のように対象となるチャンクと対応するコンテンツのファイル名と1桁の10進数とで示され、対象となるチャンクと対応するコンテンツの実体の一部分へのポインタなどが格納される。
チャンクテーブルTB7に格納されるチャンクサマリは、例えば「ハローワークに、…」といったチャンクの内容を要約した文書とする。チャンクテーブルTB7に格納されるハッシュ値は、例えば564544d8f0b746eのように15桁の16進数とする。
チャンク用メタテーブルTB8に格納されるチャンク用カテゴリIDは、例えば394のように3桁の10進数とする。チャンク用メタテーブルTB8に格納されるチャンク用カテゴリ名は、例えば紙のサイズや紙の色や紙に空いた穴の有無などとする。チャンク用メタテーブルTB8に格納されるチャンク用メタ値は、例えばA4やB4や白や青、横に穴あり、穴なしなどとする。なおチャンク用カテゴリID及びチャンク用カテゴリ名の値はNULLであってもよい。
レコメンドテーブルTB9に格納されているチャンク用メタIDの組み合わせは、(24FD,83D9)、(25FD)などとし、1又は複数のチャンク用メタIDを組み合わせたものとする。レコメンドテーブルTB9に格納されている推奨被対応物画像は、例えばIMG001.jpgのようにファイル名が拡張子付きで示された実体へのポインタなどが格納される。
シーン・コンテンツテーブルTB4、コンテンツ・チャンクテーブルTB5及びチャンク・メタテーブルTB6に示すように、作業情報のデータ構造は、チャンク用メタIDを最下層である第1の層とし、チャンクIDを第2の層とし、コンテンツIDを第3の層とし、シーンIDを最上層である第4の層とする階層構造を有している。
次に図7を用いてシーン推定機能、チャンク推定機能及びチャンク出力機能について説明する。図7は、本実施の形態によるシーン推定機能、チャンク推定機能及びチャンク出力機能の説明に供するシーケンス図である。
利用段階の情報処理機能は、後述のシーン推定処理S60によって実現されるシーン推定機能と、後述のチャンク推定処理S80によって実現されるチャンク推定機能と、後述のチャンク出力処理S100によって実現されるチャンク出力機能と、から構成される。
まずシーン推定機能について説明する。制御部15に含まれる画像取得部4は、ユーザ端末12から元画像20を受信する(S1)。次に制御部15に含まれる画像分割部5は、元画像20を分割して被対応者画像30及び被対応物画像40〜43とする。
画像分割部5は、シーン推定部6に被対応者画像30を送信し、チャンク推定部7に被対応物画像40〜43を送信する。次に制御部15に含まれるシーン推定部6は、被対応者画像30を第1の学習済みモデルDB1に入力する(S2)。
第1の学習済みモデルDB1は、受信した被対応者画像30と強く結びついているシーンIDを1又は複数選択し、シーン推定部6に対して選択した1又は複数のシーンID(以下、これを第1のシーンIDリストと呼んでもよい)を出力する(S3)。
シーン推定部6は、第1のシーンIDリストを取得すると、ユーザ端末12にそのまま送信する(S4)。ユーザ端末12は、第1のシーンIDリストに含まれるそれぞれのシーンIDについてのキャッシュの有無をシーン推定部6に対して送信する(S5)。
ユーザ端末12は、過去に処理した情報に関しては、シーンテーブルTB1と同等のテーブルを保持している。ユーザ端末12は、受信した第1のシーンIDリストのシーンIDを検索キーとしてユーザ端末12が保持するテーブル内を検索する。検索結果が見つかったシーンIDはキャッシュ有りとなり、検索結果がみつからないシーンIDについてはキャッシュ無しとなる。
シーン推定部6は、ユーザ端末12から受信した第1のシーンIDリストに含まれるそれぞれのシーンIDのうちユーザ端末12にキャッシュが無い1又は複数のシーンID(以下、これを第2のシーンIDリストと呼んでもよい)を検索キーとしてシーンテーブルTB1を検索する(S6)。
シーン推定部6は、検索結果として第2のシーンIDリストに含まれるそれぞれのシーンIDに対応するシーン名(以下、これをシーン名リストと呼んでもよい)をシーンテーブルTB1から取得する(S7)。
シーン推定部6は、取得したシーン名リストをユーザ端末12にそのままに送信する(S8)。利用段階において情報処理装置1は、ステップS1〜S8によって、被対応者画像30のシーンを、シーン名を推定することで、推定するシーン推定機能を実現する。
次にチャンク推定機能について説明する。ユーザ端末12は、受信したシーン名リストを使用者に提示する。使用者は、提示されたシーン名リストの中から例えば1つのシーン名を選択する。ユーザ端末12は、使用者に選択されたシーン名を制御部15に含まれるチャンク推定部7に送信する(S9)。
チャンク推定部7は、ユーザ端末12から受信したシーン名に対応するシーンIDを検索キーとして(S10)、モデルテーブルTB2を検索しモデルIDを取得する(S11)。
チャンク推定部7は、被対応物画像40(41〜43)を画像分割部5から受信する(S12)。チャンク推定部7は、モデルテーブルTB2から取得したモデルIDによって複数の第2の学習済みモデルDB2のうちの1つを指定し、被対応物画像40(41〜43)を指定した第2の学習済みモデルDB2に入力する(S13)。
第2の学習済みモデルDB2は、被対応物画像40(41〜43)と強く結びついている1又は複数のチャンク用メタIDを1又は複数選択し、チャンク推定部7に対して選択した1又は複数の、1又は複数のチャンク用メタID(以下、これをチャンク用メタIDリストと呼んでもよい)を出力する(S14)。
チャンク推定部7は、チャンク用メタIDリストに含まれるそれぞれの1又は複数のチャンク用メタIDを検索キーとしてチャンク・メタテーブルTB6を検索する(S15)。
チャンク推定部7は、検索結果として1又は複数のチャンクID(以下、これを第1のチャンクIDリストと呼んでもよい)をチャンク・メタテーブルTB6から取得する(S16)。チャンク推定部7は、取得した第1のチャンクIDリストをユーザ端末12にそのままに送信する(S17)。
ユーザ端末12は、第1のチャンクIDリストに含まれるそれぞれのチャンクIDについてのキャッシュの有無をチャンク推定部7に対して送信する(S18)。ユーザ端末12は、過去に処理した情報に関しては、チャンクテーブルTB7におけるチャンクID列とチャンクサマリ列とを備えたテーブルを保持している。
ユーザ端末12は、受信した第1のチャンクIDリストのチャンクIDを検索キーとしてユーザ端末12が保持するテーブル内を検索する。検索結果が見つかったチャンクIDはキャッシュ有りとなり、検索結果がみつからないチャンクIDについてはキャッシュ無しとなる。
チャンク推定部7は、ユーザ端末12から受信した第1のチャンクIDリストに含まれるそれぞれのチャンクIDのうちユーザ端末12にキャッシュが無い1又は複数のチャンクID(以下、これを第2のチャンクIDリストと呼んでもよい)を検索キーとしてチャンクテーブルTB7を検索する(S19)。
チャンク推定部7は、検索結果として第2のチャンクIDリストに含まれるそれぞれのチャンクIDに対応するチャンクサマリ(以下、これをチャンクサマリリストと呼んでもよい)をチャンクテーブルTB7から取得する(S20)。チャンク推定部7は、取得したチャンクサマリリストをユーザ端末12にそのままに送信する(S21)。
利用段階において情報処理装置1は、ステップS9〜S21によって、被対応物22(23〜25)のチャンクを、チャンクサマリを推定することで、推定するチャンク推定機能を実現する。
次にチャンク出力機能について説明する。ユーザ端末12は、受信したチャンクサマリリストを使用者に提示する。使用者は、提示されたチャンクサマリリストの中から例えば1つのチャンクサマリを選択する。ユーザ端末12は、使用者に選択されたチャンクサマリを制御部15に含まれるチャンク出力部8に送信する(S22)。
チャンク出力部8は、ユーザ端末12から受信したチャンクサマリに対応するチャンクIDを検索キーとして(S23)、チャンクテーブルTB7を検索しチャンクを取得する(S24)。
チャンク出力部8は、取得したチャンクをユーザ端末12にそのままに送信する(S25)。ユーザ端末12は、受信したチャンクをユーザに提示する。利用段階において情報処理装置1は、ステップS22〜S25によって、被対応物22(23〜25)のチャンクを出力するチャンク出力機能を実現する。
次に図8を用いて第1の学習済みモデル生成機能及び第2の学習済みモデル生成機能について説明する。図7は、本実施の形態による第1の学習済みモデル生成機能及び第2の学習済みモデル生成機能の説明に供するシーケンス図である。
学習段階の情報処理機能は、第1の学習済みモデル生成処理によって実現される第1の学習済みモデル生成機能と、第2の学習済みモデル生成処理によって実現される第2の学習済みモデル生成機能と、から構成される。
まず第1の学習済みモデル生成機能について説明する。学習済みモデル生成部16に含まれる第1の学習済みモデル生成部9は、処理対象とするシーン名と、被対応者画像30と、1又は複数の被対応物画像40〜43と、の組を決め、シーンテーブルTB1にシーン名を検索キーとして予め生成されたシーンテーブルTB1を検索する(S31)。
第1の学習済みモデル生成部9は、検索結果としてシーンIDをシーンテーブルTB1から取得し(S32)、第1の学習モデルDB1’に、被対応者画像30と、シーンIDと、を1対として学習させる(S33)。
また第1の学習済みモデル生成部9は、モデルテーブルTB2に取得したシーンIDを送信しモデルID取得要求を行う(S34)。モデルテーブルTB2は、受信したシーンIDに対応するモデルIDを生成して、シーンIDとモデルIDとの組み合わせを記憶する。
次に第1の学習済みモデル生成部9は、モデルIDをモデルテーブルTB2から取得する(S35)。学習段階において情報処理装置1は、ステップS31〜S35によって、第1の学習済みモデルDB1を生成する第1の学習済みモデル生成機能を実現する。
次に第2の学習済みモデル生成機能について説明する。学習済みモデル生成部16に含まれる第2の学習済みモデル生成部10は、ステップS32において第1の学習済みモデル生成部9が受信したシーンIDを検索キーとして、予め生成されたシーン・コンテンツテーブルTB4を検索する(S36)。
第2の学習済みモデル生成部10は、検索結果としてコンテンツIDをシーン・コンテンツテーブルTB4から取得し(S37)、取得したコンテンツIDを検索キーとして予め生成されたコンテンツテーブルTB3を検索する(S38)。
第2の学習済みモデル生成部10は、検索結果としてコンテンツをコンテンツテーブルTB3から取得し(S39)、ステップS37で取得したコンテンツIDを検索キーとして予め生成されたコンテンツ・チャンクテーブルTB5を検索する(S40)。
第2の学習済みモデル生成部10は、検索結果としてチャンクIDをコンテンツ・チャンクテーブルTB5から取得し(S41)、取得したチャンクIDを検索キーとして予め生成されたチャンクテーブルTB7を検索する(S42)。
第2の学習済みモデル生成部10は、検索結果としてチャンクをチャンクテーブルTB7から取得し(S43)、ステップS41で取得したチャンクIDを検索キーとして予め生成されたチャンク・メタテーブルTB6を検索する(S44)。
第2の学習済みモデル生成部10は、検索結果として1又は複数のチャンク用メタIDをチャンク・メタテーブルTB6から取得し(S45)、取得したそれぞれのチャンク用メタIDを検索キーとして予め生成されたチャンク用メタテーブルTB8を検索する(S46)。
第2の学習済みモデル生成部10は、検索結果としてそれぞれのチャンク用メタIDに対応するチャンク用メタ値をチャンク用メタテーブルTB8からそれぞれ取得する(S47)。
第2の学習済みモデル生成部10は、ステップS39で取得したコンテンツ、ステップS43で取得したチャンク及びステップS47で取得したそれぞれのチャンク用メタ値に問題がないかを被対応者画像30及び被対応物画像40〜43を参照して確認を行う。
例えば第2の学習済みモデル生成部10は、被対応者21の表情や被対応物22〜25に記載された書類名などを参照して確認を行う。第2の学習済みモデル生成部10は、例えば、被対応者21の表情を被対応者画像30から判定し、被対応物22〜25に記載された書類名を被対応物画像40〜43から判定する。
参照した結果、コンテンツやチャンクやチャンク用メタ値が被対応物画像40〜43に撮像されている書類とは明らかに違う書類についての情報であることが明確であるなどの問題があった場合は対象となる組についての処理を終了する。
次に第2の学習済みモデル生成部10は、第2の学習モデルDB2’にモデルIDと、被対応物画像40(41〜43)と、1又は複数のチャンク用メタIDと、を1対として学習させる(S48)。学習段階において情報処理装置1は、ステップS36〜S48によって、第2の学習済みモデルDB2を生成する第2の学習済みモデル生成機能を実現する。
次に図9を用いて利用段階における情報処理について説明する。図9は、本実施の形態による利用段階における情報処理の処理手順を示すフローチャートである。利用段階における情報処理は、シーン推定処理S60と、チャンク推定処理S80と、チャンク出力処理S100と、から構成される。
まずシーン推定処理S60について説明する。シーン推定処理S60は、ステップS61〜ステップS67から構成される。シーン推定部6は、画像分割部5から被対応者画像30(35)を受信すると(S61)、被対応者画像30(35)を第1の学習済みモデルDB1に入力する(S62)。
シーン推定部6は、第1の学習済みモデルDB1から出力として第1のシーンIDリストを取得し(S63)、ユーザ端末12に第1のシーンIDリストをそのまま送信してキャッシュの有無をユーザ端末12に問い合わせる(S64)。
ユーザ端末12からの返答結果がすべてキャッシュ有りの場合(S65:NO)、シーン推定処理S60は終了しチャンク推定処理S80が開始される。ユーザ端末12からの返答結果が1つでもキャッシュ無しの場合(S65:YES)、シーン推定部6は、シーンテーブルTB1からシーン名リストを取得し(S66)、そのままユーザ端末12に送信し(S67)、シーン推定処理S60は終了する。
次にチャンク推定処理S80について説明する。チャンク推定処理S80は、ステップS81〜ステップS88から構成される。チャンク推定部7は、使用者に選択されたシーン名をユーザ端末12から受信する(S81)。
ユーザ端末12からシーン名を受信すると、チャンク推定部7は、モデルテーブルTB2からモデルIDを取得する(S82)。次にチャンク推定部7は、モデルIDによって複数の第2の学習済みモデルDB2のうちの1つを指定し、画像分割部5から受信した被対応物画像40(41〜43)を指定した第2の学習済みモデルDB2に入力する(S83)。
チャンク推定部7は、第2の学習済みモデルDB2から出力としてチャンク用メタIDリストを取得し(S84)、チャンク・メタテーブルTB6から第1のチャンクIDリストを取得する(S85)。次にチャンク推定部7は、ユーザ端末12に第1のチャンクIDリストをそのまま送信してキャッシュの有無をユーザ端末12に問い合わせる(S86)。
ユーザ端末12からの返答結果がすべてキャッシュ有りの場合(S86:NO)、チャンク推定処理S80は終了しチャンク出力処理S100が開始される。ユーザ端末12からの返答結果が1つでもキャッシュ無しの場合(S86:YES)、チャンク推定部7は、チャンクテーブルTB7からチャンクサマリリストを取得し(S87)、そのままユーザ端末12に送信し(S88)、チャンク推定処理S80は終了する。
次にチャンク出力処理S100について説明する。チャンク出力処理S100は、ステップS101〜ステップS103から構成される。チャンク出力部8は、使用者に選択されたチャンクサマリをユーザ端末12から受信する(S101)。
ユーザ端末12からチャンクサマリを受信すると、チャンク出力部8は、チャンクテーブルTB7からチャンクを取得し(S102)、そのままユーザ端末12に送信し(S103)、チャンク出力処理S100は終了する。
次に図10を用いて学習段階における情報処理について説明する。図10は、本実施の形態による学習段階における情報処理の処理手順を示すフローチャートである。学習段階における情報処理は、第1の学習済みモデル生成処理S120と、第2の学習済みモデル生成処理S140と、から構成される。
まず第1の学習済みモデル生成処理S120について説明する。第1の学習済みモデル生成処理S120は、ステップS121〜ステップS124から構成される。第1の学習済みモデル生成部9は、シーン名と、被対応者画像30(35)と、1又は複数の被対応物画像40(41〜43)と、の組を決めると、シーン名を検索キーとしてシーンテーブルTB1を検索する(S121)。
第1の学習済みモデル生成部9は、検索結果としてシーンテーブルTB1からシーンIDを取得し(S122)、第1の学習モデルDB1’にシーンIDと、被対応者画像30(35)と、を1対として学習させる(S123)。
次に第1の学習済みモデル生成部9は、モデルテーブルTB2にステップS122で取得したシーンIDを送信しモデルID取得要求を行い、モデルIDを取得する(S124)。
次に第2の学習済みモデル生成処理S140について説明する。第2の学習済みモデル生成処理S140は、ステップS141〜ステップS150から構成される。第2の学習済みモデル生成部10は、ステップS122で取得されたシーンIDを検索キーとしてシーン・コンテンツテーブルTB4を検索しコンテンツIDを取得する(S141)。
第2の学習済みモデル生成部10は、取得したコンテンツIDを検索キーとしてコンテンツテーブルTB3を検索しコンテンツを取得する(S142)。また第2の学習済みモデル生成部10は、取得したコンテンツIDを検索キーとしてコンテンツ・チャンクテーブルTB5を検索しチャンクIDを取得する(S143)。
また第2の学習済みモデル生成部10は、取得したチャンクIDを検索キーとしてチャンクテーブルTB7を検索しチャンクを取得する(S144)。また第2の学習済みモデル生成部10は、取得したチャンクIDを検索キーとしてチャンク・メタテーブルTB6を検索し1又は複数のチャンク用メタIDを取得する(S145)。
また第2の学習済みモデル生成部10は、取得した1又は複数のチャンク用メタIDのそれぞれを検索キーとしてチャンク用メタテーブルTB8を検索し、それぞれのチャンク用メタIDに対応するチャンク用メタ値をそれぞれ取得する(S146)。
第2の学習済みモデル生成部10は、ステップS142で取得したコンテンツ、ステップS144で取得したチャンク及びステップS146で取得したそれぞれのチャンク用メタ値に問題がないかを被対応者画像30(35)及び被対応物画像40(41〜43)を参照して確認を行う(S147)。
確認の結果問題があった場合(S148:NO)、処理中の組に関しての学習段階の情報処理は終了する。確認の結果問題がない場合(S148:YES)、第2の学習済みモデル生成部10は、第2の学習モデルDB2’にモデルIDと、1又は複数のチャンク用メタIDと、被対応物画像40(41〜43)と、を1対として学習させ(S149)、処理中の組に関しての学習段階の情報処理は終了する。
以上のように本実施の形態による情報処理装置1によって、作業情報を分割又は示唆したチャンクは、ユーザ端末12を介して提示される。このため、チャンクを適切に設定することで必要な分量の情報を提示することが可能となる。またチャンクを、文書全体を示唆するような情報とすれば、大規模な情報の再構築は不要となる。
モデルテーブルTB2を使用することで、第1の学習済みモデルDB1と第2の学習済みモデルDB2との関係が変わった場合にも、モデルテーブルTB2を変更するだけ対応が可能となり、メンテナンス性に優れた装置を提供できる。
なおモデルテーブルTB2を使用しない場合、第1の学習済みモデルDB1と第2の学習済みモデルDB2との関係が変わった場合には学習済みモデルDB2を再度生成する必要がある。
本実施の形態においては、画像取得部4、画像分割部5、シーン推定部6、チャンク推定部7、チャンク出力部8、第1の学習済みモデル生成部9及び第2の学習済みモデル生成部10及びレコメンド画像出力部13は、プログラムとしたがこれに限らず論理回路でもよい。
また画像取得部4、画像分割部5、シーン推定部6、チャンク推定部7、チャンク出力部8、第1の学習済みモデル生成部9及び第2の学習済みモデル生成部10、レコメンド画像出力部13、第1の学習済みモデルDB1、第1の学習モデルDB1’、第2の学習済みモデルDB2、第2の学習モデルDB2’、シーンテーブルTB1、モデルテーブルTB2、コンテンツテーブルTB3、シーン・コンテンツテーブルTB4、コンテンツ・チャンクテーブルTB5、チャンク・メタテーブルTB6、チャンクテーブルTB7、チャンク用メタテーブルTB8及びレコメンドテーブルTB9は1つの装置に実装されておらず、ネットワークで接続された複数の装置に分散して実装されていてもよい。
また上述の図8及び図10に示した学習段階では、第1の学習済みモデル及び第2の学習済みモデルを関連付けて生成する場合について説明したが、本発明はこれに限らず、第1の学習済みモデルDB1と第2の学習済みモデルDB2とは、別々に生成してもよい。
第1の学習済みモデルDB1と第2の学習済みモデルDB2とを別々に生成する場合、例えばシーンは既存のものであってコンテンツのみを追加する場合などに、シーンに関する学習を行わずに済む。
本実施の形態においては、第2の学習済みモデルDB2を複数使用する場合について述べたが、これに限らず使用する第2の学習済みモデルDB2は1つでもよい。また本実施の形態においては、本来は必要であると推測される被対応物の画像を表示する場合について述べたが、これに限らず本来は必要であると推測される被対応物の一部を表示するようにしてもよい。また本実施の形態においては、本来は不要であると推測される被対応物や被対応物の一部を示唆するようにしてもよい。
本実施の形態の情報処理装置1は、利用段階において、画像分割部によって関連付けられた木構造と、第1の学習済みモデルDB1及び第2の学習済みモデルDB2から出力される値から構成される階層構造と、を比較することで、過不足個所を判定してもよい。
1……情報処理装置、2……中央演算装置、3……主記憶装置、4……画像取得部、5……画像分割部、6……シーン推定部、7……チャンク推定部、8……チャンク出力部、9……第1の学習済みモデル生成部、10……第2の学習済みモデル生成部、11……補助記憶装置、12……ユーザ端末、13……レコメンド画像出力部。

Claims (5)

  1. 対応者の行う作業に関する情報である作業情報を出力する情報処理装置であって、
    前記対応者が対応する被対応者と前記対応者が対応する複数の被対応物とを含む画像である元画像を取得する画像取得部と、
    前記元画像を分割し前記被対応者が撮像された被対応者画像とそれぞれの前記被対応物が撮像された複数の被対応物画像とに分割する画像分割部と、
    前記被対応者画像と、対応者が行う状況であるシーンを一意に示すシーンIDと、の間における連関性が記憶されている第1の学習済みモデルを使用して、前記シーンを推定するシーン推定部と、
    前記複数の前記被対応物画像と、前記作業情報を分割又は示唆した情報であるチャンクを一意に示すチャンクIDと、1対1に対応付けられた1又は複数のチャンク用メタIDと、の間における連関性が記憶されている複数の第2の学習済みモデルのうちの1つを使用して、前記チャンクを推定するチャンク推定部と、
    前記チャンクを出力する出力部と、を備え、
    前記チャンク推定部は、前記複数の第2の学習済みモデルのうちの1つを、シーンIDと1対1に対応付けられたモデルIDを用いて選定し、前記チャンク用メタIDは前記被対応物の性質に関する情報であるチャンク用メタ値を一意に示す、情報処理装置。
  2. さらにレコメンド画像出力部を備えてもよく、前記レコメンド画像出力部は、モデルIDと1又は複数のチャンク用メタIDの組み合わせとを検索キーとして、推奨被対応物画像を検索し、前記推奨被対応物画像は、前記元画像には撮像されていないが本来は必要であると推測される前記被対応物の画像である、請求項1に記載の情報処理装置。
  3. 前記画像分割部は、前記被対応者を根ノードとし、前記複数の前記被対応物を葉ノード又は内部ノードとした木構造として、前記被対応者と、前記複数の前記被対応物とを関連付ける、
    請求項1に記載の情報処理装置。
  4. 前記画像分割部は、さらに前記被対応物の少なくとも1つに含まれる情報を取得して葉ノードとして前記木構造に関連付ける、請求項3に記載の情報処理装置。
  5. 対応者の行う作業に関する情報である作業情報を出力する情報処理装置が行う情報処理方法であって、
    前記対応者が対応する被対応者と前記対応者が対応する複数の被対応物とを含む画像である元画像を取得する第1のステップと、
    前記元画像を分割し前記被対応者が撮像された被対応者画像とそれぞれの前記被対応物が撮像された複数の被対応物画像とに分割する第2のステップと、
    前記被対応者画像と、対応者が行う状況であるシーンを一意に示すシーンIDと、の間における連関性が記憶されている第1の学習済みモデルを使用して、前記シーンを推定する第3のステップと、
    前記複数の前記被対応物画像と、前記作業情報を分割又は示唆した情報であるチャンクを一意に示すチャンクIDと、1対1に対応付けられた1又は複数のチャンク用メタIDと、の間における連関性が記憶されている複数の第2の学習済みモデルのうちの1つを使用して、前記チャンクを推定する第4のステップと、
    前記チャンクを出力する第5のステップと、を備え、
    前記複数の第2の学習済みモデルのうちの1つはシーンIDと1対1に対応付けられたモデルIDを用いて選定され、前記チャンク用メタIDは前記被対応物の性質に関する情報であるチャンク用メタ値を一意に示す、情報処理方法。
JP2020082018A 2020-05-07 2020-05-07 情報処理装置及び情報処理方法 Active JP6800453B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2020082018A JP6800453B1 (ja) 2020-05-07 2020-05-07 情報処理装置及び情報処理方法
CN202180005310.0A CN114424183A (zh) 2020-05-07 2021-04-30 信息处理装置和信息处理方法
DE112021000030.6T DE112021000030T5 (de) 2020-05-07 2021-04-30 Informationsverarbeitungsvorrichtung und Informationsverarbeitungsverfahren
US17/610,215 US11900301B2 (en) 2020-05-07 2021-04-30 Information processing device and information processing method
PCT/JP2021/017204 WO2021225118A1 (ja) 2020-05-07 2021-04-30 情報処理装置及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020082018A JP6800453B1 (ja) 2020-05-07 2020-05-07 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JP6800453B1 JP6800453B1 (ja) 2020-12-16
JP2021177285A true JP2021177285A (ja) 2021-11-11

Family

ID=73740900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020082018A Active JP6800453B1 (ja) 2020-05-07 2020-05-07 情報処理装置及び情報処理方法

Country Status (5)

Country Link
US (1) US11900301B2 (ja)
JP (1) JP6800453B1 (ja)
CN (1) CN114424183A (ja)
DE (1) DE112021000030T5 (ja)
WO (1) WO2021225118A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6651189B1 (ja) 2019-03-29 2020-02-19 株式会社 情報システムエンジニアリング 機械学習用のデータ構造、学習方法及び情報提供システム
JP6846765B1 (ja) * 2020-03-26 2021-03-24 株式会社 情報システムエンジニアリング 情報処理プログラム
US11893464B1 (en) * 2023-03-16 2024-02-06 edYou Apparatus and methods for training an educational machine-learning model

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043437A (ja) * 2010-08-17 2012-03-01 Fujitsu Ltd 画像処理方法及び画像処理装置
JP2018097580A (ja) * 2016-12-13 2018-06-21 富士ゼロックス株式会社 情報処理装置およびプログラム
JP2018112777A (ja) * 2017-01-06 2018-07-19 富士通株式会社 推奨アイテム出力プログラム、出力制御プログラム、推奨アイテム出力装置、出力制御装置、推奨アイテム出力方法および出力制御方法
JP6651190B1 (ja) * 2019-03-29 2020-02-19 株式会社 情報システムエンジニアリング 機械学習用のデータ構造、学習方法及び情報提供システム

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892571B2 (en) * 2004-10-12 2014-11-18 International Business Machines Corporation Systems for associating records in healthcare database with individuals
US7809722B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
JP5625642B2 (ja) * 2010-09-06 2014-11-19 ソニー株式会社 情報処理装置、データ分割方法及びデータ分割プログラム
JP2014137750A (ja) * 2013-01-17 2014-07-28 Hitachi Solutions Ltd 情報処理装置、情報処理システム及び情報処理プログラム
US9607217B2 (en) * 2014-12-22 2017-03-28 Yahoo! Inc. Generating preference indices for image content
JP6660784B2 (ja) * 2016-03-24 2020-03-11 Run.Edge株式会社 表示制御プログラム、方法、及び表示制御装置
US10515265B2 (en) 2016-12-27 2019-12-24 Captricity, Inc. Generating variations of a known shred
CA3049148A1 (en) * 2017-01-24 2018-08-02 Tietronix Software, Inc. System and method for three-dimensional augmented reality guidance for use of medical equipment
EP3584717A1 (en) * 2017-08-01 2019-12-25 Samsung Electronics Co., Ltd. Electronic device and method for providing search result thereof
US11334762B1 (en) * 2017-09-07 2022-05-17 Aurora Operations, Inc. Method for image analysis
KR102599947B1 (ko) * 2017-10-27 2023-11-09 삼성전자주식회사 관련 이미지를 검색하기 위한 전자 장치 및 이의 제어 방법
US12099344B2 (en) * 2017-11-03 2024-09-24 R4N63R Capital Llc Workspace actor selection systems and methods
CN109871527A (zh) * 2017-12-01 2019-06-11 武汉楚鼎信息技术有限公司 一种基于分词的语义识别方法
JP6321879B1 (ja) 2017-12-20 2018-05-09 グレイステクノロジー株式会社 作業支援システム及び作業支援プログラム
JP7122625B2 (ja) * 2018-07-02 2022-08-22 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
JP6542445B1 (ja) * 2018-07-31 2019-07-10 株式会社 情報システムエンジニアリング 情報提供システム及び情報提供方法
JP7192109B2 (ja) * 2018-10-12 2022-12-19 ノキア テクノロジーズ オサケユイチア コンテキスト埋め込みおよび領域ベースの物体検出のための方法および装置
CN113302620B (zh) * 2018-11-13 2024-09-10 辉达公司 使用机器学习模型确定对象与人之间的关联
US11429893B1 (en) * 2018-11-13 2022-08-30 Amazon Technologies, Inc. Massively parallel real-time database-integrated machine learning inference engine
US20200265363A1 (en) * 2019-02-15 2020-08-20 Wipro Limited Method and system for determining working condition of a worker performing qualitative evaluation of products
CN109858569A (zh) * 2019-03-07 2019-06-07 中国科学院自动化研究所 基于目标检测网络的多标签物体检测方法、系统、装置
JP6647668B1 (ja) * 2019-03-29 2020-02-14 株式会社 情報システムエンジニアリング 機械学習用のデータ構造、学習方法及び情報提供システム
JP6651189B1 (ja) * 2019-03-29 2020-02-19 株式会社 情報システムエンジニアリング 機械学習用のデータ構造、学習方法及び情報提供システム
US11804014B1 (en) * 2019-04-22 2023-10-31 Apple Inc. Context-based application placement
US11593704B1 (en) * 2019-06-27 2023-02-28 Amazon Technologies, Inc. Automatic determination of hyperparameters
US10607331B1 (en) * 2019-06-28 2020-03-31 Corning Incorporated Image segmentation into overlapping tiles
US20210027098A1 (en) * 2019-07-22 2021-01-28 Shenzhen Malong Technologies Co., Ltd. Weakly Supervised Image Segmentation Via Curriculum Learning
US11232147B2 (en) * 2019-07-29 2022-01-25 Adobe Inc. Generating contextual tags for digital content
US11126855B2 (en) * 2019-08-08 2021-09-21 Robert Bosch Gmbh Artificial-intelligence powered ground truth generation for object detection and tracking on image sequences
US11393253B1 (en) * 2019-09-16 2022-07-19 Amazon Technologies, Inc. Using sensor data to determine activity
EP4024297A4 (en) * 2019-09-16 2022-11-09 Huawei Cloud Computing Technologies Co., Ltd. ARTIFICIAL INTELLIGENCE (AI) MODEL EVALUATION METHOD AND SYSTEM, AND DEVICE
US11741168B1 (en) * 2019-09-30 2023-08-29 Amazon Technologies, Inc. Multi-label document classification for documents from disjoint class sets
US11295165B1 (en) * 2019-09-30 2022-04-05 Amazon Technologies, Inc. Systems, methods, and apparatuses for determining data relevance and labeling, model updating, and deployment
US11531846B1 (en) * 2019-09-30 2022-12-20 Amazon Technologies, Inc. Extending sensitive data tagging without reannotating training data
CN111161301B (zh) * 2019-12-31 2021-07-27 上海商汤智能科技有限公司 图像分割方法及装置、电子设备和存储介质
US11734937B1 (en) * 2020-01-02 2023-08-22 Amazon Technologies, Inc. Creating text classification machine learning models
US11531571B2 (en) * 2020-01-29 2022-12-20 Walmart Apollo, Llc Systems and methods for processing of catalog items with a plurality of models
CN111340819B (zh) * 2020-02-10 2023-09-12 腾讯科技(深圳)有限公司 图像分割方法、装置和存储介质
US11301705B2 (en) * 2020-02-27 2022-04-12 Western Digital Technologies, Inc. Object detection using multiple neural network configurations
CN113361549A (zh) * 2020-03-04 2021-09-07 华为技术有限公司 一种模型更新方法以及相关装置
JP7145440B2 (ja) * 2020-03-26 2022-10-03 パナソニックIpマネジメント株式会社 学習データ生成方法、学習データ生成装置、及び、プログラム
JPWO2021200503A1 (ja) * 2020-03-31 2021-10-07
CN113688851B (zh) * 2020-05-18 2023-09-15 华为云计算技术有限公司 数据标注方法和装置和精细粒度识别方法和装置
CN111723813B (zh) * 2020-06-05 2021-07-06 中国科学院自动化研究所 基于类内判别器的弱监督图像语义分割方法、系统、装置
KR20230021144A (ko) * 2020-06-13 2023-02-13 구글 엘엘씨 사용자 선호도를 반영한 기계 학습 기반 이미지 압축 세팅
US11682065B2 (en) * 2020-06-16 2023-06-20 Fujifilm Business Innovation Corp. Systems and methods for reducing service errors for restaurants
CN111797771B (zh) * 2020-07-07 2022-09-09 南京理工大学 一种基于迭代学习的弱监督视频行为检测方法及系统
CN111950596B (zh) * 2020-07-15 2024-09-20 华为技术有限公司 一种用于神经网络的训练方法以及相关设备
US11816188B2 (en) * 2020-08-31 2023-11-14 Sap Se Weakly supervised one-shot image segmentation
US11854242B2 (en) * 2020-09-23 2023-12-26 Apple Inc. Systems and methods for providing personalized saliency models
US20220122360A1 (en) * 2020-10-21 2022-04-21 Amarjot Singh Identification of suspicious individuals during night in public areas using a video brightening network system
KR102593754B1 (ko) * 2020-11-11 2023-10-26 부산대학교 산학협력단 이미지 분류 모델의 학습 방법 및 이미지 분류 모델의 학습 시스템
US11676279B2 (en) * 2020-12-18 2023-06-13 Adobe Inc. Utilizing a segmentation neural network to process initial object segmentations and object user indicators within a digital image to generate improved object segmentations
US11893792B2 (en) * 2021-03-25 2024-02-06 Adobe Inc. Integrating video content into online product listings to demonstrate product features
US11842540B2 (en) * 2021-03-31 2023-12-12 Qualcomm Incorporated Adaptive use of video models for holistic video understanding
US20230178216A1 (en) * 2021-12-07 2023-06-08 Insight Direct Usa, Inc. Adjusting mental state to improve task performance and coaching improvement

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043437A (ja) * 2010-08-17 2012-03-01 Fujitsu Ltd 画像処理方法及び画像処理装置
JP2018097580A (ja) * 2016-12-13 2018-06-21 富士ゼロックス株式会社 情報処理装置およびプログラム
JP2018112777A (ja) * 2017-01-06 2018-07-19 富士通株式会社 推奨アイテム出力プログラム、出力制御プログラム、推奨アイテム出力装置、出力制御装置、推奨アイテム出力方法および出力制御方法
JP6651190B1 (ja) * 2019-03-29 2020-02-19 株式会社 情報システムエンジニアリング 機械学習用のデータ構造、学習方法及び情報提供システム

Also Published As

Publication number Publication date
WO2021225118A1 (ja) 2021-11-11
JP6800453B1 (ja) 2020-12-16
DE112021000030T5 (de) 2022-04-21
US20220245558A1 (en) 2022-08-04
US11900301B2 (en) 2024-02-13
CN114424183A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
WO2021225118A1 (ja) 情報処理装置及び情報処理方法
US8838681B2 (en) Systems and methods for adding digital content to content management service accounts
CN100462967C (zh) 文档管理服务器、系统和方法以及该系统的客户机和节点
US11461341B2 (en) Identifying relevant information within a document hosting system
US7321919B2 (en) System and method for collaborative image selection
US10216778B2 (en) Indexing and searching heterogenous data entities
US7933972B1 (en) Method and system for organizing categories of content in a distributed network
CN104199863B (zh) 存储设备上的文件的查找方法、装置及路由器
US20160364413A9 (en) Tagging digital images
KR20100129783A (ko) 디지털 영상 컬렉션에 자동 얼굴 인식 기능을 통합하는 방법 및 장치
WO2010076625A1 (en) Method, apparatus and computer program product for providing analysis and visualization of content items association
AU2014361702A1 (en) System and method for creating and transferring media files
JP2007316939A (ja) 電子アルバム提供装置、および画像ネットワークシステム
WO2022019222A1 (ja) 情報処理装置及び情報処理方法
CN107077576A (zh) 网络上的操作限制实施
JP5458861B2 (ja) 文書検索装置、プログラム、文書登録装置、および文書検索システム
JP6818308B1 (ja) 情報処理装置及び情報処理方法
JP6020196B2 (ja) 情報提供装置及びプログラム
JP6846765B1 (ja) 情報処理プログラム
JP7398944B2 (ja) 電子アルバム生成装置、電子アルバム生成方法及びプログラム
Kautz et al. Creating models of real-world communities with ReferralWeb
KR20200143323A (ko) 빅데이터를 활용한 영상 자동 편집 단말기 및 이를 포함하는 영상 자동 편집 시스템
WO2022124419A1 (ja) 情報処理装置、情報処理方法及び情報処理システム
JP7232741B2 (ja) 情報処理システム、サーバ、情報処理方法
JP6973178B2 (ja) 情報処理装置、システム、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200507

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201029

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20201104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201112

R150 Certificate of patent or registration of utility model

Ref document number: 6800453

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150