JP2022119207A - 機械学習および自然言語処理を利用したワクチン接種データの抽出および確認 - Google Patents

機械学習および自然言語処理を利用したワクチン接種データの抽出および確認 Download PDF

Info

Publication number
JP2022119207A
JP2022119207A JP2022014426A JP2022014426A JP2022119207A JP 2022119207 A JP2022119207 A JP 2022119207A JP 2022014426 A JP2022014426 A JP 2022014426A JP 2022014426 A JP2022014426 A JP 2022014426A JP 2022119207 A JP2022119207 A JP 2022119207A
Authority
JP
Japan
Prior art keywords
data
vaccination
document data
specific
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022014426A
Other languages
English (en)
Other versions
JP7364709B2 (ja
Inventor
ロバート プリスタ,ジェームズ
Robert Priestas James
リン オガラ,タラ
Lynn O'gara Tara
エドワード シマネック,マイケル
Edward Simanek Michael
ラドバウド ドンケル,マタイス
Radboud Donker Matthijs
ジェシー ロビンソン,マイケル
Jesse Robinson Michael
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Accenture Global Solutions Ltd
Original Assignee
Accenture Global Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Accenture Global Solutions Ltd filed Critical Accenture Global Solutions Ltd
Publication of JP2022119207A publication Critical patent/JP2022119207A/ja
Application granted granted Critical
Publication of JP7364709B2 publication Critical patent/JP7364709B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/86Mapping to a database
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Machine Translation (AREA)

Abstract

【課題】文書からワクチン接種データを抽出して確認する方法及びデバイスを提供する。【解決手段】方法は、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを受信するブロック510と、処理済み文書データを生成するために自然言語処理を文書データに対して実行するブロック520と、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理するブロック530と、ワクチン接種データをデータ構造の対応するフィールドに転記するブロック540と、特定のユーザに関連するワクチン接種データを求めるリクエストを受信するブロック550と、リクエストに基づき、データ構造の対応するフィールドからワクチン接種データを読み出すブロック560と、ワクチン接種データの確認を可能にするために、ワクチン接種データを提供するブロック570と、を含む。【選択図】図5

Description

技術分野
本開示は、全般的に、機械学習および自然言語処理を利用してワクチン接種データの抽出および確認を行う方法およびシステムに関する。
関連出願の相互参照
本特許出願は、「機械学習および自然言語処理を利用したワクチン接種データの抽出および確認(UTILIZING MACHINE LEARNING AND NATURAL LANGUAGE PROCESSING TO EXTRACT AND VERIFY VACCINATION DATA)」という題の、2021年2月3日出願の米国特許仮出願第63/199,920号および2021年3月15日出願の米国特許出願第17/249,819号の優先権を主張するものである。先行出願の開示は、本特許出願の一部とみなされ、参照により本特許出願に援用される。
コロナウイルス感染症(COVID:coronavirus disease)に関する情報収集の目的で、様々なタイプのフォームまたは文書が広く使用されている。医療系、商業系、教育系、および政府系の組織は、COVIDに関連する情報を収集するため、および記録保持目的のために、COVIDに関する様々なフォーマット(例えば、米国疾病予防管理センター(CDC:Centers for Disease Control)のCOVIDワクチン接種記録カード、他の米国およびその他の国々のCOVIDワクチン接種フォーム、COVIDワクチン証明フォーム、COVID抗原/抗体臨床検査、ならびにCOVIDに関するフォームなどに関連するフォーマット類)の文書を使用している。
一部の実装において、方法は、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを受信するステップと、処理済み文書データを生成するために自然言語処理を文書データに対して実行するステップとを含んでもよい。方法は、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理するステップと、ワクチン接種データをデータ構造の対応するフィールドに転記するステップとを含んでもよい。方法は、ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員に関連するユーザデバイスから受信するステップと、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出すステップとを含んでもよい。方法は、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供するステップを含んでもよい。
上記の方法の一部の実装において、方法は、過去のワクチン接種に関連する過去の構造化文書および非構造化文書を特定する過去の文書データを用いて、機械学習モデルを、文書データを受信する前に訓練するステップをさらに含んでもよい。
上記の方法の一部の実装において、構造化文書は、一定のフォーマットで情報を配置することを可能にする埋め込みコードを含んでもよく、非構造化文書は、元の文書からの情報の構造、スタイル、およびコンテンツが保持されない自由形式の配置を含んでもよい。
上記の方法の一部の実装において、方法は、共通のフォーマットを持つ均質な文書を生成するためにコンピュータビジョンモデルまたは光学式文字認識を用いて文書データを処理するステップをさらに含んでもよく、処理済み文書データを生成するために自然言語処理を文書データに対して実行するステップは、処理済み文書データを生成するために自然言語処理を均質な文書に対して実行するステップを含む。
上記の方法の一部の実装において、方法は、特定のリクエストが、特定のワクチン接種データにアクセスするためのアクセス制御要件を満たすと判断するステップをさらに含んでもよい。
上記の方法の一部の実装において、方法は、対応するフィールドからのワクチン接種データについて登録機関に確認するステップをさらに含んでもよい。
上記の方法の一部の実装において、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理するステップは、処理済み文書データをカテゴリに分類するステップと、処理済み文書データからワクチン接種データをカテゴリに基づき抽出するステップとを含んでもよい。
一部の実装において、デバイスは、1つ以上のメモリと、1つ以上のプロセッサとを含み、1つ以上のプロセッサは、過去のワクチン接種に関連する過去の構造化文書および非構造化文書を特定する過去の文書データを用いて機械学習モデルを訓練し、文書データを求めるリクエストを提供する。1つ以上のプロセッサは、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、リクエストに基づき受信してもよく、処理済み文書データを生成するために自然言語処理を文書データに対して実行してもよい。1つ以上のプロセッサは、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理してもよく、ワクチン接種データをデータ構造の対応するフィールドに代入してもよい。1つ以上のプロセッサは、対応するフィールドからのワクチン接種データについて登録機関に確認してもよく、ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを機関の職員に関連するユーザデバイスから受信してもよい。1つ以上のプロセッサは、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出してもよく、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供してもよい。
上記のデバイスの一部の実装において、構造化文書は、一定のフォーマットを含み、非構造化文書は、異なる複数のフォーマットを含み、1つ以上のプロセッサは、自然言語処理を文書データに対して実行する前に、構造化文書の一定のフォーマットおよび非構造化文書の異なる複数のフォーマットを、共通のフォーマットに変換するようにさらに構成されてもよい。
上記のデバイスの一部の実装において、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理するべく、1つ以上のプロセッサは、処理済み文書データにおける1つ以上の相違を特定することと、1つ以上の相違に関連するフィードバックを受信することと、処理済み文書データからワクチン接種データをフィードバックに基づき抽出することとをするように構成されてもよい。
上記のデバイスの一部の実装において、対応するフィールドからのワクチン接種データについて登録機関に確認するべく、1つ以上のプロセッサは、ワクチン接種データにおける1つ以上の相違を特定するフィードバックを登録機関から受信することと、修正されたワクチン接種データを生成するために、フィードバックにおいて特定された1つ以上の相違を修正することと、修正されたワクチン接種データについて登録機関に確認することとをするように構成されてもよい。
上記のデバイスの一部の実装において、1つ以上のプロセッサは、機関の職員に関連するユーザデバイスから、特定のワクチン接種データに関連する追加情報のリクエストを受信することと、追加情報のリクエストに基づき追加情報を特定することと、特定のワクチン接種データの確認を可能にするために、追加情報を機関の職員に関連するユーザデバイスに提供することとをするようにさらに構成されてもよい。
上記のデバイスの一部の実装において、1つ以上のプロセッサは、ユーザに関連する特定のワクチン接種データに対する更新を受信することと、更新に基づきデータ構造内の特定のワクチン接種データを更新することとをするようにさらに構成されてもよい。
上記のデバイスの一部の実装において、機械学習モデルは、ドメイン固有の専門用語に関連する機械学習ベースのドメインモデルを含んでもよい。
一部の実装において、非一時的コンピュータ可読媒体は、1つ以上の命令を含む命令のセットを保存してもよく、1つ以上の命令は、デバイスの1つ以上のプロセッサにより実行されると、文書データを求めるリクエストを提供することと、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、リクエストに基づき受信することとをデバイスにさせる。1つ以上の命令は、処理済み文書データを生成するために自然言語処理を文書データに対して実行することと、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理することとをデバイスにさせてもよい。1つ以上の命令は、ワクチン接種データをデータ構造の対応するフィールドに転記することと、対応するフィールドからのワクチン接種データについて登録機関に確認することとをデバイスにさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の実装において、1つ以上の命令は、ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員に関連するユーザデバイスから受信することと、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出すことと、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供することとをデバイスにさらにさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の実装において、1つ以上の命令は、共通のフォーマットを持つ均質な文書を生成するためにコンピュータビジョンモデルまたは光学式文字認識を用いて文書データを処理することをデバイスにさらにさせてもよく、処理済み文書データを生成するために自然言語処理を文書データに対して実行することをデバイスにさせる1つ以上の命令は、処理済み文書データを生成するために自然言語処理を均質な文書に対して実行することをデバイスにさらにさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の実装において、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理することをデバイスにさせる1つ以上の命令は、処理済み文書データをカテゴリに分類することと、処理済み文書データからワクチン接種データをカテゴリに基づき抽出することとをデバイスにさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の実装において、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理することをデバイスにさせる1つ以上の命令は、処理済み文書データにおける1つ以上の相違を特定することと、1つ以上の相違に関連するフィードバックを受信することと、処理済み文書データからワクチン接種データをフィードバックに基づき抽出することとをデバイスにさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の実装において、対応するフィールドからのワクチン接種データについて登録機関に確認することをデバイスにさせる1つ以上の命令は、ワクチン接種データにおける1つ以上の相違を特定するフィードバックを登録機関から受信することと、修正されたワクチン接種データを生成するために、フィードバックにおいて特定された1つ以上の相違を修正することと、修正されたワクチン接種データについて登録機関に確認することとをデバイスにさせてもよい。
本願明細書に記載されている例示の実装の図である。 本願明細書に記載されている例示の実装の図である。 本願明細書に記載されている例示の実装の図である。 本願明細書に記載されている例示の実装の図である。 本願明細書に記載されている例示の実装の図である。 ワクチン接種データの抽出および確認に関連して、機械学習モデルを訓練して使用する例を示す図である。 本願明細書に記載されるシステムおよび/または方法が実装され得る例示の環境の図である。 図3の1つ以上のデバイスの例示のコンポーネントの図である。 機械学習および自然言語処理を利用してワクチン接種データの抽出および確認を行う例示のプロセスのフローチャートである。
例示の実装についての以下の詳細な説明では、添付の図面を参照する。異なる図面にある同じ参照番号は、同じまたは類似の構成要素を特定し得る。
コンピュータおよび通信ネットワークが出現した結果、文書はオンラインで記入されるようになり、人々はもはや紙のフォームに書き込む必要がなくなった。さらに今では、紙の文書の電子コピーおよびスキャンされたコピーを含むデジタル化された記録もコンピュータを使用して生成されている。このような電子文書は通信ネットワーク上で共有され、他の場合であれば紙の文書を生成してやり取りするために必要となるであろう時間およびリソースが節約される。このような文書は、構造化フォーマットおよび非構造化フォーマットのデータを含むことがある。構造化文書は、情報を一定のフォーマットで配置することを可能にする埋め込みコードを含むことがある。非構造化文書は、自由形式の配置を含み、元の文書内の情報の構造、スタイル、およびコンテンツは保持されないことがある。多数の事業体が、複数のソースからのコンテンツを含むこともある大きな非構造化電子文書を作成し、保存している。
昨今のCDCガイドラインおよび政府規制が理由で、様々なシステムが、医療文書からの情報を利用して迅速なタイムフレームで動作を実行しようと試みてきた。フォーム内の既知の位置にフィールドがある場合(例えば表形式配置のデータ)にフォーム内のフィールドからデータを抽出することなど、フォーマットが明確に定義されている構造化文書から情報をプログラムにより抽出することは、比較的容易である。一方、文書が大きな非構造化文書を含む場合、システムによる動作の実行に必要とされ得る情報を抽出することは、技術的に困難である。非構造化文書のフォーマットは明確に定義されていないことが多く、そのような文書からの情報に対してプログラムにより構文解析および抽出を行うことを困難にしている。文書の多くは手書きであり、このことが情報を自動的に抽出することをいっそう困難にしている。
したがって、非構造化文書を用いて動作を実行する現行の技術は、非構造化文書から情報を不正確に抽出すること、不正確な情報に基づき不適切な決定を下すこと、不正確な情報に基づき不正確な動作を実行すること、および/または同様のことに関連するコンピューティングリソース(例えば処理リソース、メモリリソース、通信リソース、および/または同様のもの)、ネットワーキングリソース、人的リソース、および/または同様のものを浪費している。
本願明細書に記載されている一部の実装は、機械学習および自然言語処理を利用してワクチン接種データの抽出および確認を行う確認システムに関する。例として確認システムは、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、リクエストに基づき受信してもよく、処理済み文書データを生成するために自然言語処理を文書データに対して実行してもよい。確認システムは、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理してもよく、ワクチン接種データをデータ構造の対応するフィールドに転記してもよい。確認システムは、ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを機関の職員に関連するユーザデバイスから受信してもよく、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出してもよい。確認システムは、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供してもよい。
このように確認システムは、機械学習および自然言語処理を利用してワクチン接種データの抽出および確認を行う。確認システムは、構造化文書および非構造化文書などの電子文書を処理して、必要な情報を抽出し、抽出された情報に基づくプロセスの自動的な実行を可能にし得る。確認システムは、抽出された情報を利用して、プロセスの自動的な実行中のフォーム、契約書、および/または同様のものなどの生成を可能にする内部マスタ文書を構築し得る。これがひいては、他の場合であれば非構造化文書から情報を不正確に抽出すること、不正確な情報に基づき不適切な決定を下すこと、不正確な情報に基づき不正確な動作を実行すること、および/または同様のことに浪費されていたであろうコンピューティングリソース、ネットワーキングリソース、人的リソース、および/または同様のものを節約する。
図1A~図1Eは、機械学習および自然言語処理を利用してワクチン接種データの抽出および確認を行うことに関連する例100の図である。図1A~図1Eに示されているように、例100は、ユーザに関連するユーザデバイスと、確認システムとを含む。ユーザデバイスおよび確認システムについては、以下にさらに詳細に記載される。
図1Aに参照番号105により示されているように、確認システムは、文書データを求めるリクエストをユーザに提供してもよい。例として確認システムは、文書データを求めるリクエストを、ユーザに関連するユーザデバイスに提供してもよい。一部の実装においてユーザデバイスは、文書データを確認システムに自動的または定期的に提供することをユーザデバイスにさせるアプリケーションを含んでもよい。そのような実装では、確認システムが文書データを求めるリクエストを生成してユーザデバイスに提供する必要はない。
図1Aに参照番号110によりさらに示されているように、確認システムは、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、リクエストに基づき受信してもよい。例としてユーザデバイスは、リクエストに基づき文書データを生成してもよく、その文書データを確認システムに提供してもよい。確認システムは、文書データをユーザデバイスから受信してもよい。一部の実装においてユーザデバイスは、文書データを確認システムに自動的または定期的に提供することをユーザデバイスにさせるアプリケーションを含んでもよい。一部の実装において確認システムは、ユーザデバイス以外のデバイスにリクエストを提供し、1つ以上のサーバデバイス、クラウドコンピューティング環境、および/または同様のものからなど、ユーザデバイス以外のデバイスから文書データを受信してもよい。
文書データは、患者名(例えばユーザ名)、COVIDの検査結果、製薬会社名、検体番号、ワクチンロット番号、診療所情報、および/または同様のものを含む構造化文書および非構造化文書を特定してもよい。COVIDに関する情報収集の目的で、様々なタイプの文書が使用され得る。医療系、商業系、教育系、および政府系の組織は、CDCのCOVIDワクチン接種記録カード、その他COVIDワクチン接種フォーム、COVIDワクチン接種証明フォーム、COVID抗原/抗体臨床検査、COVIDとの接触に関連する情報を収集するためのCOVIDに関するフォーム、および/または同様のものなど、COVIDに関する様々なフォーマットの文書を使用している。構造化文書は、情報を一定のフォーマットで配置することを可能にする埋め込みコードを含むことがある。例として埋め込みコードは、構造化文書について、一定のフォーマットと、一定のフォーマットでの情報の配置方法とを定義することがある。非構造化文書は、自由形式の配置(例えば複数のフォーマット)を含むことがあり、元の文書内の情報の構造、スタイル、およびコンテンツは非構造化文書において保持されないことがある。一部の事業体は、複数のソースからのコンテンツを含むこともある大量の非構造化文書を作成し、保存することがある。
図1Bに参照番号115により示されているように、確認システムは、処理済み文書データを生成するために自然言語処理を文書データに対して実行してもよい。例として確認システムは、自然言語処理を文書データに対して実行して、文書データにおいて提供されたテキスト情報(例えば手書き文字、表中に提供されているテキストフィールド、グラフ中に提供されている文字、および/または同様のもの)を解読してもよい。テキスト情報は、それぞれのユーザが、COVIDのワクチン接種を1回受けたかどうか、COVIDのワクチンを2回受けたかどうか、COVIDの検査で陰性であったかどうか、COVIDへの曝露がないことを確認するフォームに書き込んだかどうか、および/または同様のことを示してもよい。
一部の実装において確認システムは、自然言語処理を実行する前に、(例えば文書データからの)異なるフォーマットの文書を、コンピュータビジョンモデル、光学式文字認識(OCR:optical character recognition)、および/または同様のものを介して、(例えば共通のフォーマットを持つ)均質な文書に変換してもよい。確認システムは、文書データを均質な文書に変換することにより、自然言語処理により生成される処理済み文書データの精度を改善してもよく、処理済み文書データにおける矛盾(例えば相違)の(例えば後述の)機械学習モデルによる自動的な解消を強化してもよく、ワクチン接種データを含むマスタデータ構造の生成を強化してもよい。文書データの構造化文書および非構造化文書は、タイプされたテキストデータ、手書き文字、表、グラフ、およびその他の非テキストフォーマットとして提示されるデータ、ならびに/または同様のものなど、様々なフォーマット(例えば不均質なデータ)を含んでもよい。確認システムは、そのような、異なるフォーマットを持つ不均質なデータを分析して、不均質なデータにおいて提示されている情報を特定し、比較してもよい。このようにして確認システムは、自然言語処理および機械学習モデルの速度および正確さを向上させることができ、それによりコンピューティングリソース、ネットワーキングリソース、および/または同様のものを節約し得る。さらに確認システムは、外部コンピューティングシステムが、異なるデータフォーマットの不均質な文書からデータを抽出するのではなく、データを均質な文書として直接消費することを可能にし得る。
図1Cに参照番号120により示されているように、確認システムは、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理してもよい。例として機械学習モデルは、ユーザ名、COVIDの検査結果、医薬品会社名、検体番号、ワクチンロット番号、診療所情報、および/または同様のものを処理済み文書データから抽出してもよい。一部の実装において機械学習モデルは、台帳または他の何らかのデータベースと対照して処理済み文書データの確認を行うために使用できるカテゴリに処理済み文書データを分類する、分類器モデルである。
機械学習モデルは、文書データの文書に含まれ得るドメイン固有の専門用語、業界用語の定義、および/または様々なデータタイプの想定されるフィールドを含む、機械学習ベースのドメインモデルを含んでもよい。したがって機械学習モデルは、そのような情報を利用して、文書中のワクチン接種データ(例えば患者名、COVIDの検査結果、医薬品会社、検体番号、ワクチンロット番号、診療所、および/または同様のもの)を特定してもよい。確認システムは、文書データに含まれる文書に基づきインテントを特定してもよく、インテントに基づき機械学習ベースの複数のドメインモデルから機械学習モデルを選択してもよい。インテントは、文書データに関連するドメインの識別子または別の指標を含んでもよい。結果的に、確認システムにより選択された機械学習ベースのドメインモデルに基づき、異なるワクチン接種データが抽出されてもよい。
一部の実装では、機械学習モデルは、処理済み文書データにおける1つ以上の矛盾(例えば相違)を特定してもよく、1つ以上の矛盾に対する1つ以上の解決策を判断してもよい。あるいは、またはさらに、機械学習モデルは、1つ以上の矛盾に関連するフィードバックを受信してもよい。機械学習モデルは、処理済み文書データからワクチン接種データを、1つ以上の解決策および/またはフィードバックに基づき抽出してもよい。図2に関連して後述されるように、機械学習モデルは、文書データを受信する前に、過去のワクチン接種に関連する過去の構造化文書および非構造化文書を特定する過去の文書データを用いて訓練されてもよい。
図1Dに参照番号125により示されているように、確認システムは、ワクチン接種データをデータ構造の対応するフィールドに転記してもよい。例としてデータ構造は、患者名、COVIDの検査結果、医薬品会社名、検体番号、ワクチンロット番号、診療所、および/または同様のもののためのフィールドを含んでもよく、確認システムは、ワクチン接種データをそのようなフィールドに転記または代入してもよい。データ構造は、異なるデータフォーマットの不均質な文書からワクチン接種データを抽出するのではなく、外部コンピューティングシステムがワクチン接種データを均質なものとして直接消費することを可能にしてもよい。データ構造は、ワクチン接種データのためのマスタリポジトリを提供してもよく、ワクチン接種データが外部コンピューティングシステムにより迅速且つ容易に発見され、読み出されることを可能にしてもよい。
図1Dに参照番号130によりさらに示されているように、確認システムは、対応するフィールドからのワクチン接種データについて登録機関に確認してもよい。例として確認システムは、州のワクチン接種台帳、国のワクチン接種台帳、国際的なワクチン接種台帳、および/または同様のものを用いてワクチン接種データを確認してもよい。確認システムは、データ構造に格納されたワクチン接種データに対応するワクチン接種データを(例えば登録機関に関連するサーバデバイスに)リクエストしてもよく、対応するワクチン接種データを受信してもよい。確認システムは、対応するワクチン接種データとデータ構造内のワクチン接種データとを比較して、対応するワクチン接種データとデータ構造内のワクチン接種データとが一致するかどうかを確認してもよい。あるいは確認は、ワクチン接種データを(例えば登録機関に関連するサーバデバイスに)提供してもよく、対応するワクチン接種データとそのワクチン接種データとが一致するかどうかをサーバデバイスが確認することをリクエストしてもよい。ワクチン接種データのいずれかが確認できない場合、そのような未確認データについて登録機関に確認できるように、確認システムは、そのような未確認データの修正または更新を(例えばユーザデバイスに)リクエストしてもよい。一部の実装において確認システムは、ワクチン接種データにおける1つ以上の矛盾を特定するフィードバックを登録機関から受信してもよい。そのような実装において確認システムは、フィードバックにおいて特定された1つ以上の矛盾を修正して、修正されたワクチン接種データを生成してもよく、修正されたワクチン接種データについて登録機関に確認してもよい。
図1Eに参照番号135により示されているように、確認システムは、特定のユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員から受信してもよい。例として確認システムは、機関の職員(例えば空港の警備員、政府職員、および/または同様)により制御され、且つ/または機関の職員に対して表示されるユーザデバイスから、特定のリクエストを受信してもよい。特定のリクエストは、アクション(例えば入国、飛行機への搭乗、列車への乗車、および/または同様のこと)を特定のユーザが実行することを許可する前に、その特定のユーザによるワクチン接種を検証するよう求めてもよい。特定のリクエストは、特定のユーザの名前を含んでもよい。特定のワクチン接種データは、特定のユーザの名前、特定のユーザが受けた単数もしくは複数のワクチン接種、特定のユーザのCOVIDの検査結果、特定のユーザに関連するワクチンロット番号、および/または同様のものを特定するデータを含んでもよい。
図1Eに参照番号140によりさらに示されているように、確認システムは、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出してもよい。例として確認システムは、特定のユーザの名前を利用して、データ構造の対応するフィールドから特定のワクチン接種データを特定し、読み出してもよい。確認システムは、データ構造の患者名フィールドに含まれるエントリから、特定のユーザの名前を特定してもよい。確認システムは、患者名フィールドに含まれるエントリに対応する、データ構造の他のフィールドのエントリから、特定のワクチン接種データを読み出してもよい。
図1Eに参照番号145によりさらに示されているように、確認システムは、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データおよび/または特定のワクチン接種データを証明するデータ(例えば「ワクチン接種確認済み」)を機関の職員に提供してもよい。例として確認システムは、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供してもよく、その機関の職員は、特定のワクチン接種データに基づき(例えばユーザが特定のワクチン接種データと確認済みのワクチン接種データとを比較することによって)、特定のユーザがアクション(例えば入国、飛行機への搭乗、列車への乗車、および/または同様のこと)を実行するための確認を行ってもよい。あるいは、確認システムが、特定のユーザについてデータ構造から読み出された特定のワクチン接種データに基づき、特定のユーザがアクションを実行するための確認を行ってもよい。そのような事例において確認システムは、特定のワクチン接種データを証明するデータを機関の職員に関連するユーザデバイスに提供してもよく、ユーザデバイスは、特定のワクチン接種データを証明するデータを機関の職員に対して表示してもよい。その結果、機関の職員は、特定のユーザにアクションの実行を許可してもよい。
一部の実装において確認システムは、機関の職員に関連するユーザデバイスから、特定のワクチン接種データに関連する追加情報のリクエストを受信してもよく、追加情報のリクエストに基づき追加情報を特定してもよい。確認システムは、特定のワクチン接種データの確認を可能にするために、機関の職員に関連するユーザデバイスに追加情報を提供してもよい。
一部の実装において確認システムは、ユーザに関連する特定のワクチン接種データに対する更新を受信してもよく、更新に基づきデータ構造内の特定のワクチン接種データを更新してもよい。さらに確認システムは、更新に基づき機械学習モデルを再訓練してもよい。確認システムは、更新を機械学習モデルの再訓練のための追加訓練データとして利用し、それによって、機械学習モデルの訓練に利用可能な訓練データの量を増大させてもよい。したがって確認システムは、機械学習モデルを訓練するための過去のデータを特定、取得、および/または生成する他のシステムと比べて、機械学習モデルを訓練するための過去のデータを特定、取得、および/または生成することに関連するコンピューティングリソースを節約することができる。
このように確認システムは、機械学習および自然言語処理を利用してワクチン接種データの抽出および確認を行う。確認システムは、構造化文書および非構造化文書などの電子文書を処理して、必要な情報を抽出し、抽出された情報に基づくプロセスの自動的な実行を可能にし得る。確認システムは、抽出された情報を利用して、プロセスの自動的な実行中のフォーム、契約書、および/または同様のものなどの生成を可能にする内部マスタ文書を構築し得る。これがひいては、他の場合であれば非構造化文書から情報を不正確に抽出すること、不正確な情報に基づき不適切な決定を下すこと、不正確な情報に基づき不正確な動作を実行すること、および/または同様のことに浪費されていたであろうコンピューティングリソース、ネットワーキングリソース、人的リソース、および/または同様のものを節約する。
確認システムは、確認システムによる処理のために受信された文書に含まれ得るドメイン固有の専門用語、業界用語の定義、および/または様々なデータタイプの想定されるフィールドを含む、機械学習ベースのドメインモデルを使ってもよい。したがって、文書中の特定のキーと値のペア(例えば患者名、COVIDの検査結果、医薬品会社、検体番号、ワクチンロット番号、診療所、および/または同様のもの)の特定を必要とする、様々なドメインからのプロセスの自動的な実行が、確認システムにより使われる特定のドメインモデルに基づき提供されてもよい。確認システムにより、1つ以上の文書を含むリクエストからインテントが特定されてもよい。インテントは、リクエストを受信(例えば1つ以上の文書を自動的に受信)するのに応答して確認システムが有効にする、自動的に実行されるプロセスの識別子または他の指標であってもよい。インテントは、ドメインモデルと、外部のナレッジベースを含む他の1つ以上のデータソースとを使うことによって、さらに処理されてもよい。特定されたインテントに基づき、文書は、異なる1つ以上のプロセスストリームを介して(例えば異なる1つ以上のドメインモデル、異なる1つ以上のナレッジベース、異なる1つ以上のデータソース、および/または同様のものを介して)処理されてもよい。したがって、様々な入力フィールドの抽出および特定がドメインモデルを使用して行われてもよく、選択されたプロセスストリームに基づき様々な内部マスタ文書が作成されてもよい。例としてドメインモデルは、様々な内部マスタ文書から様々な入力フィールドを特定してもよく、様々な内部マスタ文書内の特定されたフィールドから様々な入力フィールドを抽出してもよい。これに応じて、矛盾の解消法、および確認システムからの情報を提示するために使われるユーザインターフェースも、プロセスストリームに基づき異なってもよい。
確認システムは、異なるフォーマットの文書を、コンピュータビジョンまたは光学式文字認識を介して均質な文書に実質的に変換してもよく、これは、文書から抽出されて比較される情報の精度を改善し得る。確認システムは、機械学習モデルを使用して矛盾を自動的に解消してもよく、内部マスタ文書の作成などの下流プロセスを自動的に実行してもよい。確認システムにより処理される文書は、タイプされたテキストデータ、手書き文字、表、グラフ、または他の非テキストフォーマットなど、様々なフォーマットの構造化文書および非構造化文書を含んでもよい。確認システムは、そのような、異なるフォーマットを持つ不均質な文書を分析して、そこに提示されている情報を特定し、比較してもよい。コンピュータビジョン、光学式文字認識、および/または機械学習モデルを使用した、他のフォーマットからテキストデータタイプへのデータ変換は、編集不可能な画像ファイルからのデータの動的な提示をもたらし、抽出されて処理されたデータから内部マスタ文書を作成することによるロボティックプロセスオートメーションを可能にする。下流プロセスの自動化は、(例えばそのような自動化されたプロセスを実装し得る)確認システムだけでなく、不均質なデータソースからデータを抽出せずに均質な内部マスタ文書として直接データを消費できる他の外部コンピューティングシステムについても、速度および正確さを向上させる。確認システムは、コンピュータビジョンを利用して特定のデータ要素を抽出してもよく、抽出されたデータと検証済みのデータソース(例として州のワクチン接種台帳など)とを比較することにより検証プロセスを実行してもよい。例として確認システムは、高速医療相互運用性リソース(FHIR:Fast Healthcare Interoperability Resources)を利用して州および/または国のワクチン台帳と通信し、ワクチン接種および/または検査結果データを検証してもよい。
上記で指摘されたように、図1A~図1Eは一例として示されている。他の例は、図1A~図1Eに関して記載されているものと異なり得る。図1A~図1Eに示されたデバイスの数および配置は、一例として示されている。実際には、図1A~図1Eに示されたものと比べて、追加のデバイス、より少数のデバイス、異なるデバイス、または別様に配置されたデバイスがあってもよい。さらに、図1A~図1Eに示されている2つ以上のデバイスが単一のデバイスの中に実装されてもよく、または図1A~図1Eに示されている単一のデバイスが複数の分散型デバイスとして実装されてもよい。さらに、または代わりに、図1A~図1Eに示されている或るデバイスのセット(例えば1つ以上のデバイス)が、図1A~図1Eに示されている別のデバイスのセットにより実行されるものとして記載されている1つ以上の機能を実行してもよい。
図2は、ワクチン接種データの抽出および確認に関連して、機械学習モデルを訓練して使用する例200を示す図である。本願明細書に記載されている機械学習モデルの訓練および使用は、機械学習システムを使用して実行されてもよい。機械学習システムは、本願明細書の他の箇所にさらに詳細に記載されている確認システムなど、コンピューティングデバイス、サーバ、クラウドコンピューティング環境、および/または同様のものを含んでもよく、またはそれに含まれてもよい。
参照番号205により示されているように、機械学習モデルは、観測のセットを使用して訓練されてもよい。観測のセットは、本願明細書に記載されている1つ以上のプロセスの間に集められたデータなどの過去のデータから取得されてもよい。一部の実装において機械学習システムは、本願明細書の他の箇所に記載されているように、確認システムから(例えば入力として)観測のセットを受信してもよい。
参照番号210により示されているように、観測のセットは特徴セットを含む。特徴セットは、変数のセットを含んでもよく、変数は、特徴と呼ぶこともできる。特定の観測は、変数のセットに対応する変数値(または特徴値)のセットを含んでもよい。一部の実装において機械学習システムは、確認システムから受信された入力に基づき、観測のセットの変数および/または特定の観測の変数値を判断してもよい。例として機械学習システムは、構造化データから特徴セットを抽出すること、非構造化データから特徴セットを抽出するために自然言語処理を実行すること、オペレータから入力を受信すること、および/または同様のことにより、特徴セット(例えば1つ以上の特徴および/または特徴値)を特定してもよい。
一例として、観測のセットの特徴セットは、第1の処理済み文書データの第1の特徴、第2の処理済み文書データの第2の特徴、第3の処理済み文書データの第3の特徴などを含んでもよい。図のように、第1の観測について、第1の特徴は、名前1の値を有してもよく、第2の特徴は、ワクチン接種データ1の値を有してもよく、第3の特徴は、ワクチン接種タイプ1の値を有するなどしてもよい。これらの特徴および特徴値は例として示されており、他の例では異なってもよい。
参照番号215により示されているように、観測のセットは、目標変数に関連してもよい。目標変数は、或る数値を有する変数を表現してもよく、或る値の範囲内に入るかまたはいくつかの離散的な可能値を有する数値を有する変数を表現してもよく、複数の選択肢のうちの1つから選択可能な変数(例えば複数のクラス、分類、ラベル、および/または同様のもののうちの1つ)を表現してもよく、ブール値を有する変数を表現してもよく、且つ/または同様であってもよい。目標変数は、目標変数値に関連してもよく、目標変数値は、観測に固有であってもよい。例200では、目標変数はワクチン接種データであり、これは、第1の観測に対してワクチン接種データ1の値を有する。
目標変数は、機械学習モデルが予測するように訓練される値を表現してもよく、特徴セットは、訓練される機械学習モデルに目標変数の値の予測のため入力される変数を表現してもよい。目標変数値をもたらす特徴セットのパターンを認識するように機械学習モデルを訓練できるよう、観測のセットは目標変数値を含んでもよい。目標変数値を予測するように訓練される機械学習モデルは、教師あり学習モデルと呼ぶこともできる。
一部の実装において機械学習モデルは、目標変数を含まない観測のセットに対して訓練されてもよい。これは、教師なし学習モデルと呼ぶこともできる。この事例において、機械学習モデルは、ラベル付けまたは教師なしで観測のセットからパターンを学習してもよく、観測のセットの中の項目の関連グループを特定するクラスタリングおよび/またはアソシエーションを使用することなどにより、そのようなパターンを示す出力を提供してもよい。
参照番号220により示されているように、機械学習システムは、観測のセットを使用し、さらに回帰アルゴリズム、決定木アルゴリズム、ニューラルネットワークアルゴリズム、k最近傍アルゴリズム、サポートベクタマシンアルゴリズム、および/または同様のものなどの1つ以上の機械学習アルゴリズムを使用して、機械学習モデルを訓練してもよい。訓練後、機械学習システムは、新たな観測の分析に使用される訓練された機械学習モデル225として機械学習モデルを保存してもよい。
参照番号230により示されているように、機械学習システムは、新たな観測を受信して新たな観測を訓練された機械学習モデル225に入力することなどにより、訓練された機械学習モデル225を新たな観測に適用してもよい。図のように、新たな観測は、一例として、名前Xの第1の特徴、ワクチン接種データYの第2の特徴、ワクチン接種タイプZの第3の特徴などを含んでもよい。機械学習システムは、訓練された機械学習モデル225を新たな観測に適用して、出力(例えば結果)を生成してもよい。出力のタイプは、機械学習モデルのタイプおよび/または実行されている機械学習タスクのタイプに依存してもよい。例として出力は、教師あり学習が使われている場合などは、目標変数の予測値を含んでもよい。さらに、または代わりに、出力は、教師なし学習が使われている場合などは、新たな観測が属するクラスタを特定する情報、新たな観測と他の1つ以上の観測との間の類似度を示す情報、および/または同様のものを含んでもよい。
一例として、参照番号235により示されているように、訓練された機械学習モデル225は、新たな観測のクラスタの目標変数についてワクチン接種データAを予測してもよい。機械学習システムは、この予測に基づき、第1のレコメンデーションを提供してもよく、第1のレコメンデーションを決定するための出力を提供してもよく、第1の自動化されたアクションを実行してもよく、(例えば自動化されたアクションを実行するよう別のデバイスに命令することにより)第1の自動化されたアクションを実行させてもよく、さらに/または同様のことをしてもよい。
一部の実装では、参照番号240により示されているように、訓練された機械学習モデル225は、新たな観測をクラスタに分類(例えばクラスタリング)してもよい。クラスタの中の観測は、閾値の類似度を有してもよい。一例として、機械学習システムが新たな観測を第1のクラスタ(例えば第1の処理済み文書データクラスタ)に分類すると、機械学習システムは第1のレコメンデーションを提供してもよい。さらに、または代わりに、機械学習システムは、新たな観測を第1のクラスタに分類することに基づき、第1の自動化されたアクションを実行してもよく、且つ/または(例えば自動化されたアクションを実行するよう別のデバイスに命令することにより)第1の自動化されたアクションを実行させてもよい。
別の例として、機械学習システムが新たな観測を第2のクラスタ(例えば第2の処理済み文書データクラスタ)に分類するとした場合、機械学習システムは、第2の(例えば異なる)レコメンデーションを提供してもよく、且つ/または第2の(例えば異なる)自動化されたアクションを実行してもよく、もしくは実行させてもよい。
一部の実装において、新たな観測に関連するレコメンデーションおよび/または自動化されたアクションは、目標変数値が特定のラベル(例えば分類、カテゴリ化、および/または同様のもの)を有することに基づいてもよく、目標変数値が1つ以上の閾値を満たすかどうか(例えば目標変数値が閾値より大きいかどうか、閾値未満であるかどうか、閾値と等しいかどうか、閾値の値の範囲内にあるかどうか、および/または同様のこと)に基づいてもよく、新たな観測が分類されるクラスタに基づいてもよく、且つ/または同様であってもよい。
このように機械学習システムは、ワクチン接種データの抽出および確認を行うために、正確で自動化されたプロセスを適用できる。機械学習システムは、数十、数百、数千、または数百万の観測に関して数十、数百、数千、または数百万の特徴および/または特徴値を認識し、且つ/または特定することを可能にし、それにより、数十、数百、または数千のオペレータがワクチン接種データを手動で抽出して確認するためにコンピューティングリソースが配分されることを必要とするのに比べて、ワクチン接種データの抽出および確認に関連する正確さおよび一貫性を向上させ、遅延を軽減することができる。
上記で指摘されたように、図2は一例として示されている。他の例は、図2に関連して記載されているものと異なり得る。
図3は、本願明細書に記載されたシステムおよび/または方法が実装され得る例示の環境300の図である。図3に示されているように、環境300は、確認システム301を含んでもよく、確認システム301は、クラウドコンピューティングシステム302の構成要素1つ以上を含んでもよく、且つ/またはクラウドコンピューティングシステム302の中で実行されてもよい。クラウドコンピューティングシステム302は、より詳細に後述されるように、1つ以上の構成要素303~313を含んでもよい。図3にさらに示されているように、環境300は、ネットワーク320および/またはユーザデバイス330を含んでもよい。環境300のデバイスおよび/または構成要素は、有線接続および/または無線接続を介して相互接続してもよい。
クラウドコンピューティングシステム302は、コンピューティングハードウェア303、リソース管理コンポーネント304、ホストオペレーティングシステム(OS:operating system)305、および/または1つ以上の仮想コンピューティングシステム306を含む。リソース管理コンポーネント304は、コンピューティングハードウェア303の仮想化(例えば抽象化)を実行して1つ以上の仮想コンピューティングシステム306を作成してもよい。リソース管理コンポーネント304は、仮想化を使用して、単一のコンピューティングデバイスのコンピューティングハードウェア303から分離された複数の仮想コンピューティングシステム306を作成することなどにより、単一のコンピューティングデバイス(例えばコンピュータ、サーバ、および/または同様のもの)が複数のコンピューティングデバイスのように動作することを可能にする。こうすることで、コンピューティングハードウェア303は、別々のコンピューティングデバイスを使用するのに比べて、より高い効率性、より少ない消費電力、より高い信頼性、より高い可用性、より高い稼働率、より高い柔軟性、およびより低いコストで動作することができる。
コンピューティングハードウェア303は、1つ以上のコンピューティングデバイスのハードウェアおよび対応するリソースを含む。例としてコンピューティングハードウェア303は、単一のコンピューティングデバイス(例えば単一のサーバ)の、または1つ以上のデータセンターにある複数のコンピューティングデバイスなど複数のコンピューティングデバイス(例えば複数のサーバ)の、ハードウェアを含んでもよい。図のように、コンピューティングハードウェア303は、1つ以上のプロセッサ307、1つ以上のメモリ308、1つ以上のストレージコンポーネント309、および/または1つ以上のネットワーキングコンポーネント310を含んでもよい。プロセッサ、メモリ、ストレージコンポーネント、およびネットワーキングコンポーネント(例えば通信コンポーネント)の例は、本願明細書の他の箇所に記載される。
リソース管理コンポーネント304は、1つ以上の仮想コンピューティングシステム306を開始、停止、および/または管理するために、コンピューティングハードウェア303を仮想化できる仮想化アプリケーション(例えばコンピューティングハードウェア303などのハードウェア上で実行される)を含む。例として、仮想コンピューティングシステム306が仮想マシン311である場合などには、リソース管理コンポーネント304は、ハイパーバイザ(例えばベアメタル型もしくはタイプ1ハイパーバイザ、ホスト型もしくはタイプ2ハイパーバイザ、および/または同様のもの)または仮想マシンモニタを含んでもよい。さらに、または代わりに、仮想コンピューティングシステム306がコンテナ312である場合などには、リソース管理コンポーネント304は、コンテナマネージャを含んでもよい。一部の実装においてリソース管理コンポーネント304は、ホストオペレーティングシステム305の中で、さらに/またはホストオペレーティングシステム305と連携して実行される。
仮想コンピューティングシステム306は、コンピューティングハードウェア303を使用して、本願明細書に記載される動作および/またはプロセスをクラウドベースで実行することを可能にする仮想環境を含む。図のように、仮想コンピューティングシステム306は、仮想マシン311、コンテナ312、仮想マシンおよびコンテナを含むハイブリッド環境313、ならびに/または同様のものを含んでもよい。仮想コンピューティングシステム306は、(例えば仮想コンピューティングシステム306の中の)ゲストオペレーティングシステムまたはホストオペレーティングシステム305上でアプリケーションを実行するために必要なバイナリファイル、ソフトウェアライブラリ、および/またはその他リソースを含むファイルシステムを使用して1つ以上のアプリケーションを実行してもよい。
確認システム301は、クラウドコンピューティングシステム302の構成要素303~313を1つ以上含んでもよく、クラウドコンピューティングシステム302の中で実行してもよく、且つ/またはクラウドコンピューティングシステム302の中でホストされてもよいが、一部の実装において確認システム301は、クラウドベースでなくてもよく(例えばクラウドコンピューティングシステムの外で実装されてもよい)、または部分的にクラウドベースであってもよい。例として確認システム301は、図4のデバイス400など、クラウドコンピューティングシステム302の一部ではない1つ以上のデバイスを含んでもよく、これには、スタンドアロンサーバまたは別のタイプのコンピューティングデバイスが含まれてもよい。確認システム301は、本願明細書の他の箇所にさらに詳細に記載される1つ以上の動作および/またはプロセスを実行してもよい。
ネットワーク320は、1つ以上の有線ネットワークおよび/または無線ネットワークを含む。例としてネットワーク320は、セルラネットワーク、公衆陸上モバイルネットワーク(PLMN:public land mobile network)、ローカルエリアネットワーク(LAN:local area network)、ワイドエリアネットワーク(WAN:wide area network)、プライベートネットワーク、インターネット、および/もしくは同様のもの、ならびに/またはこれらもしくは他のタイプのネットワークの組み合わせを含んでもよい。ネットワーク320は、環境300の各デバイス間での通信を可能にする。
ユーザデバイス330は、本願明細書の他の箇所に記載されているように、情報を受信、生成、保存、処理、および/または提供できる1つ以上のデバイスを含む。ユーザデバイス330は、通信デバイスおよび/またはコンピューティングデバイスを含んでもよい。例としてユーザデバイス330は、無線通信デバイス、ユーザ機器(UE:user equipment)、モバイル電話(例えば、ほかにも例はあるが、スマートフォンまたは携帯電話)、ラップトップコンピュータ、タブレットコンピュータ、ハンドヘルドコンピュータ、デスクトップコンピュータ、ゲーム用デバイス、ウェアラブル通信デバイス(例えば、ほかにも例はあるが、スマート腕時計またはスマート眼鏡)、モノのインターネット(IoT:Internet of Things)デバイス、または同様のタイプのデバイスを含んでもよい。ユーザデバイス330は、本願明細書の他の箇所に記載されているように、環境300の他のデバイス1つ以上と通信してもよい。
図3に示されたデバイスおよびネットワークの数および配置は、一例として示されている。実際には、図3に示されたものと比べて、追加のデバイスおよび/もしくはネットワーク、より少数のデバイスおよび/もしくはネットワーク、異なるデバイスおよび/もしくはネットワーク、または別様に配置されたデバイスおよび/もしくはネットワークがあってもよい。さらに、図3に示されている2つ以上のデバイスが単一のデバイスの中に実装されてもよく、または図3に示されている単一のデバイスが複数の分散型デバイスとして実装されてもよい。さらに、または代わりに、環境300の或るデバイスのセット(例えば1つ以上のデバイス)が、環境300の別のデバイスのセットにより実行されるものとして記載されている1つ以上の機能を実行してもよい。
図4は、確認システム301および/またはユーザデバイス330に対応し得るデバイス400の例示のコンポーネントの図である。一部の実装において確認システム301および/またはユーザデバイス330は、1つ以上のデバイス400および/またはデバイス400のコンポーネント1つ以上を含んでもよい。図4に示されているように、デバイス400は、バス410、プロセッサ420、メモリ430、ストレージコンポーネント440、入力コンポーネント450、出力コンポーネント460、および通信コンポーネント470を含んでもよい。
バス410は、デバイス400のコンポーネント間の有線通信および/または無線通信を可能にするコンポーネントを含む。プロセッサ420は、中央処理ユニット、グラフィックス処理ユニット、マイクロプロセッサ、コントローラ、マイクロコントローラ、デジタル信号プロセッサ、フィールドプログラマブルゲートアレイ、特定用途向け集積回路、および/または別のタイプの処理コンポーネントを含む。プロセッサ420は、ハードウェア、ファームウェア、またはハードウェアとソフトウェアとの組み合わせにおいて実装される。一部の実装においてプロセッサ420は、機能を実行するようにプログラムできる1つ以上のプロセッサを含む。メモリ430は、ランダムアクセスメモリ、読み取り専用メモリ、および/または別のタイプのメモリ(例えばフラッシュメモリ、磁気メモリ、および/または光学メモリ)を含む。
ストレージコンポーネント440は、デバイス400の動作に関係する情報および/またはソフトウェアを保存する。例としてストレージコンポーネント440は、ハードディスクドライブ、磁気ディスクドライブ、光学ディスクドライブ、ソリッドステートディスクドライブ、コンパクトディスク、デジタル多用途ディスク、および/または別のタイプの非一時的コンピュータ可読媒体を含んでもよい。入力コンポーネント450は、デバイス400がユーザ入力および/または感知された入力などの入力を受信することを可能にする。例として入力コンポーネント450は、タッチスクリーン、キーボード、キーパッド、マウス、ボタン、マイクロフォン、スイッチ、センサ、グローバルポジショニングシステムコンポーネント、加速度計、ジャイロスコープ、アクチュエータ、および/または同様のものを含んでもよい。出力コンポーネント460は、デバイス400がディスプレイ、スピーカ、および/または1つ以上の発光ダイオードなどを介して出力を提供することを可能にする。通信コンポーネント470は、デバイス400が有線接続および/または無線接続などを介して他のデバイスと通信することを可能にする。例として通信コンポーネント470は、受信機、送信機、トランシーバ、モデム、ネットワークインターフェースカード、アンテナ、および/または同様のものを含んでもよい。
デバイス400は、本願明細書に記載された1つ以上のプロセスを実行してもよい。例として非一時的コンピュータ可読媒体(例えばメモリ430および/またはストレージコンポーネント440)は、プロセッサ420により実行される命令のセット(例えば1つ以上の命令、コード、ソフトウェアコード、プログラムコード、および/または同様のもの)を保存してもよい。プロセッサ420は、命令のセットを実行して、本願明細書に記載された1つ以上のプロセスを実行してもよい。一部の実装において、1つ以上のプロセッサ420による命令のセットの実行は、本願明細書に記載された1つ以上のプロセスを1つ以上のプロセッサ420および/またはデバイス400に実行させる。一部の実装において、本願明細書に記載の1つ以上のプロセスを実行するために、配線による回路構成が、命令の代わりに、または命令と組み合わせて使用されてもよい。したがって、本願明細書に記載された実装は、ハードウェア回路構成とソフトウェアとのいかなる特定の組み合わせにも限定されない。
図4に示されたコンポーネントの数および配置は、一例として示されている。デバイス400は、図4に示されたものと比べて、追加のコンポーネント、より少数のコンポーネント、異なるコンポーネント、または別様に配置されたコンポーネントを含んでもよい。さらに、または代わりに、デバイス400の或るコンポーネントのセット(例えば1つ以上のコンポーネント)が、デバイス400の別のコンポーネントのセットにより実行されるものとして記載されている1つ以上の機能を実行してもよい。
図5は、ワクチン接種データの抽出および確認を行うために機械学習および自然言語処理を利用する例示のプロセス500のフローチャートである。一部の実装において、図5の1つ以上のプロセスブロックは、デバイス(例えば確認システム301)により実行されてもよい。一部の実装において、図5の1つ以上のプロセスブロックは、ユーザデバイス(例えばユーザデバイス330)など、別のデバイスか、またはデバイスとは独立した、もしくはデバイスを含む、デバイスのグループかにより実行されてもよい。さらに、または代わりに、図5の1つ以上のプロセスブロックは、プロセッサ420、メモリ430、ストレージコンポーネント440、入力コンポーネント450、出力コンポーネント460、および/または通信コンポーネント470など、デバイス400の1つ以上のコンポーネントによって実行されてもよい。
図5に示されているように、プロセス500は、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、リクエストに基づき受信することを含んでもよい(ブロック510)。例としてデバイスは、上述のように、ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、リクエストに基づき受信してもよい。
図5にさらに示されているように、プロセス500は、処理済み文書データを生成するために自然言語処理を文書データに対して実行することを含んでもよい(ブロック520)。例としてデバイスは、上述のように、処理済み文書データを生成するために自然言語処理を文書データに対して実行してもよい。
図5にさらに示されているように、プロセス500は、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理することを含んでもよい(ブロック530)。例としてデバイスは、上述のように、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理してもよい。
図5にさらに示されているように、プロセス500は、ワクチン接種データをデータ構造の対応するフィールドに転記することを含んでもよい(ブロック540)。例としてデバイスは、上述のように、ワクチン接種データをデータ構造の対応するフィールドに転記してもよい。
図5にさらに示されているように、プロセス500は、ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員に関連するユーザデバイスから受信することを含んでもよい(ブロック550)。例としてデバイスは、上述のように、ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員に関連するユーザデバイスから受信してもよい。
図5にさらに示されているように、プロセス500は、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出すことを含んでもよい(ブロック560)。例としてデバイスは、上述のように、特定のリクエストに基づき、データ構造の対応するフィールドから特定のワクチン接種データを読み出してもよい。
図5にさらに示されているように、プロセス500は、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供することを含んでもよい(ブロック570)。例としてデバイスは、上述のように、特定のワクチン接種データの確認を可能にするために、特定のワクチン接種データを機関の職員に関連するユーザデバイスに提供してもよい。
プロセス500は、後述され、且つ/または本願明細書の他の箇所に記載された他の1つ以上のプロセスに関連して記載される、任意の単一の実装または複数実装の任意の組み合わせなど、追加の実装を含んでもよい。
第1の実装において、プロセス500は、過去のワクチン接種に関連する過去の構造化文書および非構造化文書を特定する過去の文書データを用いて、機械学習モデルを、文書データを受信する前に訓練することを含む。
第2の実装単体、または第1の実装と組み合わされた第2の実装において、構造化文書は、一定のフォーマットで情報を配置することを可能にする埋め込みコードを含み、非構造化文書は、元の文書からの情報の構造、スタイル、およびコンテンツが保持されない自由形式の配置を含む。
第3の実装単体、または第1および第2の実装のうちの1つ以上と組み合わされた第3の実装において、プロセス500は、共通のフォーマットを持つ均質な文書を生成するためにコンピュータビジョンモデルまたは光学式文字認識を用いて文書データを処理することを含み、処理済み文書データを生成するために自然言語処理を文書データに対して実行することは、処理済み文書データを生成するために自然言語処理を均質な文書に対して実行することを含む。
第4の実装単体、または第1~第3の実装のうちの1つ以上と組み合わされた第4の実装において、プロセス500は、特定のリクエストが、特定のワクチン接種データにアクセスするためのアクセス制御要件を満たすと判断することをさらに含む。
第5の実装単体、または第1~第4の実装のうちの1つ以上と組み合わされた第5の実装において、プロセス500は、対応するフィールドからのワクチン接種データについて登録機関に確認することを含む。
第6の実装単体、または第1~第5の実装のうちの1つ以上と組み合わされた第6の実装において、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理することは、処理済み文書データをカテゴリに分類することと、処理済み文書データからワクチン接種データをカテゴリに基づき抽出することとを含む。
第7の実装単体、または第1~第6の実装のうちの1つ以上と組み合わされた第7の実装において、構造化文書は、一定のフォーマットを含み、非構造化文書は、異なる複数のフォーマットを含み、プロセス500は、自然言語処理を文書データに対して実行する前に、構造化文書の一定のフォーマットおよび非構造化文書の異なる複数のフォーマットを、共通のフォーマットに変換することを含む。
第8の実装単体、または第1~第8の実装のうちの1つ以上と組み合わされた第8の実装において、処理済み文書データからワクチン接種データを抽出するために、処理済み文書データを、機械学習モデルを用いて処理することは、処理済み文書データにおける1つ以上の相違を特定することと、1つ以上の相違に関連するフィードバックを受信することと、処理済み文書データからワクチン接種データをフィードバックに基づき抽出することとを含む。
第9の実装単体、または第1~第8の実装のうちの1つ以上と組み合わされた第9の実装において、対応するフィールドからのワクチン接種データについて登録機関に確認することは、ワクチン接種データにおける1つ以上の相違を特定するフィードバックを登録機関から受信することと、修正されたワクチン接種データを生成するために、フィードバックにおいて特定された1つ以上の相違を修正することと、修正されたワクチン接種データについて登録機関に確認することとを含む。
第10の実装単体、または第1~第9の実装のうちの1つ以上と組み合わされた第10の実装において、プロセス500は、機関の職員に関連するユーザデバイスから、特定のワクチン接種データに関連する追加情報のリクエストを受信することと、追加情報のリクエストに基づき追加情報を特定することと、特定のワクチン接種データの確認を可能にするために、追加情報を機関の職員に関連するユーザデバイスに提供することとを含む。
第11の実装単体、または第1~第10の実装のうちの1つ以上と組み合わされた第11の実装において、プロセス500は、ユーザに関連する特定のワクチン接種データに対する更新を受信することと、更新に基づきデータ構造内の特定のワクチン接種データを更新することとを含む。
第12の実装単体、または第1~第11の実装のうちの1つ以上と組み合わされた第12の実装において、機械学習モデルは、ドメイン固有の専門用語に関連する機械学習ベースのドメインモデルを含む。
図5はプロセス500の例示のブロックを示すが、一部の実装ではプロセス500は、図5に示されたものと比べて追加のブロック、より少数のブロック、異なるブロック、または別様に配置されたブロックを含んでもよい。さらに、または代わりに、プロセス500のブロックの2つ以上が並列実行されてもよい。
前述の開示は、例示および説明を提供するが、網羅的であることも、実装を開示された厳密な形態に限定することも意図していない。上記の開示を考慮して変更が加えられてもよく、または実装の実践から変更が習得される可能性もある。
本願明細書で使用されるとき、「コンポーネント」という用語は、ハードウェア、ファームウェア、またはハードウェアとソフトウェアとの組み合わせとして広く解釈されるものとする。当然のことながら、本願明細書に記載されたシステムおよび/または方法は、様々な形態のハードウェア、ファームウェア、および/またはハードウェアとソフトウェアとの組み合わせに実装されてもよい。これらのシステムおよび/または方法を実装するために使用される実際の専用制御ハードウェアまたはソフトウェアコードは、実装を限定するものではない。したがって、システムおよび/または方法の動作および挙動は、具体的なソフトウェアコードを参照することなく本願明細書に記載されているが、当然のことながら、本願明細書の記載に基づくシステムおよび/または方法を実装するためにソフトウェアおよびハードウェアを使用できる。
本願明細書で使用されるとき、閾値を満たすとは、文脈に応じて、値が閾値より大きいこと、閾値以上であること、閾値未満であること、閾値以下であること、閾値と等しいこと、および/または同様のことを文脈に応じて指すことができる。
特徴の特定の組み合わせが特許請求の範囲に記載され且つ/または本明細書で開示されるが、これらの組み合わせは様々な実装の開示を限定することを意図したものではない。実際には、これらの特徴の多くが、特許請求の範囲に具体的に記載されなかった、且つ/または本明細書で開示されなかった形で組み合わされてもよい。下記に列挙される各従属クレームは、1つのみのクレームに直接従属していることもあるが、様々な実装の開示は、クレームセット中の他のすべてのクレームと組み合わされた各従属クレームを含む。
本願明細書で使用されるいずれの構成要素、動作、または命令も、重要または必須とは、そのように明示的に記載されない限りは解釈されてはならない。さらに、本願明細書で使用されるとき、冠詞「或る(aおよびan)」は、1つ以上の項目を含むものとし、「1つ以上の(one or more)」と交換可能なように使用され得る。さらに、本願明細書において使用されるとき、冠詞「この(the)」は、冠詞「この(the)」に関連して参照される1つ以上の項目を含むものとし、「1つ以上の(the one or more)」と交換可能なように使用され得る。さらに、本願明細書で使用されるとき、「セット(set)」という用語は、1つ以上の項目(例えば関係する項目、無関係の項目、関係する項目と無関係の項目との組み合わせ、および/または同様のもの)を含むものとし、「1つ以上の(one or more)」と交換可能なように使用され得る。1つのみの項目が意図される場合は、「1つのみ(only one)」という語句または同様の文言が使用される。さらに、本願明細書で使用されるとき、「有する(has、have、having)」または同様の用語は、非限定的な用語であるものとする。さらに、「基づき(based on)」という語句は、別段の記載が明示的になされない限り、「少なくとも部分的に基づき(based,at least in part,on)」を意味するものとする。さらに、本願明細書で使用されるとき、「または(or)」という用語は、別段の記載(例えば、「いずれか(either)」または「のうちの1つのみ(only one of)」と組み合わせて使用される場合)が明示的になされない限り、等位語句の連続の中で使用される場合には非排他的であるものとし、「および/または(and/or)」と交換可能なように使用され得る。

Claims (20)

  1. ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、デバイスにより受信するステップと、
    処理済み文書データを生成するために自然言語処理を前記文書データに対して前記デバイスにより実行するステップと、
    前記処理済み文書データからワクチン接種データを抽出するために、前記処理済み文書データを、機械学習モデルを用いて前記デバイスにより処理するステップと、
    前記ワクチン接種データをデータ構造の対応するフィールドに、前記デバイスにより転記するステップと、
    前記ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、前記デバイスにより、機関の職員に関連するユーザデバイスから受信するステップと、
    前記特定のリクエストに基づき、前記データ構造の前記対応するフィールドから前記特定のワクチン接種データを、前記デバイスにより読み出すステップと、
    前記特定のワクチン接種データの確認を可能にするために、前記特定のワクチン接種データを前記機関の職員に関連する前記ユーザデバイスに、前記デバイスにより提供するステップと
    を含む方法。
  2. 過去のワクチン接種に関連する過去の構造化文書および非構造化文書を特定する過去の文書データを用いて、前記機械学習モデルを、前記文書データを受信する前に訓練するステップ
    をさらに含む、請求項1に記載の方法。
  3. 前記構造化文書は、一定のフォーマットで情報を配置することを可能にする埋め込みコードを含み、
    前記非構造化文書は、元の文書からの情報の構造、スタイル、およびコンテンツが保持されない自由形式の配置を含む、請求項1に記載の方法。
  4. 前記方法は、
    共通のフォーマットを持つ均質な文書を生成するためにコンピュータビジョンモデルまたは光学式文字認識を用いて前記文書データを処理するステップ
    をさらに含み、
    前記処理済み文書データを生成するために前記自然言語処理を前記文書データに対して実行するステップは、
    前記処理済み文書データを生成するために前記自然言語処理を前記均質な文書に対して実行するステップ
    を含む、請求項1に記載の方法。
  5. 前記特定のリクエストが、前記特定のワクチン接種データにアクセスするためのアクセス制御要件を満たすと判断するステップ
    をさらに含む、請求項1に記載の方法。
  6. 前記対応するフィールドからの前記ワクチン接種データについて登録機関に確認するステップ
    をさらに含む、請求項1に記載の方法。
  7. 前記処理済み文書データから前記ワクチン接種データを抽出するために、前記処理済み文書データを、前記機械学習モデルを用いて処理するステップは、
    前記処理済み文書データをカテゴリに分類するステップと、
    前記処理済み文書データから前記ワクチン接種データを前記カテゴリに基づき抽出するステップと
    を含む、請求項1に記載の方法。
  8. 1つ以上のメモリと、
    前記1つ以上のメモリに結合された1つ以上のプロセッサと
    を含むデバイスであって、前記1つ以上のプロセッサは、
    過去のワクチン接種に関連する過去の構造化文書および非構造化文書を特定する過去の文書データを用いて、機械学習モデルを訓練することと、
    文書データを求めるリクエストを提供することと、
    ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、前記リクエストに基づき受信することと、
    処理済み文書データを生成するために自然言語処理を前記文書データに対して実行することと、
    前記処理済み文書データからワクチン接種データを抽出するために、前記処理済み文書データを、前記機械学習モデルを用いて処理することと、
    前記ワクチン接種データをデータ構造の対応するフィールドに代入することと、
    前記対応するフィールドからの前記ワクチン接種データについて登録機関に確認することと、
    前記ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員に関連するユーザデバイスから受信することと、
    前記特定のリクエストに基づき、前記データ構造の前記対応するフィールドから前記特定のワクチン接種データを読み出すことと、
    前記特定のワクチン接種データの確認を可能にするために、前記特定のワクチン接種データを前記機関の職員に関連する前記ユーザデバイスに提供することと
    をするように構成される、デバイス。
  9. 前記構造化文書は、一定のフォーマットを含み、前記非構造化文書は、異なる複数のフォーマットを含み、前記1つ以上のプロセッサは、
    前記自然言語処理を前記文書データに対して実行する前に、前記構造化文書の前記一定のフォーマットおよび前記非構造化文書の前記異なる複数のフォーマットを、共通のフォーマットに変換するようにさらに構成される、請求項8に記載のデバイス。
  10. 前記処理済み文書データから前記ワクチン接種データを抽出するために、前記処理済み文書データを、前記機械学習モデルを用いて処理するべく、前記1つ以上のプロセッサは、
    前記処理済み文書データにおける1つ以上の相違を特定することと、
    前記1つ以上の相違に関連するフィードバックを受信することと、
    前記処理済み文書データから前記ワクチン接種データを前記フィードバックに基づき抽出することと
    をするように構成される、請求項8に記載のデバイス。
  11. 前記対応するフィールドからの前記ワクチン接種データについて前記登録機関に確認するべく、前記1つ以上のプロセッサは、
    前記ワクチン接種データにおける1つ以上の相違を特定するフィードバックを前記登録機関から受信することと、
    修正されたワクチン接種データを生成するために、前記フィードバックにおいて特定された前記1つ以上の相違を修正することと、
    前記修正されたワクチン接種データについて前記登録機関に確認することと
    をするように構成される、請求項8に記載のデバイス。
  12. 前記1つ以上のプロセッサは、
    前記機関の職員に関連する前記ユーザデバイスから、前記特定のワクチン接種データに関連する追加情報のリクエストを受信することと、
    前記追加情報のリクエストに基づき追加情報を特定することと、
    前記特定のワクチン接種データの確認を可能にするために、前記追加情報を前記機関の職員に関連する前記ユーザデバイスに提供することと
    をするようにさらに構成される、請求項8に記載のデバイス。
  13. 前記1つ以上のプロセッサは、
    前記ユーザに関連する前記特定のワクチン接種データに対する更新を受信することと、
    前記更新に基づき前記データ構造内の前記特定のワクチン接種データを更新することと
    をするようにさらに構成される、請求項8に記載のデバイス。
  14. 前記機械学習モデルは、ドメイン固有の専門用語に関連する機械学習ベースのドメインモデルを含む、請求項8に記載のデバイス。
  15. 命令のセットを保存する非一時的コンピュータ可読媒体であって、前記命令のセットは、
    1つ以上の命令
    を含み、前記1つ以上の命令は、デバイスの1つ以上のプロセッサにより実行されると、
    文書データを求めるリクエストを提供することと、
    ユーザが受けたワクチン接種に関連する構造化文書および非構造化文書を特定する文書データを、前記リクエストに基づき受信することと、
    処理済み文書データを生成するために自然言語処理を前記文書データに対して実行することと、
    前記処理済み文書データからワクチン接種データを抽出するために、前記処理済み文書データを、機械学習モデルを用いて処理することと、
    前記ワクチン接種データをデータ構造の対応するフィールドに転記することと、
    前記対応するフィールドからの前記ワクチン接種データについて登録機関に確認することと
    を前記デバイスにさせる、非一時的コンピュータ可読媒体。
  16. 前記1つ以上の命令は、
    前記ユーザの中の或るユーザに関連する特定のワクチン接種データを求める特定のリクエストを、機関の職員に関連するユーザデバイスから受信することと、
    前記特定のリクエストに基づき、前記データ構造の前記対応するフィールドから前記特定のワクチン接種データを読み出すことと、
    前記特定のワクチン接種データの確認を可能にするために、前記特定のワクチン接種データを前記機関の職員に関連する前記ユーザデバイスに提供することと
    を前記デバイスにさらにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
  17. 前記1つ以上の命令は、
    共通のフォーマットを持つ均質な文書を生成するためにコンピュータビジョンモデルまたは光学式文字認識を用いて前記文書データを処理すること
    を前記デバイスにさらにさせ、
    前記処理済み文書データを生成するために前記自然言語処理を前記文書データに対して実行することを前記デバイスにさせる前記1つ以上の命令は、
    前記処理済み文書データを生成するために前記自然言語処理を前記均質な文書に対して実行すること
    を前記デバイスにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
  18. 前記処理済み文書データから前記ワクチン接種データを抽出するために、前記処理済み文書データを、前記機械学習モデルを用いて処理することを前記デバイスにさせる前記1つ以上の命令は、
    前記処理済み文書データをカテゴリに分類することと、
    前記処理済み文書データから前記ワクチン接種データを前記カテゴリに基づき抽出することと
    を前記デバイスにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
  19. 前記処理済み文書データから前記ワクチン接種データを抽出するために、前記処理済み文書データを、前記機械学習モデルを用いて処理することを前記デバイスにさせる前記1つ以上の命令は、
    前記処理済み文書データにおける1つ以上の相違を特定することと、
    前記1つ以上の相違に関連するフィードバックを受信することと、
    前記処理済み文書データから前記ワクチン接種データを前記フィードバックに基づき抽出することと
    を前記デバイスにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
  20. 前記対応するフィールドからの前記ワクチン接種データについて前記登録機関に確認することを前記デバイスにさせる前記1つ以上の命令は、
    前記ワクチン接種データにおける1つ以上の相違を特定するフィードバックを前記登録機関から受信することと、
    修正されたワクチン接種データを生成するために、前記フィードバックにおいて特定された前記1つ以上の相違を修正することと、
    前記修正されたワクチン接種データについて前記登録機関に確認することと
    を前記デバイスにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
JP2022014426A 2021-02-03 2022-02-01 機械学習および自然言語処理を利用したワクチン接種データの抽出および確認 Active JP7364709B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163199920P 2021-02-03 2021-02-03
US63/199,920 2021-02-03
US17/249,819 2021-03-15
US17/249,819 US20220246257A1 (en) 2021-02-03 2021-03-15 Utilizing machine learning and natural language processing to extract and verify vaccination data

Publications (2)

Publication Number Publication Date
JP2022119207A true JP2022119207A (ja) 2022-08-16
JP7364709B2 JP7364709B2 (ja) 2023-10-18

Family

ID=80445510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022014426A Active JP7364709B2 (ja) 2021-02-03 2022-02-01 機械学習および自然言語処理を利用したワクチン接種データの抽出および確認

Country Status (3)

Country Link
US (1) US20220246257A1 (ja)
EP (1) EP4040311A1 (ja)
JP (1) JP7364709B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210302427A1 (en) * 2020-03-31 2021-09-30 Shuhari Group, LLC Secure Immunity Information Transmission System And Network
US11915807B1 (en) * 2022-10-11 2024-02-27 Flatiron Health, Inc. Machine learning extraction of clinical variable values for subjects from clinical record data
US11854675B1 (en) 2022-10-11 2023-12-26 Flatiron Health, Inc. Machine learning extraction of clinical variable values for subjects from clinical record data
CN116189838A (zh) * 2022-12-18 2023-05-30 无锡市疾病预防控制中心 一种多端接种录入的信息管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169103A1 (en) * 2015-12-10 2017-06-15 Agile Data Decisions LLC Method and system for extracting, verifying and cataloging technical information from unstructured documents
US20170351814A1 (en) * 2016-06-03 2017-12-07 International Business Machines Corporation Identifying potential patient candidates for clinical trials
JP2020030445A (ja) * 2018-08-20 2020-02-27 株式会社エムティーアイ 予防接種履歴管理システム、プログラム及び予防接種履歴管理システムの制御方法
JP2020527762A (ja) * 2017-07-20 2020-09-10 京東方科技集團股▲ふん▼有限公司Boe Technology Group Co.,Ltd. 医療テキスト中の医療エンティティを識別するための方法および装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930322B2 (en) * 2008-05-27 2011-04-19 Microsoft Corporation Text based schema discovery and information extraction
US20150088545A1 (en) * 2013-09-25 2015-03-26 Scientific Technologies Corporation Health records management systems and methods
US11321364B2 (en) * 2017-10-13 2022-05-03 Kpmg Llp System and method for analysis and determination of relationships from a variety of data sources
WO2020229348A1 (en) * 2019-05-15 2020-11-19 Koninklijke Philips N.V. Correcting an examination report
US20210326474A1 (en) * 2020-04-17 2021-10-21 Vacmobile Corporation Systems and methods for storing, authenticating and transmitting digital health information and records
US20220245270A1 (en) * 2021-02-01 2022-08-04 Medblob Inc. Personal Health Record System and Method using Patient Right of Access

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169103A1 (en) * 2015-12-10 2017-06-15 Agile Data Decisions LLC Method and system for extracting, verifying and cataloging technical information from unstructured documents
US20170351814A1 (en) * 2016-06-03 2017-12-07 International Business Machines Corporation Identifying potential patient candidates for clinical trials
JP2020527762A (ja) * 2017-07-20 2020-09-10 京東方科技集團股▲ふん▼有限公司Boe Technology Group Co.,Ltd. 医療テキスト中の医療エンティティを識別するための方法および装置
JP2020030445A (ja) * 2018-08-20 2020-02-27 株式会社エムティーアイ 予防接種履歴管理システム、プログラム及び予防接種履歴管理システムの制御方法

Also Published As

Publication number Publication date
JP7364709B2 (ja) 2023-10-18
EP4040311A1 (en) 2022-08-10
US20220246257A1 (en) 2022-08-04

Similar Documents

Publication Publication Date Title
US10698868B2 (en) Identification of domain information for use in machine learning models
US10417350B1 (en) Artificial intelligence system for automated adaptation of text-based classification models for multiple languages
JP7364709B2 (ja) 機械学習および自然言語処理を利用したワクチン接種データの抽出および確認
EP3882814A1 (en) Utilizing machine learning models, position-based extraction, and automated data labeling to process image-based documents
US20230004604A1 (en) Ai-augmented auditing platform including techniques for automated document processing
WO2020147238A1 (zh) 关键词的确定方法、自动评分方法、装置、设备及介质
US20200050845A1 (en) Method and system for extracting information from an image of a filled form document
US11081215B2 (en) Medical record problem list generation
US10503830B2 (en) Natural language processing with adaptable rules based on user inputs
JP7143456B2 (ja) 医学的事実の検証方法及び検証装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
US11727704B2 (en) Systems and methods for processing a table of information in a document
CN112100312A (zh) 从数据源中智能提取因果知识
US11620558B1 (en) Iterative machine learning based techniques for value-based defect analysis in large data sets
US11822896B2 (en) Contextual diagram-text alignment through machine learning
CN114647713A (zh) 基于虚拟对抗的知识图谱问答方法、设备及存储介质
US11429556B2 (en) Document management apparatus and non-transitory computer readable medium
Rose et al. The linguistic analysis of scene semantics: LASS
US11593417B2 (en) Assigning documents to entities of a database
US20220292393A1 (en) Utilizing machine learning models to generate initiative plans
US20140207712A1 (en) Classifying Based on Extracted Information
Shidaganti et al. Chatgpt: Information retrieval from image using robotic process automation and ocr
US11176311B1 (en) Enhanced section detection using a combination of object detection with heuristics
US11803796B2 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
US11990214B2 (en) Handling form data errors arising from natural language processing
JP2016110256A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230710

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231005

R150 Certificate of patent or registration of utility model

Ref document number: 7364709

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150