JP7093593B2 - 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム - Google Patents

汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム Download PDF

Info

Publication number
JP7093593B2
JP7093593B2 JP2021533326A JP2021533326A JP7093593B2 JP 7093593 B2 JP7093593 B2 JP 7093593B2 JP 2021533326 A JP2021533326 A JP 2021533326A JP 2021533326 A JP2021533326 A JP 2021533326A JP 7093593 B2 JP7093593 B2 JP 7093593B2
Authority
JP
Japan
Prior art keywords
term
medical
mapping
module
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021533326A
Other languages
English (en)
Other versions
JP2022508350A (ja
Inventor
▲勁▼松 李
雨 田
▲執▼▲暁▼ 王
▲天▼舒 周
▲凱▼奇 董
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Publication of JP2022508350A publication Critical patent/JP2022508350A/ja
Application granted granted Critical
Publication of JP7093593B2 publication Critical patent/JP7093593B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、用語標準化分野に関し、特に汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムに関する。
医療情報化の高速発展に伴い、医療データの種類や規模が急速に増加し、複数の医療データセンタ(単に「マルチセンタ」と称す)の医療データを利用してデータ分析マイニングを行い、さらに臨床決定、医療管理サービス、科学研究にサポートすることは必然的な傾向となる。しかし、国内の医療用語の関連する標準が欠けており、体系がまだ完備ではなく、これに加えて医療情報システムベンダーが多く存在するため、医療データセンタ間、さらに医療データセンタ内の用語名とコードの異性化現象は非常に深刻であり、多数の半構造化及び非構造化データも伴う。一方、国際的に成熟した関連する用語セットは、国内での応用が限られ、且つ、言語の障壁があるため、従来の国際標準用語セット間のマッピング関係は、国内医療用語の標準化に適用することが困難である。上記理由により、医療情報システム間では、相互操作ができず、複数の医療データセンタ間の医療データの標準化と共用共有を実現することが難しい。
汎用医療用語ライブラリは、『医学用語システムの命名-臨床用語』(SNOMEDーCT)、『国際疾患の分類とコード』(ICDー10)、臨床薬物標準命名法(RxNorm)、『観測指標の識別子の論理命名のプリコーディングシステム》(LOINC)などの国際汎用医療用語セットを中核とする、医療の全過程をカバーする医療概念用語標準ライブラリである。マルチセンタの医療データを統一された汎用医療用語ライブラリにマッピングした後、ビッグデータ分析などの操作を便利に行うことができる。マルチセンタ医療データを利用してデータ分析を行う前に、異なる医療情報システムの医療データをどのように用語標準化及びクリーニングするかは、難題となっている。
従来の技術案[CN201510922676:単語分割コードに基づき、医学用語のマッピング関係を自動的に構築する方法及びシステム]、[CN201710101827:医療ビッグデータのデータ標準化処理方法及び装置]、及び[CN201710152584:医療同義語の決定方法及び装置]は、中文単語分割の角度から、文字列マッチングなどの単語分割方法に基づき、医療用語に対する単語分割を実現し、そして医療用語間の類似度を計算することで、類似度の最も高い医療用語を選択して目標用語とのマッピング関係を確立することが多い。この種の技術案は、中文医療用語のマッチング問題のみに焦点を当て、医療情報システム全体の間の用語標準化問題を解決するのではなく、中文医療用語間のマッピングのみを対象とし、国外標準医療用語セットとの標準化を達成していない。
従来の技術案[CN201610173625:医療データの辞書の自動標準化の方法及びシステム]のような特許文献は、主に倫理レベルでクラウドに基づくデータの辞書の標準化モデルを構築し、全ての医療データセンタの用語セットをクラウドにピックアップして統一してマッピング処理を行う必要があるが、実際には、病院などの医療データセンタは、データセキュリティを確保するために、医療データセンタの用語セットが中央ローカルエリアネットワーク外のクラウドに公開されることを基本的に許可しないため、実際の医療用語標準化の需要を満たしていない。
現在、広く用いられている処理方法としては、情報技術担当者及び医師などの、医療の背景知識を有する担当者が、医療システムにおけるデータと汎用医療用語ライブラリとのマッピング関係を1つずつ確定し、そしてsqlスクリプトなどを実行することで半自動マッピングを行って、標準化された医療用語を取得することが挙げられる。医療用語を標準化する別の操作は、医療従事者に、データを入力する時に、標準フォーマットに従ってデータを標準化して入力させることである。しかし、従来の方法には、以下の明らかな欠点がある。
1.従来技術は、医療情報システム全体の医療用語の標準化を解決するのではなく、医療用語間のマッピング関係の確立のみに焦点を当てる。
2.従来の技術案は、いずれもある具体的なデータモデルを対象とし、実用性及び標的性を欠くだけでなく、且つ、中文医療用語間のマッピングに限定され、国際汎用の医療用語ライブラリとの間にマッピング関係を確立することができない。
3.国際汎用の医療用語セットコードが用いられた医療データに対して、従来の用語セット間の既存のマッピング関係を十分に発見しておらず、医療データセンタ内で標準医療用語セットが用いられていない医療用語と医療データセンタ内におけるカスタムされた医療用語について、通常、曖昧マッチングの方式で取り扱い、或いは、直接廃棄し、完全なマッピングプロセス及びメカニズムを確立していない。
4.医療の背景知識を有する担当者が参与することが必要な用語マッピングの場合、フレンドリーな対話型インタフェースと標準化された人工審査と異常処理メカニズムを提供していない。
5.データが乱雑であるため、従来の医療用語の標準化プロセスでは、用語マッピングと後続のデータクリーニングを組み合わせておらず、用語間のマッピング関係を利用して実際に用語標準化プロセスを完了できず、さらにマッピング後のデータの品質を保証できず、後続のデータ分析結果に深刻な影響を及ぼす。
6.マッピング及びクリーニング後の医療データについては、用語マッピング及びデータクリーニングの精度を保証するための詳細な品質評価メカニズムが確立されていない。
7.関連する国際汎用の医療用語ライブラリの更新後の処理メカニズム及び後続の増分更新メカニズムが考慮されていない。
本発明は、従来技術の欠陥に鑑みて、汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムを提供することで、複数種の標準化された医療用語セットに基づくマルチセンタ医療用語の標準化問題を解決し、医療用語のマッピング操作を簡略化し、医療用語標準化の全過程を充実させる。
本発明の目的は、以下の技術案により達成される。汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムであって、当該システムは、ソースデータベースと、データベース接続管理モジュールと、予備分析モジュールと、用語マッピングユニットと、増分更新モジュールと、異常処理モジュールと、マルチセンタ・インタラクションモジュールとを含み、
前記ソースデータベースは、各医療データセンタのフロントサーバ内に分布され、各医療データセンタの業務データを記憶し、
前記データベース接続管理モジュールは、ソースデータベースへのアクセスに必要な情報を管理し、用語マッピングツールによるソースデータベースへのアクセス及び修正にサポートし、
前記予備分析モジュールは、ソースデータベースを自動走査し、元の医療データにおける各医療用語の出現頻度を統計し、用語の出現頻度が設定された閾値よりも小さい用語について、廃棄アドバイスを与え、用語の出現頻度が設定された閾値以上である用語について、当該用語を用語マッピングユニットに送信して後続の用語マッピングを行い、
前記用語マッピングユニットは、自動マッピングモジュールと、曖昧マッチングモジュールと、カスタム用語モジュールとを含み、
前記自動マッピングモジュールは、医療用語の自動化マッピングをサポートし、国際汎用医療用語ライブラリの標準コードが用いられた用語について、従来の汎用医療用語ライブラリの標準コード間のマッピング関係に基づき、多方向マッピングを実現し、
前記曖昧マッチングモジュールは、従来の医療用語ライブラリの内部の標準コード間のマッピング関係から直接にマッピングできない医療用語について、曖昧マッチングの方式により、汎用医療用語ライブラリにおいてトラバース照会を行い、類似度の最も高い数組の標準医療用語を提供して当該用語マッピングの目標用語として選択し、
前記カスタム用語モジュールは、従来の医療用語ライブラリ内の標準コード間のマッピング関係からマッピングできない且つ従来の汎用医療用語ライブラリで目標用語を曖昧マッチングできない医療用語について、ユーザがカスタム用語の申請を生成した後、マルチセンタ・インタラクションモジュールに送信してそれに対して審査及びフィードバックを行い、
前記マルチセンタ・インタラクションモジュールは、カスタム用語モジュールから送信された各医療データセンタのカスタム用語の申請を受信した後、カスタム用語に対して審査を行い、審査に合格したカスタム用語を標準用語として汎用医療用語ライブラリに追加するとともに、各医療データセンタに送信し、各医療データセンタの汎用医療用語ライブラリが一致するように保ち、
前記増分更新モジュールは、医療用語の標準化マッピングが行われたソースデータベースが業務原因によって増分データを生成した医療用語標準化プロセスに対して、用語マッピングユニットに生成された履歴マッピング関係記録を呼び出して増分データに対する用語の標準化マッピングを完了させ、
前記異常処理モジュールは、上記各モジュールの実行プロセスを記録し、エラーが発生した場合、エラーログを生成し、エラーログに基づき、医療用語マッピングの全過程の遡りを行うことができる。
さらに、当該システムは、データクリーニングモジュールをさらに含み、前記データクリーニングモジュールは、クリーニング・ルールを作成し、各データ要素に重みを与え、欠損が深刻なデータをスクリーニングしており、構造レベル及び実例レベルのダーティデータをクリーニングすることを含む。
さらに、前記データベース接続管理モジュールは、具体的に、プログラミング言語によって記述されたクラス及びインタフェースがJDBCモジュールを構成することにより、複数種のデータベースに統一されたアクセスインタフェースを提供し、データベース又は他のデータソースとの接続を確立し、データベースにSQL命令を送信し、データベースの返信結果を処理する機能を実現する。
さらに、前記予備分析モジュールは、データベース接続管理モジュールがソースデータベースとの接続を実現した後、当該モジュールにより、ソースデータベースにおける全てのデータ構造情報及びその具体的なフィールドの統計情報を自動走査し、統計テーブルを生成し、以下の2つの部分を含み、
まず、ソースデータベース内の、各テーブル内のフィールド名、数値タイプ、全ての値の最大長さ、テーブル内の総行数、及びヌル値の占める割合を含む全てのテーブルの要約性を統計し、
次に、具体的なある1つのテーブルの内部の具体的な用語の詳細情報及び出現頻度を統計し、且つ出現頻度の高低に応じて大きい順に配列することで、後続の用語マッピングは、出現頻度の高い用語を優先的に選択して処理し、システムは、出現頻度の低い用語が後続の用語マッピングに参与する必要があるかどうかのアドバイスを与え、未定義の場合、デフォルトで全ての用語がマッピングに参与することとし、また、ユーザが具体的な状況に応じて調整することも可能であるとすることで、後続の用語マッピングに参与しない最小の出現頻度の閾値を決定する。
さらに、前記自動マッピングモジュールは、ソースデータベース内に国際汎用医療用語ライブラリの標準コードが存在する用語について、そのコードの属する標準を特定した後、マッピングされる目標用語セットを選択し、ソースデータベース内の用語の属する標準用語セットのコードと目標用語セットコードとの間に参照可能なマッピング関係があれば、この部分の用語は、マッピングSQL文を自動的に生成でき、ソースデータベース内の用語に対する自動マッピング、及び対応するデータのロードを完了させる。
さらに、前記曖昧マッチングモジュールでは、曖昧マッチングの具体的な方法は、以下の通りであり、
(1)用語の単語分割であって、汎用医療用語ライブラリにおける全ての語彙に対して単語分割を行い、それぞれの単語分割に対して出現頻度を統計し、基礎語彙の頻度として、曖昧マッチングが必要なソース医療用語Mに対してマッチングする前に単語分割を行い、
(2)曖昧マッチングであって、医療用語間の確率差を比較することで、類似度の大きさの基準とし、具体的な操作は、以下の通りであり、
(2.1)汎用医療用語ライブラリから単語分割を含む全ての用語をスクリーニングし、単語分割を行い、用語セットAに組み合わせ、
(2.2)以下の式(1)を用いてマッチング度の計算を行い、用語M、用語セットAにおける全ての用語の加重平均確率を求め、但し、nは、単語分割が得られた各用語の数であり、P1、P2、P3、P4 … Pnは、各単語分割の基礎語彙における対応する確率であり、
Figure 0007093593000001
(1)
(2.3)用語セットAにおける全ての標準用語の加重平均確率と、曖昧マッチングが必要な用語Mとの差を求め、得られた数値に対して負値を取ってマッチング度とし、マッチング度が大きいほど、両者の類似度が高くなり、その数式(2)は、
Figure 0007093593000002
である。
さらに、前記カスタム用語モジュールは、カスタム用語と既知の標準用語との相互衝突を回避するように、事前に制約を定義し、カスタム用語を追加する際、各医療データセンタの間に追加されたカスタム標準用語の整合性を保つ必要があり、重複追加を防止するとともに、マルチセンタ医療データが用語マッピング標準化された後、データ共有が実現可能であることを保証し、カスタム用語を追加する前に、マルチセンタ・インタラクションモジュールに、カスタム用語を追加する申請を提出する必要があり、申請内容は、追加するカスタム用語、カスタム用語の具体的な説明及びカスタム用語のコードを含み、マルチセンタ・インタラクションモジュールの関連する操作者による審査に合格した場合、類似して重複する医療用語のカスタムコードがないと判断し、1つのカスタム標準用語コードを生成し、そして、自動マッピングモジュールを呼び出し、用語マッピング及び関連するデータのロードを完了させ、審査に合格しなかった場合、当該医療データセンタが、後続のマッピングを完了させるために、既存のカスタム用語コードを返送し、或いは、カスタム用語の生成に失敗した原因を返送し、エラードキュメントを生成してユーザに提示する。
さらに、前記マルチセンタ・インタラクションモジュールは、各医療データセンタの汎用医療用語ライブラリ及びその用語コードの協調と統一を担当し、マルチセンタ・インタラクションモジュールの最高権限者は、カスタム標準用語の使用問題を審査協調する。
さらに、前記増分更新モジュールは、医療用語マッピングが行われた医療データセンタの後続の医療用語標準化プロセスに用いられ、主に用語マッピングユニットの生成した従来の用語標準化されたマッピング記録に基づき増分データの更新を実現し、標準化マッピングがまだ完了していない医療用語について、カスタム用語モジュールを繰り返して実行する。
さらに、前記異常処理モジュールは、システムの動作時の全てのログを保管し、各モジュールが正常に動作するかどうかを記録し、システムの動作時に発生したエラーと、各モジュールの呼び出し時に発生したエラーと、各モジュールの動作時に個別の用語に対してマッピングを行う際に発生したエラーとを含むエラーログを分類して保管し、自動分析モジュールで無視された用語及びカスタムモジュールで無視された用語を含むマッピングが成功しなかった用語を分類して保管し、失敗した用語のドキュメントを生成し、異常処理モジュールは、データベースにタイムスタンプを設定することで、データベースの遡り機能をサポートし、ユーザがマッチングされたデータベースを、指定された日付のデータに遡ることをサポートする。
本発明の有益な効果は、以下の通りであり、本発明は、複数の医療データセンタの医療用語の標準化問題を体系的に解決し、且つ各医療データセンタの医療用語の記述の整合性を保ち、医療データセンタのソースデータベースの自動走査と分析を自動的に実現し、この上で、標準コードが存在する医療用語の自動化マッピングを実現し、医療用語マッピングの必然的に存在する複雑性を十分に考慮し、マッピングの自動化からマッピングの曖昧マッチングまで、さらにカスタム用語のマッピングまでという螺旋が上昇するプロセスを実現し、増分更新メカニズムは、従来のマッピング記録を十分に利用することで、後続の動作の負荷を大幅に軽減し、医療用語マッピングの標準化程度を大幅に向上させる。
システム流程図である。 システムデータ流向図である。 JDBC実現データベース接続管理原理図である。 医療用語標準化マッピング流程図である。 マルチセンタ交互原理図である。
以下、図面及び具体的な実施例を参照しながら本発明を詳しく説明する。
図1示すように、本発明は、汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムを提供し、当該システムは、ソースデータベースと、データベース接続管理モジュールと、予備分析モジュールと、用語マッピングユニットと、増分更新モジュールと、異常処理モジュールと、マルチセンタ・インタラクションモジュールとを含み、さらに、データクリーニングモジュールを含むことが可能であり、
ソースデータベースは、各医療データセンタのフロントサーバ内に分布され、各医療データセンタのHIS、LIS、PACS及びEMRなどの医療情報システムの業務データを記憶し、前記業務データは、患者の基本情報、治療情報、費用情報、診断情報、投薬情報、手術情報、検証情報、検査情報、テキストカルテ情報及び看護バイタルサイン情報を含み、
データベース接続管理モジュールは、ソースデータベースへのアクセスに必要な情報を管理(ロード、修正及び記憶を含む)し、用語マッピングツールによる異なるタイプのソースデータベースへのアクセス及び修正にサポートし、
予備分析モジュールは、ソースデータベースを自動走査し、元の医療データにおける各医療用語の出現頻度を統計し、用語の出現頻度が設定された閾値よりも小さい用語について、廃棄アドバイスを与え、用語の出現頻度が設定された閾値以上である用語について、当該用語を用語マッピングユニットに送信して後続の用語マッピングを行い、
用語マッピングユニットは、自動マッピングモジュールと、曖昧マッチングモジュールと、カスタム用語モジュールとを含み、
自動マッピングモジュールは、医療用語の自動化マッピングをサポートし、国際汎用医療用語ライブラリの標準コードが用いられた用語について、従来の汎用医療用語ライブラリの標準コードの間のマッピング関係に基づき、多方向マッピングを実現し、そのマッピング結果を品質制御すればよく、
曖昧マッチングモジュールは、従来の医療用語ライブラリの内部の標準コード間のマッピング関係から直接にマッピングできない医療用語について、曖昧マッチングの方式により、汎用医療用語ライブラリにおいてトラバース照会を行い、類似度の最も高い数組の標準医療用語を提供して当該用語マッピングの目標用語として選択し、
カスタム用語モジュールは、従来の医療用語ライブラリ内の標準コード間のマッピング関係からマッピングできない且つ従来の汎用医療用語ライブラリで目標用語を曖昧マッチングできない医療用語について、ユーザがカスタム用語の申請を生成した後(技術担当者と医師との共同決定により)、マルチセンタ・インタラクションモジュールに送信してそれに対して審査及びフィードバックを行い、
マルチセンタ・インタラクションモジュールは、カスタム用語モジュールから送信された各医療データセンタのカスタム用語の申請を受信した後、カスタム用語に対して審査を行い、審査に合格したカスタム用語を標準用語として汎用医療用語ライブラリに追加するとともに、各医療データセンタに送信し、各医療データセンタの汎用医療用語ライブラリが一致するように保ち、
増分更新モジュールは、医療用語の標準化マッピングが行われたソースデータベースが業務原因によって増分データを生成した医療用語標準化プロセスに対して、用語マッピングユニットに生成された履歴マッピング関係記録を呼び出して増分データに対する用語の標準化マッピングを完了させ、
異常処理モジュールは、上記各モジュールの実行プロセスを記録し、エラーが発生した場合、エラーログを生成し、その以降、エラーログに基づき医療用語マッピング全過程の遡りを行うことができるように保証する。
データクリーニングモジュールは、クリーニング・ルールを作成し、各データ要素に重みを与え、欠損が深刻なデータをスクリーニングし、データの品質を向上させる。
各モジュールの具体的な実現方式は、以下の通りである。
一.データベース接続管理モジュール
ソースデータベースへの必要な情報を管理(ロード、修正及び記憶を含む)し、ソースデータベースと目標データベースは、物理レベルで同一のデータベースシステムにすることができる。実現方法は、主に従来の例えばjavaプログラミング言語で記述されたクラス及びインタフェースがJDBCモジュールを構成し、複数種のデータベースに統一されたアクセスインタフェースを提供し、優れたクロスプラットフォームパフォーマンスを有し、主にデータベース又は他のデータソースとの接続を確立し、データベースにSQL命令を送信し、データベースの返信結果を処理する機能を実現し、その概略図は、図3に示す通りである。
二.予備分析モジュール
データベース接続管理モジュールが、ソースデータベースとの接続を実現した後、当該モジュールによりソースデータベースにおける全てのデータ構造情報及びその具体的なフィールドの統計情報を自動走査し、統計テーブルAを生成し、このテーブルは、2つの部分を含む。
まず、以下のテーブルに示すように、ソースデータベース内の、各テーブル内のフィールド名、数値タイプ、全ての値の最大長さ、テーブル内の総行数、及びヌル値の占める割合を含む全てのテーブルの要約性を統計する。
Figure 0007093593000003
次に、具体的なある1つのテーブルの内部の具体的な用語の詳細情報及び出現頻度を統計し、且つ出現頻度の高低に応じて大きい順に配列することで、後続の用語マッピングは、出現頻度の高い用語を優先的に選択して処理し、システムは、出現頻度の低い用語が後続の用語マッピングに参与する必要があるかどうかのアドバイスを与え、未定義の場合、デフォルトで全ての用語がマッピングに参与することとし、また、ユーザが具体的な状況に応じてパラメータを調整することも可能であることで、後続の用語マッピングに参与しない最小の出現頻度の閾値を決定する。このように、後続の用語マッピングプロセスを大幅に簡略化し、一定の作業量を減少し且つデータ品質を向上させることができる。
Figure 0007093593000004
例えば、ある用語Aが非標準用語であり、その合計量がN2であり、データの合計量がN1であると、Aの頻度は、P=N1/N2である。Mは、設定された、マッピングに参与する最小の出現頻度であり、P≧Mであれば、Aは、マッピングに参与する対象であり、P<Mであれば、Aは、出現頻度が極めて低い非標準用語であり、後続の用語マッピングに参与しない。但し、Mは、ユーザが実際の状況に応じて設定した閾値である。
上記のモジュールに生成されたドキュメント情報は、pdf、excel、CSVなどのフォーマットでエクスポートすることができる。
三.自動マッピングモジュール
ソースデータベース内に国際汎用医療用語ライブラリの標準コードが存在する用語について、そのコードの属する標準を特定した後、そのマッピングされる目標用語セットを選択し、ソースデータベース内の用語の属する標準用語セットコードと目標用語セットコードとの間に参照可能なマッピング関係があれば、この部分の用語は、マッピングSQL文を自動的に生成し、ソースデータベース内の用語に対する自動マッピング、及び相応的なデータロードを完了させる。
四.曖昧マッチングモジュール
当該部分の医療用語を汎用医療用語ライブラリにおける標準用語と1つずつ曖昧マッチングし、マッピングが推奨される標準用語及びその所在する標準用語セットコードを提供する。曖昧マッチングは、通常、複数の標準用語をマッチング対象として推奨し、医学知識の背景を有する専門家が手動で唯一のマッチング対象を決定する必要がある。マッピング関係が決定された後、自動マッピングモジュールを呼び出して当該部分の医療用語のマッピング及びそれにカバーされるデータのロードを完了させる。曖昧マッチングの具体的な方法は、以下の通りである。
(1)用語単語分割
医療用語は、多くの語彙が規則敵に組み合わせてなり、ここで特定の規律に応じて医療用語を複数の語彙に再び細分化する。
(1.1)このような方法に従って、汎用医療用語ライブラリにおける全ての語彙に対して単語分割を行い、各単語分割に対して出現頻度を統計し、基礎語彙の頻度とする。
(1.2)曖昧マッチングを必要とするソース医療用語を、マッチングする前に、単語分割も行う。例えば、用語Mは、単語分割された後、[単語分割1、単語分割2、…単語分割n]が得られる。
(2)曖昧マッチング
本発明は、医療用語間の確率差を比較することで、類似度の大きさの基準とし、具体的な操作は、以下の通りであり、
(2.1)汎用医療用語ライブラリから、単語分割を含む全ての用語をスクリーニングし、単語分割を行い、用語セットA{a,b,c,d,e,…}に組み合わせ、
(2.2)以下の式(1)を用いてマッチング度の計算を行い、用語M、用語セットAにおける全ての用語の加重平均確率を求め、但し、nは、単語分割が得られた各用語の数であり、P1、P2、P3、P4 … Pnは、各単語分割の基礎語彙における対応する確率であり、
Figure 0007093593000005
(1)
(2.3)用語セットAにおける全ての標準用語の加重平均確率と、曖昧マッチングが必要な用語Mとの差を求め、得られた数値に対して負値を取ってマッチング度とし、マッチング度が大きいほど、両者の類似度が高くなり、その数式(2)は、
Figure 0007093593000006
である。
用語「阿膠長寿内服液」を例とすると、
a)汎用医療用語ライブラリ用語に対して単語分割を行い、各単語分割の確率を取得し、
b)用語「阿膠長寿内服液」に対して単語分割を行った後、「阿膠\長寿\内服液」を取得した。基礎語彙の頻度にその対応する確率を検索し、それぞれ「阿膠」頻度p1、「長寿」p2、「内服液」p3を取得し、その各単語分割の平均確率d(M)を求め、
c)汎用医療用語ライブラリに「阿膠」、「長寿」、「内服液」を含む全ての用語を検索し、それらに対して単語分割を行い、用語セットA{[「阿膠」、「カルシウム」、「内服液」]、[「阿膠」、「顆粒」]、[「阿膠」、「補血」、「内服液」]…}を取得し、d(a)、d(b)、d(c)…を取得し、
d)マッチング度を求めてソートする。
Figure 0007093593000007
五.カスタム用語モジュール
複雑な場合、特に国内医療データセンタにデータが冗長であり、漢方薬及び伝統的な治療手段に関連する医療用語が多く存在する実際の状況では、国際汎用医療用語ライブラリとマッチングできないことがある。カスタム用語モジュールカスタム用語と既知の標準用語との相互衝突を回避するように、事前に制約を定義し、例えば、コード上に、カスタム用語に限られたコード範囲を使用するように強制される。
カスタム用語を追加する際、重複追加を防止するように、各医療データセンタの間に追加されたカスタム標準用語の整合性を保つ必要があり、また、マルチセンタの医療データが用語マッピング標準化された後でもデータの共有を実現できると保証する。従って、医療データセンタの医療データに対して用語標準化マッピングを行うとき、カスタム用語を追加する前に、マルチセンタ・インタラクションモジュールにカスタム用語を追加する報告を提出する必要があり、報告内容は、追加されるカスタム用語と、カスタム用語の具体的な説明、カスタム用語のコード(システムが自動的に生成する)。センタの関連する操作者が審査して、類似して重複する医療用語のカスタムコードがないと判断すると、1つのカスタム標準用語コードを生成し、続いて自動マッピングモジュールを呼び出し、用語マッピング及びそれにカバーされるデータのロードを完了させ、審査に合格しなければ、既存のカスタム用語コードを返送して、当該医療データセンタが後続のマッピングを完了させ、又は、カスタム用語の生成に失敗した原因を返送し、エラードキュメントを生成してユーザに提示する。カスタム用語モジュールの操作の概略図は、図4に示す通りである。
六.マルチセンタ・インタラクションモジュール
各医療データセンタの医療情報システムの間にデータ標準化とデータ共有を実現しようとすると、全ての医療データセンタが統一された汎用医療用語ライブラリ及び統一された医療用語セットコードを用いることが要求される。本発明は、審査後に統一的に追加する方式を採用し、各医療データセンタが標準用語をカスタムする時に生じる用語記述の差異を防止する。提出、審査、承認のプロセスでは、複数の医療データセンタのインタラクションの問題が存在する。マルチセンタ・インタラクションモジュールは、各医療データセンタの汎用医療用語ライブラリ及びその用語コードの協調及び統一を担当し、マルチセンタ・インタラクションモジュールの最高権限者は、カスタム標準用語の使用問題を審査協調する。マルチセンタのカスタム用語のインタラクションネットワークは、図5に示す通りである。
七.増分更新モジュール
医療用語マッピングが行われた医療データセンタの後続の医療用語の標準化プロセスは、主に用語マッピングユニットが生成した従来の用語標準化されたマッピング記録に基づき増分データの更新を実現し、標準化マッピングがまだ完了できていない医療用語について、カスタム用語モジュールを繰り返して実行する。
八.異常処理モジュール
異常処理モジュールは、システムの稼働時の全てのログを保存し、各モジュールが正常に稼働するかどうかを記録し、システムの動作時に発生したエラーと、各モジュールの呼び出し時に発生したエラーと、各モジュールの動作時に個別の用語に対してマッピングを行うときに発生したエラーとを含むエラーログを分類して保管し、自動分析モジュールで無視された用語及びカスタムモジュールで無視された用語を含むマッピングが成功しなかった用語を分類して保管し、失敗した用語のドキュメントを生成する。異常処理モジュールは、データベースにタイムスタンプを設定することで、データベースの遡り機能をサポートし、ユーザがマッチングされたデータベースを、指定された日付のデータ遡ることをサポートする。
九.データクリーニングモジュール
医療用語の標準化マッピングの後、医療データのクリーニングは、医療データの品質を向上させ、後続のデータマイニング及び分析のために必要であり、ここで、よく用いられるデータクリーニングポリシーが提供され、主に構造レベル及び実例レベルの「ダーティデータ」をクリーニングし、それぞれデータモード及び完全性制約要件に違反するデータを含み、例えば、データ値の超過範囲、属性依頼関係の破壊、一意の関係の破壊、参照の完全性の破壊など及び値が間違った属性に対応すること、属性間の依頼関係が破壊されたデータ、例えば欠落値、重複記録、矛盾する記録、参照エラーなどが挙げられ、最大程度にデータの完全性、一意性、権威性、正当性、整合性を満たし、データの冗長を減少し、データの品質を向上させる。
1)構造レベルのクリーニング・ルール:統一されたデータモード(データのタイプを含む)の定義、統一された完全性の制約の定義、統一された関数依存要件の定義である。
2)実施例レベルのクリーニング・ルール:ダーティデータを分析し、クリーニング・ルールを作成し、評価と検証を行い、同時にクリーニング動作をログに記録することで、追跡を行う。
本発明は、現在のデータマイニングと分析のデータ数と品質に対する要求が高まるにつれて、複数の医療データセンタ(主に病院)間のデータ共有共用を実現するとともに、各医療データセンタデータの安全性を十分に保証するために、協働モードを設計することにより、医療データの共有で医療プロセスを最適化し、関連する科学研究の進展を加速し、最終的に患者の医療サービスの品質を向上させる。複数の医療データセンタ間のデータ共有の前提は、医療データの標準化であり、2つの部分の内容を含み、1つ目は、データ構造の標準化であり、2つ目は、医療用語の標準化であり、これらの内容は、いずれも後者の標準化に基づいて設計されたものである。本発明の技術的ポイントは以下のように要約される。
1.各モジュール間の相互作用により、医療情報システム内のデータベースの自動分析走査を実現し、データベース内の医療用語の出現頻度などの統計情報を返信し、後続の医療用語のマッピング及び性能の最適化に実際の根拠を提供する。
2.国際汎用の医療用語セットのコードが用いられたデータについて、従来の医療用語セットのコード間のマッピング関係から、この部分の医療用語がカバーする医療データのマッピングを自動的に実現する。
3.医療データセンタの内部で標準用語セットコードが使用されていないデータ、カスタムされた医療用語又は国内に固有の医療用語、例えば漢方薬などについて、当該医療用語の医療データセンタ内におけるデータの出現頻度などに基づく情報をサポートし、関連者が可視化的に合理的、科学的な曖昧マッチング、又はカスタム標準用語を直接追加することをサポートする。
4.複数の医療データセンタとの間のインタラクションの需要を定期的に完了させ、各医療データセンタで医療用語標準化が完了した後、各汎用医療データベース間の標準が統一されると保証し、データの共有を実現する。
5.クリーニング策略に従ってデータをクリーニングし、データの品質を保証する。
6.全てのエラー異常をログに記録し、エラーチェック及び品質評価などの機能が実現しやすい。
7.確立された医療データセンタ内の医療用語と国際汎用の標準医療用語セットとのマッピング関係を十分に利用し、後続の医療データセンタ内の用語の半自動化的、ひいては自動化的なマッピングと標準化を実現する。
以上は本発明の実施例に過ぎず、本発明の範囲を限定するものではない。本発明の精神と原則内に、創造的な労働を付しないあらゆる修正、均等置換、改良などは、いずれも本発明の保護範囲に含まれる。

Claims (9)

  1. 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システムであって、当該システムは、ソースデータベースと、データベース接続管理モジュールと、予備分析モジュールと、用語マッピングユニットと、増分更新モジュールと、異常処理モジュールと、マルチセンタ・インタラクションモジュールとを含み、
    前記ソースデータベースは、各医療データセンタのフロントサーバ内に分布され、各医療データセンタの業務データを記憶し、
    前記データベース接続管理モジュールは、ソースデータベースへのアクセスに必要な情報を管理し、用語マッピングツールによるソースデータベースへのアクセス及び修正をサポートし、
    前記予備分析モジュールは、ソースデータベースを自動走査し、元の医療データにおける各医療用語の出現頻度を統計し、用語の出現頻度が設定された閾値よりも小さい用語について、廃棄アドバイスを与え、用語の出現頻度が設定された閾値以上である用語について、当該用語を用語マッピングユニットに送信して後続の用語マッピングを行い、
    前記用語マッピングユニットは、自動マッピングモジュールと、曖昧マッチングモジュールと、カスタム用語モジュールとを含み、
    前記自動マッピングモジュールは、医療用語の自動化マッピングをサポートし、国際汎用医療用語ライブラリの標準コードが用いられた用語について、従来の汎用医療用語ライブラリの標準コードの間のマッピング関係に基づき、多方向マッピングを実現し、
    前記曖昧マッチングモジュールは、従来の汎用医療用語ライブラリの内部の標準コード間のマッピング関係から直接にマッピングできない医療用語について、曖昧マッチングの方式により、従来の汎用医療用語ライブラリにおいてトラバース照会を行い、類似度の最も高い数組の標準医療用語を提供して当該用語マッピングの目標用語として選択し、
    前記カスタム用語モジュールは、従来の汎用医療用語ライブラリ内の標準コード間のマッピング関係からマッピングできない且つ従来の汎用医療用語ライブラリで目標用語を曖昧マッチングできない医療用語について、ユーザがカスタム用語の申請を生成した後、マルチセンタ・インタラクションモジュールに送信してそれに対して審査及びフィードバックを行い、
    前記マルチセンタ・インタラクションモジュールは、カスタム用語モジュールから送信された各医療データセンタのカスタム用語の申請を受信した後、カスタム用語に対して審査を行い、審査に合格したカスタム用語を標準用語として従来の汎用医療用語ライブラリに追加するとともに、各医療データセンタに送信し、各医療データセンタの従来の汎用医療用語ライブラリが一致するように保ち、
    前記増分更新モジュールは、医療用語の標準化マッピングが行われたソースデータベースが業務原因によって増分データを生成した医療用語標準化プロセスに対して、用語マッピングユニットに生成された履歴マッピング関係記録を呼び出して増分データに対する用語の標準化マッピングを完了させ、
    前記異常処理モジュールは、上記各モジュールの実行プロセスを記録し、エラーが発生した場合、エラーログを生成し、エラーログに基づき、医療用語マッピングの全過程の遡りを行うことができ、
    前記曖昧マッチングモジュールでは、曖昧マッチングの具体的な方法は、以下の通りであり、
    (1)用語の単語分割であって、従来の汎用医療用語ライブラリにおける全ての語彙に対して単語分割を行い、それぞれの単語分割に対して出現頻度を統計し、基礎語彙の頻度として、曖昧マッチングが必要なソース医療用語Mに対してマッチングする前に単語分割を行い、
    (2)曖昧マッチングであって、医療用語間の確率差を比較することで、類似度の大きさの基準とし、具体的な操作は、以下の通りであり、
    (2.1)従来の汎用医療用語ライブラリから単語分割を含む全ての用語をスクリーニングし、単語分割を行い、用語セットAに組み合わせ、
    (2.2)以下の式(1)を用いてマッチング度の計算を行い、用語M、用語セットAにおける全ての用語の加重平均確率を求め、但し、nは、単語分割が得られた各用語の数であり、P1、P2、P3、P4…Pnは、各単語分割の基礎語彙における対応する確率であり、
    Figure 0007093593000008
    (1)
    (2.3)用語セットAにおける全ての標準用語の加重平均確率と、曖昧マッチングが必要な用語Mとの差を求め、得られた数値に対して負値を取ってマッチング度とし、マッチング度が大きいほど、両者の類似度が高くなり、以下の式(2)は、
    Figure 0007093593000009
    である
    ことを特徴とする汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  2. 当該システムは、データクリーニングモジュールをさらに含み、前記データクリーニングモジュールは、クリーニング・ルールを作成し、各データ要素に重みを与え、欠損が深刻なデータをスクリーニングしており、構造レベル及び実例レベルのダーティデータをクリーニングすることを含む
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  3. 前記データベース接続管理モジュールは、具体的に、プログラミング言語によって記述されたクラス及びインタフェースがJDBCモジュールを構成することにより、複数種のデータベースへ統一されたアクセスインタフェースを提供し、データベース又は他のデータソースとの接続を確立し、データベースにSQL命令を送信し、データベースの返信結果を処理する機能を実現する
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  4. 前記予備分析モジュールは、データベース接続管理モジュールがソースデータベースとの接続を実現した後、当該予備分析モジュールにより、ソースデータベースにおける全てのデータ構造情報及びその具体的なフィールドの統計情報を自動走査し、統計テーブルを生成し、以下の2つの部分を含み、
    まず、ソースデータベース内の、各テーブル内のフィールド名、数値タイプ、全ての値の最大長さ、テーブル内の総行数、及びヌル値の占める割合を含む全てのテーブルの要約性を統計し、
    次に、具体的なある1つのテーブルの内部の具体的な用語の詳細情報及び出現頻度を統計し、且つ出現頻度の高低に応じて大きい順に配列することで、後続の用語マッピングは、出現頻度の高い用語を優先的に選択して処理し、システムは、出現頻度の低い用語が後続の用語マッピングに参与する必要があるかどうかのアドバイスを与え、未定義の場合、デフォルトで全ての用語がマッピングに参与することとし、また、ユーザが具体的な状況に応じて調整することも可能であるとすることで、後続の用語マッピングに参与しない最小の出現頻度の閾値を決定する
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  5. 前記自動マッピングモジュールは、ソースデータベース内に国際汎用医療用語ライブラリの標準コードが存在する用語について、国際汎用医療用語ライブラリの標準コードが存在する用語のコードの属する標準を特定した後、マッピングされる目標用語セットを選択し、ソースデータベース内の用語の属する標準用語セットのコードと目標用語セットのコードとの間に参照可能なマッピング関係があれば、この部分の用語は、マッピングSQL文を自動的に生成でき、ソースデータベース内の用語に対する自動マッピング、及び対応するデータのロードを完了させる
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  6. 前記カスタム用語モジュールは、カスタム用語と既知の標準用語との相互衝突を回避するように、事前に制約を定義し、カスタム用語を追加する際、各医療データセンタの間に追加されたカスタム標準用語の整合性を保つ必要があり、重複追加を防止するとともに、マルチセンタ医療データが用語マッピング標準化された後、データ共有が実現可能であることを保証し、カスタム用語を追加する前に、マルチセンタ・インタラクションモジュールに、カスタム用語を追加する申請を提出する必要があり、申請内容は、追加するカスタム用語、カスタム用語の具体的な説明及びカスタム用語のコードを含み、マルチセンタ・インタラクションモジュールの関連する操作者による審査に合格した場合、類似して重複する医療用語のカスタムコードがないと判断し、1つのカスタム標準用語コードを生成し、そして、自動マッピングモジュールを呼び出し、用語マッピング及び関連するデータのロードを完了させ、審査に合格しなかった場合、当該医療データセンタが、後続のマッピングを完了させるために、既存のカスタム用語コードを返送し、或いは、カスタム用語の生成に失敗した原因を返送し、エラードキュメントを生成してユーザに提示する
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  7. 前記マルチセンタ・インタラクションモジュールは、各医療データセンタの従来の汎用医療用語ライブラリ及びその用語コードの協調と統一を担当し、マルチセンタ・インタラクションモジュールの最高権限者は、カスタム標準用語の使用問題を審査協調する
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  8. 前記増分更新モジュールは、医療用語マッピングが行われた医療データセンタの後続の医療用語標準化プロセスに用いられ、主に用語マッピングユニットの生成した従来の用語標準化されたマッピング記録に基づき増分データの更新を実現し、標準化マッピングがまだ完了していない医療用語について、カスタム用語モジュールを繰り返して実行する
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
  9. 前記異常処理モジュールは、システムの動作時の全てのログを保管し、各モジュールが正常に動作するかどうかを記録し、システムの動作時に発生したエラーと、各モジュールの呼び出し時に発生したエラーと、各モジュールの動作時に個別の用語に対してマッピングを行う際に発生したエラーとを含むエラーログを分類して保管し、自動分析モジュールで無視された用語及びカスタムモジュールで無視された用語を含むマッピングが成功しなかった用語を分類して保管し、失敗した用語のドキュメントを生成し、異常処理モジュールは、データベースにタイムスタンプを設定することで、データベースの遡り機能をサポートし、ユーザがマッチングされたデータベースを、指定された日付のデータに遡ることをサポートする
    ことを特徴とする請求項1に記載の汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム。
JP2021533326A 2019-07-12 2020-04-07 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム Active JP7093593B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910629244.9A CN110349639B (zh) 2019-07-12 2019-07-12 一种基于通用医疗术语库的多中心医疗术语标准化系统
CN201910629244.9 2019-07-12
PCT/CN2020/083586 WO2020233256A1 (zh) 2019-07-12 2020-04-07 一种基于通用医疗术语库的多中心医疗术语标准化系统

Publications (2)

Publication Number Publication Date
JP2022508350A JP2022508350A (ja) 2022-01-19
JP7093593B2 true JP7093593B2 (ja) 2022-06-30

Family

ID=68176052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021533326A Active JP7093593B2 (ja) 2019-07-12 2020-04-07 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム

Country Status (3)

Country Link
JP (1) JP7093593B2 (ja)
CN (1) CN110349639B (ja)
WO (1) WO2020233256A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110349639B (zh) * 2019-07-12 2022-01-04 之江实验室 一种基于通用医疗术语库的多中心医疗术语标准化系统
CN111126018B (zh) * 2019-11-25 2023-08-08 泰康保险集团股份有限公司 表单生成方法及装置、存储介质、电子设备
CN110990591A (zh) * 2019-12-26 2020-04-10 北京亚信数据有限公司 医疗数据转码质量稽核方法及系统
CN111291225B (zh) * 2020-05-08 2020-08-11 成都金盘电子科大多媒体技术有限公司 一种医疗健康信息数据标准快速校验的方法及系统
CN112035451A (zh) * 2020-08-25 2020-12-04 上海灵长软件科技有限公司 数据校验优化的处理方法、装置、电子设备与存储介质
CN112069774A (zh) * 2020-09-03 2020-12-11 微医云(杭州)控股有限公司 一种数据映射方法、装置、电子终端及存储介质
CN112347266A (zh) * 2020-09-11 2021-02-09 湖南中医药大学 儿童康复专科术语标准化系统
CN112052667B (zh) * 2020-09-27 2024-05-03 沈阳东软智能医疗科技研究院有限公司 一种实现医学编码映射的方法、装置及设备
CN112365939B (zh) * 2020-10-14 2023-04-07 山东大学 一种基于医疗健康大数据的数据治理方法及系统
CN112395854B (zh) * 2020-12-02 2022-11-22 中国标准化研究院 一种标准要素的一致性检验方法
CN112883157B (zh) * 2021-02-07 2023-04-07 武汉大学 一种多源异构医疗数据的标准化方法及装置
CN112951355B (zh) * 2021-02-25 2023-05-02 武汉大学 一种海量医疗数据入库的质检功能方法及装置
CN112817945A (zh) * 2021-03-03 2021-05-18 江苏汇鑫融智软件科技有限公司 一种基于esb的医疗的异构系统数据仓库建设方法
CN112988966A (zh) * 2021-03-04 2021-06-18 中建海峡建设发展有限公司 一种语音交互的施工日志管理系统及实现方法
CN113284630B (zh) * 2021-04-13 2024-05-14 常州市第二人民医院 一种基于医学本体的医学术语知识库的构建系统及方法
CN113239115B (zh) * 2021-05-19 2023-06-02 中国医学科学院医学生物学研究所 一种疫苗不良反应批量数据快速、准确的同步方法
CN113377897B (zh) * 2021-05-27 2022-04-22 杭州莱迈医疗信息科技有限公司 基于深度对抗学习的多语言医疗术语规范标准化系统及方法
CN113342793B (zh) * 2021-06-18 2023-04-07 立信(重庆)数据科技股份有限公司 一种调研数据标准化方法及系统
CN113704555B (zh) * 2021-07-16 2023-11-07 杭州医康慧联科技股份有限公司 基于医疗方向联邦学习的特征管理方法
CN113764086A (zh) * 2021-08-17 2021-12-07 卫宁健康科技集团股份有限公司 基于jhnebp模型的护理信息处理系统、方法
CN113836126B (zh) * 2021-09-22 2024-01-30 上海妙一生物科技有限公司 一种数据清洗方法、装置、设备及存储介质
CN113656604B (zh) * 2021-10-19 2022-02-22 之江实验室 基于异构图神经网络的医疗术语规范化系统及方法
CN114003791B (zh) * 2021-12-30 2022-04-08 之江实验室 基于深度图匹配的医疗数据元自动化分类方法及系统
CN114461714B (zh) * 2022-01-13 2024-03-29 湖北国际物流机场有限公司 Bim编码转换系统
CN114595668A (zh) * 2022-01-28 2022-06-07 北京医鸣技术有限公司 一种医疗诊断术语标准化的方法、平台、介质及设备
CN115080751B (zh) * 2022-08-16 2022-11-11 之江实验室 一种基于通用模型的医学标准术语管理系统及方法
CN115712839B (zh) * 2022-11-14 2023-10-24 国网山东省电力公司日照供电公司 一种继电保护装置通讯模型自动匹配系统及方法
CN115952770B (zh) * 2023-03-15 2023-07-25 广州汇通国信科技有限公司 一种数据标准化的处理方法、装置、电子设备及存储介质
CN116110560A (zh) * 2023-04-13 2023-05-12 杭州璞睿生命科技有限公司 临床诊疗数据对接至edc系统的方法、装置、设备及介质
CN116167354B (zh) * 2023-04-19 2023-07-07 北京亚信数据有限公司 医疗专业名词特征提取模型训练、标准化方法及装置
CN116386799B (zh) * 2023-06-05 2023-08-18 数据空间研究院 一种医疗数据采集与标准转换方法及系统
CN116737697B (zh) * 2023-08-10 2023-10-20 云筑信息科技(成都)有限公司 建筑行业物料主数据管理方法、装置及电子设备
CN117995332A (zh) * 2024-04-07 2024-05-07 北方健康医疗大数据科技有限公司 一种值域代码标准化转换系统及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005519411A (ja) 2002-03-05 2005-06-30 シーメンス メディカル ソルーションズ ヘルス サーヴィシズ コーポレイション 動的辞書及び用語蓄積システム
JP2006079189A (ja) 2004-09-07 2006-03-23 Japan Medical Data Center Co Ltd レセプトファイル生成システム、カルテファイル生成システムおよびファイル生成システム
JP2007025834A (ja) 2005-07-13 2007-02-01 Hitachi Ltd 読影レポート入力支援方法及び読影レポート入力支援システム
JP2007531080A (ja) 2003-07-14 2007-11-01 イージーケアテック カンパニー リミテッド 医療情報の電算標準化方法
JP2016146165A (ja) 2014-11-10 2016-08-12 アクセンチュア グローバル サービスィズ リミテッド インテリジェントなコーディング、報告および分析に焦点を合わせたツールを用いた、医療コーディング管理システム
JP2016200978A (ja) 2015-04-10 2016-12-01 株式会社日立製作所 教師データの生成装置
WO2018084682A1 (ko) 2016-11-07 2018-05-11 경희대학교 산학협력단 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램
WO2019016054A1 (en) 2017-07-18 2019-01-24 Koninklijke Philips N.V. CODED MEDICAL VOCABULARY MATCHING

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610192B1 (en) * 2006-03-22 2009-10-27 Patrick William Jamieson Process and system for high precision coding of free text documents against a standard lexicon
CN101452503A (zh) * 2008-11-28 2009-06-10 上海生物信息技术研究中心 一种异构临床医疗信息共享系统和方法
US20160342746A1 (en) * 2015-05-21 2016-11-24 Naveen Sarabu Cloud-Based Medical-Terminology Manager and Translator
CN106383853A (zh) * 2016-08-30 2017-02-08 刘勇 一种电子病历后结构化以及辅助诊断的实现方法及其系统
CN107978341A (zh) * 2017-12-22 2018-05-01 南京昂特医信数据技术有限公司 一种基于语境的医学语义框架下的异构数据适配方法及其系统
CN109033080B (zh) * 2018-07-12 2023-03-24 上海金仕达卫宁软件科技有限公司 基于概率转移矩阵的医疗术语标准化方法及系统
CN109408820A (zh) * 2018-10-17 2019-03-01 长沙瀚云信息科技有限公司 一种医学术语映射系统和方法、设备及存储介质
CN109446340A (zh) * 2018-10-17 2019-03-08 长沙瀚云信息科技有限公司 一种医学标准术语本体管理系统及方法、设备和存储介质
CN110349639B (zh) * 2019-07-12 2022-01-04 之江实验室 一种基于通用医疗术语库的多中心医疗术语标准化系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005519411A (ja) 2002-03-05 2005-06-30 シーメンス メディカル ソルーションズ ヘルス サーヴィシズ コーポレイション 動的辞書及び用語蓄積システム
JP2007531080A (ja) 2003-07-14 2007-11-01 イージーケアテック カンパニー リミテッド 医療情報の電算標準化方法
JP2006079189A (ja) 2004-09-07 2006-03-23 Japan Medical Data Center Co Ltd レセプトファイル生成システム、カルテファイル生成システムおよびファイル生成システム
JP2007025834A (ja) 2005-07-13 2007-02-01 Hitachi Ltd 読影レポート入力支援方法及び読影レポート入力支援システム
JP2016146165A (ja) 2014-11-10 2016-08-12 アクセンチュア グローバル サービスィズ リミテッド インテリジェントなコーディング、報告および分析に焦点を合わせたツールを用いた、医療コーディング管理システム
JP2016200978A (ja) 2015-04-10 2016-12-01 株式会社日立製作所 教師データの生成装置
WO2018084682A1 (ko) 2016-11-07 2018-05-11 경희대학교 산학협력단 의료 데이터의 매핑 방법, 장치 및 컴퓨터 프로그램
WO2019016054A1 (en) 2017-07-18 2019-01-24 Koninklijke Philips N.V. CODED MEDICAL VOCABULARY MATCHING

Also Published As

Publication number Publication date
CN110349639B (zh) 2022-01-04
JP2022508350A (ja) 2022-01-19
CN110349639A (zh) 2019-10-18
WO2020233256A1 (zh) 2020-11-26

Similar Documents

Publication Publication Date Title
JP7093593B2 (ja) 汎用医療用語ライブラリに基づくマルチセンタ医療用語標準化システム
CN110347662B (zh) 一种基于通用数据模型的多中心医疗数据结构标准化系统
CN111916161B (zh) 用于临床试验过程中多数据源采集转换的方法及装置
US20130046529A1 (en) Method and System for Classification of Clinical Information
CN110136837B (zh) 一种医疗数据处理平台
CN112151170A (zh) 用于计算用作医疗决策支持的医疗建议的分数的方法
Huebner et al. A contemporary conceptual framework for initial data analysis
CN110119395B (zh) 大数据治理中基于元数据实现数据标准与数据质量关联处理的方法
KR101926632B1 (ko) 규칙 최적화를 통한 임상 병리 검사에 대한 전문가 경험 지식 학습 및 소견 생성 방법
CN110544528A (zh) 基于深度学习的上下级眼科远程诊断平台及其构建方法
Liu et al. Controlled vocabularies in OODBs: Modeling issues and implementation
Ott et al. Expressing patient selection criteria based on HL7 V3 templates within the open-source tool ART-DECOR
CN112331282A (zh) 基于随访项目对患者进行分组的方法和系统
CN113722324B (zh) 基于人工智能的报表生成方法、装置、电子设备及介质
CN114741459A (zh) 基于人工智能的数据查询方法、装置、电子设备及介质
Kleymenova et al. User-configurable decision support system for clinical risk management
Rad et al. Use of global consistency checking for exploring and refining relationships between distributed models: a case study
KR102616442B1 (ko) 치료영역 별 임상시험 데이터의 표준화 처리 시스템
CN109144990A (zh) 一种基于元数据驱动的电力通信大数据质量管理方法
Mansmann Extending the OLAP technology to handle non-conventional and complex data
Heavey et al. A model management systems approach to manufacturing systems design
Romanchikova et al. A framework for user-configurable data quality assurance of electronic patient records
Gruzenkin et al. The use of a production approach in the development of decision support systems for medical purposes
Oliveira et al. Towards a Data Catalog for Data Analytics
CN117727419A (zh) 一种智能化用药数据整合与分析平台

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210610

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220613

R150 Certificate of patent or registration of utility model

Ref document number: 7093593

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150