JP2022039973A - 品質を管理するための方法及び装置、電子機器、記憶媒体、並びに、コンピュータプログラム - Google Patents

品質を管理するための方法及び装置、電子機器、記憶媒体、並びに、コンピュータプログラム Download PDF

Info

Publication number
JP2022039973A
JP2022039973A JP2021107955A JP2021107955A JP2022039973A JP 2022039973 A JP2022039973 A JP 2022039973A JP 2021107955 A JP2021107955 A JP 2021107955A JP 2021107955 A JP2021107955 A JP 2021107955A JP 2022039973 A JP2022039973 A JP 2022039973A
Authority
JP
Japan
Prior art keywords
sample
answer
classifier
field
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021107955A
Other languages
English (en)
Inventor
チーフェイ ゾン,
Qifei Zeng
ユーホン ジョン,
Yuhong Zheng
ウェイジェン シュ,
Weijian Xu
タオ リー,
Tao Li
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022039973A publication Critical patent/JP2022039973A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Animal Behavior & Ethology (AREA)

Abstract

【課題】品質を管理するための方法及び装置、電子機器、記憶媒体、並びに、コンピュータプログラムの提供。【解決手段】本開示は品質を管理するための方法、装置、機器および記憶媒体を開示し、自然言語理解および知識マップなどの人工知能技術分野に関し、医療分野に応用できる。具体的な実現手段は、検出対象のテキスト情報および分野を取得するステップと、分野に基づいて予め設定された質問および読解モデルを取得するステップと、質問およびテキスト情報を読解モデルに入力し、回答を抽出して得るステップと、回答が空でなければ、品質管理情報を出力するステップと、を含む。この実施形態は自然言語の理解技術を通じて品質管理点を開発し、品質管理の能力範囲を拡大する。【選択図】図2

Description

本開示は自然言語理解や知識マップなどの人工知能技術分野に関し、医療分野に応用できる。
現在の電子文書(例えば、カルテ)の自動化品質管理(Quality Control)は伝統的な情報計画メーカーの技術能力に制限されており、多くの場合、形式(完全かつ有効性、記入の時効性)が重要視され、内容(用語の規範性、表現の一貫性、論理性など)が軽視される管理現状になっている。特に医療分野では、現在大量の医療カルテに関する問題は、病院の3級品質管理体系によって大量の手動による抽出検査を行う必要があり、時間、人手、能力が限られているため、重複的で繁雑なカルテの品質管理作業は効率と品質を効果的に向上することが難しい。
従来の品質管理アルゴリズムの多くはルールに基づいて実現されており、少数の品質管理は様々なモデルによって実現されているが、これらの実現方法には統一的な方法で実現できないという問題がある。さらに、1つの品質管理点のために1つのモデルを個別に訓練する必要がある場合もあり、非常に多くの人手とリソースが占用される。
従来技術の方案は、ルールによる実現方法と単一の品質管理点に対する単一のアルゴリズムによる実現方法であり、ルールによる実現方法は一つの人工ルールが一つの品質管理点を実現し、単一の品質管理点に対する単一のアルゴリズムによる実現方法は、単一の品質管理点に対して一つのアルゴリズムを採用し、各品質管理点の間に関係がない。
本開示は、品質を管理するための方法および装置、電子機器、記憶媒体、並びに、コンピュータプログラムを提供する。
本開示の第1の態様によれば、品質を管理するための方法であって、検出対象のテキスト情報および分野を取得するステップと、分野に基づいて予め設定された質問および読解モデルを取得するステップと、質問およびテキスト情報を読解モデルに入力し、回答を抽出して得るステップと、回答が空でなければ、品質管理情報を出力するステップと、を含む品質を管理するための方法を提供する。
本開示の第2の態様によれば、品質を管理するための装置であって、検出対象のテキスト情報および分野を取得するように構成されるテキスト取得ユニットと、分野に基づいて予め設定された質問および読解モデルを取得するように構成されるモデル取得ユニットと、質問およびテキスト情報を読解モデルに入力し、回答を抽出して得るように構成される抽出ユニットと、回答が空でない場合に品質管理情報を出力するように構成される出力ユニットと、を備える品質を管理するための装置を提供する。
本開示の第3の態様によれば、少なくとも1つのプロセッサと、少なくとも1つのプロセッサと通信可能に接続されたメモリとを備える電子機器であって、メモリには、少なくとも1つのプロセッサによって実行可能な指令が格納されており、指令が少なくとも1つのプロセッサによって実行されると、少なくとも1つのプロセッサに第1の態様のいずれか一項に記載の方法が実行される電子機器を提供する。
本開示の第4の態様によれば、コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、コンピュータ指令はコンピュータに第1の態様のいずれか一項に記載の方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体を提供する。
本開示の第5の態様によれば、プロセッサにより実行されると、本開示の第1態様のいずれか一項に記載の方法を実施するコンピュータプログラムを提供する。
本開示の技術によれば、統一的な方式で電子文書の品質管理システムを構築することができ、従来の方法に比べ、実現がより簡単で、データをマークし品質管理点に対応する質問を構築するだけでよく、且つ構築された質問には事前知識が導入されるため、モデルはより良好な汎化能力を有する。読解の方法に基づき、品質管理を読解とみなすことができ、各品質管理点は、例えば一致するか否か、どの箇所が一致しないかなどの質問に回答する。すべての品質管理点は同一のモデルで実現される。
なお、発明の概要に記載された内容は、本開示の実施形態の重要な特徴を限定することを意図するものではなく、本開示の範囲を限定するものでもないことを理解されたい。本開示の他の特徴は、以下の説明によって容易に理解されるであろう。
図面は本開示をよりよく理解するために用いられ、本開示を限定するものではない。
本開示の一実施形態を適用可能な例示的なシステムアーキテクチャを示す図である。 本開示による品質を管理するための方法の一実施形態のフローチャートである。 本開示による品質を管理するための方法の応用シ―ンの概略図である。 本開示による品質を管理するための方法のさらなる実施形態のフローチャートである。 本開示による品質を管理するための装置の一実施形態の概略構成図である。 本開示の実施形態に係る品質を管理するための方法を実施するための電子機器のブロック図である。
以下は図面を参照して本開示の例示的な実施形態を説明し、ここでは理解を容易にするため、本開示の実施形態の様々な詳細が記載されるが、これらは単なる例示的なものに過ぎない。従って、本開示の範囲および要旨を逸脱しない限り、当業者が本明細書の実施形態に対して様々な変更や修正を行うことができることは自明である。なお、以下の説明では、明確化および簡略化のため、公知の機能および構成については説明を省略する。
図1は、本開示の実施形態の品質を管理するための方法、品質を管理するための装置を適用することができる例示的なシステムアーキテクチャ100を示す。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、ネットワーク103、データベースサーバ104およびサーバ105を含んでもよい。ネットワーク103は、端末装置101、102、データベースサーバ104とサーバ105との間に通信リンクを提供するための媒体として用いられる。ネットワーク103は、有線、無線通信リンクまたは光ファイバケーブルなどの様々なタイプの接続を含んでもよい。
ユーザ110は、メッセージを送受信するために、端末装置101、102を使用してネットワーク103を介してサーバ105と情報のやり取りをすることができる。端末装置101、102には、モデル訓練アプリケーション、品質管理アプリケーション、ショッピングアプリケーション、支払いアプリケーション、Webブラウザおよびインスタントコミュニケーションツールなどの様々なクライアントアプリケーションをインストールすることができる。
ここで、端末装置101および102は、ハードウェアであってもよいし、ソフトウェアであってもよい。端末装置101および102は、ハードウェアである場合、スマートフォン、タブレット、電子ブックリーダー、MP3プレーヤー(Moving Picture Experts Group Audio LayerIII、MPEGオーディオレイヤー3)、ラップトップポータブルコンピュータ、デスクトップコンピュータなどを含むがそれらに限定されない、ディスプレイを有する様々な電子機器であってもよい。端末装置101および102は、ソフトウェアである場合、上記の電子機器にインストールされてもよい。それは、複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実装されてもよく、または単一のソフトウェア若しくはソフトウェアモジュールとして実装されてもよい。ここでは特に限定しない。
端末装置101および102がハードウェアである場合、その上に画像採集装置を設置してもよい。画像採集装置は、カメラ、センサなど、画像採集機能を実現可能な様々な装置であってもよい。ユーザ110は、端末装置101および102上の画像採集装置を用いて文書情報を採集(例えば、カルテ画像を撮影)し、OCRによって画像内容を認識して電子文書を生成してもよい。端末装置101および102は、電子文書(例えば、電子カルテ)を直接取得してもよい。
データベースサーバ104は、様々なサービスを提供するデータベースサーバであってもよい。例えば、データベースサーバにサンプル集合を格納してもよい。サンプル集合には大量のサンプルが含まれている。ここで、サンプルは、サンプル文書、サンプル質問およびサンプル回答を含んでもよい。このように、ユーザ110は、端末装置101、102を介して、データベースサーバ104に格納されたサンプル集合からサンプルを選択してもよい。
サーバ105は、端末装置101、102に表示される各種アプリケーションをサポートするバックグラウンドサーバなど、様々なサービスを提供するサーバであってもよい。バックグラウンドサーバは、端末装置101、102から送信されたサンプル集合内のサンプルを用いて、初期モデルを訓練し、訓練結果(例えば、生成された読解モデル)を端末装置101、102に送信してもよい。このようにして、ユーザは、生成された読解モデルを適用して品質検査を行うことができる。サーバはテスト対象のテキスト情報を受信し、訓練済み読解モデルを用いて品質検査を行い、検査結果を端末装置にフィードバックしてもよい。
ここでのデータベースサーバ104は、サーバ105と同様にハードウェアであってもよいし、ソフトウェアであってもよい。それらがハードウェアである場合、複数のサーバから構成される分散サーバクラスターとしても、単一のサーバとしても実装され得る。それらがソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するためのもの)として実装されてもよく、または単一のソフトウェア若しくはソフトウェアモジュールとして実装されてもよい。ここでは特に限定しない。
なお、本開示の実施形態により提供される品質を管理するための方法は、一般的にサーバ105により実行される。それに応じて、品質を管理するための装置は一般的にサーバ105に設けられる。
なお、サーバ105がデータベースサーバ104の関連機能を達成できる場合には、システムアーキテクチャ100にデータベースサーバ104を設けなくてもよい。
図1における端末装置、ネットワーク、データベースサーバおよびサーバの数は例示的なものに過ぎないことを理解するべきである。実装の必要性に応じて、端末装置、ネットワーク、データベースサーバおよびサーバの数を任意に加減してもよい。
次に、本開示に係る品質を管理するための方法の一実施形態のフロー200を示す図2を参照する。品質を管理するための方法は、ステップ201~204を含んでもよい。
ステップ201では、検出対象のテキスト情報と分野を取得する。
本実施形態では、品質を管理するための方法の実行主体(例えば、図1に示すサーバ105)は、検出対象のテキスト情報および分野を様々な方法で取得することができる。例えば、実行主体は、データベースサーバ(例えば、図1に示すデータベースサーバ104)から、有線接続または無線接続を介して、そこに格納された検出対象のテキスト情報および分野を取得してもよい。また例えば、実行主体は、端末装置(例えば、図1に示す端末装置101、102)から送信された検出対象のテキスト情報および分野を受信してもよい。テキスト情報は、コンピュータが直接認識できる電子情報であってもよいし、画像であってもよく、OCR(Optical Character Recognition,光学文字認識)などの技術によってコンピュータ文字に変換されてもよい。例えば、テキスト情報は、電子カルテでも手書きのカルテでもよく、手書きのカルテを文字認識アプリケーションにより電子カルテに変換する。分野とは、文書情報が属する分野をいい、例えば、医療、教育、スポーツなどが挙げられる。
ステップ202では、分野に基づいて予め設定された質問および読解モデルを取得する。
本実施形態では、予め分野別に品質に関する質問を構成してもよい。例えば、医療分野の質問は外来診療記録と入院診療記録の症状が一致しているか否かという質問であってもよい。教育分野の質問は、月1回の試験の成績が正常に変動しているか否かという質問であってもよい。読解モデル(MRC,Machine Reading Comprehension,機械読解)は、機械が文書を読み、関連する質問に答えることができるニューラルネットワークモデルである。
ステップ203では、質問およびテキスト情報を読解モデルに入力して、回答を抽出して得る。
本実施形態では、文章pと質問qを与え、span(start,end)を予測することを目的とし、startおよびendはp上の単語の開始位置と終了位置であり、spanはこの質問への回答である。読解モデルは、このタスクをシーケンス上の二分類問題に変換し、すなわち、文章内の単語ごとに、それぞれstartとendであるスコアを予測し、最後にこのスコアを使ってspanを予測する。
テキスト情報が「張三は台湾出身である」とすると、質問は「張三はどこで生まれた?」である。読解モデルに入力した後、start[0,0,0,0,0,1,0]、end[0,0,0,0,0,0,1]のラベルが出力される。spanは「台湾」である。
ステップ204では、回答が空でなければ、品質管理情報を出力する。
本実施形態では、質問の回答が空でなければ、品質問題が発生したことを意味し、回答に基づいて品質問題が発生した位置を特定して品質管理情報を出力してもよい。品質管理情報は、問題が発生した位置、カテゴリなどの情報を示すために使用され、解決策も含むことができる(例えば、該問題の担当者は誰ですか?その連絡先はどこですか?質問-回答の組み合わせを連絡先に従って担当者にプッシュしてもよい)。例えば、質問は「どの用語が非規範的であるか」であり、読解モデルが抽出した回答が空でなければ、見つかった回答は非規範的な用語である。出力される品質管理情報は、「非規範的な用語:XXX」であってもよい。オプションとして、これらの非規範的な用語を書く担当者の連絡先を探し、品質管理情報を担当者にプッシュすることもできる。また、例えば、どのモジュールが問題になりやすいのか、担当者ごとにどのくらい問題があったかなどの品質管理情報を集計することもできる。
本開示により提供された品質を管理するための方法は、読解方法に基づき、品質管理を読解と見なすことができ、各品質管理点はいずれも質問を回答しており、すべての品質管理点は同じモデルで実現される。品質管理の効率が向上され、コストが削減される。
本実施形態のいくつかのオプション的な実施形態において、予め設定された質問は、分野の品質管理要求を取得することと、品質管理要求における各フィールドを一つの実体とし、実体集合を取得することと、実体集合から少なくとも一つの実体を選択し、選択された実体に関連する質問を検査ルールに従って作成することとを含む方法によって作成される。例えば、品質管理が、入院診療記録における主訴と現病歴における疾患名、持続時間などのフィールドの有効性を検査することを求めることであれば、実体は、「主訴」、「現病歴」、「疾患名」、「持続時間」を含んでもよい。任意選択で1つまたは複数の実体を組み合わせて質問を作成してもよい。例えば、入院診療記録における主訴が現病歴の「疾患名」と一致しない疾患を見つけ出してください。入院診療記録における主訴と現病歴の「持続時間」が一致しない疾患を見つけ出してください。それにより、異なる品質管理ニーズに応じて質問を作成し、全面的な品質管理を実現することができる。
オプションとして、質問は、例えば[実体1]と[実体2]の[xx]が一致しないというテンプレートを充填する方式で構成され得る。[]の中は、品質管理ニーズに応じて充填される内容であり、上記[実体1]は主訴、[実体2]は現病歴、[xx]は持続時間である。
本実施形態のいくつかのオプション的な実施形態において、検査ルールは、用語の規範性、表現の一貫性および論理性のうちの少なくとも1つを含む。例えば、構成される質問は、「主訴の中で用語が非規範である単語を見つけ出してください」、「主訴の、現病歴における表現と一致しない箇所を見つけ出してください」、「主訴と現病歴における論理的に誤りがある箇所を見つけ出してください」などが挙げられる。テキスト情報を全面的にチェックすることができ、より厳密な品質管理を行うことができる。
本実施形態のいくつかのオプション的な実施形態において、検出対象のテキスト情報および分野を取得するステップは、検出対象のテキスト情報を取得することを含む。テキスト情報を所定の分野のキーワードとマッチングし、テキスト情報の分野を特定する。ユーザが事前にテキスト情報の分野を知らなければ、サーバは分野の特定を助け、分野に応じて対応する読解モデルを呼び出すことができる。キーワードマッチング方法によって分野を特定することができ、従来技術の固有表現モデルなどのツールによってテキスト情報からキーワードを抽出し、次にテキスト情報のキーワードと、予め設定された分野キーワードベースにおける分野のキーワードとを順次マッチングし、類似度を算出し、類似度が予め設定された類似度閾値よりも大きければ、マッチングに成功したと判定する。マッチングに成功した分野がテキスト情報の分野である。それにより、当該分野の読解モデルを正確に見つけることができ、テキスト情報を正確に理解して品質管理を行うことができる。
さらに図3を参照する。図3は、本実施形態による品質を管理するための方法の応用シーンの概略図である。図3の応用シーンでは、医療分野に応用され、検出対象のテキスト情報は「入院診療記録、主訴:連続発熱3日、連続嘔吐3日、現病歴:連続発熱7日、連続嘔吐3日」である。質問は「入院診療記録中の疾患持続時間が主訴、現病歴において前後で一致しない疾患を見つけ出してください」。テキスト情報および質問を医療分野の読解モデルに入力し、回答である「発熱」を得る。回答が空でないので、品質管理問題があることを意味する。「主訴と現病歴における病歴の症状とが一致しない」という品質管理情報を出力する必要がある。そうすれば、品質問題によって規則規程に従って対処することができる。
更に、品質を管理するための方法のもう一つの実施形態のフロー400を示す図4を参照する。品質を管理するための方法のフロー400は、ステップ401~406を含む。
ステップ401では、初期読解モデルを取得する。
本実施形態では、品質を管理するための方法が実行される電子機器(例えば、図1に示すサーバ)は、第三者サーバから初期読解モデルを取得してもよい。ここで、初期読解モデルはニューラルネットワークモデルである。初期読解モデルは、第1分類器、第2分類器および第3分類器を含んでもよい。第1分類器は、回答の開始位置、すなわち上述したstartを特定するために使用される。第2分類器は、回答の終了位置、すなわち上述したendを特定するために使用される。第3分類器は、回答の有効性、すなわち上述したspanの有効性を検証するために使用される。
ステップ402では、分野に基づいて事前選択して作成されたサンプル集合を取得する。
本実施形態では、サンプル集合は、文書、サンプル質問およびサンプル回答を含むサンプルのうちの少なくとも1つを含む。サンプルは分野と関係があり、分野別に異なるサンプルを使って分野と関係のある読解モデルを訓練することができる。例えば、医療分野では、文書として電子カルテを採用し、医療の品質に関する質問をあらかじめ作成しておき、その質問に対する回答を文書にマークしてもよい。同じ質問に対して複数の回答がある場合があり、すべてマークされる。
ステップ403では、サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の開始位置を期待出力として、初期読解モデルの第1分類器を訓練する。
この実施形態では、初期読解モデルは、3種類の分類器を含んでもよい。第1分類器は、回答の開始位置を特定するために使用される。別々に訓練してもよいし、マルチタスクで連携して訓練してもよい。第1分類器、第2分類器および第3分類器の間に共有層(例えば、単語埋め込み層、特徴抽出層)があってもよく、ネットワークパラメータの共有を行い、このように読解モデルの収束速度を向上させることができる。第1分類器は、訓練されていない深層学習モデルまたは部分的に訓練された深層学習モデルであってもよく、第1分類器の各層には初期パラメータが設定されてもよく、パラメータは第1分類器の訓練中に連続的に調整されてもよい。ここで、電子機器は、文書、サンプル質問を第1分類器の入力側から入力し、第1分類器における各層のパラメータの処理(例えば、乗算、畳み込みなど)を順次経て、第1分類器の出力側から出力することができ、出力側から出力される情報が予測された回答の開始位置である。予測された回答の開始位置とサンプル回答の開始位置を比較し、予め設定された損失関数に基づいて第1分類器の損失値を算出することができ、損失値が閾値よりも大きければ第1分類器のネットワークパラメータを調整し、且つサンプルを選択して訓練し続け、そうでなければ第1分類器の訓練が完了する。
ステップ404では、サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の終了位置を期待出力として、初期読解モデルの第2分類器を訓練する。
本実施形態では、第2分類器は回答の終了位置を特定するために使用される。ステップ403と同様に、第2分類器は、第2分類器の訓練速度を向上するために、第1分類器のネットワークパラメータから共有パラメータを取得してもよい。第2分類器は、訓練されていない深層学習モデルまたは部分的に訓練された深層学習モデルであってもよく、第2分類器の各層には初期パラメータが設定されてもよく、パラメータは第2分類器の訓練中に連続的に調整されてもよい。ここで、電子機器は、文書、サンプル質問を第2分類器の入力側から入力し、第2分類器における各層のパラメータの処理(例えば、乗算、畳み込みなど)を順次経て、第2分類器の出力側から出力することができ、出力側から出力される情報が予測された回答の終了位置である。予測された回答の終了位置とサンプル回答の終了位置を比較し、予め設定された損失関数に基づいて第2分類器の損失値を算出することができ、損失値が閾値よりも大きければ第2分類器のネットワークパラメータを調整し、且つサンプルを選択して訓練し続け、そうでなければ第2分類器の訓練が完了する。
ステップ405では、サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答を期待出力として、初期読解モデルの第3分類器を訓練する。
本実施形態では、第3分類器は回答の有効性を検証するために使用される。第3分類器を独立に訓練してもよいし、第1分類器および第2分類器に基づいて訓練してもよい。第3分類器は訓練されていない深層学習モデルまたは部分的に訓練された深層学習モデルであってもよく、第3分類器の各層に初期パラメータが設定されてもよく、パラメータは第3分類器の訓練中に連続的に調整されてもよい。ここで、電子機器は、文書、サンプル質問を第3分類器の入力側から入力し、第3分類器における各層のパラメータの処理(例えば、乗算、畳み込みなど)を順次経て、第3分類器の出力側から出力することができ、出力側から出力される情報が予測された回答である。予測された回答をサンプル回答と比較し、予め設定された損失関数に基づいて第3分類器の損失値を算出することができ、損失値が閾値よりも大きければ第3分類器のネットワークパラメータを調整し、且つサンプルを選択して訓練を続け、そうでなければ第3分類器の訓練が完了する。
ステップ406では、訓練された第1分類器、第2分類器および第3分類器から読解モデルを構成する。
本実施形態では、第1分類器、第2分類器および第3分類器が同じ構造およびパラメータを有するネットワーク層を共有層に統合し、さらにそれぞれ異なる出力層に接続して読解モデルを構成することで、テキスト情報および質問を入力する場合、有効性が検証された回答を出力とすることができる。
図4から分かるように、図2に対応する実施形態と比べ、本実施形態における品質を管理するための方法のフロー400は、読解モデルを訓練するステップを表す。これにより、本実施形態で述べた解決手段は、異なる分野のサンプルに基づいて異なる分野の読解モデルを訓練することができ、それによりねらいがはっきりした品質管理を行うことができる。
本実施形態のいくつかのオプション的な実施形態において、該方法はさらに以下のステップを含む。分野に基づいて事前訓練モデルを取得する。事前訓練モデルの共通パラメータに基づいて初期読解モデルのパラメータを調整する。事前訓練モデルは、BERT、ERNIEなどのニューラルネットワークモデルであってもよい。事前訓練モデルは分野に関係があり、異なる分野に対応する事前訓練モデルのパラメータは異なる。したがって、同じ分野の事前訓練モデルの共通パラメータを初期読解モデルと共有し、初期読解モデルの初期パラメータを事前訓練モデルの共通パラメータと同じになるように調整してもよい。こうすると、読解モデルの訓練速度を速め、訓練時間を節約し、読解モデルの精度を高めることができる。
更に図5を参照すると、上記の図に示された方法の実施態様として、本開示は、品質を管理するための装置の一実施形態を提供し、該装置の実施形態は、図2に示された方法の実施形態に対応しており、該装置は、具体的に様々な電子機器に適用することができる。
図5に示すように、本実施形態の品質を管理するための装置500は、テキスト取得ユニット501、モデル取得ユニット502、抽出ユニット503および出力ユニット504を備える。ここで、テキスト取得ユニット501は、検出対象のテキスト情報および分野を取得するように構成される。モデル取得ユニット502は、分野に基づいて予め設定された質問および読解モデルを取得するように構成される。抽出ユニット503は、質問およびテキスト情報を読解モデルに入力し、回答を抽出して得るように構成される。出力ユニット504は、回答が空でない場合に品質管理情報を出力するように構成される。
本実施形態において、品質を管理するための装置500のテキスト取得ユニット501、モデル取得ユニット502、抽出ユニット503および出力ユニット504の具体的な処理は、図2の対応する実施形態におけるステップ201、ステップ202、ステップ203およびステップ204を参照してもよい。
本実施形態のいくつかのオプション的な実施形態において、装置500は、第1分類器、第2分類器および第3分類器を含む初期読解モデルを取得するように構成される訓練ユニット(図示せず)をさらに含む。分野に基づいて事前選択して作成されたサンプル集合を取得し、サンプル集合は、文書、サンプル質問およびサンプル回答を含むサンプルのうちの少なくとも1つを含む。サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の開始位置を期待出力として、初期読解モデルの、回答の開始位置を特定するための第1分類器を訓練する。サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の終了位置を期待出力として、初期読解モデルの、回答の終了位置を特定するための第2分類器を訓練する。サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答を期待出力として、初期読解モデルの、回答の有効性を検証するための第3分類器を訓練する。訓練された第1分類器、第2分類器および第3分類器から読解モデルを構成する。
本実施形態のいくつかのオプション的な実施形態において、訓練ユニットは、分野に基づいて事前訓練モデルを取得するようにさらに構成される。事前訓練モデルの共通パラメータに基づいて初期読解モデルのパラメータを調整する。
本実施形態のいくつかのオプション的な実施形態において、装置500は、分野の品質管理要求を取得するように構成される質問作成ユニット(図示せず)をさらに含む。品質管理要求における各フィールドを一つの実体として、実体集合を取得する。実体集合から少なくとも一つの実体を選択し、選択された実体に関連する質問を検査ルールに従って作成する。
本実施形態のいくつかのオプション的な実施形態において、検査ルールは、用語の規範性、表現の一貫性および論理性のうちの少なくとも1つを含む。
本実施形態のいくつかのオプション的な実施形態において、テキスト取得ユニット501は、検出対象のテキスト情報を取得するようにさらに構成される。テキスト情報を所定の分野のキーワードとマッチングし、テキスト情報の分野を特定する。
本開示の実施形態によれば、本開示はさらに電子機器および可読記憶媒体を提供する。
図6に示すのは、本開示の実施形態に係る品質を管理するための方法を実施するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータおよびその他の適切なコンピュータ等の様々な形態のデジタルコンピュータを表す。また、電子機器は、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル機器およびその他の類似する演算装置等の様々な形態のモバイルデバイスを表すことができる。なお、ここで示したコンポーネント、それらの接続関係、およびそれらの機能はあくまでも一例であり、ここで記述および/または要求した本開示の実施形態を限定することを意図するものではない。
図6に示すように、該電子機器は、1つまたは複数のプロセッサ601、メモリ602、および各コンポーネントを接続するためのインタフェース(高速インタフェースおよび低速インタフェースを含む)を含む。各コンポーネントは、互いに異なるバスで接続されており、共通のマザーボード上に実装されていてもよいし、必要に応じて他の方式で実装されていてもよい。プロセッサは、電子機器内で実行される指令を処理することができ、前記指令は、インターフェースに結合された表示装置等の外部入出力装置にグラフィカルユーザインタフェース(GUI,Graphical User Interface)のグラフィック情報を表示するために、メモリ内またはメモリ上に格納される指令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを、複数のメモリとともに使用することができる。また、複数の電子機器が接続されていてもよく、各機器は、例えば、サーバアレイ、ブレードサーバ群またはマルチプロセッサシステムなど、一部の必要な動作を提供する。図6では、1つのプロセッサ601を例としている。
メモリ602は、本開示が提供する非一時的コンピュータ可読記憶媒体である。ここで、前記メモリは、少なくとも1つのプロセッサによって実行され得る指令を格納しており、それにより前記少なくとも1つのプロセッサに本開示が提供する品質を管理するための方法を実行させる。本開示の非一時的コンピュータ可読記憶媒体はコンピュータ指令を格納し、該コンピュータ指令はコンピュータに本開示に係る品質を管理するための方法を実行させるために用いられる。
メモリ602は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラムおよびモジュールを格納することに用いられ得、例えば本開示の実施形態に係る品質を管理するための方法に対応するプログラム指令/モジュール(例えば、図5に示すテキスト取得ユニット501、モデル取得ユニット502、抽出ユニット503および出力ユニット504)が挙げられる。プロセッサ601は、メモリ602に格納された非一時的ソフトウェアプログラム、指令およびモジュールを実行することにより、サーバの各種機能アプリケーションおよびデータ処理を実行し、すなわち上記方法の実施形態に係る品質を管理するための方法を実施する。
メモリ602はオペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを格納可能なプログラム記憶領域と、品質を管理するための電子機器の使用に応じて作成されるデータ等を格納可能なデータ記憶領域とを含み得る。また、メモリ602は高速ランダムアクセスメモリを含むことができ、また非一時的メモリ(例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリデバイスまたはその他の非一時的ソリッドステート記憶装置)を含み得る。いくつかの実施形態において、メモリ602は、オプションとしてプロセッサ601に対して遠隔に設置されたリモートメモリを含み、これらのリモートメモリはネットワークを介して品質を管理するための電子機器に接続され得る。上記ネットワークとしては、例えば、インターネット、企業イントラネット、ローカルエリアネットワーク、移動体通信網およびこれらの組み合わせなどが挙げられるが、それらに限定されない。
品質を管理するための方法を実施する電子機器はさらに、入力装置603および出力装置604を含み得る。プロセッサ601、メモリ602、入力装置603および出力装置604は、バスまたはその他の方式で接続されていてもよく、図6ではバスで接続されている例を示している。
例えばタッチパネル、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングデバイス、1つまたは複数のマウスボタン、トラックボール、ジョイスティック等の入力装置603は、入力された数字や文字情報を受信でき、品質を管理するための電子機器のユーザ設定および機能制御に関するキー信号の入力を生成することができる。出力装置604は表示装置、補助照明装置(例えば、LED)および触覚フィードバック装置(例えば、振動モータ)等を含むことができる。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイおよびプラズマディスプレイを含むことができるが、これらに限定されない。いくつかの実施形態において、表示装置はタッチパネルであってもよい。
ここで説明するシステムおよび技術の様々な実施形態はデジタル電子回路システム、集積回路システム、専用集積回路(Application Specific Integrated Circuit,ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実装され得る。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムに実装され、該1つまたは複数のコンピュータプログラムは少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行および/または解釈することができ、該プログラマブルプロセッサは専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置および少なくとも1つの出力装置からデータおよび指令を受信することができ、且つデータおよび指令を該記憶システム、該少なくとも1つの入力装置および該少なくとも1つの出力装置に伝送することを含み得る。
これらのコンピュータプログラムは、プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとも呼ばれ、プログラマブルプロセッサの機械命令を含み、且つ高度プロセスおよび/またはオブジェクト指向のプログラミング言語、および/またはアセンブリ言語/機械語を用いて実施することができる。ここで、「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械命令および/またはデータをプログラマブルプロセッサに供給するための任意のコンピュータプログラム、装置、および/またはデバイス(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を意味し、機械可読信号である機械命令を受信する機械可読媒体を含む。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに供給するための任意の信号を意味する。
ユーザとのやりとりをするために、ここで記述するシステムと技術は、ユーザに情報を表示するための表示装置(例えば、陰極線管(Cathode Ray Tube,CRT)またはLCD(液晶ディスプレイ)モニタ)と、キーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)とを備えるコンピュータ上で実施することができ、ユーザが該キーボードおよび該ポインティングデバイスを介してコンピュータに入力を提供できる。他の種類の装置もユーザとのやりとりをすることに用いられてもよい。例えば、ユーザに提供されるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであるいかなる形態のセンシングフィードバックであってもよく、且つ音入力、音声入力若しくは触覚入力を含むいかなる形態でユーザからの入力を受信してもよい。
ここで記述したシステムおよび技術は、バックグラウンドコンポーネントを含む計算システム(例えば、データサーバ)に実装されてもよく、またはミドルウェアコンポーネントを含む計算システム(例えば、アプリケーションサーバ)に実装されてもよく、またはフロントエンドコンポーネントを含む計算システム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータ)に実装されてもよく、ユーザは該グラフィカルユーザインタフェースまたはウェブブラウザを介してここで記述したシステムおよび技術の実装とやりとりをしてもよく、またはこのようなバックグラウンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントのいずれかの組み合わせを含む計算システムに実装されてもよい。また、システムの各コンポーネントは、通信ネットワーク等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)およびインターネットなどを含む。
コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してやりとりを行う。クライアントとサーバとの関係は、互いにクライアント-サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。サーバは、分散システムのサーバ、あるいはブロックチェーンを結合したサーバであってもよい。サーバは、クラウドサーバ、または人工知能技術を備えたインテリジェントクラウドコンピューティングサーバまたはインテリジェントクラウドホストであってもよい。サーバは、分散システムのサーバ、あるいはブロックチェーンを結合したサーバであってもよい。
本開示の実施形態の技術方案によれば、統一的な方式で異なる分野の品質管理システムを構築することができ、従来の方法に比べ、実現方法がより簡単で、データをマークし品質管理点に対応する質問を構築するだけでよく、且つ構築された質問には事前知識が導入されるため、モデルはより良好な汎化能力を有する。
なお、上述した様々な形態のフローを用いて、ステップを並び替え、追加または削除を行うことができることを理解されるべきである。例えば、本開示に記載された各ステップは、本開示に開示された技術方案の所望の結果が達成できる限り、並行して実行されてもよく、順番に実行されてもよく、異なる順序で実行されてもよく、本明細書はここで限定しない。
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件および他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、および代替を行うことができることは理解される。本開示の精神および原理内で行われたあらゆる補正、均等な置換および改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims (15)

  1. 検出対象のテキスト情報および分野を取得するステップと、
    前記分野に基づいて予め設定された質問および読解モデルを取得するステップと、
    前記質問および前記テキスト情報を前記読解モデルに入力し、回答を抽出して得るステップと、
    前記回答が空でなければ、品質管理情報を出力するステップと、を含む品質を管理するための方法。
  2. 前記読解モデルは、
    第1分類器、第2分類器および第3分類器を含む初期読解モデルを取得するステップと、
    分野に基づいて事前選択して作成されたサンプル集合を取得するステップであって、サンプル集合は、文書、サンプル質問およびサンプル回答を含むサンプルのうちの少なくとも1つを含む、ステップと、
    前記サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の開始位置を期待出力として、前記初期読解モデルの、回答の開始位置を特定するための第1分類器を訓練するステップと、
    前記サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の終了位置を期待出力として、前記初期読解モデルの、回答の終了位置を特定するための第2分類器を訓練するステップと、
    前記サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答を期待出力として、前記初期読解モデルの、回答の有効性を検証するための第3分類器を訓練するステップと、
    訓練された第1分類器、第2分類器および第3分類器から読解モデルを構成するステップと、により訓練される請求項1に記載の方法。
  3. 分野に基づいて事前訓練モデルを取得するステップと、
    前記事前訓練モデルの共通パラメータに基づいて前記初期読解モデルのパラメータを調整するステップとをさらに含む請求項2に記載の方法。
  4. 前記予め設定された質問は、
    前記分野の品質管理要求を取得するステップと、
    前記品質管理要求における各フィールドを一つの実体とし、実体集合を得るステップと、
    前記実体集合から少なくとも一つの実体を選択し、選択された実体に関連する質問を検査ルールに従って作成するステップと、
    により作成される請求項1に記載の方法。
  5. 前記検査ルールは、
    用語の規範性、表現の一貫性および論理性のうちの少なくとも1つを含む請求項4に記載の方法。
  6. 前記の、検出対象のテキスト情報および分野を取得するステップは、
    検出対象のテキスト情報を取得することと、
    前記テキスト情報と所定の分野のキーワードとをマッチングし、前記テキスト情報の分野を特定することとを含む請求項1~5のいずれか一項に記載の方法。
  7. 検出対象のテキスト情報および分野を取得するように構成されるテキスト取得ユニットと、
    前記分野に基づいて予め設定された質問および読解モデルを取得するように構成されるモデル取得ユニットと、
    前記質問および前記テキスト情報を前記読解モデルに入力し、回答を抽出して得るように構成される抽出ユニットと、
    前記回答が空でない場合に品質管理情報を出力するように構成される出力ユニットと、を備える品質を管理するための装置。
  8. 第1分類器、第2分類器および第3分類器を含む初期読解モデルを取得するステップと、
    分野に基づいて事前選択して作成されたサンプル集合を取得するステップであって、サンプル集合は、文書、サンプル質問およびサンプル回答を含むサンプルのうちの少なくとも1つを含む、ステップと、
    前記サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の開始位置を期待出力として、前記初期読解モデルの、回答の開始位置を特定するための第1分類器を訓練するステップと、
    前記サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答の終了位置を期待出力として、前記初期読解モデルの、回答の終了位置を特定するための第2分類器を訓練するステップと、
    前記サンプル集合からサンプルを選択し、文書、サンプル質問を入力とし、サンプル回答を期待出力として、前記初期読解モデルの、回答の有効性を検証するための第3分類器を訓練するステップと、
    訓練された第1分類器、第2分類器および第3分類器から読解モデルを構成するステップと、
    を行うように構成される訓練ユニットをさらに備える、請求項7に記載の装置。
  9. 前記訓練ユニットは、さらに
    分野に基づいて事前訓練モデルを取得し、
    前記事前訓練モデルの共通パラメータに基づいて前記初期読解モデルのパラメータを調整する
    ように構成される請求項8に記載の装置。
  10. 前記分野の品質管理要求を取得し、
    前記品質管理要求における各フィールドを一つの実体とし、実体集合を取得し、
    前記実体集合から少なくとも一つの実体を選択し、選択された実体に関連する質問を検査ルールに従って作成するように構成される質問作成ユニットをさらに備える、請求項7に記載の装置。
  11. 前記検査ルールは、
    用語の規範性、表現の一貫性および論理性のうちの少なくとも1つを含む請求項10に記載の装置。
  12. 前記テキスト取得ユニットは、さらに
    検出対象のテキスト情報を取得し、
    前記テキスト情報と所定の分野のキーワードとをマッチングし、前記テキスト情報の分野を特定するように構成される請求項7~11のいずれか一項に記載の装置。
  13. 少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備える電子機器であって、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が格納されており、前記指令が前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~6のいずれか一項に記載の方法が実行される、電子機器。
  14. コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
    前記コンピュータ指令は前記コンピュータに請求項1~6のいずれか一項に記載の方法を実行させるために用いられることを特徴とする非一時的コンピュータ可読記憶媒体。
  15. プロセッサにより実行されると、請求項1~6のいずれか一項に記載の方法を実施するコンピュータプログラム。

JP2021107955A 2020-11-30 2021-06-29 品質を管理するための方法及び装置、電子機器、記憶媒体、並びに、コンピュータプログラム Pending JP2022039973A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011375351.2 2020-11-30
CN202011375351.2A CN112509690B (zh) 2020-11-30 2020-11-30 用于控制质量的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
JP2022039973A true JP2022039973A (ja) 2022-03-10

Family

ID=74969257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021107955A Pending JP2022039973A (ja) 2020-11-30 2021-06-29 品質を管理するための方法及び装置、電子機器、記憶媒体、並びに、コンピュータプログラム

Country Status (5)

Country Link
US (1) US20210326524A1 (ja)
EP (1) EP4006909B1 (ja)
JP (1) JP2022039973A (ja)
KR (1) KR20210090576A (ja)
CN (1) CN112509690B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024014386A1 (ja) * 2022-07-13 2024-01-18 ダイキン工業株式会社 情報処理方法、情報処理装置及びコンピュータプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239165B (zh) * 2021-05-17 2023-04-18 山东新一代信息产业技术研究院有限公司 基于云化机器人的阅读理解方法、系统及存储介质
CN113674827A (zh) * 2021-08-27 2021-11-19 中山大学肿瘤防治中心 电子病历的生成方法、装置、电子设备及计算机可读介质
CN114330718B (zh) * 2021-12-23 2023-03-24 北京百度网讯科技有限公司 因果关系的提取方法、装置及电子设备
CN116860933A (zh) * 2023-06-30 2023-10-10 北京百度网讯科技有限公司 对话模型训练方法、回复信息生成方法、装置及介质
CN117373594A (zh) * 2023-10-24 2024-01-09 广州国家实验室 医疗信息确定方法、装置、设备及介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346701B2 (en) * 2009-01-23 2013-01-01 Microsoft Corporation Answer ranking in community question-answering sites
US9207760B1 (en) * 2012-09-28 2015-12-08 Google Inc. Input detection
US10282466B2 (en) * 2015-12-31 2019-05-07 Samsung Electronics Co., Ltd. Machine processing of search query based on grammar rules
US10489712B2 (en) * 2016-02-26 2019-11-26 Oath Inc. Quality-based scoring and inhibiting of user-generated content
CN106777236B (zh) * 2016-12-27 2020-11-03 北京百度网讯科技有限公司 基于深度问答的查询结果的展现方法和装置
CN107203600B (zh) * 2017-05-12 2020-09-18 浙江大学 一种利用刻画因果依赖关系和时序影响机制增强答案质量排序的评判方法
US10331402B1 (en) * 2017-05-30 2019-06-25 Amazon Technologies, Inc. Search and knowledge base question answering for a voice user interface
US10784000B2 (en) * 2018-03-16 2020-09-22 Vvc Holding Corporation Medical system interface apparatus and methods to classify and provide medical data using artificial intelligence
US11049594B2 (en) * 2018-05-29 2021-06-29 RevvPro Inc. Computer-implemented system and method of facilitating artificial intelligence based revenue cycle management in healthcare
CN109543014B (zh) * 2018-11-05 2021-06-15 腾讯科技(深圳)有限公司 人机对话方法、装置、终端及服务器
US11423538B2 (en) * 2019-04-16 2022-08-23 Covera Health Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers
CN110210021B (zh) * 2019-05-22 2021-05-28 北京百度网讯科技有限公司 阅读理解方法及装置
CN110675871B (zh) * 2019-09-25 2021-03-05 北京蓦然认知科技有限公司 一种语音识别方法及装置
CN111462894B (zh) * 2020-03-27 2023-09-01 北京百度网讯科技有限公司 一种医疗冲突的检测方法、装置、电子设备及存储介质
CN111640511B (zh) * 2020-05-29 2023-08-04 北京百度网讯科技有限公司 医疗事实验证的方法、装置、电子设备及存储介质
CN111611391B (zh) * 2020-06-17 2022-08-23 厦门快商通科技股份有限公司 一种对对话进行归类别的方法、装置、设备和存储介质
CN111783473B (zh) * 2020-07-14 2024-02-13 腾讯科技(深圳)有限公司 医疗问答中最佳答案的识别方法、装置和计算机设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024014386A1 (ja) * 2022-07-13 2024-01-18 ダイキン工業株式会社 情報処理方法、情報処理装置及びコンピュータプログラム
JP7455338B2 (ja) 2022-07-13 2024-03-26 ダイキン工業株式会社 情報処理方法、情報処理装置及びコンピュータプログラム

Also Published As

Publication number Publication date
KR20210090576A (ko) 2021-07-20
EP4006909A1 (en) 2022-06-01
CN112509690B (zh) 2023-08-04
US20210326524A1 (en) 2021-10-21
EP4006909B1 (en) 2024-02-14
CN112509690A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
JP2022039973A (ja) 品質を管理するための方法及び装置、電子機器、記憶媒体、並びに、コンピュータプログラム
KR20210037619A (ko) 멀티 모달 콘텐츠 처리 방법, 장치, 기기 및 저장 매체
US20220350965A1 (en) Method for generating pre-trained language model, electronic device and storage medium
CN111274815B (zh) 用于挖掘文本中的实体关注点的方法和装置
KR20210038449A (ko) 문답 처리, 언어 모델 훈련 방법, 장치, 기기 및 저장 매체
JP2021197137A (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US9766868B2 (en) Dynamic source code generation
EP1672537A2 (en) Data semanticizer
US9619209B1 (en) Dynamic source code generation
CN111666416B (zh) 用于生成语义匹配模型的方法和装置
CN111159220B (zh) 用于输出结构化查询语句的方法和装置
JP2021197133A (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
CN110517767B (zh) 辅助诊断方法、装置、电子设备及存储介质
JP2021099798A (ja) 構造化処理方法、装置、コンピュータ機器及び媒体
US20170212886A1 (en) Configurable Generic Language Understanding Models
JP2022006173A (ja) 知識事前訓練モデルの訓練方法、装置及び電子機器
JP2022031625A (ja) 情報をプッシュするための方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
CN112507090A (zh) 用于输出信息的方法、装置、设备和存储介质
CN110991183B (zh) 问题的谓词确定方法、装置、设备及存储介质
KR20220009338A (ko) 모델링 매개 변수의 설정 방법, 장치, 전자 기기 및 기록 매체
US20220129623A1 (en) Performance characteristics of cartridge artifacts over text pattern constructs
CN112329429B (zh) 文本相似度学习方法、装置、设备以及存储介质
US20200150981A1 (en) Dynamic Generation of User Interfaces Based on Dialogue
CN113672699A (zh) 基于知识图谱的nl2sql生成方法
US20170154031A1 (en) Plugin Tool for Collecting User Generated Document Segmentation Feedback

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230718