JP7317146B2 - ヒト表現型オントロジーの決定方法及び関連装置 - Google Patents

ヒト表現型オントロジーの決定方法及び関連装置 Download PDF

Info

Publication number
JP7317146B2
JP7317146B2 JP2021571988A JP2021571988A JP7317146B2 JP 7317146 B2 JP7317146 B2 JP 7317146B2 JP 2021571988 A JP2021571988 A JP 2021571988A JP 2021571988 A JP2021571988 A JP 2021571988A JP 7317146 B2 JP7317146 B2 JP 7317146B2
Authority
JP
Japan
Prior art keywords
word
description information
human phenotype
post
phenotype ontology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021571988A
Other languages
English (en)
Other versions
JP2022535853A (ja
Inventor
ジェン・ヂョウ
リンシャン・コン
ジャオブォ・ヤン
ゾンチュアン・ホー
ジンアン・ワン
Original Assignee
ビージーアイ ジェノミクス カンパニー リミテッド
ビージーアイ ヘルス (エイチケー) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビージーアイ ジェノミクス カンパニー リミテッド, ビージーアイ ヘルス (エイチケー) カンパニー リミテッド filed Critical ビージーアイ ジェノミクス カンパニー リミテッド
Publication of JP2022535853A publication Critical patent/JP2022535853A/ja
Application granted granted Critical
Publication of JP7317146B2 publication Critical patent/JP7317146B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Saccharide Compounds (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

本出願は、2020年04月07日に中国特許局に提出され、出願番号が202010265146.4であり、発明の名称が「ヒト表現型オントロジーの決定方法及び装置」の中国特許出願の優先権を主張しており、そのすべての内容は引用により本出願に組み込まれている。
本出願は、情報処理分野に属し、より具体的には、特にヒト表現型オントロジーの決定方法及び関連装置に関する。
ヒト表現型オントロジー(HPO、HumanPhenotypeOntology)は、人間疾患による異常表現型を説明する標準用語の集合である。中国国内の大部分の医療、科学研究者が使用する表現型説明語が統一できるようにするため、中国国内では中国語ヒト表現型オントロジー連盟を設立し、英語形式で表現されたHPOを中国語形式で表現されたCHPO(ChineseHumanPhenotypeOntology、中国語ヒト表現型オントロジー)に翻訳した。
実際には、異なる医師が症状記述情報において、同一のヒト表現型オントロジーに対応する症状の記述が多種多様であるため、これは症状に続く臨床研究やコミュニケーションに不便をもたらすと同時に、当該症状に対するデータ分析やマイニングをさらに困難にする。
上記問題に鑑みて、本出願は、上記問題を克服するか、又は少なくとも部分的に上記問題を解決するヒト表現型オントロジーの決定方法及び関連装置を提供し、関連する技術案は以下の通りである。
ヒト表現型オントロジーの決定方法であって、
症状記述情報を取得するステップと、
予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーのいずれかに対応する分割後単語群を対象とし、当該分割後単語群における分割後単語リストのいずれかに対して、前記症状記述情報内で当該分割後単語リスト内の分割後単語を検索し、前記症状記述情報内に現れる当該分割後単語リスト内の分割後単語を共通語として決定し、当該分割後単語リストにおける共通語の数と、前記症状記述情報における各共通語の位置とを決定し、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数とに基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定し、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定するステップと、
当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定するステップと、
前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定するステップと、
前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定するステップと、を含む。
選択可能に、前記分割後単語群における各分割後単語リストの分割後単語が異なり、同一の分割後単語リストの各分割後単語の文字数が同じである。
選択可能に、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定するステップの後に、前記方法は、
前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定するステップと、
前記記述語彙に隣接する隣接語彙が予め設定された否定語であるか否かを決定し、そうである場合、前記隣接語彙をラベル付けするステップと、をさらに含む。
選択可能に、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定するステップの後に、前記方法は、
前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定するステップと、
前記記述語彙と前記ヒト表現型オントロジーが一致するか否かを判断し、一致する場合、前記ヒト表現型オントロジーと前記記述語彙とが完全マッチングであると決定し、一致しない場合、前記ヒト表現型オントロジーと前記記述語彙とがファジーマッチングであると決定するステップと、をさらに含む。
選択可能に、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定するステップは、
当該ヒト表現型オントロジーと前記症状記述情報との第3の類似度を各分割後単語リストの第1の類似度によって決定するステップと、
前記第3の類似度に調整可能な重み係数を乗じて、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を決定するステップと、を含む。
選択可能に、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定するステップは、
前記症状記述情報における各共通語の位置に基づいて、前記症状記述情報における当該分割後単語リストの第1の位置ベクトルを決定するステップと、
各共通語の当該ヒト表現型オントロジーにおける位置に基づいて、当該ヒト表現型オントロジーにおける当該分割後単語リストの第2の位置ベクトルを決定するステップと、
各分割後単語リストの第1の位置ベクトルと第2の位置ベクトルに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定するステップと、をさらに含む。
選択可能に、前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定するステップは、以下の式を含み、
ここで、AEEVは、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いであり、VARは、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度であり、Scoreは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度であり、Nは、当該分割後単語群に含まれる分割後単語リストの数であり、
ここで、γは調整可能な重み係数であり、preScoreは第3の類似度であり、
ここで、nは分割後単語リストの番号であり、αβlogpは分割後単語リストnの第1の類似度であり、ここで、1≦n≦Nであり、αは調整係数であり、βは分割後単語リストnに対応する正規化因子であり、wは分割後単語リストnに対応する重みであり、pは分割後単語リストn内の共通語数と分割後単語リストn内の分割後単語数との比であり、
ここで、aは前記症状記述情報における分割後単語リストnの第1の位置ベクトルであり、bは当該ヒト表現型オントロジーにおける分割後単語リストnの第2の位置ベクトルである。
症状記述情報取得ユニット、マッチング度合い決定ユニット及びヒト表現型オントロジー決定ユニットを含むヒト表現型オントロジーの決定装置であって、ここで、前記マッチング度合い決定ユニットは、共通語決定サブユニット、共通語数決定サブユニット、共通語位置決定サブユニット、第1の類似度決定サブユニット、離散度決定サブユニット、第2の類似度決定サブユニット及びマッチング度合い決定サブユニットを含み、
前記症状記述情報取得ユニットは、症状記述情報を取得することに用いられ、
前記共通語決定サブユニットは、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーのいずれかに対応する分割後単語群を対象とし、当該分割後単語群における分割後単語リストのいずれかに対して、前記症状記述情報内で当該分割後単語リスト内の分割後単語を検索し、前記症状記述情報内に現れる当該分割後単語リスト内の分割後単語を共通語として決定することに用いられ、
前記共通語数決定サブユニットは、当該分割後単語リストにおける共通語の数を決定することに用いられ、
前記共通語位置決定サブユニットは、前記症状記述情報における各共通語の位置を決定することに用いられ、
前記第1の類似度決定サブユニットは、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数とに基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定することに用いられ、
前記離散度決定サブユニットは、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定することに用いられ、
前記第2の類似度決定サブユニットは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定することに用いられ、
前記マッチング度合い決定サブユニットは、前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定することに用いられ、
前記ヒト表現型オントロジー決定ユニットは、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定することに用いられる。
選択可能に、前記装置は、記述語彙決定ユニット、否定語検出ユニット及び否定語ラベル付けユニットをさらに含み、
前記記述語彙決定ユニットは、前記ヒト表現型オントロジー決定ユニットが、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定した後、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定することに用いられ、
前記否定語検出ユニットは、前記記述語彙に隣接する隣接語彙が予め設定された否定語であるか否かを検出し、そうである場合、前記否定語ラベル付けユニットをトリガすることに用いられ、
前記否定語ラベル付けユニットは、前記隣接語彙をラベル付けすることに用いられる。
選択可能に、前記装置は、記述語彙決定ユニット、語彙判断ユニット及び語彙マッチング決定ユニットをさらに含み、
前記記述語彙決定ユニットは、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定することに用いられ、
前記語彙判断ユニットは、前記記述語彙と前記ヒト表現型オントロジーが一致するか否かを判断することに用いられ、一致する場合、前記語彙マッチング決定ユニットをトリガし、前記語彙マッチング決定ユニットは、前記ヒト表現型オントロジーと前記記述語彙とが完全マッチングであると決定することに用いられ、一致しない場合、前記語彙マッチング決定ユニットをトリガし、前記語彙マッチング決定ユニットは、前記ヒト表現型オントロジーと前記記述語彙とがファジーマッチングであると決定することに用いられる。
上記技術案により、本出願により提供されるヒト表現型オントロジーの決定方法及び関連装置は、症状記述情報を取得し、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーに対応する分割後単語群と症状記述情報とを検索してマッチングさせ、各ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定し、分割後単語群が、当該分割後単語群に対応するヒト表現型オントロジーを予め設定された単語分割規則に従って単語分割をして得られた少なくとも1つの分割後単語リストを含み、当該分割後単語リストが、少なくとも1つの分割後単語を含み、マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定することができる。本出願では、症状記述情報と各ヒト表現型オントロジーに対応する分割後単語群とを検索してマッチングさせ、当該症状記述情報に合致するヒト表現型オントロジーを選別することは、技術者間での症状記述情報の研究やコミュニケーションに役立つとともに、当該症状記述情報に係る症状に対するデータ分析やマイニングにも役立つ。
上述説明は、本出願の技術案の概要にすぎず、本出願の技術的手段をより明確に理解できるように、明細書の内容に基づいて実施することができ、かつ本出願の上述及びその他の目的、特徴及び利点をより明確かつ分かりやすくするために、以下では特に本出願の具体的な実施形態を挙げる。
本出願の実施例又は先行技術における技術案をより明確に説明するために、以下では、実施例又は先行技術の説明において使用する必要がある図面について簡単に説明するが、以下の説明における図面は本出願のいくつかの実施例であり、当業者にとっては、創造的な労働をせずに、これらの図面に基づいて他の図面を得ることができることは自明なことである。
本出願の実施例により提供されるヒト表現型オントロジーの決定方法の概略フローチャートである。 本出願の実施例により提供される別のヒト表現型オントロジーの決定方法の概略フローチャートである。 本出願の実施例により提供される別のヒト表現型オントロジーの決定方法の概略フローチャートである。 本出願の実施例により提供される別のヒト表現型オントロジーの決定方法の概略フローチャートである。 本出願の実施例により提供されるヒト表現型オントロジーの出力結果の概略図である。 本出願の実施例により提供される別のヒト表現型オントロジーの決定方法の概略フローチャートである。 本出願の実施例により提供される別のヒト表現型オントロジーの決定方法の概略フローチャートである。 本出願の実施例により提供される別のヒト表現型オントロジーの出力結果の概略図である。 本出願の実施例により提供されるヒト表現型オントロジーの決定装置の概略構成図である。
以下、図面に合わせて本開示の例示的な実施例をより詳細に説明する。図面には、本開示の例示的な実施例が示されているが、本開示は、本明細書に記載された実施例によって限定されるべきではなく、様々な形態で実現することができることを理解されたい。むしろ、これらの実施例は、本開示をより完全に理解し、本開示の範囲を当業者に完全に伝達することを可能にするために提供される。
図1に示すように、本出願の実施例により提供されるヒト表現型オントロジーの決定方法は、以下のステップを含むことができる。
S100において、症状記述情報を取得する。
ここで、症状記述情報は、医療従事者が患者の疾病を検査、診断するなどの医療活動の経過を記録したものであってもよい。症状記述情報は、複数の語彙からなる文や段落であってもよい。本出願の実施例は、ユーザが症状記述情報を入力するためのインタフェースを提供し、ユーザは、当該インタフェースにおいて症状記述情報を編集入力したり、症状記述情報を編集したファイルをアップロードしたりすることができる。本出願の実施例は、文字スキャン装置により、医療従事者が手書きした症状記述情報をスキャンして得ることができる。もちろん、本出願は、従来の診療システム(例えば、病院の各科のパソコンにインストールされている診療システム)から医療従事者が診療システムに入力済みの症状記述情報を取得することもできる。
S200において、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーに対応する分割後単語群と前記症状記述情報とを検索してマッチングさせ、各ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定し、ここで、前記分割後単語群は、前記分割後単語群に対応するヒト表現型オントロジーを予め設定された単語分割規則に従って単語分割をして得られた少なくとも1つの分割後単語リストを含み、前記分割後単語リストは、少なくとも1つの分割後単語を含む。
ここで、予め設定されたヒト表現型オントロジーベースは、各ヒト表現型オントロジーを記憶したデータベースであってもよい。当該データベースには、各ヒト表現型オントロジーの中英文対照語彙を含むことができる。例えば、CHPO:「腸捻転」とHPO:「Volvulus」は互いに対照する。予め設定された単語分割規則は、技術者が各ヒト表現型オントロジーを一定の規範に従って単語列に再構成する規則であってもよい。選択可能に、予め設定された単語分割規則は、統計的言語モデル(StatisticalLanguageModel、SLM)に基づくアルゴリズムであってもよく、技術者がカスタマイズした単語分割規則であってもよい。例えば、本出願の実施例は、統計的言語モデルのn-gramに基づいて、ヒト表現型オントロジーに対して単語分割を行うことができる。具体的には、本出願の実施例は、n-gramアルゴリズムを利用して異なる文字数に従って、ヒト表現型オントロジーに対して単語分割を行って、異なる文字数の分割後単語を得ることができる。例えば、1つの漢字が1文字に等しいと仮定すると、本出願の実施例は、「腸捻転」に対して、それぞれ文字数が1、文字数が2及び文字数が3である場合に応じて単語分割を行うことができ、文字数が1である場合に応じて単語分割をして得られる分割後単語リストは、「腸」、「捻」、「転」という分割後単語を含み、文字数が2である場合に応じて単語分割をして得られる分割後単語リストは、「腸捻」、「捻転」という分割後単語を含み、文字数が3である場合に応じて単語分割をして得られる分割後単語リストは、「腸捻転」という分割後単語を含む。
選択可能に、前記分割後単語群における各分割後単語リストの分割後単語が異なり、同一の分割後単語リストの各分割後単語の文字数が同じである。
具体的には、本出願の実施例は、ある規則に従って、分割後単語結果における分割後単語を分類して、分割後単語リストを得ることができる。例えば、本出願の実施例は、分割後単語結果における分割後単語を文字数によって分類することができ、前述の例の「腸捻転」に対する単語分割結果については、文字数が1の分割後単語「腸」、「捻」、「転」を分割後単語リストAに、文字数が2の分割後単語「腸捻」、「捻転」を分割後単語リストBに、文字数が3の分割後単語「腸捻転」を分割後単語リストCに分類することができる。
予め設定された単語分割規則は、既存の単語分割ツールによって使用される単語分割規則であってもよいことを理解されたい。既存の単語分割ツールは、結巴(jieba)単語分割、言語技術プラットフォーム(LanguageTechnologyPlatform、LTP)及び自然言語処理と情報検索プラットフォーム(NaturalLanguageProcessing&InformationRetrievalSharingPlatform、NLPIR)を含むことができる。
なお、上記の例は、ヒト表現型オントロジーを中国語で表現する場合の語彙について説明したものにすぎず、本出願の実施例では、英語を含む言語表現形式のヒト表現型オントロジーについて分割後単語を行うことができることを理解されたい。
選択可能に、図2に示すように、図1に示す方法に基づいて、本明細書の実施例により提供される別のヒト表現型オントロジーの決定方法のステップS200は、以下のステップを含むことができる。
S210において、各ヒト表現型オントロジーのいずれかに対応する分割後単語群を対象とし、当該分割後単語群における分割後単語リストのいずれかに対して、前記症状記述情報内で当該分割後単語リスト内の分割後単語を検索し、前記症状記述情報内に現れる当該分割後単語リスト内の分割後単語を共通語として決定し、S211において、当該分割後単語リストにおける共通語の数と、前記症状記述情報における各共通語の位置とを決定し、S212において、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数とに基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定し、S213において、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定する。
ここで、ステップS210における共通語の理解を容易にするために、ここで例を挙げて説明する。症状記述情報が「腸回転不良による死亡」である場合、当該症状記述情報内で分割後単語リストにおける分割後単語「腸」、「捻」、「転」を検索すると、症状記述情報及び分割後単語リストの両方が「腸」と「転」を含むので、「腸」と「転」を共通語として決定することができる。もちろん、分割後単語リストにおける分割後単語が「腸捻転」である場合、当該分割後単語リストと当該症状記述情報には共通語がない。
ここで、ステップS212は、当該分割後単語リストにおける共通語数と当該分割後単語リストにおける分割後単語数との比に基づいて、当該分割後単語リストと症状記述情報との第1の類似度を決定することを具体的に含むことができる。
例えば、ある分割後単語リストには、「腸」、「捻」、「転」の3つの分割後単語が含まれており、このうち「腸」と「転」の2つの分割後単語が、当該分割後単語リストと症状記述情報との共通語であり、したがって、当該分割後単語リストと症状記述情報との第1の類似度は、2/3である。
選択可能に、図2に示す方法に基づいて、図3に示すように、本出願の実施例により提供される別のヒト表現型オントロジーの決定方法のステップS213は、以下のステップを含むことができる。
S213aにおいて、前記症状記述情報における各共通語の位置に基づいて、前記症状記述情報における当該分割後単語リストの第1の位置ベクトルを決定する。
ここで、症状記述情報における共通語の位置は、文字番号であってもよい。なお、文字番号は、分割後単語リストにおける各分割後単語の文字数に関連してもよく、例えば、分割後単語リストにおける各単語の文字数が1である場合、症状記述情報における1つの文字番号が1文字を表すことができる。分割後単語リストにおける各分割後単語の文字数が2である場合、症状記述情報における1つの文字番号が2文字を表すことができる。理解を容易にするために、ここで例を挙げることによってさらに説明する。症状記述情報が「長骨の部分が湾曲している」である場合、共通語が「長」及び「湾曲」であれば、当該症状記述情報における「長」という共通語の文字番号は「1」とし、当該症状記述情報における「湾曲」という共通語の文字番号は「5」としてもよい。共通語が「湾曲」であれば、当該症状記述情報における「湾曲」という共通語の文字番号は「5」としてもよい。
ここで、第1の位置ベクトルは、症状記述情報における各共通語の文字番号からなる1次元リストであってもよい。理解を容易にするために、ここで例を挙げて説明する。症状記述情報が「疑いのある患者、妊娠32週+5、胎児の骨幹が発育不良で妊娠26週の骨幹のように見え、長骨の部分が湾曲している。家族遺伝病歴がある」である場合、ある分割後単語リストと当該症状記述情報との共通語が「長」、「骨」、「湾」、「曲」であれば、当該症状記述情報における当該分割後単語リストの第1の位置ベクトルは[27、28、31、32]となる。ある分割後単語リストと当該症状記述情報との共通語が「長骨」、「骨湾」、「湾曲」であれば、当該ヒト表現型オントロジーにおける当該分割後単語リストの第2の位置ベクトルは[1、2、3]となる。
S213bにおいて、各共通語の当該ヒト表現型オントロジーにおける位置に基づいて、当該ヒト表現型オントロジーにおける当該分割後単語リストの第2の位置ベクトルを決定する。
このうち、ヒト表現型オントロジーにおける共通語の位置は文字番号であってもよい。なお、文字番号は、分割後単語リストにおける各分割後単語の文字数に関連してもよい。例えば、分割後単語リストにおける各分割後単語の文字数が1である場合、ヒト表現型オントロジーにおける1つの文字番号は1文字を表すことができる。分割後単語リストにおける各分割後単語の文字数が2である場合、ヒト表現型オントロジーにおける1つの文字番号が2文字を表すことができる。理解を容易にするため、ここで例を挙げてさらに説明する。ヒト表現型オントロジーが「長骨湾曲」である場合、共通語が「長」と「湾」であれば、当該ヒト表現型オントロジーにおける共通語「長」の文字番号は「1」であってもよく、当該ヒト表現型オントロジーにおける共通語「湾」の文字番号は「3」であってもよい。共通語が「湾曲」であれば、共通語「湾曲」の当該ヒト表現型オントロジーにおける文字番号は「3」であってもよい。なお、句読点も1つの文字番号を占めていることに留意されたい。
ここで、第2の位置ベクトルは、ヒト表現型オントロジーにおける各共通語の文字番号からなる1次元リストであってもよい。理解を容易にするため、ここで例を挙げて説明する。ヒト表現型オントロジーが「長骨湾曲」の場合、ある分割後単語リストと当該症状記述情報との共通語が「長」、「骨」、「湾」、「曲」であれば、当該分割後単語リストの当該ヒト表現型オントロジーにおける第2の位置ベクトルは[1、2、3、4]となる。ある分割後単語リストと当該症状記述情報との共通語が「長骨」、「骨湾」、「湾曲」であれば、当該ヒト表現型オントロジーにおける当該分割後単語リストの第2の位置ベクトルは[1、2、3]となる。
S213cにおいて、各分割後単語リストの第1の位置ベクトルと第2の位置ベクトルに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定する。
ステップS213cは、次の式を含むことができる。
ここで、VARは、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度であり、Nは、当該分割後単語群に含まれる分割後単語リストの数であり、aは前記症状記述情報における分割後単語リストnの第1の位置ベクトルであり、bは当該ヒト表現型オントロジーにおける分割後単語リストnの第2の位置ベクトルである。
S220において、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定する。
選択可能に、図2に示す方法に基づいて、図4に示すように、本出願の実施例により提供される別のヒト表現型オントロジーの決定方法のステップS220は、以下のステップを含むことができる。
S221において、当該ヒト表現型オントロジーと前記症状記述情報との第3の類似度を各分割後単語リストの第1の類似度によって決定する。
S222において、前記第3の類似度に調整可能な重み係数を乗じて、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を決定する。
選択可能に、ステップS221は、次の式を含むことができる。
ここで、nは分割後単語リストの番号であり、preScoreは第3の類似度であり、αβlogpは分割後単語リストnの第1の類似度であり、ここで、1≦n≦Nであり、αは調整係数であり、βは分割後単語リストnに対応する正規化因子であり、wは分割後単語リストnに対応する重みであり、pは分割後単語リストn内の共通語数と分割後単語リストn内の分割後単語数との比である。
ここで、調整係数は技術者が設定することができる。技術者は、本出願の実施例により提供されるヒト表現型オントロジーの決定方法の各実行が完了した後に、各実行結果に基づいて調整係数を調整することができる。
ここで、分割後単語リストnに対応する正規化係数は、次のように表すことができる。
ここで、logpはデータlogp、……、logpの平均値であり、次のように表すことができる。
ここで、Sはデータlogp、……、logpの分散であり、次のように表すことができる。
ここで、各分割後単語リストに対応する重みは、技術者が設定することができる。技術者は、本出願の実施例により提供されるヒト表現型オントロジーの決定方法の各実行が完了した後、各実行結果に基づいて、各分割後単語リストに対応する重みを調整することができる。
ステップS222は、次の式を含むことができる。
ここで、Scoreは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度であり、γは調整可能な重み係数である。
なお、調整可能重み係数は、ヒト表現型オントロジーに関連する。具体的には、本出願の実施例は、当該ヒト表現型オントロジーの履歴マッチングデータを用いて、調整可能な重み係数を決定することができる。具体的には、本出願の実施例は、当該ヒト表現型オントロジーの履歴マッチングデータを履歴マッチングデータベースから抽出することができ、当該履歴データは、当該ヒト表現型オントロジーが正しくマッチングされた第1の回数と、当該ヒト表現型オントロジーが誤ってマッチングされた第2の回数と、当該ヒト表現型オントロジーが手動で補完された第3の回数とを含むことができる。本出願の実施例は、第1の回数、第2の回数及び第3の回数を重み付け加算して、当該調整可能な重み係数を決定することができる。本出願の実施例は、当該ヒト表現型オントロジーと症状記述情報とのマッチング度合いを計算するために使用される調整可能な重み係数を、当該ヒト表現型オントロジーの履歴マッチングデータに基づいて決定することにより、当該ヒト表現型オントロジーが正しくマッチングされる確率を高めることができる。
S230において、前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定する。
各ヒト表現型オントロジーと症状記述情報とのマッチング度合いを容易に理解するために、選択可能に、本出願の実施例により提供される別のヒト表現型オントロジーの決定方法のステップS230は次の式を含むことができる。
ここで、AEEVは、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いであり、VARは、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度であり、Scoreは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度であり、Nは、当該分割後単語群に含まれる分割後単語リストの数であり、
ここで、γは調整可能な重み係数であり、preScoreは第3の類似度であり、
ここで、nは分割後単語リストの番号であり、αβlogpは分割後単語リストnの第1の類似度であり、ここで、1≦n≦Nであり、αは調整係数であり、βは分割後単語リストnに対応する正規化因子であり、wは分割後単語リストnに対応する重みであり、pは分割後単語リストn内の共通語数と分割後単語リストn内の分割後単語数との比であり、
ここで、aは前記症状記述情報における分割後単語リストnの第1の位置ベクトルであり、bは当該ヒト表現型オントロジーにおける分割後単語リストnの第2の位置ベクトルである。
S300において、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定する。
ここで、予め設定されたマッチング成功条件は、あるヒト表現型オントロジーとある症状記述情報とのマッチング度合いが、予め設定されたマッチング度合いの閾値より大きい場合であってもよい。理解を容易にするために、ここで例を挙げて説明する。人間表現型基準用語Mと症状記述情報Tとのマッチング度合いが9であり、人間表現型基準用語Nと症状記述情報Tとのマッチング度合いが4である場合に、予め設定されたマッチング度合い閾値が8である場合、人間表現型基準用語Mは、予め設定されたマッチング成功条件を満たす人間表現型基準用語である。
本出願の実施例では、マッチング度合いが予め設定されたマッチング成功条件を満たさないヒト表現型オントロジーをフィルタリングして、マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーのみを出力してもよい。図5に示すように、本出願の実施例により提供されるヒト表現型オントロジーの出力結果には、マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーの中英文対照語彙が含まれていてもよく、すなわち、本出願の実施例では、当該ヒト表現型オントロジーのCHPOとHPOとを同時に出力してもよく、HPOを出力する際には、HPOに対応する番号も併せて出力してもよいことを理解することができる。実際には、複数のヒト表現型オントロジーと同じ症状記述情報とのマッチング度合いが予め設定されたマッチング成功条件を満たす可能性があり、図5に示すように、本出願の実施例では、当該複数のヒト表現型オントロジーを同時に出力し、当該症状記述情報における当該複数のヒト表現型オントロジーのそれぞれに対応する記述語彙を、予め設定された対応識別子(矢印など)を用いて対応づけて出力することができることを理解することができる。
本出願の実施例により提供されるヒト表現型オントロジーの決定方法は、症状記述情報を取得し、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーに対応する分割後単語群と前記症状記述情報とを検索してマッチングさせ、各ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定することができ、ここで、前記分割後単語群が、前記分割後単語群に対応するヒト表現型オントロジーを予め設定された単語分割規則に従って単語分割をして得られた少なくとも1つの分割後単語リストを含み、前記分割後単語リストが、少なくとも1つの分割後単語を含み、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定する。本出願の実施例は、症状記述情報と各ヒト表現型オントロジーに対応する分割後単語群とを検索してマッチングさせ、各ヒト表現型オントロジーと症状記述情報とのマッチング度合いを決定することにより、当該症状記述情報に適合するヒト表現型オントロジーを決定することができ、技術者間での症状記述情報の研究やコミュニケーションに役立つとともに、当該症状記述情報に係る症状に対するデータ分析やマイニングにも役立つ。
選択可能に、図6に示すように、本出願の実施例により提供される別のヒト表現型オントロジーの決定方法は、ステップS300の後に以下のステップをさらに含む。
S400において、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定する。
具体的には、本出願の実施例は、ヒト表現型オントロジーに対応する各分割後単語リストにおける共通語が当該症状記述情報に現れる離散度に基づいて、当該位置にある語彙が、当該症状記述情報における当該ヒト表現型オントロジーの対応する記述語彙であると決定することができる。例えば、症状記述情報が「当該患者は腸回転を伴う胃腸炎に罹患している」である場合、「腸捻転」というヒト表現型オントロジーと当該症状記述情報における共通語が「腸」と「転」であり、症状記述情報には「胃腸炎」と「腸回転」の両方に共通語「腸」が存在するが、「腸回転」には共通語「回転」が存在するため、「腸回転」は「胃腸炎」に比べて共通語との離散度が低いので、当該症状記述情報におけるヒト表現型オントロジーである「腸捻転」の対応する記述語彙は「腸回転」である。
S500において、前記記述語彙に隣接する隣接語彙が予め設定された否定語であるか否かを決定し、そうである場合、前記隣接語彙をラベル付けする。
ここで、予め設定された否定語は、「なし」、「まだ」、「ない」、「いいえ」、「非」、「別」、「するな」、「欠ける」、「否」などがある。本出願の実施例は、当該記述語彙に隣接して当該記述語彙の前の隣接語彙が予め設定された否定語であるか否かを検出することができる。本出願の実施例は、当該隣接語彙が予め設定された否定語である場合、予め設定された否定識別子によって隣接語彙をラベル付けすることができる。例えば、本出願の実施例は、当該隣接語彙のフォントを太字化し、当該隣接語彙のフォント色を変更し、当該隣接語彙に特別な記号表示を使用することができる。本出願の実施例では、予め設定された否定語の隣接語彙をラベル付けすることにより、当該症状記述情報における記述語彙が肯定的な意味を表しているのか、否定的な意味を表しているのかをユーザが明確に識別することを容易にすることができる。本出願の実施例では、前記記述語彙に隣接する隣接語彙が予め設定された否定語でないことが検出された場合、前記隣接語彙をラベル付けしないようにしてもよい。
選択可能に、図7に示すように、本出願の実施例により提供される別のヒト表現型オントロジーの決定方法は、ステップS300の後に次のステップをさらに含む。
S600において、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定する。
ステップS600の説明は、上述したステップS400の説明を参照することができ、ここで説明を省略する。
S700において、前記記述語彙と前記ヒト表現型オントロジーが一致するか否かを判断し、一致する場合、ステップ800を実行し、一致しない場合、ステップ900を実行する。
S800において、前記ヒト表現型オントロジーと前記記述語彙とが完全マッチングであると決定する。
S900において、前記ヒト表現型オントロジーと前記記述語彙とがファジーマッチングであると決定する。
図5に示す出力結果に基づいて、図8に示すように、本出願の実施例により提供される別のヒト表現型オントロジーの出力結果を示す。本出願の実施例では、マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを出力する際に、当該ヒト表現型オントロジーと記述語彙とのマッチングパターンが完全マッチングであるかファジーマッチングであるかを出力することができる。
上記方法の実施例に対応して、本出願の実施例は、図9に示すように構成され、症状記述情報取得ユニット100、マッチング度合い決定ユニット200及びヒト表現型オントロジー決定ユニット300を含むことができる人間表現型基準用語決定装置をさらに提供する。
前記症状記述情報取得ユニット100は、症状記述情報を取得することに用いられる。
ここで、症状記述情報は、医療従事者が患者の疾病を検査、診断するなどの医療活動の経過を記録したものであってもよい。症状記述情報は、複数の語彙からなる文や段落であってもよい。本出願の実施例は、ユーザが症状記述情報を入力するためのインタフェースを提供し、ユーザは、当該インタフェースにおいて症状記述情報を編集入力したり、症状記述情報を編集したファイルをアップロードしたりすることができる。本出願の実施例は、文字スキャン装置により、医療従事者が手書きした症状記述情報をスキャンして得ることができる。もちろん、本出願は、従来の診療システム(例えば、病院の各科のパソコンにインストールされている診療システム)から医療従事者が診療システムに入力済みの症状記述情報を取得することもできる。
マッチング度合い決定ユニット200は、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーに対応する分割後単語群と前記症状記述情報とを検索してマッチングさせ、各ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定することに用いられ、ここで、前記分割後単語群は、前記分割後単語群に対応するヒト表現型オントロジーを予め設定された単語分割規則に従って単語分割をして得られた少なくとも1つの分割後単語リストを含み、前記分割後単語リストは、少なくとも1つの分割後単語を含む。
ここで、予め設定されたヒト表現型オントロジーベースは、各ヒト表現型オントロジーを記憶したデータベースであってもよい。当該データベースには、各ヒト表現型オントロジーの中英文対照語彙を含むことができる。選択可能に、予め設定された単語分割規則は、統計的言語モデル(StatisticalLanguageModel、SLM)に基づくアルゴリズムであってもよく、技術者がカスタマイズした単語分割規則であってもよい。
選択可能に、前記分割後単語群における各分割後単語リストの分割後単語が異なり、同一の分割後単語リストの各分割後単語の文字数が同じである。
具体的には、本出願の実施例は、ある規則に従って分割後単語結果における分割後単語を分類し、分割後単語リストを得ることができる。
予め設定された単語分割規則は、既存の単語分割ツールによって使用される単語分割規則であってもよいことを理解されたい。既存の単語分割ツールは、結巴(jieba)分割後単語、言語技術プラットフォーム(LanguageTechnologyPlatform、LTP)及び自然言語処理と情報検索プラットフォーム(NaturalLanguageProcessing&InformationRetrievalSharingPlatform、NLPIR)を含むことができる。
選択可能に、本発明の実施形態によって提供される別のヒト表現型オントロジーの決定装置は、前記マッチング度合い決定ユニット200は、共通語決定サブユニット、共通語数決定サブユニット、共通語位置決定サブユニット、第1の類似度決定サブユニット、離散度決定サブユニット、第2の類似度決定サブユニット及びマッチング度合い決定サブユニットを含む。
前記共通語決定サブユニットは、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーのいずれかに対応する分割後単語群を対象とし、当該分割後単語群における分割後単語リストのいずれかに対して、前記症状記述情報内で当該分割後単語リスト内の分割後単語を検索し、前記症状記述情報内に現れる当該分割後単語リスト内の分割後単語を共通語として決定することに用いられる。
前記共通語数決定サブユニットは、当該分割後単語リストにおける共通語の数を決定することに用いられ、
前記共通語位置決定サブユニットは、前記症状記述情報における各共通語の位置を決定することに用いられ、
前記第1の類似度決定サブユニットは、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数とに基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定することに用いられる。
ここで、前記第1の類似度決定サブユニットは、具体的には、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数との比に基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定することができる。
前記離散度決定サブユニットは、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定することに用いられる。
選択可能に、前記離散度決定サブユニットは、前記症状記述情報における各共通語の位置に基づいて、前記症状記述情報における当該分割後単語リストの第1の位置ベクトルを決定し、当該症状記述情報における各共通語の位置に基づいて、当該症状記述情報における当該分割後単語リストの第1の位置ベクトルを決定し、当該ヒト表現型オントロジーにおける各共通語の位置に基づいて、当該ヒト表現型オントロジーにおける当該分割後単語リストの第2の位置ベクトルを決定し、各分割後単語リストの第1の位置ベクトルと第2の位置ベクトルに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定することにも用いられる。
ここで、症状記述情報における共通語の位置は、文字番号であってもよい。なお、文字番号は、分割後単語リストにおける各分割後単語の文字数に関連してもよい。
ここで、第1の位置ベクトルは、症状記述情報における各共通語の文字番号からなる1次元リストであってもよい。
ここで、ヒト表現型オントロジーにおける共通語の位置は文字番号であってもよい。なお、文字番号は、分割後単語リストにおける各分割後単語の文字数に関連してもよい。
ここで、第2の位置ベクトルは、ヒト表現型オントロジーにおける各共通語の文字番号からなる1次元リストであってもよい。
選択可能に、前記離散度決定サブユニットは、具体的には、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を以下の式に基づいて決定することに用いることもできる。
ここで、VARは、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度であり、Nは、当該分割後単語群に含まれる分割後単語リストの数であり、aは前記症状記述情報における分割後単語リストnの第1の位置ベクトルであり、bは当該ヒト表現型オントロジーにおける分割後単語リストnの第2の位置ベクトルである。
前記第2の類似度決定サブユニットは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定することに用いられる。
選択可能に、前記第2の類似度決定サブユニットは、具体的には、当該ヒト表現型オントロジーと前記症状記述情報との第3の類似度を各分割後単語リストの第1の類似度によって決定し、前記第3の類似度に調整可能な重み係数を乗じて、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を決定することに用いることもできる。
選択可能に、前記第2の類似度決定サブユニットは、具体的には、当該ヒト表現型オントロジーと前記症状記述情報との第3の類似度を以下の式に基づいて決定することに用いることもできる。
ここで、nは分割後単語リストの番号であり、preScoreは第3の類似度であり、αβlogpは分割後単語リストnの第1の類似度であり、ここで、1≦n≦Nであり、αは調整係数であり、βは分割後単語リストnに対応する正規化因子であり、wは分割後単語リストnに対応する重みであり、pは分割後単語リストn内の共通語数と分割後単語リストn内の分割後単語数との比である。
ここで、調整係数は技術者が設定することができる。技術者は、本出願の実施例により提供されるヒト表現型オントロジーの決定方法の各実行が完了した後、各実行結果に応じて調整係数を調整することができる。
ここで、分割後単語リストnに対応する正規化係数は、次のように表すことができる。
ここで、logpはデータlogp、……、logpの平均値であり、次のように表すことができる。
ここで、Sはデータlogp、……、logpの分散であり、次のように表すことができる。
ここで、各分割後単語リストに対応する重みは、技術者が設定することができる。技術者は、本出願の実施例により提供されるヒト表現型オントロジーの決定方法の各実行が完了した後、各実行結果に基づいて、各分割後単語リストに対応する重みを調整することができる。
なお、各分割後単語リストに対応する重みは、技術者が設定することができる。技術者は、本出願の実施形態で提供されるヒト表現型オントロジーの決定方法の各実行が完了した後、各実行結果に応じて、各分割後単語リストに対応する重みを調整することができる。
前記第2の類似度決定サブユニットは、具体的には、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を以下の式に基づいて決定することに用いることもできる。
ここで、Scoreは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度であり、γは、調整可能な重み係数である。
なお、調整可能重み係数は、ヒト表現型オントロジーに関連する。具体的には、本出願の実施例は、当該ヒト表現型オントロジーの履歴マッチングデータを用いて、調整可能な重み係数を決定することができる。具体的には、本出願の実施例は、当該ヒト表現型オントロジーの履歴マッチングデータを履歴マッチングデータベースから抽出することができ、当該履歴データは、当該ヒト表現型オントロジーが正しくマッチングされた第1の回数と、当該ヒト表現型オントロジーが誤ってマッチングされた第2の回数と、当該ヒト表現型オントロジーが手動で補完された第3の回数とを含むことができる。本出願の実施例は、第1の回数、第2の回数及び第3の回数を重み付け加算して、当該調整可能な重み係数を決定することができる。本出願の実施例は、当該ヒト表現型オントロジーと症状記述情報とのマッチング度合いを計算するために使用される調整可能な重み係数を、当該ヒト表現型オントロジーの履歴マッチングデータに基づいて決定することにより、当該ヒト表現型オントロジーが正しくマッチングされる確率を高めることができる。
前記マッチング度合い決定サブユニットは、前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定することに用いられる。
選択可能に、前記マッチング度合い決定サブユニットは、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを以下の式に基づいて決定することに用いることができる。
ここで、AEEVは、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いであり、VARは、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度であり、Scoreは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度であり、Nは、当該分割後単語群に含まれる分割後単語リストの数であり、
ここで、γは調整可能な重み係数であり、preScoreは第3の類似度であり、
ここで、nは分割後単語リストの番号であり、αβlogpは分割後単語リストnの第1の類似度であり、ここで、1≦n≦Nであり、αは調整係数であり、βは分割後単語リストnに対応する正規化因子であり、wは分割後単語リストnに対応する重みであり、pは分割後単語リストn内の共通語数と分割後単語リストn内の分割後単語数との比であり、
ここで、aは前記症状記述情報における分割後単語リストnの第1の位置ベクトルであり、bは当該ヒト表現型オントロジーにおける分割後単語リストnの第2の位置ベクトルである。
前記ヒト表現型オントロジー決定ユニット300は、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定することに用いられる。
ここで、予め設定されたマッチング成功条件は、あるヒト表現型オントロジーとある症状記述情報とのマッチング度合いが、予め設定されたマッチング度合いの閾値より大きい場合であってもよい。
本出願の実施例では、マッチング度合いが予め設定されたマッチング成功条件を満たさないヒト表現型オントロジーをフィルタリングして、マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーのみを出力してもよい。
本出願の実施例により提供されるヒト表現型オントロジーの決定装置は、症状記述情報を取得し、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーに対応する分割後単語群と前記症状記述情報とを検索してマッチングさせ、各ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定することができ、ここで、前記分割後単語群が、前記分割後単語群に対応するヒト表現型オントロジーを予め設定された単語分割規則に従って単語分割をして得られた少なくとも1つの分割後単語リストを含み、前記分割後単語リストが、少なくとも1つの分割後単語を含み、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定する。本出願の実施例は、症状記述情報と各ヒト表現型オントロジーに対応する分割後単語群とを検索してマッチングさせ、各ヒト表現型オントロジーと症状記述情報とのマッチング度合いを決定することにより、当該症状記述情報に適合するヒト表現型オントロジーを決定することができ、技術者間での症状記述情報の研究やコミュニケーションに役立つとともに、当該症状記述情報に係る症状に対するデータ分析やマイニングにも役立つ。
選択可能に、本出願の実施例により提供される別のヒト表現型オントロジーの決定装置は、記述語彙決定ユニット、否定語検出ユニット及び否定語ラベル付けユニットをさらに含むことができる。
前記記述語彙決定ユニットは、前記ヒト表現型オントロジー決定ユニット300が、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定した後、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定することに用いられる。
具体的には、本出願の実施例は、ヒト表現型オントロジーに対応する各分割後単語リストにおける共通語が当該症状記述情報に現れる離散度に基づいて、当該位置にある語彙を、当該症状記述情報における当該ヒト表現型オントロジーの対応する記述語彙とするようにしてもよい。
前記否定語検出ユニットは、前記記述語彙に隣接する隣接語彙が予め設定された否定語であるか否かを検出し、そうである場合、前記否定語ラベル付けユニットをトリガすることに用いられる。
前記否定語ラベル付けユニットは、前記隣接語彙をラベル付けすることに用いられる。
本出願の実施例は、当該記述語彙に隣接して当該記述語彙の前の隣接語彙が予め設定された否定語であるか否かを検出することができる。本出願の実施例は、当該隣接語彙が予め設定された否定語である場合、予め設定された否定識別子によって隣接語彙をラベル付けすることができる。
選択可能に、本出願の実施例により提供される別のヒト表現型オントロジーの決定装置は、記述語彙決定ユニット、語彙判断ユニット及び語彙マッチング決定ユニットをさらに含むことができる。
前記記述語彙決定ユニットは、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定することに用いられる。
前記語彙判断ユニットは、前記記述語彙と前記ヒト表現型オントロジーが一致するか否かを判断することに用いられ、一致する場合、前記語彙マッチング決定ユニットをトリガし、前記語彙マッチング決定ユニットは、前記ヒト表現型オントロジーと前記記述語彙とが完全マッチングであると決定することに用いられ、一致しない場合、前記語彙マッチング決定ユニットをトリガし、前記語彙マッチング決定ユニットは、前記ヒト表現型オントロジーと前記記述語彙とがファジーマッチングであると決定することに用いられる。
前記ヒト表現型オントロジーの決定装置は、プロセッサ及びメモリを含み、前記症状記述情報取得ユニット100、マッチング度合い決定ユニット200及びヒト表現型オントロジー決定ユニット300などは、プログラムユニットとしてメモリに記憶されており、メモリに記憶された前記プログラムユニットをプロセッサが実行することにより、対応する機能を実現する。
プロセッサにはカーネルが含まれており、カーネルは対応するプログラムユニットをメモリから呼び出す。カーネルは、1つ以上設定することができ、カーネルパラメータを調整することにより、症状記述情報と各ヒト表現型オントロジーに対応する分割後単語群とを検索してマッチングさせ、各ヒト表現型オントロジーと症状記述情報とのマッチング度合いを決定し、当該症状記述情報に適合するヒト表現型オントロジーを決定する。
本出願の実施例は、プログラムが記憶されている記憶媒体を提供し、当該プログラムがプロセッサによって実行される場合、前記ヒト表現型オントロジーの決定方法が実現される。
本発明の実施形態は、プログラムを実行するためのプロセッサを提供し、前記プログラムが実行される場合、前記ヒト表現型オントロジーの決定方法が実行される。
本発明の実施形態は、少なくとも1つのプロセッサ、プロセッサに接続された少なくとも1つのメモリ、バスを備える装置を提供し、プロセッサ、メモリはバスを介して相互の通信を完了し、プロセッサは、前記ヒト表現型オントロジーの決定方法を実行するために、メモリ内のプログラム指令を呼び出すことに用いられる。本明細書における装置は、サーバ、PC、PAD、携帯電話などであってもよい。
本出願は、データ処理装置で実行される場合、前記ヒト表現型オントロジーの決定方法のステップを初期化するプログラムを実行するのに適しているコンピュータプログラム製品をさらに提供する。
本出願は、本出願の実施例に係る方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照して説明される。フローチャート及び/又はブロック図における各フロー及び/又はブロック、ならびにフローチャート及び/又はブロック図におけるフロー及び/又はブロックの組み合わせは、コンピュータプログラム指令によって実現され得ることを理解すべきである。これらのコンピュータプログラム指令は、汎用コンピュータ、専用コンピュータ、組み込みプロセッサ、又は他のプログラマブルデータ処理装置のプロセッサに提供されて1つの機械を生成することにより、コンピュータ又は他のプログラマブルデータ処理装置のプロセッサによって実行される指令が、フローチャートの1つ又は複数のフロー及び/又はブロック図の1つ又は複数のブロック内で指定された機能を実現するユニットを生成するようにすることができる。
典型的な構成では、装置は、1つ又は複数のプロセッサ(CPU)、メモリ及びバスを含む。装置は、入力/出力インタフェース、ネットワークインターフェースなどをさらに含むことができる。
メモリは、読み取り専用メモリ(ROM)又はフラッシュメモリ(flashRAM)などのコンピュータ読み取り可能な媒体における非永続的メモリ、ランダムアクセスメモリ(RAM)及び/又は不揮発性メモリの形態を含むことができ、少なくとも1つのメモリチップを含む。メモリは、コンピュータ読み取り可能な媒体の一例である。
コンピュータ読み取り可能な媒体は、永続的及び非永続的、リムーバブルメディア及び非リムーバブル媒体を含み、任意の方法又は技術によって情報記憶を実現することができる。情報は、コンピュータ読み取り可能な指令、データ構造、プログラムのモジュール又は他のデータであってもよい。コンピュータの記憶媒体の例としては、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他のタイプのランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、フラッシュメモリ又は他のメモリ技術、コンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)又は他の光学記憶装置、磁気カートリッジ、磁気テープ磁気ディスク記憶装置又は他の磁気記憶装置、又はコンピューティングデバイスによってアクセス可能な情報を記憶するために使用できる他の非伝送媒体を含むが、これらに限定されない。本明細書で定義されるように、コンピュータ読み取り可能な媒体は、変調されたデータ信号及び搬送波などの一時的なコンピュータ読み取り可能な媒体(transitorymedia)を含まない。
なお、「含む」、「包含」という用語又は任意の他の変形は、非排他的な包含をカバーすることを意図しており、一連の要素を含むプロセス、方法、商品、又は装置が、それらの要素だけでなく、明示的に記載されていない他の要素、又はそのようなプロセス、方法、商品、又は装置に固有の要素も含むようになる。これ以上の制限がない場合、語句「……を1つ含む」によって限定される要素は、要素を含む過程、方法、商品又は装置に別の同じ要素が存在することを排除しない。
当業者は、本出願の実施例が、方法、システム、又はコンピュータプログラム製品として提供され得ることを理解するであろう。したがって、本明細書は、完全なハードウェアの実施例、完全なソフトウェアの実施例、又はソフトウェア及びハードウェアの態様を組み合わせた実施例の形態をとることができる。さらに、本出願は、コンピュータ利用可能なプログラムコードを含む1つ又は複数のコンピュータ利用可能な記憶媒体(磁気ディスクメモリ、CD-ROM、光学メモリなどを含むが、これらに限定されない)で実施されるコンピュータプログラム製品の形態をとることができる。
以上は、本出願の実施例にすぎず、本出願を限定するためのものではない。当業者にとっては、出願に様々な変更及び変化が可能である。本出願の精神及び原理の範囲内で行われたいかなる補正、等価置換、改善等は、本出願の特許請求の範囲に含まれるものとする。

Claims (14)

  1. コンピュータにより実行されるヒト表現型オントロジーの決定方法であって、
    症状記述情報を取得するステップと、
    予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーのいずれかに対応する分割後単語群を対象とし、当該分割後単語群における分割後単語リストのいずれかに対して、前記症状記述情報内で当該分割後単語リスト内の分割後単語を検索し、前記症状記述情報内に現れる当該分割後単語リスト内の分割後単語を共通語として決定し、当該分割後単語リストにおける共通語の数と、前記症状記述情報における各共通語の位置とを決定し、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数とに基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定し、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定するステップと、
    当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定するステップと、
    前記第2の類似度、前記離散度、及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定するステップと、
    前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定するステップと、を含む、
    ことを特徴とするコンピュータにより実行されるヒト表現型オントロジーの決定方法。
  2. 前記分割後単語群における各分割後単語リストの分割後単語が異なり、同一の分割後単語リストの各分割後単語の文字数が同じである、
    ことを特徴とする請求項1に記載の方法。
  3. 前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定するステップの後に、前記方法は、
    前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定するステップと、
    前記記述語彙に隣接する隣接語彙が予め設定された否定語であるか否かを決定し、そうである場合、前記隣接語彙をラベル付けするステップと、をさらに含む、
    ことを特徴とする請求項1に記載の方法。
  4. 前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定するステップの後に、前記方法は、
    前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定するステップと、
    前記記述語彙と前記ヒト表現型オントロジーが一致するか否かを判断し、一致する場合、前記ヒト表現型オントロジーと前記記述語彙とが完全マッチングであると決定し、一致しない場合、前記ヒト表現型オントロジーと前記記述語彙とがファジーマッチングであると決定するステップと、をさらに含む、
    ことを特徴とする請求項1に記載の方法。
  5. 当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定するステップは、
    当該ヒト表現型オントロジーと前記症状記述情報との第3の類似度を各分割後単語リストの第1の類似度によって決定するステップと、
    前記第3の類似度に調整可能な重み係数を乗じて、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を決定するステップと、を含む、
    ことを特徴とする請求項1に記載の方法。
  6. 前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定するステップは、
    前記症状記述情報における各共通語の位置に基づいて、前記症状記述情報における当該分割後単語リストの第1の位置ベクトルを決定するステップと、
    各共通語の当該ヒト表現型オントロジーにおける位置に基づいて、当該ヒト表現型オントロジーにおける当該分割後単語リストの第2の位置ベクトルを決定するステップと、
    各分割後単語リストの第1の位置ベクトルと第2の位置ベクトルに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定するステップと、を含む、
    ことを特徴とする請求項1に記載の方法。
  7. 前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定するステップは、以下の式を含み、
    ここで、AEEVは、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いであり、VARは、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度であり、Scoreは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度であり、Nは、当該分割後単語群に含まれる分割後単語リストの数であり、
    ここで、γは調整可能な重み係数であり、preScoreは第3の類似度であり、
    ここで、nは分割後単語リストの番号であり、αβlogpは分割後単語リストnの第1の類似度であり、ここで、1≦n≦Nであり、αは調整係数であり、βは分割後単語リストnに対応する正規化因子であり、wは分割後単語リストnに対応する重みであり、pは分割後単語リストn内の共通語数と分割後単語リストn内の分割後単語数との比であり、
    ここで、aは前記症状記述情報における分割後単語リストnの第1の位置ベクトルであり、bは当該ヒト表現型オントロジーにおける分割後単語リストnの第2の位置ベクトルである、
    ことを特徴とする請求項1に記載の方法。
  8. ヒト表現型オントロジーの決定装置であって、症状記述情報取得ユニット、マッチング度合い決定ユニット及びヒト表現型オントロジー決定ユニットを含み、前記マッチング度合い決定ユニットは、共通語決定サブユニット、共通語数決定サブユニット、共通語位置決定サブユニット、第1の類似度決定サブユニット、離散度決定サブユニット、第2の類似度決定サブユニット及びマッチング度合い決定サブユニットを含み、
    前記症状記述情報取得ユニットは、症状記述情報を取得することに用いられ、
    前記共通語決定サブユニットは、予め設定されたヒト表現型オントロジーベースにおける各ヒト表現型オントロジーのいずれかに対応する分割後単語群を対象とし、当該分割後単語群における分割後単語リストのいずれかに対して、前記症状記述情報内で当該分割後単語リスト内の分割後単語を検索し、前記症状記述情報内に現れる当該分割後単語リスト内の分割後単語を共通語として決定することに用いられ、
    前記共通語数決定サブユニットは、当該分割後単語リストにおける共通語の数を決定することに用いられ、
    前記共通語位置決定サブユニットは、前記症状記述情報における各共通語の位置を決定することに用いられ、
    前記第1の類似度決定サブユニットは、当該分割後単語リストにおける共通語の数と当該分割後単語リストにおける分割後単語の数とに基づいて、当該分割後単語リストと前記症状記述情報との第1の類似度を決定することに用いられ、
    前記離散度決定サブユニットは、前記症状記述情報における各共通語の位置と当該ヒト表現型オントロジーにおける各共通語の位置とに基づいて、当該ヒト表現型オントロジーと前記症状記述情報との間の離散度を決定することに用いられ、
    前記第2の類似度決定サブユニットは、当該ヒト表現型オントロジーと前記症状記述情報との第2の類似度を各分割後単語リストの第1の類似度によって決定することに用いられ、
    前記マッチング度合い決定サブユニットは、前記第2の類似度、前記離散度及び当該分割後単語群における分割後単語リストの数に基づいて、当該ヒト表現型オントロジーと前記症状記述情報とのマッチング度合いを決定することに用いられ、
    前記ヒト表現型オントロジー決定ユニットは、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定することに用いられる、
    ことを特徴とするヒト表現型オントロジーの決定装置。
  9. 記述語彙決定ユニット、否定語検出ユニット及び否定語ラベル付けユニットをさらに含み、
    前記記述語彙決定ユニットは、前記ヒト表現型オントロジー決定ユニットが、前記マッチング度合いが予め設定されたマッチング成功条件を満たすヒト表現型オントロジーを決定した後、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定することに用いられ、
    前記否定語検出ユニットは、前記記述語彙に隣接する隣接語彙が予め設定された否定語であるか否かを検出し、そうである場合、前記否定語ラベル付けユニットをトリガすることに用いられ、
    前記否定語ラベル付けユニットは、前記隣接語彙をラベル付けすることに用いられる、
    ことを特徴とする請求項8に記載の装置。
  10. 記述語彙決定ユニット、語彙判断ユニット及び語彙マッチング決定ユニットをさらに含み、
    前記記述語彙決定ユニットは、前記症状記述情報における前記ヒト表現型オントロジーの対応する記述語彙を決定することに用いられ、
    前記語彙判断ユニットは、前記記述語彙と前記ヒト表現型オントロジーが一致するか否かを判断することに用いられ、一致する場合、前記語彙マッチング決定ユニットをトリガし、前記語彙マッチング決定ユニットは、前記ヒト表現型オントロジーと前記記述語彙とが完全マッチングであると決定することに用いられ、一致しない場合、前記語彙マッチング決定ユニットをトリガし、前記語彙マッチング決定ユニットは、前記ヒト表現型オントロジーと前記記述語彙とがファジーマッチングであると決定することに用いられる、
    ことを特徴とする請求項8に記載の装置。
  11. 記憶媒体であって、前記記憶媒体にプログラムが記憶されており、当該プログラムがプロセッサによって実行される場合、請求項1~7のいずれか一項に記載のコンピュータにより実行されるヒト表現型オントロジーの決定方法が実現される、
    ことを特徴とする記憶媒体。
  12. プロセッサであって、前記プロセッサはプログラムを実行するために用いられ、前記プログラムが実行される場合、請求項1~7のいずれか一項に記載のコンピュータにより実行されるヒト表現型オントロジーの決定方法が実行される、
    ことを特徴とするプロセッサ。
  13. 装置であって、装置は少なくとも1つのプロセッサ、プロセッサに接続された少なくとも1つのメモリ、バスを備え、プロセッサ、メモリはバスを介して相互の通信を完了し、プロセッサは、請求項1~7のいずれか一項に記載のコンピュータにより実行されるヒト表現型オントロジーの決定方法を実行するために、メモリ内のプログラム指令を呼び出すことに用いられる、
    ことを特徴とする装置。
  14. コンピュータプログラム製品であって、データ処理装置で実行される場合、請求項1~7のいずれか一項に記載のコンピュータにより実行されるヒト表現型オントロジーの決定方法のステップを初期化するプログラムを実行するのに適している、
    ことを特徴とするコンピュータプログラム製品。
JP2021571988A 2020-04-07 2020-11-06 ヒト表現型オントロジーの決定方法及び関連装置 Active JP7317146B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010265146.4A CN111159977B (zh) 2020-04-07 2020-04-07 一种人类表型标准用语确定方法及装置
CN202010265146.4 2020-04-07
PCT/CN2020/127048 WO2021203694A1 (zh) 2020-04-07 2020-11-06 一种人类表型标准用语确定方法及相关设备

Publications (2)

Publication Number Publication Date
JP2022535853A JP2022535853A (ja) 2022-08-10
JP7317146B2 true JP7317146B2 (ja) 2023-07-28

Family

ID=70567751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021571988A Active JP7317146B2 (ja) 2020-04-07 2020-11-06 ヒト表現型オントロジーの決定方法及び関連装置

Country Status (6)

Country Link
EP (1) EP4134864A4 (ja)
JP (1) JP7317146B2 (ja)
CN (1) CN111159977B (ja)
AU (1) AU2020441876B2 (ja)
IL (1) IL288616B2 (ja)
WO (1) WO2021203694A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159977B (zh) * 2020-04-07 2020-09-08 深圳华大基因科技服务有限公司 一种人类表型标准用语确定方法及装置
CN114676229B (zh) * 2022-04-20 2023-01-24 国网安徽省电力有限公司滁州供电公司 一种技改大修工程档案管理系统及管理方法
CN115910213B (zh) * 2022-10-26 2023-12-29 广州金域医学检验中心有限公司 人类表型本体的筛选方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223852A (ja) 2008-03-19 2009-10-01 Fuji Xerox Co Ltd 検索装置
US20110040766A1 (en) 2009-08-13 2011-02-17 Charité-Universitätsmedizin Berlin Methods for searching with semantic similarity scores in one or more ontologies

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2419197A (en) * 2004-10-14 2006-04-19 3Com Corp A content addressable memory storing wide words partitioned into segments
US20210375407A1 (en) * 2017-10-06 2021-12-02 The Trustees Of Columbia University In The City Of New York Diagnostic genomic predictions based on electronic health record data
CN110021364B (zh) * 2017-11-24 2023-07-28 上海暖闻信息科技有限公司 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统
CN108710613B (zh) * 2018-05-22 2022-04-08 平安科技(深圳)有限公司 文本相似度的获取方法、终端设备及介质
CN110209808B (zh) * 2018-08-08 2023-03-10 腾讯科技(深圳)有限公司 一种基于文本信息的事件生成方法以及相关装置
CN109473169A (zh) * 2018-10-18 2019-03-15 安吉康尔(深圳)科技有限公司 一种疾病诊断方法、装置及终端设备
CN109255021A (zh) * 2018-11-01 2019-01-22 北京京航计算通讯研究所 基于质量文本相似性的数据查询方法
CN109753555B (zh) * 2018-11-30 2023-07-07 平安科技(深圳)有限公司 词语匹配方法、装置、设备及计算机可读存储介质
CN109949927A (zh) * 2019-02-18 2019-06-28 四川拾智联兴科技有限公司 一种基于深度神经网络的智能诊断方法及其系统
CN110335684A (zh) * 2019-06-14 2019-10-15 电子科技大学 基于主题模型技术的中医智能辨证辅助决策方法
CN111159977B (zh) * 2020-04-07 2020-09-08 深圳华大基因科技服务有限公司 一种人类表型标准用语确定方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223852A (ja) 2008-03-19 2009-10-01 Fuji Xerox Co Ltd 検索装置
US20110040766A1 (en) 2009-08-13 2011-02-17 Charité-Universitätsmedizin Berlin Methods for searching with semantic similarity scores in one or more ontologies

Also Published As

Publication number Publication date
EP4134864A4 (en) 2024-03-20
IL288616A (en) 2022-02-01
EP4134864A1 (en) 2023-02-15
JP2022535853A (ja) 2022-08-10
CN111159977B (zh) 2020-09-08
AU2020441876B2 (en) 2023-06-15
IL288616B1 (en) 2023-08-01
AU2020441876A1 (en) 2022-01-06
CN111159977A (zh) 2020-05-15
WO2021203694A1 (zh) 2021-10-14
IL288616B2 (en) 2023-12-01

Similar Documents

Publication Publication Date Title
JP7317146B2 (ja) ヒト表現型オントロジーの決定方法及び関連装置
US10929420B2 (en) Structured report data from a medical text report
US20140101606A1 (en) Context-sensitive information display with selected text
US20140101544A1 (en) Displaying information according to selected entity type
CN104778186B (zh) 将商品对象挂载到标准产品单元的方法及系统
JP6884436B1 (ja) 文書表示支援システム及び文書表示支援方法並びに該方法を実行するためのプログラム
JP2011501275A (ja) 異種データセットからの知識移転を伴うテキスト分類
US20140101542A1 (en) Automated data visualization about selected text
KR20130056207A (ko) 관계 정보 확장 장치, 관계 정보 확장 방법, 및 프로그램
JP2009514076A (ja) テキスト表現の類似性を定量化するコンピュータを用いた自動類似度計算システム
CN111984851A (zh) 医学资料搜索方法、装置、电子装置及存储介质
Banik et al. Gru based named entity recognition system for bangla online newspapers
KR20210089340A (ko) 문서 내 텍스트를 분류하는 방법 및 장치
CN115062621A (zh) 标签提取方法、装置、电子设备和存储介质
AU2018226420A1 (en) Voice assisted intelligent searching in mobile documents
EP3901875A1 (en) Topic modelling of short medical inquiries
CN111008519A (zh) 阅读页面的展示方法、电子设备及计算机存储介质
WO2019192122A1 (zh) 文档主题参数提取方法、产品推荐方法、设备及存储介质
CN115964474A (zh) 一种政策关键词抽取方法、装置、存储介质及电子设备
CN114400099A (zh) 疾病信息挖掘和检索方法、装置、电子设备和存储介质
CN115066679B (zh) 一种提取专业领域内的自造术语的方法及系统
CN114388084A (zh) 一种人类表型本体术语提取系统
JP7117168B2 (ja) 情報処理装置および情報処理方法
Yadav et al. Graph-based extractive text summarization based on single document
Rajkumar et al. An efficient feature extraction with bidirectional long short term memory based deep learning model for Tamil document classification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211203

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220527

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230718

R150 Certificate of patent or registration of utility model

Ref document number: 7317146

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150