KR20180024554A - 모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법 - Google Patents

모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법 Download PDF

Info

Publication number
KR20180024554A
KR20180024554A KR1020160110972A KR20160110972A KR20180024554A KR 20180024554 A KR20180024554 A KR 20180024554A KR 1020160110972 A KR1020160110972 A KR 1020160110972A KR 20160110972 A KR20160110972 A KR 20160110972A KR 20180024554 A KR20180024554 A KR 20180024554A
Authority
KR
South Korea
Prior art keywords
item
file
information
drug
permission
Prior art date
Application number
KR1020160110972A
Other languages
English (en)
Inventor
김정훈
Original Assignee
루크코리아 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 루크코리아 주식회사 filed Critical 루크코리아 주식회사
Priority to KR1020160110972A priority Critical patent/KR20180024554A/ko
Publication of KR20180024554A publication Critical patent/KR20180024554A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

본 발명은 비정형화된 파일내에 담겨있는 의약품 허가정보를 자동화하여 분석하는 장치 및 방법에 관한것으로, 보다 상세하게는 아래아 한글등 비정형화된 형태로 구성된 의약품 허가사항정보의 정형화된 분석을 통한 2차적인 대규모 의약품 정보분석을 통한 유용한 데이터를 확보하고 분석하기 위한 장치 및 방법에 관한 것이다.

Description

모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법 {APPARATUS AND METHOD FOR ANALYZING INSERT PAPER TEXT FOR MOBILE HEATHCARE MANAGEMENT SERVICE}
본 발명은 비정형화된 파일내에 담겨있는 의약품 허가정보를 자동화하여 분석하는 장치 및 방법에 관한것으로, 보사 상세하게는 아래아 한글등 비정형화된 형태로 구성된 의약품 허가사항정보의 정형화된 분석을 통한 2차적인 대규모 의약품 정보분석을 통한 유용한 데이터를 확보하고 분석하기 위한 장치 및 방법에 관한 것이다.
본 발명의 배경이 되는 기술은 Text Analytics에 관한 분야이다.
현재 우리나라에서 의약품 허가사항정보를 공지하고 있는 웹 사이트는 ezdrug(ezdrug.kfda.go.kr)이다. 이며, 실제 사이트의 모습은 아래와 같다.
Figure pat00001
그러나, 상기 바이엘 아스피린 500mg정에 대한 의약품허가사항정보를 조회결과를 보면, 의약품 허가사항정보를 바로 확인할수도 없고, 허가사항 정보가 글 파일 형태로만 존재하기 때문에, 효능효과, 용법용량 , 사용상주의사항 항목의 다운로드 버튼을 클릭하여야만 글 형태의 허가사항 정보를 다운로드 받아서 볼 수가 있다. 이때 윈도우의 보안 설정등으로 파일을 다운받기 위한 절차만으로도 매우 번거로운 클릭이 필요하다. 그리고, 읽어 들인 사용상 주의사항 한글화일의 정보도 아래의 표1 의 예시와 같이,
1. 경고
매일 세잔 이상 정기적으로 술을 마시는 사람이 이 약이나 다른 해열진통제를 복용해야 할 경우 반드시 의사 또는 약사와 상의해야 한다. 이러한 사람이 이 약을 복용하면 위장출혈이 유발될 수 있다.

2. 다음 환자에는 투여하지 말 것
1) 이 약 또는 다른 살리실산제제에 과민증의 병력이 있는 환자
2) 소화성궤양 환자
3) 아스피린천식(비스테로이드성 소염진통제 등에 의한 천식발작의 유발) 또는 그 병력이 있는 환자
4) 혈우병 환자
5) 중증의 간장애 환자
6) 중증의 신장애 환자
7) 중증의 심기능부전 환자
8) 출혈 경향이 있는 환자
9) 메트트렉세이트 15밀리그람(15mg/주) 이상의 용량을 병용 투여하는 환자
10) 임신 3기에 해당하는 임부 (7. 임부 및 수유부에 대한 투여 항 참고)

3. 다음 환자에는 신중히 투여할 것
1) 신장애 환자 또는 심혈관 순환 기능 이상 환자(신혈관 질환, 울혈성 심부전, 체액 감소, 큰 수술, 패혈증 또는 주요 출혈 사고 등)
2) 간장애 또는 그의 병력이 있는 환자
3) 심기능이상 환자
4) 혈액 이상 또는 그 병력이 있는 환자
5) 기관지천식 환자
6) 수술전의 환자
7) 3세 이하의 유아
8) 진통제, 소염제, 항류마티스제에 대한 과민증 및 다른 알레르기 질환의 병력이 있는 환자
9) 고령자
10) 항응고제를 병용투여하는 환자 (6. 상호작용 항 참고)
11) 중증 포도당-6-인산염 탈수소효소(G6PD) 결핍증 환자. 이 약이 용혈 및 용혈성 빈혈을 유도할 수 있다. 용혈의 위험을 증가시킬 수 있는 요인은 고용량 투여, 열, 급성감염이다.

4. 이상반응
기재된 이상약물반응은 단기, 장기 경구 투여를 포함한 모든 경구 아스피린 제제의 시판 후 자발적 보고에 근거 하였다.

1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
3) 피부 : 드물게 리엘증후군(중독성표피괴사증), 스티븐스-존슨증후군(피부점막안증후군), 박탈성 피부염이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다.
4) 혈액 : 드물게 재생불량성빈혈, 빈혈, 백혈구감소, 혈소판감소, 혈소판기능 저하(출혈시간의 지연) 등이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다. 중증의 포도당-6-인산염 탈수소효소(G6PD) 결핍 중증 환자에서 용혈 및 용혈성 빈혈이 보고되었다.
5) 소화기계 : 식욕부진, 가슴쓰림, 위통, 구역, 구토 등의 증상이 나타날 수 있고 장기투여시 위장관에 대한 이상반응 특히 위장출혈, 소화성궤양 및 뚫림(천공)이 나타날 수 있다.
6) 정신신경계 : 귀울림, 귀 먹음, 어지러움, 두통, 흥분 등의 증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 용량을 줄이거나 투여를 중지한다.
7) 간장 : 드물게 간장애가 나타날 수 있다. 매우 드물게 간 트랜스아미나제 상승에 따른 일시적인 간손상이 보고되었다.
8) 신장 : 신장애와 급성신부전이 보고되었다.
9) 기타 : 과호흡, 대사성 산증 등이 나타날 경우에는 혈중농도가 현저하게 상승될 수 있으므로 용량을 줄이거나 투여를 중지한다.

5. 일반적 주의
1) 살리실산 제제와 레이 증후군과의 인과관계는 명확하지 않으나 관련성이 있다는 역학조사보고가 있으므로 14세 이하의 수두 또는 인플루엔자 환자에는 부득이한 경우에 한하여 신중히 투여하고, 투여후 환자의 상태를 충분히 관찰한다.
(레이증후군 : 소아에 있어 매우 드물게 수두, 인플루엔자 등의 바이러스성 질환에 뒤이어 심한 구토, 의식장애, 경련(급성뇌부종), 간이외의 장기에 지방 침착, 미토콘드리아변형, ALT, AST, LDH, CPK의 급격한 상승, 고암모니아혈증, 저프로트롬빈혈증, 저혈당 등의 증상이 단기간에 발현하는 증세로 사망율이 높음)
2) 소염진통제에 의한 치료는 원인요법이 아닌 대증요법(증상별로 치료하는 방법)임에 유의한다.
3) 만성질환(만성관절류마티스, 변형성관절증 등)에 사용하는 경우에는 다음 사항을 고려한다.
(1) 장기투여하는 경우 정기적인 임상검사(요검사, 혈액검사, 간기능검사 등)를 하고 이상이 있을 경우 용량을 줄이거나, 투여중지 등의 적절한 조치를 한다.
(2) 약물요법 이외의 치료법도 고려한다.
4) 급성질환에 사용하는 경우에는 다음 사항을 고려한다.
(1) 급성염증, 동통(통증) 및 발열의 정도를 고려하여 투여한다.
(2) 원칙적으로 동일한 약물의 장기투여는 피한다.
(3) 원인요법이 있으면 그것을 실시한다.
5) 환자의 상태를 충분히 관찰하고 이상반응의 발현에 유의한다. 과도한 체온강하, 허탈, 사지냉각 등이 나타날 수 있으므로 특히 고열을 수반하는 소아 및 고령자 또는 소모성 질환 환자에 있어서는 투여후 환자의 상태에 충분히 주의한다.
6) 감염증이 은폐될 수 있으므로 감염에 의한 염증에 대해서 사용하는 경우에는 적절한 항균제를 사용하고 관찰을 충분히 하면서 신중히 투여한다.
7) 고령자 및 어린이에 있어서 필요한 최소량으로 신중히 투여하고 이상반응의 발현에 특히 유의한다.
8) 수술전 1주 이내에 아스피린을 투여한 예에서 손실 혈액량의 유의성있는 증가가 보고되었다.
9) 이 약을 과량투여할 경우에는 살리실산 중독을 일으키며, 중증일 경우에는 환각, 경련, 혼수, 호흡마비, 순환기장애 등을 일으켜 사망할 수 있다.
10) 이 약을 심혈관계 또는 다른 용도로 사용할 경우는 의사, 약사와 상의해야 한다. 효능효과와 다른 용도로 자가치료할 경우 심한 이상반응이 나타날 수 있다.
11) 이 약은 복용 후 일정 기간 혈소판 응고 억제 작용을 나타내므로 수술 중 또는 수술 후 출혈 경향이 지속될 수 있다(치과 수술 등의 간단한 수술 포함).
12) 살리실산 제제는 혈소판 억제 작용으로 인해 출혈의 위험성을 증가시킬 수 있다. 수술 중 출혈, 혈종, 코피, 비뇨생식기 출혈, 잇몸출혈 등의 증상이 관찰된 바 있다. 드물게 또는 매우 드물게 위장관계 출혈, 뇌출혈(특히 조절되지 않는 고혈압 또는 다른 항지혈제와 병용시)이 나타나며 생명을 위협할 수 있다.
13) 저용량에서 아스피린은 요산 배설을 감소시켜 통풍의 소인을 가진 환자에서 통풍의 발병을 유발할 수 있다.

6. 상호작용
1) 항응고제, 혈전용해제/다른 혈소판응집억제제, 지혈제 및 당뇨병치료제(인슐린제제, 톨부타미드 등) : 이 약의 효과가 증가되어 출혈에 대한 위험성이 증가될 수 있으므로 용량을 감소시키는 등 신중히 투여한다.
2) 요산배설촉진제(벤즈브로마론, 프로베네시드) : 이 약과 병용투여시 요산배설 작용이 억제된다. 티아지드계 이뇨제의 작용을 감소시킬 수 있다.
3) 메토트렉세이트 : 비스테로이드성 소염진통제(NSAIDs) 및 살리실산과의 병용투여로 신세뇨관에서 메토트렉세이트의 배설이 지연되어 치명적인 메토트렉세이트의 혈액학적 독성이 증가될 수 있으므로 고용량의 메토트렉세이트(15mg/주 이상)는 아스피린과 병용투여하지 않으며 병용투여하는 경우에는 저용량의 메토트렉세이트와 신중히 투여하여야 한다.
4) 리튬제제 : 이 약과 병용투여시 리튬의 혈중농도가 상승하여 리튬중독이 나타났다는 보고가 있으므로 병용시에 관찰을 충분히 하고 신중히 투여한다.
5) 다른 비스테로이드성 소염진통제(NSAIDs) 및 살리실산 제제 : 이 약과 병용투여시 출혈이 증가되거나 신기능이 감소될 수 있으므로 병용투여하지 않는다.
6) 이부프로펜 : 이 약과 병용투여시 아스피린에 의한 비가역적 혈소판 응집억제 작용이 감소된다. 심혈관계 질환에 대한 위험이 증가된 환자에게 이 약과 이부프로펜을 병용투여시 아스피린의 심혈관계 보호 효과가 제한될 수 있다.
7) 선택적 세포토닌 재흡수 억제제(SSRIs) : 이 약과 병용 투여시 상부 위장관 출혈 위험성을 증가시킬 수 있다.
8) 디곡신 : 이 약과 병용투여시 신장 배설이 감소되어 디곡신의 혈장 농도가 증가할 수 있다.
9) 전신 작용 부신피질호르몬 제제(애디슨병 대체요법용 히드로코티손 제외) : 이 약과 병용 투여시 살리실산 제제의 혈중 농도를 감소시킨다.
10) 안지오텐신 전환 효소 억제제(ACE inhibitor) : 이 약의 고용량과 병용 투여시 혈관확장성 프로스타글란딘의 억제로 인해 사구체 여과율이 감소하고, 혈압 강하 효과가 감소된다.
11) 발프로산 : 이 약과 병용투여시 단백결합 치환으로 인해 발프로산의 독성이 증가한다.
12) 알코올 : 이 약과 병용 투여시 위장관 점막 손상이 증가하고, 살리실산과 알코올의 상가작용에 의해 출혈시간이 연장된다.

7. 임부 및 수유부에 대한 투여
1) 프로스타글란딘 합성 저해는 임신 또는 태아의 발달에 불리한 영향을 줄 수 있다. 역학 연구결과, 임신초기에 프로스타글란딘 합성 저해제 사용으로 인하여 유산 및 기관 결손에 대한 위험성이 증가될 수 있다 우려가 제기되었다. 이러한 위험성은 투여 용량 및 투여 기간에 따라 증가할 것으로 예상된다. 유산 위험성과 살리실산제제 복용간의 연관성을 입증할 유효한 자료는 없다. 살리실산의 기형발생에 대한 역학 연구 자료는 일관되지는 않으나, 정중배벽갈림증(gastroschisis)에 대한 위험성 증가가 배제될 수 없다. 임신초기(1-4개월째)에 이 약을 투여한 14,800쌍의 모자에서 기형발생의 증가는 나타나지 않았다.
동물실험에서 생식독성이 나타났다.
임신 1기와 2기에는 반드시 필요한 경우가 아니라면 살리실산 함유 제제를 투여해서는 안 된다. 살리실산 함유제제를 임신하고자 하는 여성 혹은 임신 1기 및 2기에 투여할 경우, 저용량을 유지해야하며 가능한 한 최소한의 기간동안만 복용한다.
임신 3기 동안 모든 프로스타글란딘 합성 저해제들은 태아의 심폐기관 독성(동맥관의 조기 폐쇄 및 폐고혈압), 신기능 저하(이는 양수과소증(oligohydramnios))을 유발할 수 있다. 또한 임신말기에는 산모와 아이에서 출혈시간을 연장시키고, 저용량에서도 항응고작용이 나타날 수 있으며, 자궁 수축이 억제되어 분만시간이 연장 또는 지연될 수 있다. 따라서 임신 3기에 아스피린을 투여해서는 안 된다.
2) 임신 말기의 랫트에 투여한 실험에서 태자의 동맥관 수축이 보고되어 있다.
3) 이 약은 유즙으로의 이행이 일어나므로 수유부에는 투여하지 않는다.

8. 고령자에 대한 투여
고령자에는 이상반응이 나타나기 쉬우므로 소량부터 투여를 시작하는 등 환자의 상태를 관찰하면서 신중히 투여한다.

9. 보관 및 취급상의 주의사항
1) 어린이의 손이 닿지 않는 곳에 보관한다.
2) 의약품을 원래 용기에서 꺼내어 다른 용기에 보관하는 것은 의약품 오용에 의한 사고 발생이나 의약품 품질 저하의 원인이 될 수 있으므로 원래의 용기에 넣고 꼭 닫아 보관한다
비정형화된 아래아 한글 문서형태이며, 특정한 표식자 없이 항목별로만 나열된 형태이기 때문에, 해당 약품의 경고항목이 무엇인지, 금기항목이 무엇인지 그리고 특정한 환자에게 금기인 약물전체를 검토하고자 때와 같이 아래 표 2와 같은 예시처럼 세부 항목별로 분류하여 분석하고자 할때에는, 세부항목별로 허가사항을 분석하여 표현하고 DB화하는 것이 매우 필요한 기본적인 것이지만, 일일이 사람(약사등 의료전문인)이 분석하여 분류하여야 하기 때문에 기존에는, 매우 시간과 노력이 많이 소요되었다. 그러나, 본 발명은 컴퓨터 알고리즘으로 이러한 과정을 자동화하여, 의약품 허가사항정보DB를 기본적으로 매우 짧은 시간에 구현할 수 있고, 대규모의비정형화된 의약품 허가사항 정보를 분석하여 임상적으로 의미있는 2차 의약품정보를 생성해 낼 수 있는 기반이 될 수 있다.
1. 경고
2. 다음 환자에는 투여하지 말 것
3. 다음 환자에는 신중히 투여할 것
4. 이상반응
5. 일반적 주의
6. 상호작용
7. 임부 및 수유부에 대한 투여
8. 고령자에 대한 투여
9. 보관 및 취급상의 주의사항
또한 표3과 같이 각 세부 항목내에서 (예를들어 아래 표3에서는 부작용)에서의 소항목 수준( 1) ~ 9) )에서의 정보 분석은 아예 시도할 수 없는 상태였다.
1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
3) 피부 : 드물게 리엘증후군(중독성표피괴사증), 스티븐스-존슨증후군(피부점막안증후군), 박탈성 피부염이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다.
4) 혈액 : 드물게 재생불량성빈혈, 빈혈, 백혈구감소, 혈소판감소, 혈소판기능 저하(출혈시간의 지연) 등이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다. 중증의 포도당-6-인산염 탈수소효소(G6PD) 결핍 중증 환자에서 용혈 및 용혈성 빈혈이 보고되었다.
5) 소화기계 : 식욕부진, 가슴쓰림, 위통, 구역, 구토 등의 증상이 나타날 수 있고 장기투여시 위장관에 대한 이상반응 특히 위장출혈, 소화성궤양 및 뚫림(천공)이 나타날 수 있다.
6) 정신신경계 : 귀울림, 귀 먹음, 어지러움, 두통, 흥분 등의 증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 용량을 줄이거나 투여를 중지한다.
7) 간장 : 드물게 간장애가 나타날 수 있다. 매우 드물게 간 트랜스아미나제 상승에 따른 일시적인 간손상이 보고되었다.
8) 신장 : 신장애와 급성신부전이 보고되었다.
9) 기타 : 과호흡, 대사성 산증 등이 나타날 경우에는 혈중농도가 현저하게 상승될 수 있으므로 용량을 줄이거나 투여를 중지한다.
소항목 수준에서의 분석이 가능하다면, 전체 의약품 내에서 어떤 부작용뿐만 아니라, 부작용으로 분류한 소항목 분류기준을 추출하여(예, 5)번 항목의 소화기계 부작용 , 정신신경계 부작용, 간장 부작용, 신장 부작용등) 어떠한 빈도로 나타나는 지를 허가사항수준에서 체계적으로 분석하고 활용할수 있는등 그 활용가능성이 매우 크다고 하겠다.
- Ezdrug상등에 공지된 의약품 허가사항 정보화일의 자동다운로드
웹상에 공지된 한글파일을 자동으로 다운로드 받는 과정을 통하여 의약품 허가정보 파일을 웹으로부터 다운로드 받는 방법이다. Ezdrug 홈페이지를 이용하는데, 아래와 같은 URL을 이용하여,
"http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=" + 품목기준코드
각 품목기준코드별로, 해당 URL 을 방문하여, 문서가 저장된 서버내의 특정 URL을 얻는다. 그리고, 이때 로그펜600밀리그람 의약품의 허가사항정보는 아래와 같이, 효능효과 파일, 용법용량파일, 사용상주의사항 파일로 3가지로 각각 구성되고, 각 한글문서의 식약처 서버내의 위치를 나타내는
ezdrug.kfda.go.kr/jsp/com/kfda2/commen/FileDownloa.jsp?doc_id=문서아이디(아래그림 좌측 하단 참고)가 각 효능효과, 용법용량, 사용상주의사항의 파일의 위치임을 알 수 있다.
[1] 각 품목기준코드별 허가사항 원문화일(효능효과 파일, 용법용량파일 , 사용상주의사항 파일)의 서버내 URL 을 얻기 위한 방법
- 품목기준코드별 의약품 허가정보 페이지로 이동방법
본 발명의 모든 코드는 변의상 VBA(Visual Basic For Application) Pseudo Code로 작성하였으나, 다양한 컴퓨터 언어로 변환가능함은 당연하다. 의약품은 식품의약품 안전처에서 품목기준코드라는 코드부여체계를 통해 허가사항 별로 관리하고 있는데, Ezdrug을 통해 해당 품목기준코드를 가진 약품으로 바로 접속가능한 URL은 다음과 같다.
"http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=" + 품목기준 코드
아래는 위와 같은 작업이 가능하도록 VBA로 구성한 코드의 작업순서 예시이다.
제 1단계 : Webbrowser 객체를 선언한다. (dim ie as new internetexplorer)
제 2단계 : 선언된 객체를 이용하여, 상기 품목기준코드별 의약품 허가정보 페이지로이동한다. ( ie.navigate ‘http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq= + 품목기준코드’ )
제 3단계 : 충분한 웹사이트 이동시 응답대기시간을 확보하는 로직을 추가한다.
제4단계 : Explorere 객체안의 document.body.innerHTML 값내에 저장된 상기 의약품 품목기준코드별 페이지의 HTML을 확보
제 5단계:확보된 HTML에 대한 구문분석을 시행하여, 상기 허가사항 효능효과,용법용량,사용상주의사항 원본파일의 URL만 별도로 확보하여 품목기준코드별 URL정보를 저장한다.
위의 방식은 WebBrowser control을 이용하여, 직접 해당 웹페이지를 방문하여, 데이터를 가져오는 방식이었는데, 이 방식은, 속도가 느린편이기 때문에, 직접 윈도우즈의 URLDownloadToFile API를 이용하여, 해당 URL상의 페이지가 가지고 있는 HTML 을 직접 가져오는 방식을 추가로 고안하였다. 이 방식에 따르면 1단계~ 4단계는 한가지 단계로 간소화 된다.
1단계 : kfda_url = "http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=품목기준코드 선언
2단계 : URL상의 웹페이지의 HTML을 직접 로컬컴퓨터의 특정화일이름으로 저장한다.
Results = URLDownloadToFile(0,kfda_url, [저장될화일명], 0, 0)
3단계: 확보된 HTML에 대한 구문분석을 시행하여, 상기 허가사항 원본파일의 URL만 별도로 확보하여 품목기준코드별 URL정보를 저장한다.
4단계 : 모든 품목기준코드에 대하여, 1단계를 반복한다.
이렇게 1단계~4단계까지의 과정이 끝나면 아래표와 같은 품목기준코드별 의약품허가사항 원문파일의 URL이 효능효과, 용법용량, 사용상 주의별로 저장된 테이블이 생성된다.
상기와 같이 의약품 허가사항(효능효과, 용법용량,사용상주의사항에 대한 HWP문서화일이 저장된 서버내 URL 주소를 모두 확보하여 별도 테이블에 저장해둔다.
[2] 각 품목기준코드별 허가사항 원문화일(효능효과 파일, 용법용량파일 , 사용상주의사항 파일)의 서버내 URL 을 통해 자동적으로 다운로드
1) 두 번째 단계로, 실제로 이와 같이 각 품목기준코드별로, 의약품 허가사항 원문화일이 저장된 서버상의 URL을 확보하였다면, 각 품목기준코드별로, 실제 URL주소에서 허가사항 원문화일을 효능효과, 용법용량, 사용상 주의사항 파일을 직접 다운로드 받는다. 표4은 위의 사항을 구체화한 내용이다.

1단계 : 품목기준코드별 효능효과,용법용량,사용상주의사항의 한글화일 문서 URL을 이용하여, URLdownloadToFile API를 호출하여, 실제 로컬컴퓨터의 파일로 저장한다.
Results1 = URLDownloadToFile(0,[효능효과문서주소], [효능효과 원문화일명], 0, 0)
Results2 = URLDownloadToFile(0,[용법용량문서주소], [용법용량 원문화일명], 0, 0)
Results3 = URLDownloadToFile(0,[사용상주의문서주소], [사용상주의 원문화일명], 0, 0)

2단계 : 모든 품목기준코드에 대하여 상기 1단계를 반복한다. 로컬컴퓨터에 저장되는 원문화일명은 사용자지정의 중복이 되지 않도록 명칭을 자동화하여 지정할 수 있다.
[2-1] 각 품목기준코드별로 다운로드받은 효능효과,용법용량,사용상 주의사항 파일에 대한 자동화된 편집 에디팅
1) 만약에 식약처등에서 받은 허가사항 정보화일에서 편집기술을 적용하거나, 사용자 지정의 editing을 자동화된 형태로 진행하고자 할 수 있다. 이와 같은 기술을 구현하기 위하여, HWP의 API를 이용하여, 정보의 typing, 편집디자인작업을 수행할 수 있으며, HWP가 아닌 PPT, WORD, EXCEL의 경우에서도 VBA를 이용하여, 사전에 자동화된 편집 에디팅 작업이 가능하다.
[3] 각 품목기준코드별로 다운로드받은 효능효과,용법용량,사용상 주의사항에 대한 TEXT형태 파일 변환
1) 만약에 식약처등의 웹사이트에서 직접 상12기와 같은 방식으로 받아오지 않고, 각 품목기준코드별로 의약품 허가사항 원문화일을 직접 받아올 수 있다면, 상기 [1].[2] 과정은 필요치 않다. 특히 공공데이터 개방정책에 따라, 원문화일을 직접 공공데이터 포털등을 통하여 확보할 수 있는 경우라면 이에 해당한다. 이와같이 원문화일을 직접 확보할 수 있다고 한다면, 바로 [3] 스텝에서, 구문분석을 위하여 HWP화일형태를 HTML화일형태등 TEXT화일 형태로 변환하여야 한다. 표5는 이러한 HWP파일의 HTML 또는 TEXT형태로 변환가능한 모습을 표현하였다.
1단계 : 글 컨트롤 사용선언
2단계 : 각 품목기준코드별로 허가사항 원문화일을 자동적으로 읽어들이면서, HWP(아래아한글) 컨트롤의 SAVEAS API를 이용하여, TEXT형태의 “구문분석이 가능한 형태의 파일로 변화시킨다.” 본 발명에서는 실시례로 HTML로 변환시키는 방법에 대하여 보이고자 한다. 물론 XML형태등 다양한 형태로 변환하여 구문분석이 가능하다.

HWP.saveas [허가사항원문화일명],[변환형식화일명],"HTML"

3단계 : 모든 품목기준코드별로 효능효과,용법용량,사용상주의사항 원문화일에 대하여 2과 같은 과정을 반복함.
만약에, 다운받거나 제공받은 허가사항 원문화일이 MS-WORD 또는 EXCEL화일일 경우에는, VBA를 이용하여, WORD 파일 또는 EXCEL화일을 HTML파일로 형식을 변경하여 저장할 수 있다. 아래 표6 및 표7의 실시례는 VBA를 이용하여 글이 아닌 형태의 파일로 다운받았을 경우의 파일변환 방법이다.
Dim xlsapp as new Excel.application
xlsapp.Open [허가사항원문화일명]
xlsapp.SaveAs
Filename:=[형식변환파일명], _
FileFormat:=xlHtml, ReadOnlyRecommended:=False, CreateBackup:=False
Dim docapp as new Word.application
docapp.Open [허가사항원문화일명]
docapp.SaveAs FileName:=[형식변환파일명], FileFormat:= _
wdFormatFilteredHTML, LockComments:=False, Password:="", AddToRecentFiles
:=True, WritePassword:="", ReadOnlyRecommended:=False, EmbedTrueTypeFonts _
:=False, SaveNativePictureFormat:=False, SaveFormsData:=False, _
SaveAsAOCELetter:=False
[4] 각 품목기준코드별로 TEXT형태(HTML, XML, .... )화일로 변환된 정보 분석
[4-0] HTML형태의 변환을 통한 허가사항 정보의 직접적인 웹서비스 기능
확보된 의약품허가정보 파일(한글 또는 워드)등 전자문서화된 파일을 HTML화일로 변환한 결과는 바로 웹페이지상에서 실제 한글과 거의 동일한 형태로 HTML이 변환되기 때문에, 일일이 식약처 홈페이지의 한글파일을 HTML을 수작업으로 변환하여 구축한 DB와 달리 즉시 빠른 속도로 웹형태로 제공이 가능하다.
[4-1] 각 품목기준 코드별 허가사항 항목별 자동분류
1) 먼저 HTML 등 TEXT화일 형태로 변환된 의약품허가사항 정보중에서, 효능효과, 용법용량정보는 별도의 파일단위로 제공되기 때문에, 의약품허가항목별 분류로직은 사용상주의사항 파일에 적용할 수 있다. 의약품 사용상 주의사항은 총 14개 항목으로 구분이 되는데, 이때 분류 RULE DB에 따라 사용자가 원하는 형태의 다양한 추가항목으로 언제든지 구분할 수 있다.
허가사항 항목별 자동분류작업은 아래와 같다. 아래 실시례는 HTML화일로 변환되었을때의 기준을 의미한다.
1단계 : HTML화일을 분석을 용이하게 하기 위하여 분석에 불필요한 HTML 속성정보 등을 정리하여 필요한 HTML element 및 필요한 속성정보만을 걸러낸다.(HTML filtering)
2단계 :
: HTML 파일로부터, 각 항목명과 각 항목의 내용을 구분한다.
원본허가사항 파일이 1. 2. 3. 4. ... 과 같이 끝나는 경우가 대부분인데, 실제로는
아래와 같이 허가사항의 각 항목들의 형식의 예시이다.
1. 경고
2. 다음 환자에는 투여하지 말 것
3. 다음 환자에는 신중히 투여할 것
4. 이상반응
5. 일반적 주의
6. 상호작용
7. 임부 및 수유부에 대한 투여
8. 고령자에 대한 투여
9. 보관 및 취급상의 주의사항
이렇게 항목명은 HTML 로 변환되엇을 때, 아래와 같이 변환이 되는데,
1) <P>1. ~~~ </P> 와 같이 끝나는 경우가 항목명을 의미한다
이렇게 <P>숫자. ~~~ </P> 와 같은 형태를 가진 것을 항목명으로 간주하고 이 정보들을 가져온다. 이때 숫자는 1~20까지로 하였다.
단, 허가사항상 항목명 규칙은, <P>에 한정되지 않고, HTML구문을 분석한 허가사항 항목명 규칙DB를 구성하여, <HTML element>숫자. ~~~ </HTML element> 와 같은 형태로 규칙DB의 갱신이 물론 가능하다. 항목명은 이 숫자.~~~~ 이며, 이 것의 길이가 너무 길경우에도 항목이 아니므로, 이에 대한 조건을 규칙DB에 저장하여 둔다.
또한, 허가사항항목에 따라 (숫자) 형태, 숫자) 형태등 다양한 목차형태가 있을수 있으며, 이에 대해서도 규칙DB에 별도로 추출기준을 저장하여 두고 적용한다.
3단계 : 각 항목명아래의 항목의 실제 내용추출
2단계에서,
<P>(숫자). ~~~ </P> 가 어떤 항목명이고,
<P>(숫자+1). ~~~ </P> 이라면,
해당 항목의 항목내용은 상기 표의 위치에 해당할 것이다. 이 위치를 파서로 가져오고 항목의 내용으로 저장한다.
4단계: 각 항목별 관련 미리 지정된 카테고리로 자동분류
3단계에서, <P>(숫자). ~~~ </P> 가 어떤 항목명이고, 그 항목의 구체적인 내용은 ~~~ 에 포함되어 있다. 이 ~~~ 는 의약품허가사항별로 같은 항목에 해당될지라도 통일화되어 있지 않아서 여러 가지 통일되지 않은 용어들로 구성되어 있다.
따라서, 경험적으로 “특정한 키워드” 들의 존재여부를 통해 해당 항목으로 분류하도록 분류규칙DB를 구성하고, 분류규칙DB에 따라서, 항목명에 대하여 특정 분류로 자동적으로 분류하도록 할 수 있고, 분류규칙DB는 계속적으로 학습시켜서 update할 수있다.
RULE DB에는 “키워드” 규칙뿐만 아니라, 다양한 문맥, 조사, 조건식, 특정 단어들사이의 거리등이 실제 수많은 허가사항 정보를 분석하여 나온 기준에 따라 적용되어 항목명의 여러 가지 언어적 특성을 고려하여 가장 적합한 카테고리로 이동하도록 학습이 가능하도록 고안할 수 있다.
1)특정 키워드 들의 존재여부
2)NOT 조건, OR조건등 조건식의 채용
3)형태소 분석을 통한 의미분석
4)복합적인 조건의 부가등
[4-2] 각 품목기준 코드별 허가사항 항목별 자동분류 결과내에서 소항목별 추가분류
아래는 특정 품목기준코드에 따른 부작용 항목 내용이 다음 표7과 같다면,
항목내용중에서, 각 소항목별로 분리 추출하는 방법에 대한 절차이다.
1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
3) 피부 : 드물게 리엘증후군(중독성표피괴사증), 스티븐스-존슨증후군(피부점막안증후군), 박탈성 피부염이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다.
4) 혈액 : 드물게 재생불량성빈혈, 빈혈, 백혈구감소, 혈소판감소, 혈소판기능 저하(출혈시간의 지연) 등이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다. 중증의 포도당-6-인산염 탈수소효소(G6PD) 결핍 중증 환자에서 용혈 및 용혈성 빈혈이 보고되었다.
5) 소화기계 : 식욕부진, 가슴쓰림, 위통, 구역, 구토 등의 증상이 나타날 수 있고 장기투여시 위장관에 대한 이상반응 특히 위장출혈, 소화성궤양 및 뚫림(천공)이 나타날 수 있다.
6) 정신신경계 : 귀울림, 귀 먹음, 어지러움, 두통, 흥분 등의 증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 용량을 줄이거나 투여를 중지한다.
7) 간장 : 드물게 간장애가 나타날 수 있다. 매우 드물게 간 트랜스아미나제 상승에 따른 일시적인 간손상이 보고되었다.
8) 신장 : 신장애와 급성신부전이 보고되었다.
9) 기타 : 과호흡, 대사성 산증 등이 나타날 경우에는 혈중농도가 현저하게 상승될 수 있으므로 용량을 줄이거나 투여를 중지한다.

1단계 : HTML화일을 분석을 용이하게 하기 위하여 분석에 불필요한 HTML 속성정보 등을 정리하여 필요한 HTML element 및 필요한 속성정보만을 걸러낸다.(HTML filtering)
2단계 :
: HTML 파일로부터, 소항목별로 분리한다.
원본허가사항 파일이 1) 2) 3) 4) ... 과 같이 끝나는 경우가 대부분인데, 실제로는
1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
3) 피부 : 드물게 리엘증후군(중독성표피괴사증), 스티븐스-존슨증후군(피부점막안증후군), 박탈성 피부염이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다.
4) 혈액 : 드물게 재생불량성빈혈, 빈혈, 백혈구감소, 혈소판감소, 혈소판기능 저하(출혈시간의 지연) 등이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다. 중증의 포도당-6-인산염 탈수소효소(G6PD) 결핍 중증 환자에서 용혈 및 용혈성 빈혈이 보고되었다.
상기 표8은 허가사항의 각 항목들의 형식의 예시이다.
이렇게 소항목명은 HTML 로 변환되엇을 때, 아래와 같이 변환이 되는데,
1) <P>1) ~~~ </P> 와 같이 끝나는 경우가 항목명을 의미한다
이렇게 <P>숫자) ~~~ </P> 와 같은 형태를 가진 것을 항목명으로 간주하고 이 정보들을 가져온다. 이때 숫자는 1~20까지로 하였다.
단, 허가사항상 항목명 규칙은, <P>에 한정되지 않고, HTML구문을 분석한 허가사항 항목명 규칙DB를 구성하여, <HTML element>숫자. ~~~ </HTML element> 와 같은 형태로 규칙DB의 갱신이 물론 가능하다. 항목명은 이 숫자.~~~~ 이며, 이 것의 길이가 너무 길경우에도 항목이 아니므로, 이에 대한 조건을 규칙DB에 저장하여 둔다.
또한, 소항목에 따라 (숫자) 형태, 숫자) 형태등 다양한 목차형태가 있을수 있으며, 이에 대해서도 규칙DB에 별도로 추출기준을 저장하여 두고 적용한다.
3단계 : 각 소항목의 실제 내용추출
2단계에서,
<P>숫자) ~~~~~~~~~
<P>숫자+1) ~~~~~~~ 이라면,
“<P>숫자)” 다음부터 “<P>숫자+1)” 앞까지의 값이 소항목의 실제 내용이다.
이땟 '숫자+1)'은 숫자가 2이면, 숫자) 는 '2)'를 의미하고 따라서 '숫자+1)' 은 3) 을 의미한다.
4단계: 각 소항목별 키워드분석을 통하여 특정 정보를 찾아낸다.
3단계에서, 소항목의 실제적인 내용은 ~~~~~~ 에 포함되어 있다. 이 ~~~~~ 에 담겨있는 키워드 및 허가사항 항목분류결과를 조합하여 분류결과를 저장할 수 있다.
따라서, 경험적으로 “특정한 키워드” 들의 존재여부와 해당 허가사항항목의 분류결과를 조합하여, 보다 더 의미있는 결과를 분석할 수 있는데, 예를들어, “부작용” 항목에 “골격근계” 라는 키워드가 있다면 “골격근계 부작용” 이 있다는 내용일 수가 있고, 여기에 소항목의 내용중에 “때때로”라는 항목이 들어있다면 특정 약품/부작용빈도/부작용 내용을 DB화할 수 있다.
5단계 : 이러한 분석을 전체 품목기준코드에 따라 진행하면, “임부” 중에 “금기”인 약물을 전체적으로 자동화하여 분석도 가능하며, “간 손상자”가 “금기”인 약물도 식약처 허가사항 기준으로 자동화한 분석도 가능해진다.
5)처리된 파싱결과를 분석하여, 각 항목별로 약물정보를 연결하여, 부작용/금기/효능/신중투여/금기환자등 허가사항중 주요 정보요소와 관련하여, 부작용 분포에 대한 분석, 특정환자가 금기, 신중투여해야 할 의약품에 대한 분석등 다양한 2차적 분석이 가능해진다.
[5] 웹등에 자동적으로 writing하기 위한 방법
구체적인 알고리즘(실시례)
[1]네이버 블로그에 대규모로 의약품 허가사항 DB를 자동적으로 구축한 사례
네이버등 특정 사이트에 자동적으로 이렇게 구축된 의약품 정보를 저장할 수 있는데, 그러한 방법은 사이트 분석결과에 따라 각기 다르다. 그러나 기본적으로, 사이트에서, 목적정보를 넣을 HTML element 의 element ID, NAME 에 접근하여, 해당 element에 값을 자동적으로 입력한뒤, 목적정보를 서버로 전송하기 위한 HTML element 요소의 ID,NAME에 접근하여 해당 element에 필요한 event를 일으켜줌으로써 웹페이지로의 자동적인 입력과 전송이 가능해진다.
[6] 부작용 정보 분석방법
의약품 허가사항 정보에서 어떤 부작용이 존재하는지를 자동화된 방식으로 대량으로 확인해볼 수 있는 방법은, WHO-ART 092 버전의 한글화된 부작용명이 허가사항 정보에 있는지를 확인하는 방법이 있고, 이 한글화된 부작용명을 기준으로 보다 정교한 부작용명에 대한 RULE을 담을 수 있는 RULE DB를 이용하여 의약품 각 품목당 부작용정보를 집계할 수 있다.
본 발명을 이용하면, 현재 비정형화된 아래아 한글 문서형태등인 의약품 허가사항 정보에 대하여, 특정한 표식자 없이 항목별로만 나열된 형태이기 때문에, 해당 약품의 경고항목이 무엇인지, 금기항목이 무엇인지 그리고 특정한 환자에게 금기인 약물전체를 검토하고자 때와 같이 아래 표 2와 같은 예시처럼 세부 항목별로 분류하여 분석하고자 할때에는, 세부항목별로 허가사항을 분석하여 표현하고 DB화하는 것이 매우 필요한 기본적인 것이지만, 일일이 사람(약사등 의료전문인)이 분석하여 분류하여야 하기 때문에 기존에는, 매우 시간과 노력이 많이 소요되었다. 그러나, 본 발명은 컴퓨터 알고리즘으로 이러한 과정을 자동화하여, 의약품 허가사항정보DB를 기본적으로 매우 짧은 시간에 구현할 수 있고, 대규모의비정형화된 의약품 허가사항 정보를 분석하여 임상적으로 의미있는 2차 의약품정보를 생성해 낼 수 있는 기반이 될 수 있다.
또는 이렇게 대량으로 전체 품목기준 코드별로 허가사항화일을 다운로드 받은뒤 이를 DB화하여야 하는데, 이를 위해서는 VBA 및 한글ActiveX를 이용하여 효능효과, 용법용량, 사용상 주의사항 허가사항화일을 HTML 형식으로 자동적으로 변환한뒤, 통합한다. 그리고 이 결과값을 메모리로 읽어 파싱을 한다. 이때 의약품표시기재를 기준으로 HTML 로 변환된 허가정보의 목차정보를 분석하여 16개의 허가사항표시기재 항목별로 정보를 자동적으로 분류한다. 분류과정에서 키워드를 기준으로 분류하는데, 예를들어 “금기”항목의 경우, “투여하지” 와 “말 것” 의 키워드를 가진 목차 또는 “투여” 와 “말 것”을 가진 목차등을 각각 처리하여 금기항목으로 분류를 하게 된다. 본 발명을 통해 16개의 허가정보 항목으로 자동적으로 분류된 허가정보는 각각 DB 필드에 저장되고, SPL structure가 구성된다. 모든
품목기준코드(약5만 7천건)에 대한의약품허가정보의 표시기재지침에 따른 항목별 DB화 및 SPL structure 구조로의 변화가 매우 빠르고 효과적으로 가능하다. 또한 자동화된 정보구축 기반이므로, XML , HTML, Javascript등으로 다양하게 변화시켜 컨텐츠화할 수 있기 때문에 손쉽게 약물정보데이터 베이스를 구축할 수 있게 되었다. 또한 DB화가 됨으로써 특정 항목 예를들어 “금기” 항목에서 “녹내장” 환자가 포함된 약의 리스트와 관련 정보를 매우 빠르게 검토가 가능하다.
참고로, SPL structure는 Stuctured Product Labeling의 약자로서, FDA에서 허가하는 모든 의약품에 대한 허가정보를 구조화한 document markup standard로서, 의약품라벨 문서의 SPL markup은 평이하게 읽을수있고, semantic markup을 제공하여 어떤 특정한 목적을 위해서 관련자료 추출이 매우 효과적이고,
SPL문서는 변형을 거치지 않고, 시스템간 상호자료교환이 가능하고, 정보접근성을 향상시켜 의약품라벨 내용에 대한 자료화 능력을 높이고, 성별,나이,질병,환자의 특성에 대한 평가를 가능하게 한다. 또한 의약품부작용 보고와 같은 다른 기술적,임상적 사례의 분류,저장이 가능하고, 다양한 의약정보 데이터로 활용이 가능하다.
도1은 식약처의 의약품허가사항 정보 홈페이지인 Ezdrug으로부터 의약품 품목기준코드를 기준으로 의약품 허가사항 정보의 3가지 요소인 효능효과, 용법용량,사용상주의사항 파일을 자동적으로 다운로드 받아서, 분류하고, 이 정보를 웹페이지에 자동적으로 담는 과정을 표현한 그림이다.
- Ezdrug상등에 공지된 의약품 허가사항 정보화일의 자동다운로드
웹상에 공지된 한글파일을 자동으로 다운로드 받는 과정을 통하여 의약품 허가정보 파일을 웹으로부터 다운로드 받는 방법이다. Ezdrug 홈페이지를 이용하는데, 아래와 같은 URL을 이용하여,
"http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=" + 품목기준코드
각 품목기준코드별로, 해당 URL 을 방문하여, 문서가 저장된 서버내의 특정 URL을 얻는다. 이 URL이 가리키는 페이지는 다음과 같다.
Figure pat00002
그리고, 이때 로그펜600밀리그람 의약품의 허가사항정보는 아래와 같이, 효능효과 파일, 용법용량파일, 사용상주의사항 파일로 3가지로 각각 구성되고, 각 한글문서의 식약처 서버내의 위치를 나타내는
ezdrug.kfda.go.kr/jsp/com/kfda2/commen/FileDownloa.jsp?doc_id=문서아이디(아래그림 좌측 하단 참고)가 각 효능효과, 용법용량, 사용상주의사항의 파일의 위치임을 알 수 있다.
Figure pat00003
[1] 각 품목기준코드별 허가사항 원문화일(효능효과 파일, 용법용량파일 , 사용상주의사항 파일)의 서버내 URL 을 얻기 위한 방법
- 품목기준코드별 의약품 허가정보 페이지로 이동방법
본 발명의 모든 코드는 변의상 VBA(Visual Basic For Application) Pseudo Code로 작성하였으나, 다양한 컴퓨터 언어로 변환가능함은 당연하다.
의약품은 식품의약품 안전처에서 품목기준코드라는 코드부여체계를 통해 허가사항 별로 관리하고 있는데, Ezdrug을 통해 해당 품목기준코드를 가진 약품으로 바로 접속가능한 URL은 다음과 같다.
"http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=" + 품목기준코드
아래는 위와 같은 작업이 가능하도록 VBA로 구성한 코드의 작업순서 예시이다.
제 1단계 : Webbrowser 객체를 선언한다. (dim ie as new internetexplorer)
제 2단계 : 선언된 객체를 이용하여, 상기 품목기준코드별 의약품 허가정보 페이지로이동한다. ( ie.navigate ‘http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq= + 품목기준코드’ )
제 3단계 : 충분한 웹사이트 이동시 응답대기시간을 확보해야하는데, 아래 표9 또는 표10과 같은 코드들이 예시로 사용될 수 있겠다.
do
if ie.readystate = 4 and ie.busy = false then exit do
doevents
loop
do
nw_timer = timer
if abs(nw_timer-st_timer)>=10 then goto re_navi:
if ie.readystate = 4 and ie.busy = false then exit do
doevents
loop
제4단계 : Explorere 객체안의 document.body.innerHTML 값내에 저장된 상기 의약품 품목기준코드별 페이지의 HTML을 확보
제 5단계:확보된 HTML에 대한 구문분석을 시행하여, 상기 허가사항 효능효과,용법용량,사용상주의사항 원본파일의 URL만 별도로 확보하여 품목기준코드별 URL정보를 저장한다.
Figure pat00004
위의 방식은 WebBrowser control을 이용하여, 직접 해당 웹페이지를 방문하여, 데이터를 가져오는 방식이었는데, 이 방식은, 속도가 느린편이기 때문에, 직접 윈도우즈의 URLDownloadToFile API를 이용하여, 해당 URL상의 페이지가 가지고 있는 HTML 을 직접 가져오는 방식을 추가로 고안하였다. 이 방식에 따르면 1단계~ 4단계는 한가지 단계로 간소화 된다.
1단계 : kfda_url = "http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=품목기준코드 선언
2단계 : URL상의 웹페이지의 HTML을 직접 로컬컴퓨터의 특정화일이름으로 저장한다.
Results = URLDownloadToFile(0,kfda_url, [저장될화일명], 0, 0)
상기처럼 허가정보 페이지 소스 자체를 개인PC에 받을 경우 다운로드 속도가 익스플로러를 이용한 웹서핑시보다 향상되고, Ezdrug사이트에서의 불필요한 ActiveX 다운로드 및 팝업창 처리를 하지 않아도 되기 때문에 속도향상이 가능하다. 본 연구에서 필요로 하는 것은 전체 홈페이지의 디자인된 페이지와 ActiveX 다운로드가 아니고, 단지 허가정보 페이지 소스내의 효능효과,용법용량,사용상주의사항 파일의 URL과 기타 제품정보들만 필요로 하기 때문에, 이러한 방법을 통해 핵심 정보만을 추출하기 때문에 검색시간을 매우 단축하였다.
Call URLdownloadtoFile (0,0,http://ezdrug.kfda.go.kr/kfda2?cmd=CCBAA02L2&itemSeq=200108429,C:\허가정보200108429.html?
상기 표11과 같이 개인PC로 다운로드 받은 HTML소스화일(C:\허가정보200104829.html)을 분석하면 아래와 표12와 같이 제품별로 구체적인 효능효과,용법용량,사용상주의를 가리키는 document의 고유 id인 doc_id값을 가지고 있는 URL을 찾을 수 있다.
<TD><B>효능효과</B></TD>
<TD align=middle>
<A href="../../jsp/com/kfda2/common/FileDownload.jsp?doc_id=121740646303500091">
<IMG border=0 align=absMiddle src="../../images/img/ico_download.gif" width=14 height=13>&nbsp;다운로드</A></TD>
<TD vAlign=center rowSpan=3 align=middle>
<A href="javascript:Open_File('121740646303500091,121740646303500094,121740646303500097');">
<IMG align=absMiddle src="../../images/img/ico_search_01.gif"></A> </TD></TR>
<TR class=table_td01_bg>
<TD><B>용법용량</B></TD>
<TD align=middle>
<A href="../../jsp/com/kfda2/common/FileDownload.jsp?doc_id=121740646303500094">
<IMG border=0 align=absMiddle src="../../images/img/ico_download.gif" width=14 height=13>&nbsp;다운로드</A></TD></TR>
<TR class=table_td01_bg>
<TD><B>사용상의주의사항</B></TD>
<TD align=middle>
<A href="../../jsp/com/kfda2/common/FileDownload.jsp?doc_id=121740646303500097">
<IMG border=0 align=absMiddle src="../../images/img/ico_download.gif" width=14 height=13>&nbsp;다운로드</A></TD></TR><!--drb_item 의 DOC_ID를 뿌린다. 2007.2.12 끝--></TBODY></TABLE></TD></TR></TBODY></TABLE><BR></TD></TR></TBODY></TABLE>
다만 상기 표에서와 같이 bold체로 표시된 URL은 상대주소 형태이기 대문에, 절대주소로 바꾸기 위해 "../.." 문자를 http://ezdrug.kfda.go.kr/kfda2로 교체하여생성한 URL을 추출하여 품목기준코드와 허가정보의 한글문서의 URL만을 모아서 별도의 테이블에 저장하였다.
3단계: 확보된 HTML에 대한 구문분석을 시행하여, 상기 허가사항 원본파일의 URL만 별도로 확보하여 품목기준코드별 URL정보를 저장한다.
Figure pat00005
4단계 : 모든 품목기준코드에 대하여, 1단계를 반복한다.
이렇게 1단계~4단계까지의 과정이 끝나면 아래표와 같은 품목기준코드별 의약품허가사항 원문파일의 URL이 효능효과, 용법용량, 사용상 주의별로 저장된 테이블이 생성된다.
Figure pat00006
상기와 같이 의약품 허가사항(효능효과, 용법용량,사용상주의사항에 대한 HWP문서화일이 저장된 서버내 URL 주소를 모두 확보하여 별도 테이블에 저장해둔다.
[2] 각 품목기준코드별 허가사항 원문화일(효능효과 파일, 용법용량파일 , 사용상주의사항 파일)의 서버내 URL 을 통해 자동적으로 다운로드
1) 두 번째 단계로, 실제로 아래 표 13과 같이 각 품목기준코드별로, 의약품 허가사항 원문화일이 저장된 서버상의 URL을 확보하였다면, 각 품목기준코드별로, 실제 URL주소에서 허가사항 원문화일을 효능효과, 용법용량, 사용상 주의사항 파일을 직접 다운로드 받는다. 아래 표14는 실제 VBA 코드 예시이다.
1단계 : 품목기준코드별 효능효과,용법용량,사용상주의사항의 한글화일 문서 URL을 이용하여, URLdownloadToFile API를 호출하여, 실제 로컬컴퓨터의 파일로 저장한다.
Results1 = URLDownloadToFile(0,[효능효과문서주소], [효능효과 원문화일명], 0, 0)
Results2 = URLDownloadToFile(0,[용법용량문서주소], [용법용량 원문화일명], 0, 0)
Results3 = URLDownloadToFile(0,[사용상주의문서주소], [사용상주의 원문화일명], 0, 0)

2단계 : 모든 품목기준코드에 대하여 상기 1단계를 반복한다. 로컬컴퓨터에 저장되는 원문화일명은 사용자지정의 중복이 되지 않도록 명칭을 자동화하여 지정할 수 있다.
Call URLdownloadtoFile
(0,0,"http://ezdrug.kfda.go.kr/kfda2/jsp/com/kfda2/common/FileDownload.jsp?doc_id=121740646303500097",”c:\사용사주의사항.hwp")
상기 코드는 위의 1단계의 코드를 실제로 구현한 사례이다.
Ezdrug상의 특정 의약품의 사용상주의사항이 c:\사용상주의사항.hwp 화일로 로딩되게 된다.
[2-1] 각 품목기준코드별로 다운로드받은 효능효과,용법용량,사용상 주의사항 파일에 대한 자동화된 편집 에디팅
1) 만약에 식약처등에서 받은 허가사항 정보화일에서 편집기술을 적용하거나, 사용자 지정의 editing을 자동화된 형태로 진행하고자 할 수 있다. 이와 같은 기술을 구현하기 위하여, HWP의 API를 이용하여, 정보의 typing, 편집디자인작업을 수행할 수 있으며, HWP가 아닌 PPT, WORD, EXCEL의 경우에서도 VBA를 이용하여, 사전에 자동화된 편집 에디팅 작업이 가능하다.
[3] 각 품목기준코드별로 다운로드받은 효능효과,용법용량,사용상 주의사항에 대한 TEXT형태 파일 변환
1) 만약에 식약처등의 웹사이트에서 직접 상기와 같은 방식으로 받아오지 않고, 각 품목기준코드별로 의약품 허가사항 원문화일을 직접 받아올 수 있다면, 상기 [1].[2] 과정은 필요치 않다. 특히 공공데이터 개방정책에 따라, 원문화일을 직접 공공데이터 포털등을 통하여 확보할 수 있는 경우라면 이에 해당한다. 이와같이 원문화일을 직접 확보할 수 있다고 한다면, 바로 [3] 스텝에서, 구문분석을 위하여 HWP화일형태를 HTML화일형태등 TEXT화일 형태로 변환하여야 한다. 아래 표15는 이와같은 단계를 요약한 내용이다.
1단계 : 글 컨트롤 사용선언
2단계 : 각 품목기준코드별로 허가사항 원문화일을 자동적으로 읽어들이면서, HWP(아래아한글) 컨트롤의 SAVEAS API를 이용하여, TEXT형태의 “구문분석이 가능한 형태의 파일로 변화시킨다.” 본 발명에서는 실시례로 HTML로 변환시키는 방법에 대하여 보이고자 한다. 물론 XML형태등 다양한 형태로 변환하여 구문분석이 가능하다.

HWP.saveas [허가사항원문화일명],[변환형식화일명],"HTML"

3단계 : 모든 품목기준코드별로 효능효과,용법용량,사용상주의사항 원문화일에 대하여 2과 같은 과정을 반복함.
아래예시는 위의 2단계를 실제로 구현한 VBA 예시코드이다.
Hwp.SaveAs “c:\사용상주의사항.hwp", "HTML"
만약에, 다운받거나 제공받은 허가사항 원문화일이 MS-WORD 또는 EXCEL화일일 경우에는, VBA를 이용하여, WORD 파일 또는 EXCEL화일을 HTML파일로 형식을 변경하여 저장할 수 있다. 아래 표16 및 표17는 VBA를 이용하여 글이 아닌 형태의 파일로 다운받았을 경우의 파일변환 방법이다.
Dim xlsapp as new Excel.application
xlsapp.Open [허가사항원문화일명]
xlsapp.SaveAs
Filename:=[형식변환파일명], _
FileFormat:=xlHtml, ReadOnlyRecommended:=False, CreateBackup:=False
docapp.Open [허가사항원문화일명]
docapp.SaveAs FileName:=[형식변환파일명], FileFormat:= _
wdFormatFilteredHTML, LockComments:=False, Password:="", AddToRecentFiles
:=True, WritePassword:="", ReadOnlyRecommended:=False, EmbedTrueTypeFonts _
:=False, SaveNativePictureFormat:=False, SaveFormsData:=False, _
SaveAsAOCELetter:=False
[4] 각 품목기준코드별로 TEXT형태(HTML, XML, .... )화일로 변환된 정보 분석
[4-0] HTML형태의 변환을 통한 허가사항 정보의 직접적인 웹서비스 기능
확보된 의약품허가정보 파일(한글 또는 워드)등 전자문서화된 파일을 HTML화일로 변환한 결과는 바로 웹페이지상에서 실제 한글과 거의 동일한 형태로 HTML이 변환되기 때문에, 일일이 식약처 홈페이지의 한글파일을 HTML을 수작업으로 변환하여 구축한 DB와 달리 즉시 매우 빠른 속도로 웹형태로 제공이 가능하다.
예를들어, 바라크르두정0.5mg의 사용상주의사항 원문화일은 글 로 10페이지에 달하고, 15,034 글자의 방대한 분량이다.
Figure pat00007
특히, 사용상주의사항 중에는, 다음과 같이 다수의 표가 있어서, 이와 같은 표를 웹상에서 서비스하기 위하여는 HTML로 일일이 수작업으로 바꾸어 주는등 매우 작업효율이 낮았는데, 이를 자동적으로 모두 HTML로 변환시켜 주기 때문에 매우 작업능률을 향상 시킬 수 있다. 또한 단순히 HTML로의 변환이 아니라, 각 허가사항 항목별로 분류로직에 따라 자동분류하면서, HTML로 변환하여 주기 때문에 매우 강력하다.
Figure pat00008
[4-1] 각 품목기준 코드별 허가사항 항목별 자동분류
1) 먼저 HTML 등 TEXT화일 형태로 변환된 의약품허가사항 정보중에서, 효능효과, 용법용량정보는 별도의 파일단위로 제공되기 때문에, 의약품허가항목별 분류로직은 사용상주의사항 파일에 적용할 수 있다. 의약품 사용상 주의사항은 총 14개 항목으로 구분이 되는데, 이때 분류 RULE DB에 따라 사용자가 원하는 형태의 다양한 추가항목으로 언제든지 구분할 수 있다. 참고로 의약품표시기재에 따른 의약품허가사항 16개 항목은 다음 표18과 같다.
1. 효능효과
2. 용법용량
3. 경고
4. 금기
5. 신중투여
6. 부작용
7. 일반적 주의
8. 상호작용
9. 임부에 대한 투여
10. 수유부에 대한 투여
11. 소아고령자에 대한 투여
12. 적용상 주의
13. 과량투여시의 처치
14. 임상검사치에의 영향
15. 보관 및 취급상 주의
16. 기타
허가사항 항목별 자동분류작업은 아래와 같다. 아래 실시례는 HTML화일로 변환되었을때의 기준을 의미한다.
1단계 : HTML화일을 분석을 용이하게 하기 위하여 분석에 불필요한 HTML 속성정보 등을 정리하여 필요한 HTML element 및 필요한 속성정보만을 걸러낸다.(HTML filtering)
2단계 :
: HTML 파일로부터, 각 항목명과 각 항목의 내용을 구분한다.
원본허가사항 파일이 1. 2. 3. 4. ... 과 같이 끝나는 경우가 대부분인데, 실제로는
아래와 같이 허가사항의 각 항목들의 형식의 예시이다.
1. 경고
2. 다음 환자에는 투여하지 말 것
3. 다음 환자에는 신중히 투여할 것
4. 이상반응
5. 일반적 주의
6. 상호작용
7. 임부 및 수유부에 대한 투여
8. 고령자에 대한 투여
9. 보관 및 취급상의 주의사항
이렇게 항목명은 HTML 로 변환되엇을 때, 아래와 같이 변환이 되는데,
1) <P>1. ~~~ </P> 와 같이 끝나는 경우가 항목명을 의미한다
이렇게 <P>숫자. ~~~ </P> 와 같은 형태를 가진 것을 항목명으로 간주하고 이 정보들을 가져온다. 이때 숫자는 1~20까지로 하였다.
단, 허가사항상 항목명 규칙은, <P>에 한정되지 않고, HTML구문을 분석한 허가사항 항목명 규칙DB를 구성하여, <HTML element>숫자. ~~~ </HTML element> 와 같은 형태로 규칙DB의 갱신이 물론 가능하다. 항목명은 이 숫자.~~~~ 이며, 이 것의 길이가 너무 길경우에도 항목이 아니므로, 이에 대한 조건을 규칙DB에 저장하여 둔다.
또한, 허가사항항목에 따라 (숫자) 형태, 숫자) 형태등 다양한 목차형태가 있을수 있으며, 이에 대해서도 규칙DB에 별도로 추출기준을 저장하여 두고 적용한다.
3단계 : 각 항목명아래의 항목의 실제 내용추출
2단계에서,
<P>(숫자). ~~~ </P> 가 어떤 항목명이고,
<P>(숫자+1). ~~~ </P> 이라면,
해당 항목의 항목내용은 상기 표의 위치에 해당할 것이다. 이 위치를 파서로 가져오고 항목의 내용으로 저장한다.
4단계: 각 항목별 관련 미리 지정된 카테고리로 자동분류
3단계에서, <P>(숫자). ~~~ </P> 가 어떤 항목명이고, 그 항목의 구체적인 내용은 ~~~ 에 포함되어 있다. 이 ~~~ 는 의약품허가사항별로 같은 항목에 해당될지라도 통일화되어 있지 않아서 여러 가지 통일되지 않은 용어들로 구성되어 있다.
따라서, 경험적으로 “특정한 키워드” 들의 존재여부를 통해 해당 항목으로 분류하도록 분류규칙DB를 구성하고, 분류규칙DB에 따라서, 항목명에 대하여 특정 분류로 자동적으로 분류하도록 할 수 있고, 분류규칙DB는 계속적으로 학습시켜서 update할 수있다.
분류규칙DB는 아래와 같은 예시로도 표현가능하다
(1)즉, 200606991 품목기준코드의 경우, 항목명이 “1. 이상반응” 이었는데, “이상” 이란 단어와 “반응”이란 다어가 두가지 모두 있을 경우엔 “부작용” 항목으로(BOXID=6) 분류하라는 분류RULE_DB의 규칙에 따라서, 분류가 되었다.
Figure pat00009
(2) 또한, 201308031 의 금기사항의 경우, 항목명은 “2. 다음 환자에는 투여하지 말 것” 이었고, “투여” 와 “하지” 와 “말것”이라는 단어가 들어가면 “금기”항목으로(BOXID=4)분류하는 RULE DB의 규칙에 따라서 분류가 되었다.
(3)역시 201308031 의 임부에 대한 투여의 경우에 항목명은 “8. 임부, 수유부 및 소아에 대한 투여” 였는데, “임부” 와 “수유부”란 단어가 모두 들어있는 경우 “임부에 대한 투여”로 분류하라는 RULE DB의 규칙에 따라 분류를 하였다.
(4) 또한 과량투여시의 처치의 경우에도, “10. 과량투여시의 처치”가 항목명이었는데,(“과량투여” 또는 “과량”) 이라는 단어와 (“처치” 또는 “대처법”) 이라는 단어가 모두 들어있는 경우에 과량투여시 처치로 분류하는 RULE DB에 따라 분류를 하였다.
이때 “미리 지정된 카테고리”는 허가사항상의 16개 항목에 국한하지 않고, 별도의 카테고리를 만들어서, 해당 키워드를 가진 경우에 RULE DB에 정의하면, 새로운 카테고리로 분류가 될 것이다.
RULE DB에는 “키워드” 규칙뿐만 아니라, 다양한 문맥, 조사, 조건식, 특정 단어들사이의 거리등이 실제 수많은 허가사항 정보를 분석하여 나온 기준에 따라 적용되어 항목명의 여러 가지 언어적 특성을 고려하여 가장 적합한 카테고리로 이동하도록 학습이 가능하도록 고안할 수 있다.
1)특정 키워드 들의 존재여부
2)NOT 조건, OR조건등 조건식의 채용
3)형태소 분석을 통한 의미분석
4)복합적인 조건의 부가등
RULE DB의 예시는 다음과 같이 보일 수 있다. 이 예시는 그야말로 예시이며, 계속적으로 분류를 위한 RULE DB는 계속적으로 업데이트가 될 것이다. 아래 표19는 Rule DB의 예시이다.
규칙명 단어 도출 순서 단어간거리 항목분류 비고
유해+반응 관계없음 해당없음 부작용
이약+사용+동안+행위+말것 관계없음 해당없음 금기
이약+사용+동안+사용+말것 관계없음 해당없음 금기
발암성+변이원성 관계없음 해당없음 기타
임부+수유부 관계없음 해당없음 임부에 대한투여, 수유부에 대한 투여
신중+투여 관계없음 해당없음 신중투여
신중+사용 관계없음 해당없음 신중투여
경우+중지+상의 관계없음 해당없음 신중투여
효능|효과 관계없음 해당없음 효능효과
용법|용량 관계없음 해당없음 용법용량
투여+마십 관계없음 해당없음 금기
금기 관계없음 해당없음 금기
투여+마세 관계없음 해당없음 금기
투여+하지+말것 관계없음 해당없음 금기
접종+하지+말것 관계없음 해당없음 금기
NOT(동안)+복용하지말것 관계없음 해당없음 금기
사용+주의+사항 관계없음 해당없음
수유부+(투여|주의|복용) 관계없음 해당없음 수유부에 대한 투여
소아+(사용|투여|복용) 관계없음 해당없음 소아에 대한 투여 기존 의약품표시기재의 항목정의를 더 세분화하여 신규분류
어린이+(투여|복용) 관계없음 해당없음 소아 대한 투여
신생아+(투여|복용) 관계없음 해당없음 소아 대한 투여
미숙아+(투여|복용) 관계없음 해당없음 소아 대한 투여
유아+(투여|복용) 관계없음 해당없음 소아 대한 투여
영유아+(투여|복용) 관계없음 해당없음 소아 대한 투여
보관+(주의|방법) 보관 및 취급상 주의
저장+(주의|방법) 보관 및 취급상 주의
취급+(주의|방법) 보관 및 취급상 주의
약리+작용 약리작용 기존 의약품표시기재에서 정의 않지 않은 신규분류 항목
복용시+주의 적용상 주의
투여+설명 적용상 주의
복용할때+주의 적용상 주의
적용상+주의 적용상 주의
(과량투여|과량)+(처치|대처법) 과량투여시 처치
(과랑|과량|복용)+(처치|대처법) 과량투여시 처치
운전+기계+영향 운전기계조작시 주의 기존 의약품표시기재에서 정의 않지 않은 신규분류 항목
기계+주의 운전기계조작시 주의
운전+주의 운전기계조작시 주의
일반적+주의 일반적주의
복용+동안+행위+말+것 일반적주의 분류방법에 따라 여러항목으로 분류가 가능한 정보
... ... ... ... ...
..... ..... ....
[4-2] 각 품목기준 코드별 허가사항 항목별 자동분류 결과내에서 소항목별 추가분류
아래와 같이 특정 품목기준코드에 따른 부작용 항목 내용이 다음 표20과 같다면,
항목내용중에서, 각 소항목별로 분리 추출하는 방법에 대한 절차이다.
1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
3) 피부 : 드물게 리엘증후군(중독성표피괴사증), 스티븐스-존슨증후군(피부점막안증후군), 박탈성 피부염이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다.
4) 혈액 : 드물게 재생불량성빈혈, 빈혈, 백혈구감소, 혈소판감소, 혈소판기능 저하(출혈시간의 지연) 등이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다. 중증의 포도당-6-인산염 탈수소효소(G6PD) 결핍 중증 환자에서 용혈 및 용혈성 빈혈이 보고되었다.
5) 소화기계 : 식욕부진, 가슴쓰림, 위통, 구역, 구토 등의 증상이 나타날 수 있고 장기투여시 위장관에 대한 이상반응 특히 위장출혈, 소화성궤양 및 뚫림(천공)이 나타날 수 있다.
6) 정신신경계 : 귀울림, 귀 먹음, 어지러움, 두통, 흥분 등의 증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 용량을 줄이거나 투여를 중지한다.
7) 간장 : 드물게 간장애가 나타날 수 있다. 매우 드물게 간 트랜스아미나제 상승에 따른 일시적인 간손상이 보고되었다.
8) 신장 : 신장애와 급성신부전이 보고되었다.
9) 기타 : 과호흡, 대사성 산증 등이 나타날 경우에는 혈중농도가 현저하게 상승될 수 있으므로 용량을 줄이거나 투여를 중지한다.

1단계 : HTML화일을 분석을 용이하게 하기 위하여 분석에 불필요한 HTML 속성정보 등을 정리하여 필요한 HTML element 및 필요한 속성정보만을 걸러낸다.(HTML filtering)
2단계 :
: HTML 파일로부터, 소항목별로 분리한다.
원본허가사항 파일이 1) 2) 3) 4) ... 과 같이 끝나는 경우가 대부분인데, 실제로는 아래 표21와 같다.
1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
3) 피부 : 드물게 리엘증후군(중독성표피괴사증), 스티븐스-존슨증후군(피부점막안증후군), 박탈성 피부염이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다.
4) 혈액 : 드물게 재생불량성빈혈, 빈혈, 백혈구감소, 혈소판감소, 혈소판기능 저하(출혈시간의 지연) 등이 나타날 수 있으므로 충분히 관찰하고 이상이 있을 경우에는 투여를 중지하고 적절한 조치를 한다. 중증의 포도당-6-인산염 탈수소효소(G6PD) 결핍 중증 환자에서 용혈 및 용혈성 빈혈이 보고되었다.
아래와 같이 허가사항의 각 항목들의 형식의 예시이다.
이렇게 소항목명은 HTML 로 변환되엇을 때, 아래와 같이 변환이 되는데,
1) <P>1) ~~~ </P> 와 같이 끝나는 경우가 항목명을 의미한다
이렇게 <P>숫자) ~~~ </P> 와 같은 형태를 가진 것을 항목명으로 간주하고 이 정보들을 가져온다. 이때 숫자는 1~20까지로 하였다.
단, 허가사항상 항목명 규칙은, <P>에 한정되지 않고, HTML구문을 분석한 허가사항 항목명 규칙DB를 구성하여, <HTML element>숫자. ~~~ </HTML element> 와 같은 형태로 규칙DB의 갱신이 물론 가능하다. 항목명은 이 숫자.~~~~ 이며, 이 것의 길이가 너무 길경우에도 항목이 아니므로, 이에 대한 조건을 규칙DB에 저장하여 둔다.
또한, 소항목에 따라 (숫자) 형태, 숫자) 형태등 다양한 목차형태가 있을수 있으며, 이에 대해서도 규칙DB에 별도로 추출기준을 저장하여 두고 적용한다.
3단계 : 각 소항목의 실제 내용추출
2단계에서,
<P>숫자) ~~~~~~~~~
<P>숫자+1) ~~~~~~~ 이라면,
“<P>숫자)” 다음부터 “<P>숫자+1)” 앞까지의 값이 소항목의 실제 내용이다.
4단계: 각 소항목별 키워드분석을 통하여 특정 정보를 찾아낸다.
3단계에서, 소항목의 실제적인 내용은 ~~~~~~ 에 포함되어 있다. 이 ~~~~~ 에 담겨있는 키워드 및 허가사항 항목분류결과를 조합하여 분류결과를 저장할 수 있다.
따라서, 경험적으로 “특정한 키워드” 들의 존재여부와 해당 허가사항항목의 분류결과를 조합하여, 보다 더 의미있는 결과를 분석할 수 있는데, 예를들어, “부작용” 항목에 “골격근계” 라는 키워드가 있다면 “골격근계 부작용” 이 있다는 내용일 수가 있고, 여기에 소항목의 내용중에 “때때로”라는 항목이 들어있다면 특정 약품/부작용빈도/부작용 내용을 DB화할 수 있다.
아래와 표 22와 같이 “부작용” 허가사항 분류결과에서, 소항목이 도출되었다면, “과민증” 이라는 키워드를 통해, “과민증”이 “부작용”이라는 것을 명확하게 알게되고, 상세한 부작용이 도출된다. 그리고, “투여를 중지”한다는 문구분석을 통해
2) 과민증 : 홍반, 가려움, 코막힘, 심장-호흡기 장애, 때때로 발진, 부종, 두드러기, 비염양 증상, 결막염 등의 과민증상이 나타날 수 있으므로 이러한 증상이 나타날 경우에는 투여를 중지한다.
A라는 약은 “부작용”으로서 “과민증” 이 발생하는데, “투여중지”라는 메시지를 도출해낼 수 있다.
1) 쇼크 : 쇼크 및 아나필락시양 증상(호흡곤란, 전신홍조, 혈관부종, 두드러기 등)이 나타나는 경우가 있으므로 충분히 관찰하여 이상이 확인될 경우에는 투여를 중지하고 적절한 처치를 할 것. 이 약은 천식발작을 유발할 수 있다.
또는 A라는 약은 상기 표23처럼 “부작용”으로서 “쇼크”가 발생하는데, “투여중지”라는 메시지를 도출할 수 있고, “호흡곤란” , “전신홍조”, “혈관부종”, "두드러기“, ”천식발작“ 이 쇼크의 구체적이 부작용 정보로서 확인이 되고 이를 코드화 할 수 있다.
따라서, 종합하면, 아래그림과 같이 품목기준코드별로 허가사항 분류항목으로 나눈뒤에, 각 허가사항 항목별로 소항목 단위에서, 세분화 할 수 있다.
Figure pat00010
상기 그림처럼, 3번째 줄을 보면, “201100216” 품목기준코드를 가진 약물은 “금기” 사항이 있는데, 키워드 분석을 통해 “임부” , “수유부” 인 경우에 금기라는 정형화된 정보를 추출해 낼수 있다. 그리고, 4번째 줄을 보면, “간 손상자”의 경우에도 금기라는 정형화된 정보를 추출해 낼 수 있다.
5단계 : 이러한 분석을 전체 품목기준코드에 따라 진행하면, “임부” 중에 “금기”인 약물을 전체적으로 자동화하여 분석도 가능하며, “간 손상자”가 “금기”인 약물도 식약처 허가사항 기준으로 자동화한 분석도 가능해진다.
아래는 이러한 예시로서 부작용에 대한 종합분석결과를 정리하였다.
먼저 이를 위해서 WHO-ART 코드표가 필요하다.
Figure pat00011
WHO-ART코드표에 따라, “부작용” 항목별로, 표준화된 부작용 용어로 정형화할수 있다.
Figure pat00012
허가사항 항목별 자동분류작업은 아래와 같다. 아래 실시례는 HTML화일로 변환되었을때의 기준을 의미한다.
5)처리된 파싱결과를 분석하여, 각 항목별로 약물정보를 연결하여, 부작용/금기/효능/신중투여/금기환자등 허가사항중 주요 정보요소와 관련하여, 부작용 분포에 대한 분석, 특정환자가 금기, 신중투여해야 할 의약품에 대한 분석등 다양한 2차적 분석이 가능해진다.
[5] 웹등에 자동적으로 writing하기 위한 방법
구체적인 알고리즘(실시례)
[1]네이버 블로그에 대규모로 의약품 허가사항 DB를 자동적으로 구축한 사례
네이버등 특정 사이트에 자동적으로 이렇게 구축된 의약품 정보를 저장할 수 있는데, 그러한 방법은 사이트 분석결과에 따라 각기 다르다. 그러나 기본적으로, 사이트에서, 목적정보를 넣을 HTML element 의 element ID, NAME 에 접근하여, 해당 element에 값을 자동적으로 입력한뒤, 목적정보를 서버로 전송하기 위한 HTML element 요소의 ID,NAME에 접근하여 해당 element에 필요한 event를 일으켜줌으로써 웹페이지로의 자동적인 입력과 전송이 가능해진다.
예를들어, 아래 표24와 같이 HTML element 의 선언부와 HTML element collection 선언부를 구성하고,
Dim button As HTMLButtonElement
Dim anchor As HTMLAnchorElement
Dim frame As HTMLFrameElement
Dim frame2 As HTMLFrameElement
Dim buttons As IHTMLElementCollection
Dim anchors As IHTMLElementCollection
Dim frames As IHTMLElementCollection
Dim frames2 As IHTMLElementCollection
Dim iedoc As HTMLDocument
Dim iedoc2 As HTMLDocument
Dim ta As HTMLTextAreaElement
Dim tas As IHTMLElementCollection
이후 특정 목적 element tag의 이름과 해당 tag의 ID ,Classname, Name등 속성정보를 기초로 해당되는 조건의 element에 대하여 Click event등 정보입력에 필요한 event를 자동적으로 일으킬 수가 있다. 아래는 A element 들, BUTTON element들, TEXTAREA element들에 대하여 target이 되는 element들을 찾고 이에 대해 필요한 값 입력, event를 일으키는 방법의 실시례를 각각 아패 표25에서 보여준다.
Set anchors = ie.Document.getElementsByTagName("A")
For Each anchor In anchors
If anchor.className = "col _checkBlock _rosRestrict" Then
anchor.Click
Do
If ie.Busy = False And ie.ReadyState = 4 Then Exit Do
DoEvents
Loop
Exit For
End If
Next
Set buttons = ie.Document.getElementsByTagName("BUTTON")
For Each button In buttons
If button.className = "se2_to_html" Then
button.Click: Exit For
End If
Next
Set tas = ie.Document.getElementsByTagName("TEXTAREA")
For Each ta In tas
If ta.className = "se2_input_syntax se2_input_htmlsrc" Then
ta.innerHTML = "테스트2"
End If
ta.innerText = tt
Exit For
End If
Next
[6] 부작용 정보 분석방법
의약품 허가사항 정보에서 어떤 부작용이 존재하는지를 자동화된 방식으로 대량으로 확인해볼 수 있는 방법은, WHO-ART 092 버전의 한글화된 부작용명이 허가사항 정보에 있는지를 확인하는 방법이 있고, 이 한글화된 부작용명을 기준으로 보다 정교한 부작용명에 대한 RULE을 담을 수 있는 RULE DB를 이용하여 의약품 각 품목당 부작용정보를 집계할 수 있다.
일 실시례로서, 의약품의 품목기준코드(198800495) 를 가진 (주)마더스 제약의 “로그펜정” 에 대하여 허가사항 정보 분석을 통하여, 부작용 정보만 별도로 분류한뒤, 부작용에 대한 키워드 분석을 통해 의약품 부작용 발생현황을 TABLE로 생성할 수 있다. 이렇게 집계된 의약품 부작용 발생현황 테이블로부터, 의약품 품목기준코드를 기반으로 - 의약품 주성분코드 - 의약품ATC코드 매핑테이블을 구성할 수 있다.
궁극적으로는 의약품 ATC 코드별 - 의약품 부작용 내역 TABLE이 생성가능하다.
이렇게 하여, 관심 의약품 또는 의약품 계열별로 해당 부작용별 또는 부작용의 분류정보별로 아래 표26과 같이 ROR/PRR/IC값등의 약물역학 지표를 이용하여, 부작용의 유의성을 확인할 수 있다.
관심약물(D) 관심약물외의 약물(not D)
관심부작용(ATC 코드(A)) a b
관심부작용외의 부작용(특정 ATC코드 이외의 부작용(not A)) c d
PRR 및 ROR값을 계산하기 위하여는 아래의 산식을 이용하다.
이때 a,b,c,d 는 해당 약물의 갯수이다.
PRR = (a / (a+b)) / (c / (c+d))
ROR = (a/b) / (c/d)
이러한 부작용 분석을 위한 실시례로서,
의약품중에서, 스티븐스 존슨 증후군 부작용이 존재하는 약물과 그렇지 않은 약물을 구분하여 분석이 가능하였다. 아래와 같이, ATC 코드 분류별로, 스티븐스 존스 증후군이 주로 발현되었던 약물계열정보를 아래와 같이 확인할 수 있었다. 이 데이
터는 ATC코드별 약물계열별로 부작용 항목에 스티븐슨 존스증후군이 나타난 약품의 갯수를 계산함으로써 얻어질 수 있었다.
Figure pat00013
그리고, 최초에 ezdrug 의약품정보사이트내에 파일형화일형 존재하여 매우 활용성이 떨어졌던 허가정보를 VBA를 이용하여 자동으로 다운로드받고, 형변환한뒤, 원하는 형태로 분류하고 가공하여 SPL 구조화 가능하도록 하였고, DB화할수 있는 형태로 만들 수 있었다. 여기에서 의약품 허가정보를 파싱(parsing) 하여 추가적인 정보를 획득할 수 있었는데, 예를들면 의약품 부작용 분석을 위한 부작용 keyword추출 또는 효능 keyword 추출, 상병명 keyword추출등을 진행하였다. 방법은 의약품허가정보에서 의약품용어사전 또는 상병명사전을 참조하여 해당 분류결과내에 용어가 존재할 경우, 분류카테고리와 용어간의 통계를 낼 수 있다.
그리고, 분류된 상병명 분석결과를 기초로 어떠한 의약품이 어떠한 상병명이 허가되었는지에 대한 통계도 구축이 가능하다.

Claims (2)

  1. 의약품 허가사항 정보를 자동적으로 다운로드 받아서, 처리가능한 텍스트 내지 정형화된 구조로 바꾸기 위한 방법으로서,
    아래아 한글등 비정형화된 파일형태로 구성된 의약품 허가사항 정보를 자동으로 다운로드 받는 단계 및 다운받은 허가사항정보 파일을 텍스트 분석이 가능하도록 처리가능한 형태로 바꾸는 단계 및 텍스트 형태로 변형된 허가사항 화일을 자동적으로 그 내용별로 분류하여 지정한 카테고리로 분류하는 단계 및 지정한 카테고리내에서 세부항목 및 세부키워드로 분석하는 단계를 포함한다.
  2. 제 1항의 세부카테고리 분석결과를 자동적으로 웹사이트에 저장하는 방법으로서,웹사이트의 특정 정보입력 엘리멘트(element)에 접근하는 단계 및 접근한 엘리먼트에 값을 입력하는 단계 또는 접근한 엘리멘트에 특정한 이벤트를 발생시키는 단계를 포함하되, 엘리멘트의 접근 및 이벤트 발생은 사용자가 미리 지정하여 둔 시나리오에 따라 처리하도록 제어된다.
KR1020160110972A 2016-08-30 2016-08-30 모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법 KR20180024554A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160110972A KR20180024554A (ko) 2016-08-30 2016-08-30 모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160110972A KR20180024554A (ko) 2016-08-30 2016-08-30 모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR20180024554A true KR20180024554A (ko) 2018-03-08

Family

ID=61726539

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160110972A KR20180024554A (ko) 2016-08-30 2016-08-30 모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR20180024554A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063015A (zh) * 2018-07-11 2018-12-21 北京奇艺世纪科技有限公司 热点内容的提取方法、装置及设备
KR20200083806A (ko) 2018-12-28 2020-07-09 충북대학교병원 성분명 기반 알레르기 위험도 평가 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063015A (zh) * 2018-07-11 2018-12-21 北京奇艺世纪科技有限公司 热点内容的提取方法、装置及设备
CN109063015B (zh) * 2018-07-11 2021-01-22 北京奇艺世纪科技有限公司 热点内容的提取方法、装置及设备
KR20200083806A (ko) 2018-12-28 2020-07-09 충북대학교병원 성분명 기반 알레르기 위험도 평가 방법

Similar Documents

Publication Publication Date Title
Sharma et al. A study of potential drug-drug interactions among hospitalized cardiac patients in a teaching hospital in Western Nepal
Barnsteiner Medication Reconciliation: Transfer of medication information across settings—keeping it free from error.
Stock et al. Medicines in pregnancy
Epstein et al. Automated identification of drug and food allergies entered using non-standard terminology
Manrique-Rodríguez et al. Development of a compatibility chart for intravenous Y-site drug administration in a pediatric intensive care unit
Berrier Medication errors in outpatient pediatrics
KR20180024554A (ko) 모바일 건강관리 서비스를 위한 의약품 약품설명 정보 분석 장치 및 그 방법
Hendrick et al. Paroxetine use during breast-feeding
Costello et al. Capturing the use of dietary supplements in electronic medical records: room for improvement
KR20160079591A (ko) 전자문서형태의 비정형화된 의약품 정보 항목별 자동분류 및 의약품 허가사항 정보 분석을 통한 자동 복약안내문 및 복약픽토그램 생성 장치 및 그 방법
KR20160127308A (ko) 전자문서형태의 비정형화된 의약품 정보 항목별 자동분류 및 의약품 허가사항 정보 분석을 통한 자동 복약안내문 및 복약픽토그램 생성 장치 및 자동화된 환자별 맞춤 복용약물 제시 시스템 및 그 방법
Zhu et al. Disambiguation of PharmGKB drug–disease relations with NDF-RT and SPL
LUPȘE et al. Extracting and structuring drug information to improve e-prescription and streamline medical treatment
Brun et al. Beyond-use dates assignment for pharmaceutical preparations: example of low-dose amiodarone capsules
KR20160008074A (ko) 전자문서형태의 비정형화된 의약품 정보 항목별 자동분류 및 의약품 허가사항 정보 분석을 위한 장치 및 그 방법
Erebara et al. Treating the common cold during pregnancy
Finkelstein et al. Automated summarization of publications associated with adverse drug reactions from PubMed
DeLisle et al. Gabapentin use during pregnancy and lactation with and without concurrent opioid exposure: considerations and future directions
Taher et al. Pharmacovigilance for pediatric outpatient prescriptions in tripoli children hospital
Tolle et al. Delivering pediatric HIV care in resource-limited settings: cost considerations in an expanded response
De la Torre-Díez et al. Comparison of response times of a mobile-web EHRs system using PHP and JSP languages
Uguz Gastrointestinal side effects in the baby of a breastfeeding woman treated with low-dose fluvoxamine
Ozturk et al. Pregnancy outcomes after suicide attempts by self-poisoning and drug overdose: experience of a clinical pharmacology consultation service in Izmir, Turkey
Abedtash et al. An interactive user interface for drug labeling to improve readability and decision-making
Wise et al. Periconceptional use of phthalate-containing medications and secondary sex ratio