KR102524828B1 - 빅데이터 기반의 탐정기관 중개 시스템 - Google Patents
빅데이터 기반의 탐정기관 중개 시스템 Download PDFInfo
- Publication number
- KR102524828B1 KR102524828B1 KR1020230014174A KR20230014174A KR102524828B1 KR 102524828 B1 KR102524828 B1 KR 102524828B1 KR 1020230014174 A KR1020230014174 A KR 1020230014174A KR 20230014174 A KR20230014174 A KR 20230014174A KR 102524828 B1 KR102524828 B1 KR 102524828B1
- Authority
- KR
- South Korea
- Prior art keywords
- text data
- agency
- private investigation
- score
- extracted
- Prior art date
Links
- 238000011835 investigation Methods 0.000 claims abstract description 72
- 239000013598 vector Substances 0.000 claims description 23
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 11
- 238000013480 data collection Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0613—Third-party assisted
- G06Q30/0619—Neutral agent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/30—Transportation; Communications
Abstract
본 발명은 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간조사기관 중개 서비스를 제공할 수 있는 빅데이터 기반의 탐정기관 중개 시스템에 관한 것이다.
Description
본 발명은 빅데이터 기반의 탐정기관 중개 시스템에 관한 것으로, 더욱 상세하게는 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간조사기관 중개 서비스를 제공할 수 있는 빅데이터 기반의 탐정기관 중개 시스템에 관한 것이다.
민간조사 기관이란, 현 사회가 고도로 발전하여 정보화 시대로 변화함에 따라 일상에서 생각지도 못한 사건, 사고가 발생하고, 특히 범죄의 경우 다양화, 지능화 및 광폭화되는 현실에서 일상생활 중 일어나는 각종 민, 형사상 사건, 사고에 대하여 공권력이 미치지 못하는 부분을 현행 법률이 허용하는 범위에서 개인 또는 기업 등에 대한 정보, 자료수집, 사실확인 등을 민간인이 조사업무를 수행하도록 하는 조사 기관을 의미한다.
이와 관련된 선행기술문헌으로서, 공개특허 제10-2017-0138909호는 인터페이스를 통해 민간 조사에 관한 의뢰 정보를 입력하는 단계, 민간 조사에 대한 의뢰 방식을 선택하는 단계, 의뢰 정보 및 의뢰 방식을 포함한 민간조사 의뢰 요청을 중개 서버로 전송하는 단계, 민간 조사 의뢰 요청에 입찰한 적어도 하나의 조사 업체의 입찰정보를 표시하는 단계 및, 적어도 하나의 조사 업체 중 어느 하나의 조사 업체를 선택하는 단계를 포함하고, 의뢰 방식으로 고객 단말이 선택된 조사 업체에 민간 조사를 의뢰하는 직접 의뢰 방식 및 고객 단말이 민간 조사의 의뢰를 중개 업체에 위임하고, 중개 업체가 상기 선택된 조사 업체에 민간 조사를 의뢰하는 의뢰 대행 방식을 제공하는 내용을 개시하고 있다.
전술한 선행기술문헌에 따르면, 민간 조사를 의뢰하는데 최적화된 인터페이스를 제공하고, 의뢰 사건에 대한 비용을 민간 조사 업체에 입찰함으로써 각 사건에 대한 업체 별 비용 정보를 고객 단말에 제공해주는 민간 조사중개 서비스를 제공할 수 있는 효과를 기대할 수 있다.
그러나, 전술한 선행기술문헌은, 고객의 신상정보 노출 및 의뢰내용의 유출을 방지하기 위해 고객의 전화번호를 임의의 타 번호로 변경하는 '안심번호'를 제공하는 정도의 수단을 제시하고 있을 뿐, 사건을 의뢰한 의뢰자의 신상정보부터 구체적 의뢰내용까지 모든 정보에 대한 별도의 유출방지 수단을 제시하지는 못한다는 한계가 있다.
또한, 민간 조사 기관들은 다양한 기관들이 난립하고 있으며, 기관별로 주력분야(예를 들면, 이혼, 사람찾기, 채권회수 등)가 있으나, 의뢰인들은 자신이 필요한 분야의 전문가를 확인하기가 쉽지 않은 문제점이 있다.
또한, 조사 분야는 그 결과를 이용하여 소송이나 사고 처리에 활용될 여지가 많다. 그러나 종래에는, 예를 들면, 이혼 목적의 조사 의뢰를 세무 또는 보험 사고 관련 조사 분야의 경력자가 진행할 경우에 관련 이혼 관련 법령에 대한 전문 지식이 부족하여 향후 이혼 소송과정에 제시된 증거가 위법한 행위로 간주되어 관련 조사가 유명무실해지는 문제점이 있었다.
즉, 종래에는 의뢰인들이 다수의 민간 조사 기관들의 전문 분야나, 인력 현황 및 기존의 실적에 대하여 객관적인 평가 결과를 알 수 없었기에 실제 소송 과정에서 사용할 수 없는 부실한 결과를 얻을 수 밖에 없었다.
또한, 최근에는 조사 의뢰, 협의 및 메세지의 송 수신 가능한 민간 조사 기관용 모바일 앱이 제시되었다. 하지만, 모바일 앱은, 예를 들면, 의뢰인의 모바일 단말에 상시 앱이 출력되어 있어 제3자가 이를 확인하여 의뢰인의 모바일 앱을 통하여 정보를 취득할 수 있는 문제점이 있었다.
즉, 종래의 모바일 앱을 이용한 민간 조사 기관 중개 시스템들은 의뢰인 주변의 지인 및/또는 제3자가 의뢰인의 모바일 단말을 통하여 해당 모바일 앱을 확인할 수 있어 정보 유출이나 조사 대상에게 의뢰인의 정보 의뢰 사실에 대한 합리적 의심을 가능하게 하였고, 해킹이나 모바일 단말의 분실시에 쉽게 의뢰인의 개인정보 및 조사 정보 또는 조사 의뢰 여부 등이 유출될 수 있었다.
한편, 전술한 배경 기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
본 발명의 일측면은 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간 조사기관 중개 서비스를 제공할 수 있는 빅데이터 기반의 탐정기관 중개 시스템을 제공한다.
본 발명의 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따른 빅데이터 기반의 탐정기관 중개 시스템은, 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간조사기관 중개 서비스를 제공하는 관리서버를 포함한다.
상기 관리서버는,
온라인 상에서 민간조사기관에 대해 작성된 텍스트 데이터를 수집하는 데이터 수집부;
민간조사기관에 대해 작성된 텍스트 데이터에 기초하여 민간조사기관별로 평판점수를 산출하는 검증부; 및
상기 검증부에 의해 산출된 평판점수에 기초하여 민간조사기관의 서비스를 제공받고자 하는 사용자 단말을 특정 민간조사기관에 매칭시키는 매칭부를 포함한다.
상기 검증부는,
각각의 텍스트 데이터로부터 키워드를 추출하고, 추출된 키워드를 미리 학습된 키워드 사전과 비교한 결과에 따라 복수의 텍스트 데이터를 평가 항목별로 분류하고,
동일 항목으로 분류된 텍스트 데이터로부터 추출된 키워드간 연속성 점수를 산출하여, 연속성 점수가 미리 설정된 기준 점수보다 높은 텍스트 데이터를 대표 텍스트 데이터로 추출하고,
추출된 대표 텍스트 데이터별로 개별 평가 점수를 산출하여, 산출된 복수의 개별 평가 점수에 대한 평균값을 평판점수로 산출하되,
상기 연속성 점수는 하기 수학식 1에 따라 산출되고, 상기 개별 평가 점수는 하기 수학식 2에 따라 산출된다.
[수학식 1]
여기서, Cn은 n번째 텍스트 데이터의 연속성 점수, Vcn은 n번째 텍스트 데이터로부터 추출된 키워드의 임베딩 벡터, Vcf는 n번째 텍스트 데이터로부터 추출된 키워드의 직전 단어에 대한 임베딩 벡터, Vcb는 n번째 텍스트 데이터로부터 추출된 키워드의 직후 단어에 대한 임베딩 벡터이다.
[수학식 2]
여기서, ri는 i번째 대표 텍스트 데이터의 개별 평가 점수, Vj는 i번째 대표 텍스트 데이터의 j번째 단어에 대한 임베딩 벡터, Vzj는 i번째 대표 텍스트 데이터에서 j번째 단어를 제외한 나머지 단어들 대한 임베딩 벡터의 평균값, aj는 i번째 대표 텍스트 데이터의 j번째 단어에 대한 가중치값이다.
상술한 본 발명의 일측면에 따르면, 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간조사기관 중개 서비스를 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 기반의 탐정기관 중개 시스템의 개략적인 구성이 도시된 도면이다.
도 2는 도 1에 도시된 관리서버의 구체적인 구성이 도시된 도면이다.
도 2는 도 1에 도시된 관리서버의 구체적인 구성이 도시된 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 태양광 발전 설비 데이터 표준화 시스템의 개략적인 구성요소들이 도시된 도면이다.
본 발명의 일 실시예에 따른 빅데이터 기반의 탐정기관 중개 시스템은, 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간조사기관 중개 서비스를 제공하는 것을 목적으로 한다.
이를 위해, 본 발명의 일 실시예에 따른 빅데이터 기반의 탐정기관 중개 시스템은, 사용자 단말(1), 민간조사기관 단말(2) 및 관리서버(3)를 포함한다.
사용자 단말(1)은 민간조사기관의 서비스를 이용하고자 하는 사용자가 소지한 단말기로, 외부기기와 유무선 통신이 가능하며 정보의 입출력 및 처리가 가능한 스마트폰, PC, 웨어러블 디바이스 등과 같은 전자장치의 형태일 수 있다.
민간조사기관 단말(2)은 사용자에게
도 2는 이러한 관리서버의 구체적인 구성이 도시된 도면이다.
도시된 바와 같이, 관리서버(2)는 온라인 상에서 민간조사기관에 대해 작성된 텍스트 데이터를 수집하는 데이터 수집부(100), 민간조사기관에 대해 작성된 텍스트 데이터에 기초하여 민간조사기관별로 평판점수를 산출하는 검증부(200) 및 상기 검증부에 의해 산출된 평판점수에 기초하여 민간조사기관의 서비스를 제공받고자 하는 사용자 단말을 특정 민간조사기관에 매칭시키는 매칭부(300)를 포함한다.
텍스트 데이터 수집부(100)는 민간조사기관의 이용 과정에서 작성된 텍스트 데이터를 수집한다.
예컨대 특정 민간조사기관을 이용한 사용자들이 작성한 리뷰 데이터가 텍스트 데이터에 포함될 수 있다. 하지만, 텍스트 데이터의 종류는 이에 한정되는 것은 아니며, 민간조사기관에 대한 뉴스 기사, 설문 데이터 등과 같이 다양한 형태의 텍스트 데이터를 더 포함할 수 있다.
텍스트 데이터 수집부(100)는 다양한 방법으로 텍스트 데이터를 수집할 수 있다. 예컨대, 텍스트 데이터 수집부(100)는 유무선 통신을 통해 외부 서버로부터 텍스트 데이터를 스크래핑 할 수 있다. 또는, 텍스트 데이터 수집부(100)는 사용자 단말로부터 텍스트 데이터를 직접 수신할 수도 있다.
검증부(200)는 각각의 텍스트 데이터로부터 키워드를 추출하고, 추출된 키워드를 미리 학습된 키워드 사전과 비교한 결과에 따라 복수의 텍스트 데이터를 평가 항목별로 분류한다.
검증부(200)는 동일 항목으로 분류된 텍스트 데이터로부터 추출된 키워드간 연속성 점수를 산출하여, 연속성 점수가 미리 설정된 기준 점수보다 높은 텍스트 데이터를 대표 텍스트 데이터로 추출한다.
이때, 연속성 점수는 하기 수학식 1에 따라 산출된다.
[수학식 1]
여기서, Cn은 n번째 텍스트 데이터의 연속성 점수, Vcn은 n번째 텍스트 데이터로부터 추출된 키워드의 임베딩 벡터, Vcf는 n번째 텍스트 데이터로부터 추출된 키워드의 직전 단어에 대한 임베딩 벡터, Vcb는 n번째 텍스트 데이터로부터 추출된 키워드의 직후 단어에 대한 임베딩 벡터이다.
예를 들어, n번째 텍스트 데이터가 A, B, C, D, E라는 단어들로 구성된 리뷰 데이터이고, 이 중 C라는 단어가 키워드로 추출되는 경우, Vcn은 단어 C에 대한 임베딩 벡터, Vcf는 단어 B에 대한 임베딩 벡터, Vcb는 단어 D에 대한 임베딩 벡터로 결정될 수 있다.
한편, 검증부(200)는 BERT(Bidirectional Encoder Representations from Transformers) 모델을 이용하여 각각의 단어에 대한 임베딩 벡터를 생성한다.
BERT 모델은 문맥을 이해하는 자연어 처리 모델로, 다양한 작업에 의해 학습된 사전 훈련된(Pre-trained) 언어 모델 중 가장 좋은 성능을 발휘하는 모델이다. BERT 모델은 특별 분류 토큰(CLS)을 이용하며, 특별 분류 토큰(CLS)이란, 문장 또는 어절 단위의 내제된 정보를 이용하여 분류 작업에 사용할 때, 문장 또는 어절의 내제된 정보를 담고 있을 수 있도록 학습된 BERT 고유의 토큰이다. 특별 분류 토큰(CLS)을 이용하는 방식은 다음과 같다. 핵심 문장을 추출하고 싶은 자연어 데이터를 문장 어절 단위로 나눈 뒤, 각 문장(어절)에 특별 분류 토큰(CLS)을 문장 앞에 추가한다. 특별 분류 토큰(CLS)은 '[CLS]'라는 단어를 문장 시작 부분에 추가하면 되기 때문에 다른 추가 제약조건 없이, 어떤 형태의 문장에도 추가가 가능하다. 이후, 모델에 의해 수치화된 특별 분류 토큰(CLS)의 벡터는 각 문장 사이의 유사도를 계산할 때 이용된다. 즉, 해당 특별 분류 토큰(CLS)은 BERT에서 문장 단위로 분류 작업을 실행할 때, 문장의 표현 벡터로 사용되는 토큰이며 특별 분류 토큰(CLS)의 표현 벡터를 문장 토큰의 임베딩 벡터(Embedding Vector)로 사용한다.
이후, 검증부(200)는 추출된 대표 텍스트 데이터별로 개별 평가 점수를 산출하여, 산출된 복수의 개별 평가 점수에 대한 평균값을 평판점수로 산출한다.
이때, 상기 개별 평가 점수는 하기 수학식 2에 따라 산출된다.
[수학식 2]
여기서, ri는 i번째 대표 텍스트 데이터의 개별 평가 점수, Vj는 i번째 대표 텍스트 데이터의 j번째 단어에 대한 임베딩 벡터, Vzj는 i번째 대표 텍스트 데이터에서 j번째 단어를 제외한 나머지 단어들 대한 임베딩 벡터의 평균값, aj는 i번째 대표 텍스트 데이터의 j번째 단어에 대한 가중치값이다.
즉, Vzj는 아래의 수학식을 통해 구할 수 있다.
[수학식 3]
여기서, Vzj는 i번째 대표 텍스트 데이터에서 j번째 단어를 제외한 나머지 단어들에 대한 임베딩 벡터의 평균값으로, j번째 단어를 제외한 나머지 단어들 각각에 대한 임베딩 벡터를 합산한 후, i번째 대표 텍스트 데이터를 구성하는 단어의 수(k)-1을 나눈 값으로 설정될 수 있다.
매칭부(300)는 산출된 상기 평판점수에 기초하여 민간조사기관의 서비스를 제공받고자 하는 사용자 단말을 특정 민간조사기관에 매칭시킨다.
매칭부(300)는 하기 수학식 4를 이용하여 민간조사기관별로 매칭 적합도를 산출한다.
[수학식 4]
여기서, mpk는 k번째 민간조사기관과 사용자 단말 간의 매칭 적합도, ark는 k번째 민간조사기관의 평판점수, Ps는 k번째 민간조사기관의 평균 의뢰비용, Ph는 사용자 단말로부터 수신된 희망 의뢰비용, ri는 k번째 민간조사기관에 대해 추출된 m개의 대표 텍스트 중 임의로 선택된 특정 대표 텍스트에 대한 개별 평가 점수이다.
이와 같이, 본 발명에 따른 빅데이터 기반의 탐정기관 중개 시스템은 민간조사기관별로 수집된 텍스트 데이터(리뷰 데이터)를 빅데이터 분석을 통해 분석함으로써 민간조사기관에 대한 평판점수 및 매칭 결과의 신뢰성을 향상시킬 수 있다.
이와 같은, 본 발명에 따른 기술은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 공간으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
1: 사용자 단말
2: 민간조사기관 단말
3: 관리서버
2: 민간조사기관 단말
3: 관리서버
Claims (3)
- 자체 커뮤니티와 빅데이터를 활용하여 민간조사기관의 평판을 자동으로 검증하고, 이에 기초하여 고객 맞춤형 민간조사기관 중개 서비스를 제공하는 관리서버를 포함하는, 빅데이터 기반의 탐정기관 중개 시스템에 있어서,
상기 관리서버는,
온라인 상에서 민간조사기관에 대해 작성된 텍스트 데이터를 수집하는 데이터 수집부;
민간조사기관에 대해 작성된 텍스트 데이터에 기초하여 민간조사기관별로 평판점수를 산출하는 검증부; 및
상기 검증부에 의해 산출된 평판점수에 기초하여 민간조사기관의 서비스를 제공받고자 하는 사용자 단말을 특정 민간조사기관에 매칭시키는 매칭부를 포함하고,
상기 검증부는,
각각의 텍스트 데이터로부터 키워드를 추출하고, 추출된 키워드를 미리 학습된 키워드 사전과 비교한 결과에 따라 복수의 텍스트 데이터를 평가 항목별로 분류하고,
동일 항목으로 분류된 텍스트 데이터로부터 추출된 키워드간 연속성 점수를 산출하여, 연속성 점수가 미리 설정된 기준 점수보다 높은 텍스트 데이터를 대표 텍스트 데이터로 추출하고,
추출된 대표 텍스트 데이터별로 개별 평가 점수를 산출하여, 산출된 복수의 개별 평가 점수에 대한 평균값을 평판점수로 산출하되,
상기 연속성 점수는 하기 수학식 1에 따라 산출되고, 상기 개별 평가 점수는 하기 수학식 2에 따라 산출되며,
상기 매칭부는,
하기 수학식 4에 따라 민간조사기관별로 매칭 적합도를 산출하는, 빅데이터 기반의 탐정기관 중개 시스템.
[수학식 1]
여기서, Cn은 n번째 텍스트 데이터의 연속성 점수, Vcn은 n번째 텍스트 데이터로부터 추출된 키워드의 임베딩 벡터, Vcf는 n번째 텍스트 데이터로부터 추출된 키워드의 직전 단어에 대한 임베딩 벡터, Vcb는 n번째 텍스트 데이터로부터 추출된 키워드의 직후 단어에 대한 임베딩 벡터이다.
[수학식 2]
여기서, ri는 i번째 대표 텍스트 데이터의 개별 평가 점수, Vj는 i번째 대표 텍스트 데이터의 j번째 단어에 대한 임베딩 벡터, Vzj는 하기 수학식 3에 의해 산출되는 i번째 대표 텍스트 데이터에서 j번째 단어를 제외한 나머지 단어들 대한 임베딩 벡터의 평균값, aj는 i번째 대표 텍스트 데이터의 j번째 단어에 대한 가중치값이다.
[수학식 3]
[수학식 4]
여기서, mpk는 k번째 민간조사기관과 사용자 단말 간의 매칭 적합도, ark는 k번째 민간조사기관의 평판점수, Ps는 k번째 민간조사기관의 평균 의뢰비용, Ph는 사용자 단말로부터 수신된 희망 의뢰비용, ri는 k번째 민간조사기관에 대해 추출된 m개의 대표 텍스트 중 임의로 선택된 특정 대표 텍스트에 대한 개별 평가 점수이다.
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230014174A KR102524828B1 (ko) | 2023-02-02 | 2023-02-02 | 빅데이터 기반의 탐정기관 중개 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230014174A KR102524828B1 (ko) | 2023-02-02 | 2023-02-02 | 빅데이터 기반의 탐정기관 중개 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102524828B1 true KR102524828B1 (ko) | 2023-04-24 |
Family
ID=86141787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230014174A KR102524828B1 (ko) | 2023-02-02 | 2023-02-02 | 빅데이터 기반의 탐정기관 중개 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102524828B1 (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170138909A (ko) * | 2016-06-08 | 2017-12-18 | 한정현 | 민간 조사 중개 서비스를 제공하는 방법 및 컴퓨터 프로그램 |
KR20180074323A (ko) * | 2016-12-23 | 2018-07-03 | 주식회사 케이아이씨티 | 화장품 고객 트렌드 분석 시스템 및 방법 |
KR102329456B1 (ko) | 2021-01-21 | 2021-11-22 | 이동엽 | 모바일 앱 기반의 민간 조사 기관 중개시스템 |
-
2023
- 2023-02-02 KR KR1020230014174A patent/KR102524828B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170138909A (ko) * | 2016-06-08 | 2017-12-18 | 한정현 | 민간 조사 중개 서비스를 제공하는 방법 및 컴퓨터 프로그램 |
KR20180074323A (ko) * | 2016-12-23 | 2018-07-03 | 주식회사 케이아이씨티 | 화장품 고객 트렌드 분석 시스템 및 방법 |
KR102329456B1 (ko) | 2021-01-21 | 2021-11-22 | 이동엽 | 모바일 앱 기반의 민간 조사 기관 중개시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107122451B (zh) | 一种法律文书案由分类器的自动构建方法 | |
US11321784B2 (en) | Methods and systems for automatically detecting fraud and compliance issues in expense reports and invoices | |
Cabañas et al. | Unveiling and quantifying facebook exploitation of sensitive personal data for advertising purposes | |
US11593671B2 (en) | Systems and methods for semantic analysis based on knowledge graph | |
US10970680B1 (en) | Systems and methods for monitored social media participation | |
CN109345417B (zh) | 基于身份认证的业务人员的在线考核方法及终端设备 | |
WO2019109698A1 (zh) | 目标用户群体的确定方法及装置 | |
US11681817B2 (en) | System and method for implementing attribute classification for PII data | |
CN111553318A (zh) | 敏感信息提取方法、裁判文书处理方法、装置和电子设备 | |
US20230237055A1 (en) | Method and system for analytic based connections among user types in an online platform | |
CN117114514B (zh) | 一种基于大数据的人才信息分析管理方法、系统及装置 | |
KR20170060958A (ko) | 금융 사기 방지 방법 및 시스템 | |
US11593385B2 (en) | Contextual interestingness ranking of documents for due diligence in the banking industry with entity grouping | |
US9317871B2 (en) | Mobile classifieds search | |
KR102524828B1 (ko) | 빅데이터 기반의 탐정기관 중개 시스템 | |
Krysovatyy et al. | Classification Method of Fictitious Enterprises Based on Gaussian Naive Bayes | |
CN114298845A (zh) | 一种理赔票据处理方法和装置 | |
CN113095078A (zh) | 关联资产确定方法、装置和电子设备 | |
CN114153939A (zh) | 文本识别方法及装置 | |
KR20200125819A (ko) | 대화형 개인 환경 마일리지 제공 추천 방법 | |
CN108520334A (zh) | 一种职业征信方法和装置 | |
CN115618120B (zh) | 一种公众号信息推送方法、系统、终端设备及存储介质 | |
KR20200003676A (ko) | 통합 복지 지원 관리 방법 | |
CN113240556B (zh) | 基于智能决策的侵权处理方法、装置、设备及介质 | |
Kaul | Agenda detector: labeling tweets with political policy agenda |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |