KR20190085272A

KR20190085272A - ＭＱｔｔ 프로토콜을 통한 Ｊｓｏｎ 포맷 방식 지원의 오픈 ＡＰＩ 시스템 및 방법

Info

Publication number: KR20190085272A
Application number: KR1020180003193A
Authority: KR
Inventors: 서형호; 최규태
Original assignee: (주)트리포스; 서형호; 최규태
Priority date: 2018-01-10
Filing date: 2018-01-10
Publication date: 2019-07-18

Abstract

MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템 및 방법이 개시된다. 음성/음향 신호 데이터가 미리 저장되는 음성/음향 신호 데이터베이스; 발화자 단말로부터 발화자음성/주변음향을 실시간으로 수신하여 재생하거나 상기 음성/음향 신호 데이터베이스에 미리 저장된 음성/음향 신호 데이터를 추출하여 실시간 재생하는 음성 플레이어 모듈; 상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 음성/음향 분석 모듈; 상기 음성/음향 분석기의 분석 결과를 Json 데이터로 생성하는 Json 데이터 생성 모듈; 상기 Json 데이터 생성 모듈에서 생성된 Json 데이터가 상기 음성/음향 분석 모듈의 기계 학습을 위한 데이터로서 저장되는 기계 학습 데이터베이스를 구성한다.

Description

ＭＱｔｔ 프로토콜을 통한 Ｊｓｏｎ 포맷 방식 지원의 오픈 ＡＰＩ 시스템 및 방법{OPEN API SYSTEM AND METHOD OF JSON FORMAT SUPPORT BY MQTT PROTOCOL}

본 발명은 오픈 API 시스템 및 방법에 관한 것으로서, 구체적으로는 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템 및 방법에 관한 것이다.

매년 끊임없이 발생되는 많은 응급 사고라든가 범죄 사고에 대한 신고 전화가 폭주하고 있다.

그런데 이처럼 폭주하는 신고 전화에는 허위 신고가 상당 비율을 차지하고 있다.

무분별한 신고 전화는 몇초 간격으로 발생할 정도로 잦은데, 짧은 시간안에 허위 신고 여부를 판단하고 초기에 신속하게 이를 판단해야 한다.

신고 전화의 접수자는 허위 신고 전화를 오랫동안 끌면서 진정한 신고 전화를 놓쳐서는 안된다.

한편, 허위 신고가 아닌 경우, 발화자는 당황하여 제대로 상황을 전달하지 못하는 경우가 많이 있다. 이러한 경우 발화자의 음성이나 주변 음향을 통해서 신고의 진정성은 물론 그 위급성을 신속하고 정확하게 판단함은 물론 짧은 시간안에 사고 현장이나 발화자에 대해 가능한 한 많은 정보를 파악하고 추론해내야 한다.

하지만, 짧은 시간안에 신고 전화 접수자가 정확하고 신속하게 많은 정보를 파악해내는 것은 쉽지 않고 그 정확성이나 객관성에서도 일정하지 않을 수 있는 문제점이 있다.

본 발명의 목적은 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템을 제공하는 데 있다.

본 발명의 다른 목적은 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 방법을 제공하는 데 있다.

상술한 본 발명의 목적에 따른 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템은, 음성/음향 신호 데이터가 미리 저장되는 음성/음향 신호 데이터베이스; 발화자 단말로부터 발화자음성/주변음향을 실시간으로 수신하여 재생하거나 상기 음성/음향 신호 데이터베이스에 미리 저장된 음성/음향 신호 데이터를 추출하여 실시간 재생하는 음성 플레이어 모듈; 상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 음성/음향 분석 모듈; 상기 음성/음향 분석기의 분석 결과를 Json 데이터로 생성하는 Json 데이터 생성 모듈; 상기 Json 데이터 생성 모듈에서 생성된 Json 데이터가 상기 음성/음향 분석 모듈의 기계 학습을 위한 데이터로서 저장되는 기계 학습 데이터베이스를 포함하도록 구성될 수 있다.

여기서, 상기 음성/음향 분석 모듈은, 상기 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화자의 성별, 연령, 심리상태, 진위 여부, 응급 상황 분류, 심각성 및 상황 진행 단계의 분석 결과를 출력하도록 구성될 수 있다.

상술한 본 발명의 다른 목적에 따른 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 방법은, 음성 플레이어 모듈이 발화자 단말로부터 발화자음성/주변음향을 실시간 수신하거나 음성/음향 신호 데이터베이스에 미리 저장된 음성/음향 신호 데이터를 추출하는 단계; 상기 음성 플레이어 모듈이 상기 발화자음성/주변음향 또는 음성/음향 신호 데이터를 실시간 재생하는 단계; 음성/음향 분석 모듈이 상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 단계; Json 데이터 생성 모듈이 상기 음성/음향 분석기의 분석 결과를 Json 데이터로 생성하는 단계; 기계 학습 데이터베이스에 상기 Json 데이터 생성 모듈에서 생성된 Json 데이터가 상기 음성/음향 분석 모듈의 기계 학습을 위한 데이터로서 저장되는 단계를 포함하도록 구성될 수 있다.

여기서, 상기 음성/음향 분석 모듈이 상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 단계는, 상기 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화자의 성별, 연령, 심리상태, 진위 여부, 응급 상황 분류, 심각성 및 상황 진행 단계의 분석 결과를 출력하도록 구성될 수 있다.

상술한 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템 및 방법에 의하면, 분석 결과를 Json 데이터로 변환하고 이를 음성/음향 분석을 위한 기계 학습용 데이터로 활용할 수 있는 효과가 있다.

도 1은 본 발명의 일 실시예에 따른 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 방법의 흐름도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 발명을 실시하기 위한 구체적인 내용에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일 실시예에 따른 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템의 블록 구성도이다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템(100)은 음성/음향 신호 데이터베이스(110), 음성 플레이어 모듈(120), 음성/음향 분석 모듈(130), Json 데이터 생성 모듈(140), 기계 학습 데이터베이스(150)를 포함하도록 구성될 수 있다.

이하, 세부적인 구성에 대하여 설명한다.

음성/음향 신호 데이터베이스(110)에는 음성/음향 신호 데이터가 미리 저장되도록 구성될 수 있다.

음성 플레이어 모듈(120)은 발화자 단말(10)로부터 발화자음성/주변음향을 실시간으로 수신하여 재생하거나 음성/음향 신호 데이터베이스(110)에 미리 저장된 음성/음향 신호 데이터를 추출하여 실시간 재생하도록 구성될 수 있다.

여기서, 음성 플레이어 모듈(120)은 발화자음성/주변음향 또는 음성/음향 신호 데이터를 실시간 재생하거나 되감기하거나 빨리감기하거나 건너뛰기 재생을 하는 등의 다양한 플레이 기능을 수행하도록 구성될 수 있다.

음성 플레이어 모듈(120)은 음성/음향 분석기(130)의 각 모듈들의 피드백 제어에 따라 다양한 플레이 기능을 실시간으로 병렬적으로 수행할 수 있다. 즉, 각 모듈들이 각각 피드백 제어하는 명령에 따라 빨리감기, 되감기, 빠른 재생, 특정 주파수 신호 추출 재생 등의 다양한 재생 기능을 병렬적으로 실시간 수행하여 발화자 행태, 주변 음향, 심리 상태, 음성 인식 등의 다양한 분석이 동시에 실시간 수행될 수 있다.

음성/음향 분석 모듈(130)은 음성 플레이어 모듈(120)에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하도록 구성될 수 있다.

음성/음향 분석 모듈(130)은 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화자의 성별, 연령, 심리상태, 진위 여부, 응급 상황 분류, 심각성 및 상황 진행 단계의 분석 결과를 출력하도록 구성될 수 있다.

좀 더 구체적으로는 다음과 같다.

음성/음향 분석 모듈(130)은 음성 플레이어 모듈(120)에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 음성 인식을 수행하고 키워드를 분석하도록 구성될 수 있다.

음성/음향 분석 모듈(130)은 음성 플레이어 모듈(120)에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 환경 음향을 분석하도록 구성될 수 있다.

환경 음향은 미리 구비된 음향과 대비하여 주변 음향이 어떠한 음향인지 추론되도록 구성될 수 있다.

예를 들어, 차 소리, 사람 소리, 비 소리 등의 음향을 미리 구비된 음향과 상호 대비하여 주변 상황을 판단하도록 구성될 수 있다.

음성/음향 분석 모듈(130)은 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화 행태 및 심리 상태를 분석하도록 구성될 수 있다.

발화자의 발화행태에 의해 연령 정보 등이 추론될 수 있다. 구체적으로는 다음과 같은 추론 판단 기준에 따라 연령 정보가 추론될 수 있다.

일반적으로 노인의 발화 행태는 청년들에 비해 유의한 차이를 유발하는 인자들이 있다. 노인들의 경우 청년들에 비해 발화 속도가 대체로 느리면서 음절들의 발화 속도도 일정치 않은 문제점이 있다. 또한 묵음이 부적절한 위치에 길게 삽입되며, 초성과 종성의 발음에 있어서 비정상적인 행태를 보이는 경향이 있다.

한편, 청년층은 노년층에 비하여 더 긴 MPT(maximum phonation time)를 보였고 이는 정상 성인이라 하더라도 연령이 증가함에 따른 모음의 연장 수행력이 낮아지는 경향이 있다. 음절의 반복 속도 및 규칙성을 검사하는 AMR(alternating motion rate)과 SMR(sequential motion rate)도 청년층이 노년층에 비하여 더 빠른 것으로 나타나고 있다.

한편, 노인은 ?은 연령층에 비해 말 산출에 과여하는 인지적 감각 및 운동적 기능 등이 저하되므로 전체 말 속도와 조음 속도가 느려지고, 이러한 변화는 노인기 내에서도 높은 연령대일수록 더욱 확연하게 관찰되는 경향이 있다.

그리고 노인은 주관적, 객관적인 측면에서 모두 높은 장애 출현율을 보이며, 노인 여성의 경우에는 성인 여성에 비해 유의하게 높은 음성 장애 지수를 보인다.

그리고 남성의 경우 40세에서 50세까지 보컬 피치(vocal pitch)가 낮아지고 그 이후에 다시 상승하며 여성은 나이가 듦에 따라 피치가 떨어지는 경향이 있다.

그리고 지터(jitter)와 시머(shimmer)를 측정한 결과, 노인 남성은 진동의 변화율과 파형의 규칙성이 증가되었고, 노인 여성은 진동의 변화율만 증가되는 경향이 있다. 여기서, 지터는 성대 진동의 변화율이며, 시머는 음성 파형의 규칙성을 의미한다. 이러한 경향은 후두 조절 기능의 감소나 후두 조직의 퇴행성 변화를 나타내는 것이다. 발성의 안정성을 나타내는 또 하나의 지표인 잡음대 조파비를 측정한 결과, 노인 여성에게 있어서 의미있게 증가되어 연령 증가에 따른 발성의 불안정성을 뒷받침 해주고 있다.

후두의 퇴행성 변화에 따른 음성 지표의 변화를 보면 성대 진동의 변화율(jitter)의 경우 더 큰 값을 보이는 경향이 있다.

또한 발화 행태로부터 발화자의 성별이 추론될 수 있다. 성별에 따른 발화행태는 은 최대 발성 지속 시간, 기본 주파수, 주파수 변동률, 진폭 변동률, 소음대 배음비, 평균 기본 주파수, 최대 기본 주파수, 최소 기본 주파수의 차이를 나타낸다.

성별에 따라서는 기본 주파수, 주파수 변동률, 진폭 변동률, 최대 기본 주파수에서 유의한 차이를 나타낸다. 또한 소음대 배음비, 평균 기본 주파수, 최소 기본 주파수는 성별에 따라서 유의한 차이가 보이지 않는다. 더불어 기본 주파수는 연별 발화와 모음 연장 발성 사이에서 유의한 차이를 나타낸다.

또한, 음성 및 주변 음향을 분석하여 발화자의 심리 상태를 추론하도록 구성될 수 있다.

심리 상태 및 의도는 다음과 같은 기준에 의해 추론될 수 있다.

먼저 발화 행태를 통해 발화자의 성격을 추론할 수 있는데, 발화 속도, 묵음 길이, 묵음 빈도수, 피치의 상대적 변화량을 기반으로 발화자의 외향성과 내향성을 판단할 수 있다.

또한, 발화자의 뇌파/맥파 센싱 정보로부터 유쾌/유쾌/안정 중 하나의 감성 상태를 판단하는 감성 추론 엔진에 의해 발화자의 감성이나 성격, 심리 상태, 의도 등을 다면적으로 파악할 수 있다.

Json 데이터 생성 모듈(140)은 음성/음향 분석 모듈(130)의 분석 결과를 Json 데이터로 생성하도록 구성될 수 있다.

기계 학습 데이터베이스(150)에는 Json 데이터 생성 모듈(140)에서 생성된 Json 데이터가 음성/음향 분석 모듈(130)의 기계 학습을 위한 데이터로서 저장될 수 있다.

도 2는 본 발명의 일 실시예에 따른 음성/음향 데이터 분석 패턴 관리를 위한 음성플레이어 방법의 흐름도이다.

도 2를 참조하면, 음성 플레이어 모듈(120)이 발화자 단말(10)로부터 발화자음성/주변음향을 실시간 수신하거나 음성/음향 신호 데이터베이스(110)에 미리 저장된 음성/음향 신호 데이터를 추출한다(S101).

다음으로, 음성 플레이어 모듈(120)이 발화자음성/주변음향 또는 음성/음향 신호 데이터를 실시간 재생한다(S102).

다음으로, 음성/음향 분석 모듈(130)이 음성 플레이어 모듈(120)에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석한다(S103).

이때, 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화자의 성별, 연령, 심리상태, 진위 여부, 응급 상황 분류, 심각성 및 상황 진행 단계의 분석 결과를 출력하도록 구성될 수 있다.

다음으로, Json 데이터 생성 모듈(140)이 음성/음향 분석 모듈(130)의 분석 결과를 Json 데이터로 생성한다(S104).

다음으로, 기계 학습 데이터베이스(150)에 Json 데이터 생성 모듈(140)에서 생성된 Json 데이터가 음성/음향 분석 모듈(130)의 기계 학습을 위한 데이터로서 저장된다(S105).

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

110: 음성/음향 신호 데이터베이스
120: 음성 플레이어 모듈
130: 음성/음향 분석 모듈
140: Json 데이터 생성 모듈
150: 기계 학습 데이터베이스

Claims

음성/음향 신호 데이터가 미리 저장되는 음성/음향 신호 데이터베이스;
발화자 단말로부터 발화자음성/주변음향을 실시간으로 수신하여 재생하거나 상기 음성/음향 신호 데이터베이스에 미리 저장된 음성/음향 신호 데이터를 추출하여 실시간 재생하는 음성 플레이어 모듈;
상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 음성/음향 분석 모듈;
상기 음성/음향 분석기의 분석 결과를 Json 데이터로 생성하는 Json 데이터 생성 모듈;
상기 Json 데이터 생성 모듈에서 생성된 Json 데이터가 상기 음성/음향 분석 모듈의 기계 학습을 위한 데이터로서 저장되는 기계 학습 데이터베이스를 포함하는 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템.
제1항에 있어서, 상기 음성/음향 분석 모듈은,
상기 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화자의 성별, 연령, 심리상태, 진위 여부, 응급 상황 분류, 심각성 및 상황 진행 단계의 분석 결과를 출력하도록 구성되는 것을 특징으로 하는 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 시스템.
음성 플레이어 모듈이 발화자 단말로부터 발화자음성/주변음향을 실시간 수신하거나 음성/음향 신호 데이터베이스에 미리 저장된 음성/음향 신호 데이터를 추출하는 단계;
상기 음성 플레이어 모듈이 상기 발화자음성/주변음향 또는 음성/음향 신호 데이터를 실시간 재생하는 단계;
음성/음향 분석 모듈이 상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 단계;
Json 데이터 생성 모듈이 상기 음성/음향 분석기의 분석 결과를 Json 데이터로 생성하는 단계;
기계 학습 데이터베이스에 상기 Json 데이터 생성 모듈에서 생성된 Json 데이터가 상기 음성/음향 분석 모듈의 기계 학습을 위한 데이터로서 저장되는 단계를 포함하는 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 방법.
제3항에 있어서, 상기 음성/음향 분석 모듈이 상기 음성 플레이어 모듈에서 실시간 재생되는 발화자음성/주변음향 또는 음성/음향 신호 데이터를 분석하는 단계는,
상기 발화자음성/주변음향 또는 음성/음향 신호 데이터로부터 발화자의 성별, 연령, 심리상태, 진위 여부, 응급 상황 분류, 심각성 및 상황 진행 단계의 분석 결과를 출력하도록 구성되는 것을 특징으로 하는 MQtt 프로토콜을 통한 Json 포맷 방식 지원의 오픈 API 방법.