KR102307249B1 - 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템 - Google Patents

블록체인을 기반으로 한 음성 녹취 정보 저장 시스템 Download PDF

Info

Publication number
KR102307249B1
KR102307249B1 KR1020190148017A KR20190148017A KR102307249B1 KR 102307249 B1 KR102307249 B1 KR 102307249B1 KR 1020190148017 A KR1020190148017 A KR 1020190148017A KR 20190148017 A KR20190148017 A KR 20190148017A KR 102307249 B1 KR102307249 B1 KR 102307249B1
Authority
KR
South Korea
Prior art keywords
file
voice recording
recording file
text
voice
Prior art date
Application number
KR1020190148017A
Other languages
English (en)
Other versions
KR20210060224A (ko
Inventor
박수용
구명완
김인근
Original Assignee
서강대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교 산학협력단 filed Critical 서강대학교 산학협력단
Priority to KR1020190148017A priority Critical patent/KR102307249B1/ko
Priority to US17/776,988 priority patent/US20220415329A1/en
Priority to PCT/KR2020/014651 priority patent/WO2021101096A1/ko
Publication of KR20210060224A publication Critical patent/KR20210060224A/ko
Application granted granted Critical
Publication of KR102307249B1 publication Critical patent/KR102307249B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1865Transactional file systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees
    • H04L2209/38

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템에 관한 것이다. 상기 음성 녹취 파일 저장 시스템은, 음성 녹취 파일을 사전 설정된 음성-텍스트 변환 알고리즘을 사용하여 텍스트 파일로 변환시키고, 상기 변환된 텍스트 파일 및 상기 음성-텍스트 변환 알고리즘에 대한 정보를 출력하는 음성-텍스트 변환 장치; 상기 음성-텍스트 변환 장치로부터 출력된 텍스트 파일 및 상기 음성-텍스트 변환 알고리즘에 대한 정보를 포함하는 블록을 생성하고, 상기 생성된 블록을 블록체인에 저장하도록 구성된 블록체인 네트워크; 및 상기 음성 녹취 파일의 원본을 저장하는 데이터 저장 장치를 구비하여, 상기 음성 녹취 파일에 대한 텍스트 파일 및 원본의 음성 녹취 파일을 신뢰성있게 저장한다.

Description

블록체인을 기반으로 한 음성 녹취 정보 저장 시스템{Storage system of voice recording information based on blockchain}
본 발명은 음성 녹취 정보 저장 시스템에 관한 것으로서, 더욱 구체적으로는 계약 관련 음성 녹취 정보를 텍스트로 변환시켜 음성-텍스트 변환 관련 정보와 변환된 텍스트는 블록의 형태로 블록체인에 저장하고 원본 음성 녹취 파일은 별도의 데이터 저장 장치에 저장하여, 음성 녹취 정보들을 무결성 및 보안성이 보장되고 신뢰성있게 저장할 뿐만 아니라 조회 및 감사 등의 내용 확인도 편리하게 할 수 있도록 한 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템에 관한 것이다.
일반적으로, 텔레마케팅을 통한 계약은 전화 통화로 이루어지며 계약에 대한 정보가 음성 녹취 파일에 포함되어 저장된다. 이러한 음성 녹취 파일들에 포함된 계약 관련 정보들은 향후 계약에 대한 감사, 조회, 분쟁시에 다시 재생되어 그 내용들을 확인하게 된다. 이러한 음성 녹취 파일들은 음성 정보로 보관되므로, 내용 확인이 어려울 뿐만 아니라, 키워드 검색등을 통한 검색도 쉽지 아니하며 조회도 어려운 문제점들이 내포되어 있다.
한편, 블록체인 기술은 각 데이터들이 Peer-to-Peer 방식을 기반으로 생성된 체인 형태의 연결고리 기반 분산 데이터 저장 환경에 저장됨으로써, 누구라도 임의로 수정할 수 없고 누구나 변경의 결과를 열람할 수 있는 분산 컴퓨팅 기술 기반의 데이터 대변 방지 기술이다. 블록체인 네트워크에서는, 트랜잭션이 발생하게 되면 블록체인 내의 모든 노드들에게 해당 트랜잭션을 전파하게 되고, 이 트랜잭션이 유효한 트랜잭션인지에 대해 검증이 이루어지게 된다. 이렇게 검증된 트랜잭션들이 쌓이면 블록을 생성하게 되고, 생성된 블록에 대해 블록체인 내의 모든 노드들에게 전파하게 된다. 그 후, 합의 알고리즘 중 하나인 작업 증명 과정을 통해 블록을 검증하고 검증이 완료된 블록은 이전 블록과 연결되어 블록 체인에 기록된다.
블록체인 기술의 가장 큰 핵심을 탈 중앙화이다. 블록체인 노드들은 블록체인의 부분 또는 전체를 가지고 있다. 이로써, 중앙 집중형 데이터베이스에 모든 정보를 저장할 필요성이 없어졌으며, 데이터의 임의 조작이 불가능하게 되었다. 이는 하나의 데이터에 대한 수정을 하려면 해당 데이터가 속한 블록의 정보를 갖고 있는 모든 노드들의 데이터를 바꾸어 주어야 하기 때문이다. 이를 통해, 블록체인 기술은 데이터에 대한 무결성이 유지될 수 있다. 또한, 블록체인에는 데이터가 해시 알고리즘에 의해 암호화되기 때문에 보안성이 보장되며 누구나 정보에 접근 가능하므로 투명성이 보장된다.
한편, 분산 해시 테이블(DHT)은 해시 테이블을 분산하여 관리하는 기술이다. 어떤 항목을 찾아갈 때 해시 테이블을 이용하는데, 중앙 시스템이 아닌 각 노드들이 이름을 값으로 매핑하는 기능을 하는 방식이다. 이러한 DHT 기술은 부하가 집중되지 않고 분산되는 큰 장점이 있으며, 극단적으로 큰 규모의 노드들도 관리할 수 있게 된다. 이러한 DHT 는 순수 P2P라도 네트워크의 부하를 억제할 수 있으며, 네트워크 상의 콘텐츠를 빠르고 정확하게 검색할 수 있는 것이 가능하며, DHT를 활용하는 대표적인 시스템으로는 비트토렌트, eDonkey 등이 있다.
한편, 해시 트리는 모든 non-leaf node의 이름이 자식 노드들 이름의 해시로 구성된 트리구조를 가리키는데, 발명자의 이름을 따서 Merkle tree라고도 불리운다. 해시 트리는 트리 구조의 일종으로, 잎 노드는 파일 등의 데이터를 가리킨다. 상위 노드는 각각 자식 노드들의 해시 값이 된다. 예를 들어, 해시 0은 해시 0-0과 해시 0-1을 연결한 문자열을 다시 해시 함수로 계산한다. 해시 함수는 이진 트리를 사용할 수도 있지만, 임의의 차수를 가진 트리에서도 사용 가능하다. 해시 함수는 어떤 것이든 사용할 수 있지만, 보통 SHA-1, Tiger, Whirlpool 등의 암호화 해시 함수가 사용된다. 그러나 해시 트리를 사용하는 목적이 악의적인 공격자의 데이터 변조를 막으려는 것이 아니라, 단순히 오류를 찾기 위한 경우, CRC 등의 안전하지 않은 함수를 사용할 수도 있다.
데이터를 검증하고자 하는 사용자는 루트 노드의 해시 값(루트 해시 또는 마스터 해시라고 부른다)만 알면 데이터가 옳은 데이터인지 검증할 수 있다.
한국등록특허공보 제 10-1989902호 한국등록특허공보 제 10-1797712호
전술한 문제점을 해결하기 위한 본 발명의 목적은 텔레마케팅을 이용한 계약 등의 정보를 포함하는 음성 녹취 파일을 텍스트 파일로 변환시켜 블록체인에 기록하도록 하여 신뢰성있게 저장할 뿐만 아니라 키워드를 이용한 조회 및 감사 등의 내용 확인도 편리하게 할 수 있도록 하여 업무에 대한 효율성을 증대시키는 음성 녹취 정보 저장 시스템을 제공하는 것이다.
전술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템은, 음성 녹취 파일을 사전 설정된 음성-텍스트 변환 알고리즘을 사용하여 텍스트 파일로 변환시키고, 상기 변환된 텍스트 파일 및 상기 음성-텍스트 변환 알고리즘에 대한 정보를 출력하는 음성-텍스트 변환 장치; 다수 개의 참여 노드들을 포함하여 구성되며, 사전 설정된 합의 알고리즘에 따라, 상기 음성-텍스트 변환 장치로부터 출력된 텍스트 파일 및 상기 음성-텍스트 변환 알고리즘에 대한 정보를 포함하는 블록을 생성하고, 상기 생성된 블록을 블록체인에 저장하도록 구성된 블록체인 네트워크; 를 구비하여, 상기 음성 녹취 파일에 대한 텍스트 파일을 신뢰성있게 저장한다.
전술한 특징에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템에 있어서, 상기 음성-텍스트 변환 알고리즘에 대한 정보는, 상기 음성-텍스트 변환 알고리즘의 종류 및 상기 음성-텍스트 변환 알고리즘에 사용되는 파라미터 정보를 포함하는 것이 바람직하다.
전술한 특징에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템은, 음성 녹취 파일의 원본을 저장하는 데이터 저장 장치를 더 구비하고, 상기 텍스트 파일에 대한 음성 녹취 파일의 원본은 상기 데이터 저장 장치에 저장하는 것이 바람직하다.
전술한 특징에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템은, 사용자들의 단말에 설치되어 실행되는 파일 조회용 어플리케이션을 더 구비하고, 상기 파일 조회용 어플리케이션은 사용자로부터 특정 음성 녹취 파일에 대한 요청이 발생하면, 상기 요청에 따라 해당 음성 녹취 파일에 대한 텍스트 파일을 검색하여 제공하거나 데이터 저장 장치에 저장된 음성 녹취 파일의 원본을 검색하여 제공하는 것이 바람직하다.
본 발명에 따른 음성 녹취 정보 저장 시스템은 음성 녹취 파일을 텍스트 파일로 변환시켜 블록체인에 블록의 형태로 기록함으로써, 음성 녹취 파일에 대한 텍스트 파일의 신뢰성을 보장할 수 있게 된다.
또한, 본 발명에 따른 음성 녹취 정보 저장 시스템에 의하여, 텔레마케팅을 통한 계약시에 생성되는 음성 녹취 파일에 포함된 계약 정보에 대한 조회 및 감사 업무, 그리고 분쟁 조정 업무는 오로지 텍스트 정보를 사용하여 이루어질 수 있게 된다. 그 결과, 종래의 음성 정보를 사용하여 업무를 수행하던 때와는 달리, 시간과 비용을 절약할 수 있게 된다.
또한, 본 발명에 따른 음성 녹취 정보 저장 시스템에 의하여, 블록체인상에 계약 관련 텍스트 정보들을 저장하는 정보 저장 체계를 가짐으로써, 음성-텍스트 변환 과정의 신뢰를 보장하고, 저장된 텍스트 정보는 위조 및 변조에 대하여 면역을 지니게 되어, 텔레마케팅 회사와 소비자 사이의 분쟁을 최소화시킬 수 있게 된다.
도 1은 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템을 전체적으로 도시한 구성도이다.
도 2는 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템에 있어서, 상기 음성-텍스트 변환 장치(10)의 일실시형태를 도시한 블록도이다.
도 3은 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템에 있어서, 상기 블록체인 네트워크(30)의 각 참여 노드에 구비된 블록체인 처리 모듈의 일실시형태를 도시한 블록도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템의 구조 및 동작에 대하여 구체적으로 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템을 전체적으로 도시한 구성도이다. 도 1을 참조하면, 본 발명에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템(1)은 음성 녹취 파일에 대한 음성-텍스트 변환 장치(10), 원본 음성 녹취 파일을 저장하는 데이터 저장 장치(20), 블록체인(34)을 구비하는 다수 개의 참여 노드들(Peer #1, #2, #3,…, #n)을 포함하는 블록체인 네트워크(30) 및 파일 조회용 어플리케이션(40)을 구비한다. 상기 음성 녹취 파일 저장 시스템(1)은 음성 녹취 파일이 생성되면, 원본의 음성 녹취 파일은 데이터 저장 장치에 저장하고, 음성 녹취 파일을 텍스트 파일로 변환시키고, 변환된 텍스트 파일과 변환 관련 파라미터 정보들을 포함하는 블록을 생성하여 블록체인 네트워크의 블록체인에 저장한다. 상기 블록체인 네트워크(30)의 다수 개의 참여 노드들(Peer #1, #2, #3,…, #n)은 각각 블록체인 처리용 어플리케이션(32)을 구비한다. 상기 블록체인 처리용 어플리케이션(32)은 블록체인 네트워크에서 전파되는 트랜잭션들을 이용하여 블록으로 생성하고, 상기 생성된 블록은 블록체인에 기록하게 된다. 한편, 상기 파일 조회용 어플리케이션(40)은 사용자로부터 특정 음성 녹취 파일에 대한 요청이 발생하면, 해당되는 텍스트 파일 또는 음성 녹취 파일의 원본을 제공한다.
이하, 전술한 구성들에 대하여 보다 구체적으로 설명한다.
상기 데이터 저장 장치(20)는 음성 녹취 파일의 원본이 저장되는 데이터베이스 장치이며, 상기 파일 조회용 어플리케이션(40)으로부터 특정 음성 녹취 파일에 대한 요청이 발생되면, 해당되는 음성 녹취 파일을 제공한다.
상기 음성-텍스트 변환 장치(10)는 음성 녹취 파일을 사전 설정된 음성-텍스트 변환 알고리즘을 사용하여 텍스트 파일로 변환시키고, 상기 변환된 텍스트 파일과 상기 음성-텍스트 변환 알고리즘에 대한 정보를 상기 블록체인 네트워크로 전송한다. 상기 음성-텍스트 변환 알고리즘에 대한 정보는 음성-텍스트 변환 알고리즘의 종류 및 상기 음성-텍스트 변환 알고리즘에 사용되는 파라미터 정보를 포함한다.
도 2는 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템에 있어서, 상기 음성-텍스트 변환 장치(10)의 일실시형태를 도시한 블록도이다. 도 2를 참조하면, 상기 음성-텍스트 변환 장치(10)는 전처리부(Pre-processing unit; 12), 음성 변환 모델부(Acoustic Model unit; 14), 언어 처리 모델부(Linguistic Model unit; 16), 파라미터 추출부(17), 기록부(Recorder; 19)를 구비하여, 입력 정보인 음성 녹취 파일을 텍스트 파일로 변환하고 상기 변환된 텍스트 파일과 변환 알고리즘에 대한 정보를 출력하게 된다. 상기 변환 알고리즘에 대한 정보는 변환 알고리즘의 종류 및 사용되는 파라미터에 대한 정보를 포함한다.
상기 전처리부(Pre-processing unit; 12)는, 변환 및 특징 추출을 위한 청각 시스템과 같이 음성 신호로부터 신호 및 주파수 영역의 특징을 추출하는 것으로서, 청각 시스템의 달팽이관 기능을 하며 음성 신호로부터 주기성과 동기성의 정보를 추출한다.
상기 음성 처리 모델부(Acoustic Model unit; 14)는, 상기 전처리부로부터 추출된 특징으로부터 결과값을 산출하는 것으로서, 상기 전처리부에 의해 음성 신호의 전처리를 통해 얻어낸 특징들을 바탕으로 하여, 문장을 구성하는데 필요한 원소인 음소, 음절, 단어를 인식해내는 역할을 한다. 일반적으로, 이를 위하여, 음성학, 음운학, 음운배열론, 시형론 등이 요구되는데, 사전 기반의 다양한 알고리즘이 사용되며, 각 알고리즘 별 접근 방식은 다음과 같다. DTW는 동적 프로그래밍을 통한 접근이며, HMM은 확률 추정을 통한 접근이며, Knowledge Base는 인공지능을 이용한 추론을 통한 접근이며, Neural Network는 패턴 분류를 통한 접근이다.
상기 언어 처리 모델부(Linguistic Model unit; 16)는, 언어처리(문장 복원) 패턴 인식후의 결과인 음소, 음절, 단어를 재구성해서 문장을 복원하는 것으로서, 이를 위해 구문론, 의미론, 어형론이 이용된다. 문장을 구성하기 위하여 규칙, 통계 기반 모델을 이용하게 된다. 구문 규칙 모델(syntactic)은 매 단어 다음에 올 수 있는 단어의 종류를 제한해 문장을 구성하게 된다. 통계적 모델(statistical)은 매 단어에 대해 이전의 N개의 단어가 발생할 확률을 고려하여 문장을 인식하게 된다.
상기 파라미터 추출부(17)는, 상기 전처리부로부터 추출된 특징들로부터 음성 처리 모델부와 언어 처리 모델부에 사용되는 파라미터들을 추출한다.
상기 기록부(Recorder; 19)는 상기 파라미터 추출부에 의해 추출된 파라미터 정보들, 상기 음성 처리 모델부로부터 출력된 음성 처리 정보들, 상기 음성 처리 정보들을 이용하여 언어 처리 모델부로부터 복원된 문장들을 이용하여 텍스트 파일을 생성하여 기록하고, 상기 텍스트 파일과 상기 파라미터 정보들을 출력한다. 상기 파라미터 정보는 각 음성-텍스트 변환 알고리즘들에 대한 특징을 가지고 있는 변환 키(key)를 나타낸다. 따라서, 음성-텍스트 변환 알고리즘의 종류 및 이에 사용된 파라미터 정보만 있다면, 동일한 음성 녹취 파일은 동일한 텍스트 파일로 변환시켜 출력할 수 있게 된다.
전술한 구성을 갖는 음성-텍스트 변환 장치는 사전 설정된 음성-텍스트 변환 알고리즘을 사용하여 외부로부터 입력된 음성 녹취 파일을 텍스트 파일로 변환시키고, 변환된 텍스트 파일과 상기 음성-텍스트 변환 알고리즘에 대한 정보를 출력하며, 상기 변환 알고리즘에 대한 정보는 변환 알고리즘의 종류 및 상기 변환 알고리즘에 사용된 파라미터들에 대한 정보를 포함한다.
도 3은 본 발명의 바람직한 실시예에 따른 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템에 있어서, 상기 블록체인 네트워크(30)의 각 참여 노드에 구비된 블록체인 처리 모듈의 일실시형태를 도시한 블록도이다. 도 3를 참조하면, 상기 블록체인 네트워크(30)는 다수 개의 참여 노드들(Peer #1, #2, #3,…, #n)을 포함하여 구성되며, 각 참여 노드들에 구비된 블록체인 처리용 어플리케이션(32)은 데이터들이 기록된 트랜잭션을 생성하고, 사전 설정된 합의 알고리즘에 따라 상기 트랜잭션을 포함하는 블록을 생성하여 각 참여 노드의 블록체인에 각각 저장하게 된다.
본 발명에 따른 시스템에서의 임의의 참여 노드에 구비된 블록체인 처리용 어플리케이션(32)은 텍스트 정보와 변환 알고리즘에 대한 정보가 입력되면, 해당 데이터들을 포함하는 트랜잭션을 생성하고, 사전 설정된 합의 알고리즘에 따라 상기 트랜잭션을 포함하는 파일 블록(File Block)을 생성하여 저장하고, 이 저장본은 각각의 peer node의 블록체인에 저장하게 된다. 이렇게 저장된 파일에 대한 위변조 확인은 Merkle Tree를 이용하여 각각의 파일들을 Merkle Tree의 leaf node에 위치하고, Merkle Tree의 root node 만 확인하여 위변조를 확인할 수 있게 된다. 이 일련의 과정들은 Distributed Hash Table(DHT)에 의해 관리되며 여기서 각 파일들의 고유한 ID 부여 및 원본 파일에 대한 정보가 저장된다. 기본적으로, 상기 블록체인 처리용 어플리케이션은 File Broadcast나 Block Generate 기능을 포함하며, 상기 파일 조회용 어플리케이션(40)으로부터의 요청을 받고 이러한 요청에 따른 텍스트 파일을 출력으로 전달하기 위한 DATA I/O API 기능도 포함한다.
한편, 상기 파일 조회용 어플리케이션(40)은 사용자의 단말등에 설치되어 사용자가 직접 사용하는 어플리케이션으로서, 사용자가 감사, 조회, 분쟁 해결등을 위하여 특정 음성 녹취 파일에 대한 텍스트 파일을 요청하게 되면, 필요한 정보를 블록체인이나 데이터 저장 장치에 요청하여 블록체인으로부터 텍스트 파일을 가지고 오거나 데이터 저장 장치로부터 원본 음성 녹취 파일을 제공받을 수 있게 된다.
본 발명에 따른 음성 녹취 파일 저장 시스템에 있어서, 상기 음성-텍스트 변환 장치로부터 음성 녹취 파일을 변환한 텍스트 파일과 파라미터 정보들을 제공받은 블록체인 네트워크의 참여 노드는 텍스트 파일과 파라미터 정보들을 기록한 트랜잭션을 생성하고, 사전 설정된 합의 알고리즘에 따라 상기 트랜잭션을 포함하는 블록을 생성하여 상기 블록체인에 기록하게 된다. 그 결과, 본 발명에 따른 시스템에서, 음성 녹취 파일을 변환시킨 텍스트 파일을 블록체인에 신뢰성있게 저장할 수 있게 된다.
한편, 전술한 구성을 갖는 음성 녹취 파일 저장 시스템은 음성 녹취 파일을 텍스트 파일의 형태로 저장함으로써, 조회 및 검사를 매우 편리하게 할 수 있게 된다. 또한, 본 발명에 따른 음성 녹취 파일 저장 시스템은 텔레마케팅 계약시 음성 정보를 텍스트 정보로 저장할 때 블록체인에 기록하여 저장함으로써, 이것이 원본의 음성 녹취 파일에서 온 텍스트 정보인지 여부를 확인하고 텍스트 파일 자체에 대한 위조 및 변조가 없는지에 대한 신뢰성을 보장할 수 있게 된다.
따라서, 사용자들은 텍스트로 된 검색 키워드를 사용하여 블록체인 네트워크의 블록체인에 저장된 음성 녹취 파일에 대한 텍스트 파일을 검색하여 조회할 수 있게 된다. 그리고, 본 발명에 따른 시스템은, 해당 텍스트 파일에 대한 원본 음성 녹취 파일을 데이터 저장 장치로부터 획득할 수 있도록 함으로써, 필요한 경우 원본과의 일치 여부를 다시 확인할 수 있게 된다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.
1 : 음성 녹취 파일 저장 시스템
10 : 음성-텍스트 변환 장치
20 : 데이터 저장 장치
30 : 블록체인 네트워크
32 : 블록체인 처리용 어플리케이션
34 : 블록체인
40 : 파일 조회용 어플리케이션

Claims (5)

  1. 음성 녹취 파일을 사전 설정된 음성-텍스트 변환 알고리즘을 사용하여 텍스트 파일로 변환시키고, 상기 변환된 텍스트 파일 및 상기 음성-텍스트 변환 알고리즘에 대한 정보를 출력하는 음성-텍스트 변환 장치;
    다수 개의 참여 노드들을 포함하여 구성되며, 사전 설정된 합의 알고리즘에 따라, 상기 음성-텍스트 변환 장치로부터 출력된 텍스트 파일 및 상기 음성-텍스트 변환 알고리즘에 대한 정보를 포함하는 블록을 생성하고, 상기 생성된 블록을 블록체인에 저장하도록 구성된 블록체인 네트워크; 및
    사용자들의 단말에 설치되어 실행되는 어플리케이션으로서, 사용자로부터 특정 음성 녹취 파일에 대한 요청이 발생하면, 상기 요청에 따라 해당 음성 녹취 파일에 대한 텍스트 파일을 검색하여 제공하도록 구성된 파일 조회용 어플리케이션;
    을 구비하여, 상기 음성 녹취 파일에 대한 텍스트 파일을 저장하는 것을 특징으로 하는 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템.
  2. 제1항에 있어서, 상기 음성-텍스트 변환 알고리즘에 대한 정보는,
    상기 음성-텍스트 변환 알고리즘의 종류 및 상기 음성-텍스트 변환 알고리즘에 사용되는 파라미터 정보를 포함하는 것을 특징으로 하는 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템.
  3. 제1항에 있어서, 상기 음성 녹취 파일 시스템은,
    음성 녹취 파일의 원본을 저장하는 데이터 저장 장치를 더 구비하고,
    상기 텍스트 파일에 대한 음성 녹취 파일의 원본은 상기 데이터 저장 장치에 저장하는 것을 특징으로 하며,
    상기 파일 조회용 어플리케이션은 사용자로부터 특정 음성 녹취 파일에 대한 요청이 발생하면, 상기 요청에 따라 해당 음성 녹취 파일에 대한 텍스트 파일을 검색하여 제공하거나 데이터 저장 장치에 저장된 음성 녹취 파일의 원본을 검색하여 제공하는 것을 특징으로 하는 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템.
  4. 삭제
  5. 제1항에 있어서, 상기 음성 녹취 파일 시스템에 저장되는 음성 녹취 파일은 계약 정보를 포함하는 텔레마케팅 계약시에 생성된 음성 녹취 파일인 것을 특징으로 하는 블록체인을 기반으로 한 음성 녹취 파일 저장 시스템.
KR1020190148017A 2019-11-18 2019-11-18 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템 KR102307249B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020190148017A KR102307249B1 (ko) 2019-11-18 2019-11-18 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템
US17/776,988 US20220415329A1 (en) 2019-11-18 2020-10-26 System for storing voice recording information based on blockchain
PCT/KR2020/014651 WO2021101096A1 (ko) 2019-11-18 2020-10-26 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190148017A KR102307249B1 (ko) 2019-11-18 2019-11-18 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템

Publications (2)

Publication Number Publication Date
KR20210060224A KR20210060224A (ko) 2021-05-26
KR102307249B1 true KR102307249B1 (ko) 2021-10-01

Family

ID=75981673

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190148017A KR102307249B1 (ko) 2019-11-18 2019-11-18 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템

Country Status (3)

Country Link
US (1) US20220415329A1 (ko)
KR (1) KR102307249B1 (ko)
WO (1) WO2021101096A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102466985B1 (ko) * 2020-07-14 2022-11-11 (주)드림어스컴퍼니 음성 명령 기반의 음질 제어 방법 및 그를 위한 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160371509A1 (en) * 2013-07-06 2016-12-22 Newvoicemedia, Ltd. System and methods for tamper proof interaction recording and timestamping
KR101890280B1 (ko) 2018-01-16 2018-09-28 주식회사 아이디엔소프트 앱 기반의 금융상품정보 통합 제공시스템
US20180336515A1 (en) 2017-05-19 2018-11-22 Zest Labs, Inc. Process and condition recording and validation using a blockchain
KR101952498B1 (ko) 2017-04-05 2019-02-27 주식회사 케이뱅크은행 블록 체인을 이용한 대출 서비스 제공 방법 및 이를 실행하는 시스템
KR102032220B1 (ko) * 2018-09-13 2019-11-08 주식회사 통블록 블록체인 기반의 데이터 거래 시스템 및 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101699252B1 (ko) * 2013-10-28 2017-01-24 에스케이텔레콤 주식회사 음성 인식을 위한 특징 파라미터 추출 방법 및 이를 이용하는 음성 인식 장치
KR101797712B1 (ko) 2016-04-14 2017-11-15 주식회사 잇팩 텔레마케팅 표준 스크립트 동적 구성 시스템
US10715331B2 (en) * 2016-12-28 2020-07-14 MasterCard International Incorported Method and system for providing validated, auditable, and immutable inputs to a smart contract
KR20190031989A (ko) * 2017-09-19 2019-03-27 주식회사 케이티 블록체인 기반의 전자 계약 처리 시스템 및 방법
KR20190058066A (ko) * 2017-11-21 2019-05-29 주식회사 케이티 상담데이터 관리 방법 및 장치
KR20190125683A (ko) * 2018-04-30 2019-11-07 김민규 블록체인을 기반으로 하는 계약 정보 또는 법률 정보의 위변조 검증 시스템 및 방법
KR101989902B1 (ko) 2018-11-23 2019-06-17 주식회사 에이티앤아이 블록체인을 이용한 문서생성 관리방법 및 이를 이용한 기록관리 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160371509A1 (en) * 2013-07-06 2016-12-22 Newvoicemedia, Ltd. System and methods for tamper proof interaction recording and timestamping
KR101952498B1 (ko) 2017-04-05 2019-02-27 주식회사 케이뱅크은행 블록 체인을 이용한 대출 서비스 제공 방법 및 이를 실행하는 시스템
US20180336515A1 (en) 2017-05-19 2018-11-22 Zest Labs, Inc. Process and condition recording and validation using a blockchain
KR101890280B1 (ko) 2018-01-16 2018-09-28 주식회사 아이디엔소프트 앱 기반의 금융상품정보 통합 제공시스템
KR102032220B1 (ko) * 2018-09-13 2019-11-08 주식회사 통블록 블록체인 기반의 데이터 거래 시스템 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
김인근 등, "계약 관련 음성 녹취 정보의 신뢰성 있는 저장을 위한 블록체인 기반 시스템 구성 방식", 2019 한국 인공지능/블록체인 학회 공동 학술대회, 2019.11.07 1부.*

Also Published As

Publication number Publication date
WO2021101096A1 (ko) 2021-05-27
US20220415329A1 (en) 2022-12-29
KR20210060224A (ko) 2021-05-26

Similar Documents

Publication Publication Date Title
CN107038220B (zh) 用于生成备忘录的方法、智能机器人及系统
US9245523B2 (en) Method and apparatus for expansion of search queries on large vocabulary continuous speech recognition transcripts
US8706486B1 (en) Voice data leakage detection and prevention systems
Han et al. Voice-indistinguishability: Protecting voiceprint in privacy-preserving speech data release
CN109918668B (zh) 基于区块链的信用信息管理方法、装置、设备及存储介质
US20140207442A1 (en) Protection of Private Information in a Client/Server Automatic Speech Recognition System
US9947320B2 (en) Script compliance in spoken documents based on number of words between key terms
CN110688151B (zh) 一种面向以太坊Solidity智能合约的安全翻译与解析方法
CN111883140A (zh) 基于知识图谱和声纹识别的认证方法、装置、设备及介质
Zhang et al. A retrieval algorithm of encrypted speech based on short-term cross-correlation and perceptual hashing
CA2809021C (en) Systems and methods for lexicon generation
CN114938679A (zh) 文本到语音模型和个性化模型生成的话音的受控训练和使用
KR101887629B1 (ko) 자연어기반 정보공개분류시스템
KR102307249B1 (ko) 블록체인을 기반으로 한 음성 녹취 정보 저장 시스템
CN110851797A (zh) 基于区块链的作品创作方法及装置、电子设备
US20090216533A1 (en) Stored phrase reutilization when testing speech recognition
Rajput et al. Spoken Web Search.
CN111563126B (zh) 一种基于区块链系统的数据处理方法、装置和电子设备
JP6067616B2 (ja) 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム
US20210319787A1 (en) Hindrance speech portion detection using time stamps
Nio et al. Conversation dialog corpora from television and movie scripts
Portêlo et al. Privacy-preserving query-by-example speech search
CN117009319B (zh) 基于大语言模型的数据库操作方法、系统及存储介质
Hu et al. A novel hashing-inverted index for secure content-based retrieval with massive encrypted speeches
US11429681B2 (en) System for performing multi-level conversational and contextual voice based search

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right