KR20160129787A - 디지털 녹취 파일 녹취록 생성 방법 - Google Patents

디지털 녹취 파일 녹취록 생성 방법 Download PDF

Info

Publication number
KR20160129787A
KR20160129787A KR1020160066947A KR20160066947A KR20160129787A KR 20160129787 A KR20160129787 A KR 20160129787A KR 1020160066947 A KR1020160066947 A KR 1020160066947A KR 20160066947 A KR20160066947 A KR 20160066947A KR 20160129787 A KR20160129787 A KR 20160129787A
Authority
KR
South Korea
Prior art keywords
voice
text
digital
transcription
display unit
Prior art date
Application number
KR1020160066947A
Other languages
English (en)
Other versions
KR101727587B1 (ko
Inventor
이중
변준석
박남인
Original Assignee
대한민국(관리부서: 행정자치부 국립과학수사연구원장)
대한민국(관리부서: 행정자치부 국립과학수사연구원장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(관리부서: 행정자치부 국립과학수사연구원장), 대한민국(관리부서: 행정자치부 국립과학수사연구원장) filed Critical 대한민국(관리부서: 행정자치부 국립과학수사연구원장)
Priority to KR1020160066947A priority Critical patent/KR101727587B1/ko
Publication of KR20160129787A publication Critical patent/KR20160129787A/ko
Application granted granted Critical
Publication of KR101727587B1 publication Critical patent/KR101727587B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F17/30769
    • G06F17/30784
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

본 발명은 제어부와, 상기 제어부에 연결된 저장부와, 상기 제어부에 연결되며 사용자의 명령이 입력되는 수단이 되는 입력부와, 상기 제어부에 연결되며 음성이 입력되는 음성 입력부로 이루어지고, 상기 저장부에는 디지털 녹취 데이터 생성 프로그램과 전자지문(해쉬값) 생성 알고리즘이 저장되며; 입력부를 통하여 녹음 명령이 입력되면 음성 입력부를 통하여 입력된 음성이 디지털 파일로 저장부에 저장되는 무결성 디지털 녹취 파일 생성 시스템에서 실행되며; 디지털 녹취 데이터 생성 프로그램 실행 후 녹음 명령 입력 후 녹음 중 일시 정지 명령이 입력되면 임시 정지 명령 바로 앞에 저장된 디지털 음성 파일 데이터에 대한 전자지문이 생성되어 저장부에 저장되는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법에 관한 것이다.

Description

디지털 녹취 파일 녹취록 생성 방법{A Method Generating Transcripts Of Digital Recording File}
본 발명은 디지털 녹취 파일 녹취록 생성 방법에 관한 것으로, 보다 상세하게는 생성된 녹취 디지털 파일의 무결성이 확실하게 보장될 수 있으며, 녹취록 작성 효율이 증대되고 증거물로써의 효력을 향상되는 디지털 녹취 파일 녹취록 생성 방법에 관한 것이다.
현재 전용 디지털 녹음기를 통한 녹취, 스마트폰의 녹음 앱을 통한 녹취 등 다양한 녹취 방법이 존재하나, 녹취된 디지털 파일에 대한 위변조 방지 및 무결성을 담보할 수 있는 방법은 제공되지 않고 있다. 그리고 CCTV 디지털 녹화의 경우 프레임을 저장할 때 각 프레임에 대한 전자지문(해쉬값)을 저장하여 재생 중에 각 프레임의 전자지문(해쉬값)이 저장된 전자지문(해쉬값)과 상이할 경우 변조되었음을 확인하는 방법이 존재하나, 각 프레임에 대한 무결성만을 보증할 수 있으므로 전체 녹화된 디지털 파일의 무결성을 담보할 수 없는 문제점이 있었다.
기존의 녹취록 작성 과정은 사용자가 직접 녹음된 음성을 청취하면서 문자화하는 방식(수동적 녹취록 작성법)이 대부분이다. 이는 녹음된 음성 파일의 용량에 따라 작업 속도가 현저히 낮고 녹취자의 피로도(fatigue)를 증가시킨다. 또한, PC로 작성된 녹취록 파일을 인쇄한 형태로 제공하기 때문에, 제3자에 의해서 문서 편집 조작의 확률이 높다.
도 1은 종래 기술에 의한 디지털 음성 파일 재생 및 녹취록 작성 프로그램의 실행 화면(UI)을 도시한 것이다.
기존 PC 기반 녹취 프로그램은 녹음된 파일을 PC로 녹음된 디지털 파일을 읽어 온 다음, 실시간으로 재생과 동시에 하단에 위치한 쓰기 박스를 구비하도록 하여 재생되는 음성을 사용자가 TEXT 입력하도록 한 것이다. 도 1에 도시된 바와 같이, 녹취록 작성 프로그램의 실행 화면(1, UI)에는 쓰기 박스인 TEXT 입력부(10)가 구비된다. 음성 재생 프로그램 및 쓰기 박스는 종래 기술로서 이에 대한 상세한 설명은 생략한다.
상기와 같은 녹취록 작성 프로그램은 수동적 녹취록 작성 방법에 비해, 녹음기와 문서 편집 기능을 하나로 통합한 솔루션을 제공하여, 녹취록 작성시 청취 및 작성 효율을 향상시켰지만, 여전히 사용이 불편한 문제점이 있었다.
대한민국 특허 제10-0462882호 등록특허공보 대한민국 특허 제10-0851654호 등록특허공보
본 발명은 상기와 같은 종래 기술이 가지는 문제점을 해결하기 위하여 제안된 것으로, 디지털 음성 파일의 무결성을 담보하고, 녹취록을 용이하게 생성할 수 있는 디지털 녹취 파일 녹취록 생성 방법을 제공하는 것을 목적으로 한다.
상기와 같은 목적을 이루기 위하여 본 발명은 제어부와, 상기 제어부에 연결된 저장부와, 상기 제어부에 연결되며 사용자의 명령이 입력되는 수단이 되는 입력부와, 상기 제어부에 연결되며 음성이 입력되는 음성 입력부로 이루어지고, 상기 저장부에는 디지털 녹취 데이터 생성 프로그램과 전자지문(해쉬값) 생성 알고리즘이 저장되며; 입력부를 통하여 녹음 명령이 입력되면 음성 입력부를 통하여 입력된 음성이 디지털 파일로 저장부에 저장되는 무결성 디지털 녹취 파일 생성 시스템에서 실행되며; 디지털 녹취 데이터 생성 프로그램 실행 후 녹음 명령 입력 후 녹음 중 일시 정지 명령이 입력되면 임시 정지 명령 바로 앞에 저장된 디지털 음성 파일 데이터에 대한 전자지문이 생성되어 저장부에 저장되는 무결성 디지털 녹취 파일 생성 방법을 제공한다.
상기에서, 일시 정지 명령이 2회 이상 입력되면, 1회 일시 정지 명령에서는 일시 정지 명령 바로 앞에 저장된 디지털 음성 파일 데이터에 전자지문(해쉬값)이 생성되어 저장부에 저장되며; 2번째부터의 일시 정지 명령이 입력되면 일시 정지 명령 바로 앞에서 저장된 디지털 음성 파일 데이터와 바로 앞 일시 정지 명령 때 생성된 전자지문(해쉬값)에 대한 전자지문(해쉬값)이 생성되어 저장부에 저장되는 것을 특징으로 한다.
상기에서, 녹음 완료 명령인 정지 명령 입력되면, 정지 명령 바로 앞의 디지털 음성 파일 데이터와 바로 앞 일시 정지 명령 때 생성된 전자지문(해쉬값)에 대한 전자지문(해쉬값)이 생성되어 저장부에 저장되는 것을 특징으로 한다.
한편, 본 발명은 제어부(마이컴)와, 제어부에 연결되며 디지털 음성 데이터와 녹취록 생성 프로그램과 음성인식 프로그램이 저장된 저장부, 제어부에 연결되며 녹취록 생성 프로그램 UI가 디스플레이되는 표시부, 제어부에 연결되며 사용자의 명령이 입력되는 입력부와, 제어부에 연결되며 저장부에 저장된 디지털 음성 데이터가 재생되는 음성 재생부로 이루어지는 녹취록 작성 시스템에서 실행되며; 사용자의 명령에 의하여 녹취 프로그램이 실행되고 저장부에 저장된 디지털 음성 데이터가 선택되면 디지털 음성 데이터를 이루는 음성의 VAD 구간이 추출되는 음성 VAD 구간 추출 단계와, 음성인식 프로그램의 실행에 의하여 VAD 구간이 추출된 각 음성 단위에 대한 음성 TEXT가 추출되어 저장부에 저장되는 TEXT 변환 단계로 이루어지며; 음성 녹취록 작성 후 재생 시 음성 단위의 파형과 함께 해당 음성 텍스트가 표시부에 디스플레이되는 디지털 녹취 파일 녹취록 생성 방법을 제공한다.
상기에서, 녹취록 생성 프로그램이 실행되면 표시부에는 녹취록 생성 프로그램 UI가 디스플레이되며, 상기 녹취록 생성 프로그램 UI는 VAD 구간 추출된 음성 파형이 디스플레이되는 음성 파형 표시부와, 음성 파형 표시부에 디스플레이된 음성 파형에 대한 TEXT가 디스플레이되는 TEXT 표시부와, 선택된 디지털 음성 데이터에 대한 전체 녹취록 TEXT가 디스플레이되는 녹취록 표시부로 이루어지며; TEXT 입력으로 전체 녹취록으로부터 일치하는 TEXT가 검색되며; 검색된 TEXT는 인덱스와 함께 디스플레이되는 검색결과 표시부를 더 포함하는 것을 특징으로 한다.
상기에서, 녹취록 표시부에 디스플레이되는 녹취록 TEXT 중 검색된 TEXT와 일치하는 TEXT는 하이라이트로 표시되어 디스플레이되는 것을 특징으로 한다.
상기에서, 사용자가 검색결과 표시부에서 인덱스를 선택하면, 해당 음성 파형이 음성 파형 표시부에 디스플레이되고, 녹취록 표시부에 디스플레이되는 전체 녹취록에서도 해당 단어 위치로 이동하여 디스플레이되며, 음성 재생부에서 해당 음성이 재생되는 것을 특징으로 한다.
상기에서, 디지털 음성 데이터가 복수화자들의 음성으로 이루어진 경우 음성 VAD 구간 추출 단계 전에 화자 분리 단계가 더 포함되며; 녹취록 표시부에는 전체 녹취록 TEXT가 화자마다 구분되어 디스플레이되는 것을 특징으로 한다.
상기에서, 녹취록 생성 프로그램 UI는 전자지문(해쉬값)이 디스플레이되는 해쉬코드 표시부를 더 가지며; 상기 해쉬코드 표시부에는 검색된 TEXT와 해당 음성 파형 데이터로부터 생성된 전자지문(해쉬값)이 디스플레이되는 것을 특징으로 한다.
상기와 같은 본 발명에 의하면, 생성된 녹취 디지털 파일의 무결성이 확실하게 보장될 수 있으며, 녹취록 작성 효율이 증대되고 증거물로써의 효력을 향상할 수 있다.
도 1은 종래 기술에 의한 디지털 음성 파일 재생 및 녹취록 작성 프로그램의 실행 화면을 도시한 것이며,
도 2는 본 발명에 따르는 무결정성 디지털 파일 생성 방법을 예시적으로 도시한 것이며,
도 3은 본 발명에 따르는 무결정성 디지털 파일 생성 방법을 도시한 순서도이며,
도 4는 본 발명에 따라 생성된 무결정성 디지털 파일의 검증 순서도이며,
도 5는 본 발명에 따르는 디지털 파일 녹취록 생성 방법을 도시한 순서도이며,
도 6 및 도 7은 본 발명에 따르는 디지털 파일 녹취록 작성 프로그램의 실행 화면을 도시한 것이다.
이하에서 첨부된 도면을 참조하여 본 발명에 따르는 디지털 녹취 파일 녹취록 생성 방법에 대하여 상세하게 설명한다.
도 2는 본 발명에 따르는 무결정성 디지털 파일 생성 방법을 예시적으로 도시한 것이며, 도 3은 본 발명에 따르는 무결정성 디지털 파일 생성 방법을 도시한 순서도이며, 도 4는 본 발명에 따라 생성된 무결정성 디지털 파일의 검증 순서도이다.
본 발명에 따르는 무결정성 디지털 파일 생성 방법은 제어부와, 상기 제어부에 연결된 저장부와, 상기 제어부에 연결되며 사용자의 명령이 입력되는 수단이 되는 입력부와, 상기 제어부에 연결되며 음성이 입력되는 음성 입력부로 이루어지고, 상기 저장부에는 디지털 녹취 데이터 생성 프로그램과 전자지문(해쉬값) 생성 알고리즘이 저장되며, 입력부를 통하여 녹음 명령이 입력되면 음성 입력부를 통하여 입력된 음성이 디지털 파일로 저장부에 저장되는 무결성 디지털 녹취 파일 생성 시스템에서 실행된다. 상기 음성 입력부는 마이크와, 마이크의 아날로그 신호를 디지털 신호로 변환시키는 A/D 컨버터로 이루어져 음성 입력부로 입력되는 음성 신호는 디지털 데이터로 변환되어 저장부에 저장된다. 저장부는 PC의 저장부와 같은 기능을 하는 것으로 이에 대한 상세한 설명은 생략한다. 상기 입력부는 버튼이나 터치 스크린으로 형성할 수 있다. 상기 무결성 디지털 녹취 파일 생성 시스템의 예로 PC나 스마트폰을 들 수 있다.
도 2 및 도 3에 도시된 바와 같이, 디지털 녹취 데이터 생성 프로그램이 실행되고 입력부를 통하여 녹음 명령이 입력되면(ST-310) 음성 입력부를 통하여 입력된 음성이 디지털 파일로 저장부에 저장되며; 입력부의 녹음 명령 입력부(R1)를 작동하여 녹음 명령을 입력하면 녹음이 진행된다(ST-320). 녹음 중 일시 정지 명령 입력부(P1)를 작동하여 일시 정지 명령이 입력되면(ST-330), 전자지문(해쉬값) 생성 알고리즘에 의하여 일시 정지 명령 바로 앞에 저장된 디지털 음성 파일 데이터(D1)에 대한 전자지문(해쉬값, H1)이 생성되어(ST-340) 저장부에 저장된다. 전자지문(해쉬값, H1)은 일시 정지 명령 바로 앞에 저장된 디지털 음성 파일 데이터(D1)의 시간 및 구간 정보와 함께 저장부에 저장된다(ST-340). 일시 정지 명령이 해제하면 (ST-360) 녹음이 다시 진행된다. 도 2에서 도면부호 R2는 입력부를 이루는 일시 정지 명령 해제부를 도시한 것이다. 상기 일시 정지 명령 해제부(R2)는 별도로 구비되지 않고 정지 명령 입력부(P1)를 2번 작동시켜 일시 정지 명령이 해제되도록 하는 것도 가능하다.
그리고 녹음 완료 명령인 정지 명령이 입력되면(ST-370) 녹음이 종료된다(ST-395). 정지 명령 바로 앞의 디지털 음성 파일 데이터와 일시 정지 명령 입력에 의하여 생성된 전자지문(해쉬값)에 대한 전자지문(해쉬값)이 전자지문(해쉬값) 생성 알고리즘에 의하여 생성되어(ST-380) 저장부에 저장된다. 정지 명령 바로 앞의 디지털 음성 파일 데이터는 일시 정지 명령 해제 후 정지 명령까지 녹음되어 저장된 디지털 음성 파일 데이터이다. 상기 전자지문(해쉬값)은 정지 명령 바로 앞의 디지털 음성 파일 데이터는 일시 정지 명령 해제 후 정지 명령까지 녹음되어 저장된 디지털 음성 파일 데이터의 시간 및 구간 정보와 함께 저장부에 저장된다(ST-390).
녹음 명령과 정지 명령 사이에 일시 정지 명령이 2회 이상 입력되면, 첫 번째 일시 정지 명령에서는 당해 일시 정지 명령 바로 앞에 저장된 디지털 음성 파일 데이터(D1)에 대한 전자지문(해쉬값, H1)이 생성되어 저장부에 저장된다. 이때 상기 디지털 음성 파일 데이터(D1)에 대한 시간 및 구간 정보도 함께 저장부에 저장된다. 2번째 일시 정지 명령이 입력되면 일시 정지 명령 바로 앞에서 저장된 디지털 음성 파일 데이터(D2)와 바로 앞 일시 정지 명령 때 생성된 전자지문(해쉬값, H1)에 대한 전자지문(해쉬값, H2)이 생성되어 저장부에 저장된다. 이때 상기 디지털 음성 파일 데이터(D2)에 대한 시간 및 구간 정보도 함께 저장부에 저장된다.
상기와 같이 본 발명 무결성 디지털 녹취 파일 생성 방법에서는 일시 정지 명령과 정지 명령이 입력되면 바로 앞 일시 정지 명령 후 당해 일시 정지 명령 또는 정지 명령까지의 디지털 음성 파일 데이터와, 바로 앞 일시 정지 명령 입력시 생성된 전자지문(해쉬값)이 함께 전자지문(해쉬값) 생성 알고리즘에 의하여 전자지문(해쉬값)으로 생성되어 저장부에 저장되는데 특징이 있다.
따라서, 디지털 음성 파일의 변조가 원천적으로 방지될 수 있다.
전자지문(해쉬값) 생성 알고리즘에 의하여 생성된 전자지문(해쉬값)은 디지털 음성 파일 데이터 형식을 손상시키지 않도록 하기 위하여 디지털 음성 파일의 마지막 부분에 사용자가 설정한 저장 영역에 별도로 저장될 수 있다.
상기와 같은 방법에 의하여 저장된 디지털 파일은 도 4에 도시된 바와 같이 검증될 수 있다. 디지털 녹취 데이터 재생 프로그램은 디지털 파일 생성 프로그램이 실행되는 무결성 디지털 녹취 파일 생성 시스템에서 실행된다.
도 4에 도시된 바와 같이, 디지털 녹취 데이터 재생 프로그램이 실행되어(ST-410) 저장부에 저장된 디지털 파일이 재생되면(ST-415), 저장부에 저장된 구간 정보에 따라(ST-420) 해당 구간의 디지털 파일 데이터에 대한 전자지문(해쉬값)이 생성되어(ST-425), 해당 디지털 파일 생성시 생성된 당해 구간에 대한 전자지문(해쉬값)과 비교되며(ST-430), 전자지문(해쉬값)이 일치하는 여부가 제어부에서 대비된다(ST-435). 전자지문(해쉬값)이 일치하는 경우 다음 구간의 재생이 계속된다. 전자지문(해쉬값)이 일치하지 않는 경우 당해 구간은 변조 구간으로 표시부에 표시되고(ST-445) 알림 메시지가 디스플레이된다(ST-450). 사용자의 선택에 따라 변조된 디지털 데이터로 판단하고 재생을 종료할 수도 있고, 나머지 구간을 재생할 수도 있다(ST-455). 상기에서 일시 정지 명령에 의하여 일시 정지되지 않은 디지털 파일인 경우 미검증으로 판단된다(ST-440).
2번째 구간에서는 첫 번째 구간과 2번째 구간 사이의 디지털 음성 파일 데이터와, 첫 번째 구간에서 생성된 전자지문(해쉬값)이 함께 전자지문(해쉬값) 생성 알고리즘에 의하여 전자지문(해쉬값)으로 생성되어 저장부에 저장된 2번째 전자지문(해쉬값)과 일치 여부가 비교된다.
상기와 같은 일시 정지 명령에 따라 누적된 전자지문(해쉬값)이 생성되고 대비됨으로써 디지털 파일의 변조가 원천적으로 방지될 수 있다.
도 5는 본 발명에 따르는 디지털 파일 녹취록 생성 방법을 도시한 순서도이며, 도 6 및 도 7은 본 발명에 따르는 디지털 파일 녹취록 작성 프로그램의 실행 화면을 도시한 것이다.
본 발명에 따르는 본 발명에 따르는 디지털 파일 녹취록 생성 방법은 제어부(마이컴)와, 제어부에 연결되며 디지털 음성 데이터와 녹취록 생성 프로그램과 음성인식 프로그램이 저장된 저장부, 제어부에 연결되며 녹취록 생성 프로그램 UI가 디스플레이되는 표시부, 제어부에 연결되며 사용자의 명령이 입력되는 입력부와, 제어부에 연결되며 저장부에 저장된 디지털 음성 데이터가 재생되는 음성 재생부로 이루어지는 녹취록 작성 시스템에서 실행된다. 녹취록 작성 시스템의 예로 PC를 들 수 있다. 저장부에 저장된 디지털 음성 데이터의 재생 방법은 종래 기술에 대한 것으로 설명을 생략한다.
본 발명에 따르는 디지털 파일 녹취록 생성 방법은 음성 VAD(VOICE ACTIVITY DETECTION) 구간 추출 단계(ST-120)와, VAD 구간이 추출된 각 음성 단위에 대한 음성이 TEXT로 변환되어 저장부에 저장되는 TEXT 변환 단계(ST-130)로 이루어진다. 저장부에 저장된 디지털 파일이 영상과 음성으로 이루어진 동영상 파일인 경우 먼저 디지털 파일로부터 음성 데이터가 추출된다(ST-110). 동영상 파일에서 음성 데이터가 추출되는 과정은 종래 기술이므로 설명을 생략한다. VAD 구간 추출 단계(ST-120)에서 음성의 시작과 끝은 음성의 에너지가 연산되어 추출된다.
본 발명에 따르는 디지털 파일 녹취록 생성 방법이 실행되는 녹취록 생성 프로그램을 실행시키면, 표시부에는 도 6에 도시한 바와 같은 활성창(UI)이 디스플레이된다. 도 6에 도시된 바와 같이 녹취록 생성 프로그램 UI는 VAD 구간 추출된 음성 파형이 디스플레이되는 음성 파형 표시부(125)와, 음성 파형 표시부에 디스플레이된 음성 파형에 대한 TEXT가 디스플레이되는 TEXT 표시부(130)와, 선택된 디지털 음성 데이터에 대한 전체 녹취록 TEXT가 디스플레이되는 녹취록 표시부(160)로 이루어진다. 저장부에 저장된 디지털 파일이 영상과 음성 데이터를 가지는 동영상 파일인 경우 동영상이 재생되어 디스플레이되는 동영상 재생 표시부(120)가 더 포함되며, 저장부에 저장된 디지털 파일을 불러오거나, 새로운 이름으로 저장하거나, TEXT 검색 등의 기능이 수행되도록 하는 메뉴들이 디스플레이되는 메뉴 표시부(110)를 가진다. 상기 음성 파형 표시부에는 재생되는 해당 VAD 구간 추출된 음성의 파형이 디스플레이된다.
도 6에서 도면부호 150은 TEXT 검색 메뉴에서 입력된 TEXT가 디스플레이되는 검색단어 표시부를 도시한 것이다. 사용자가 TEXT 검색 메뉴에서 검색하기 위한 TEXT를 입력하면, 저장부에 저장된 전체 녹취록 TEXT의 데이터 베이스에서 검색되고(ST-170) 매칭 포맷으로 디코딩되고(ST-180) 매칭된 검색 결과가 검색단어 표시부(150)에 디스플레이된다(ST-190). 검색단어 표시부(150)에는 전체 녹취록 TEXT 중 검색된 TEXT에 대한 인덱스가 함께 디스플레이된다(ST-190). 전체 녹취록 TEXT 중 검색된 TEXT가 복수개인 경우 일련번호가 함께 디스플레이된다. 사용자가 UI 상에서 일련번호를 선택하면, 선택 영역에 대한 입력신호가 제어부로 전달되고, 녹취록 표시부에는 전체 녹취록 TEXT 중 해당되는 TEXT 부분을 가지는 녹취록 부분이 디스플레이되며, 해당 TEXT는 하이라이트 표시되어 디스플레이될 수 있다.
사용자가 검색결과 표시부에서 인덱스를 선택하면, 해당 음성 파형이 음성 파형 표시부에 디스플레이되고, 녹취록 표시부에 디스플레이되는 전체 녹취록에서도 해당 단어 위치로 이동하여 디스플레이되며, 음성 재생부에서 해당 음성이 재생된다(ST-160).
디지털 음성 데이터가 복수 화자들의 음성으로 이루어진 경우 음성 VAD 구간 추출 단계 전에 화자 분리 단계가 더 포함되며, 도 7에 도시된 바와 같이 녹취록 표시부에는 전체 녹취록 TEXT가 화자마다 구분되어 디스플레이된다. 도 7에서 도면부호 170, 180. 190은 각 화자의 음성 TEXT가 분리되어 디스플레이되는 화자분리 표시부를 도시한 것이다.
상기 녹취록 생성 프로그램 UI는 전자지문(해쉬값)이 디스플레이되는 해쉬코드 표시부(140)를 더 가지며, 상기 해쉬코드 표시부(140)에는 검색된 TEXT와 해당 음성 파형 데이터로부터 생성된 전자지문(해쉬값)이 디스플레이된다.
100: 녹취록 생성 프로그램 UI
110: 메뉴 표시부 120: 동영상 재생 표시부
130: TEXT 표시부 140: 해쉬코드 표시부
150: 검색단어 표시부 160: 녹취록 표시부

Claims (6)

  1. 제어부(마이컴)와, 제어부에 연결되며 디지털 음성 데이터와 녹취록 생성 프로그램과 음성인식 프로그램이 저장된 저장부, 제어부에 연결되며 녹취록 생성 프로그램 UI가 디스플레이되는 표시부, 제어부에 연결되며 사용자의 명령이 입력되는 입력부와, 제어부에 연결되며 저장부에 저장된 디지털 음성 데이터가 재생되는 음성 재생부로 이루어지는 녹취록 작성 시스템에서 실행되며; 사용자의 명령에 의하여 녹취 프로그램이 실행되고 저장부에 저장된 디지털 음성 데이터가 선택되면 디지털 음성 데이터를 이루는 음성의 VAD 구간이 추출되는 음성 VAD 구간 추출 단계와, 음성인식 프로그램의 실행에 의하여 VAD 구간이 추출된 각 음성 단위에 대한 음성 TEXT가 추출되어 저장부에 저장되는 TEXT 변환 단계로 이루어지며; 음성 녹취록 작성 후 재생 시 음성 단위의 파형과 함께 해당 음성 텍스트가 표시부에 디스플레이되는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법.
  2. 제1 항에 있어서, 상기 녹취록 생성 프로그램이 실행되면 표시부에는 녹취록 생성 프로그램 UI가 디스플레이되며, 상기 녹취록 생성 프로그램 UI는 VAD 구간 추출된 음성 파형이 디스플레이되는 음성 파형 표시부와, 음성 파형 표시부에 디스플레이된 음성 파형에 대한 TEXT가 디스플레이되는 TEXT 표시부와, 선택된 디지털 음성 데이터에 대한 전체 녹취록 TEXT가 디스플레이되는 녹취록 표시부로 이루어지며; TEXT 입력으로 전체 녹취록으로부터 일치하는 TEXT가 검색되며; 검색된 TEXT는 인덱스와 함께 디스플레이되는 검색결과 표시부를 더 포함하는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법.
  3. 제2 항에 있어서, 상기 녹취록 표시부에 디스플레이되는 녹취록 TEXT 중 검색된 TEXT와 일치하는 TEXT는 하이라이트로 표시되어 디스플레이되는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법.
  4. 제2 항 또는 제3 항에 있어서, 사용자가 검색결과 표시부에서 인덱스를 선택하면, 해당 음성 파형이 음성 파형 표시부에 디스플레이되고, 녹취록 표시부에 디스플레이되는 전체 녹취록에서도 해당 단어 위치로 이동하여 디스플레이되며, 음성 재생부에서 해당 음성이 재생되는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법.
  5. 제4 항에 있어서, 디지털 음성 데이터가 복수화자들의 음성으로 이루어진 경우 음성 VAD 구간 추출 단계 전에 화자 분리 단계가 더 포함되며; 녹취록 표시부에는 전체 녹취록 TEXT가 화자마다 구분되어 디스플레이되는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법.
  6. 제4 항에 있어서, 상기 녹취록 생성 프로그램 UI는 전자지문(해쉬값)이 디스플레이되는 해쉬코드 표시부를 더 가지며; 상기 해쉬코드 표시부에는 검색된 TEXT와 해당 음성 파형 데이터로부터 생성된 전자지문(해쉬값)이 디스플레이되는 것을 특징으로 하는 디지털 녹취 파일 녹취록 생성 방법.
KR1020160066947A 2016-05-31 2016-05-31 디지털 녹취 파일 녹취록 생성 방법 KR101727587B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160066947A KR101727587B1 (ko) 2016-05-31 2016-05-31 디지털 녹취 파일 녹취록 생성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160066947A KR101727587B1 (ko) 2016-05-31 2016-05-31 디지털 녹취 파일 녹취록 생성 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020150060789A Division KR101781353B1 (ko) 2015-04-29 2015-04-29 무결성 디지털 녹취 파일 생성 방법

Publications (2)

Publication Number Publication Date
KR20160129787A true KR20160129787A (ko) 2016-11-09
KR101727587B1 KR101727587B1 (ko) 2017-04-18

Family

ID=57529350

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160066947A KR101727587B1 (ko) 2016-05-31 2016-05-31 디지털 녹취 파일 녹취록 생성 방법

Country Status (1)

Country Link
KR (1) KR101727587B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101965575B1 (ko) * 2017-11-03 2019-04-04 주식회사 셀바스에이아이 전자의무기록 서비스의 편집 인터페이스를 제공하는 방법 및 장치
CN111785271A (zh) * 2020-05-15 2020-10-16 深圳奥尼电子股份有限公司 语音识别处理方法及系统、电子设备
CN111859890A (zh) * 2020-07-29 2020-10-30 济南市疾病预防控制中心 一种微生物实验室语音录入记录系统及方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102269123B1 (ko) 2020-11-30 2021-06-24 주식회사 케이에스컨버전스 비대면 녹취록 자동 생성 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100462882B1 (ko) 2002-04-22 2004-12-17 서울통신기술 주식회사 음성 녹취 기능이 구비된 디지털 전화기
KR100851654B1 (ko) 2006-11-27 2008-08-13 서울통신기술 주식회사 디지털 음성 녹취 방법 및 그 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100462882B1 (ko) 2002-04-22 2004-12-17 서울통신기술 주식회사 음성 녹취 기능이 구비된 디지털 전화기
KR100851654B1 (ko) 2006-11-27 2008-08-13 서울통신기술 주식회사 디지털 음성 녹취 방법 및 그 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101965575B1 (ko) * 2017-11-03 2019-04-04 주식회사 셀바스에이아이 전자의무기록 서비스의 편집 인터페이스를 제공하는 방법 및 장치
CN111785271A (zh) * 2020-05-15 2020-10-16 深圳奥尼电子股份有限公司 语音识别处理方法及系统、电子设备
CN111859890A (zh) * 2020-07-29 2020-10-30 济南市疾病预防控制中心 一种微生物实验室语音录入记录系统及方法
CN111859890B (zh) * 2020-07-29 2024-03-26 济南市疾病预防控制中心 一种微生物实验室语音录入记录系统及方法

Also Published As

Publication number Publication date
KR101727587B1 (ko) 2017-04-18

Similar Documents

Publication Publication Date Title
CN111526242B (zh) 音频处理方法、装置和电子设备
KR101727587B1 (ko) 디지털 녹취 파일 녹취록 생성 방법
KR101057559B1 (ko) 정보 기록 장치
JP6128146B2 (ja) 音声検索装置、音声検索方法及びプログラム
WO2014161282A1 (zh) 视频文件播放进度的调整方法及装置
CN106155470B (zh) 一种音频文件生成方法及装置
WO2016197708A1 (zh) 一种录音方法及终端
JP2013222347A (ja) 議事録生成装置及び議事録生成方法
JP4741406B2 (ja) ノンリニア編集装置およびそのプログラム
US20060224616A1 (en) Information processing device and method thereof
KR101877559B1 (ko) 모바일 단말기를 이용한 언어 자가학습 서비스 제공방법, 이를 실행하는 모바일 단말기 및 이를 실행하기 위한 애플리케이션을 저장하는 기록매체
US20140019132A1 (en) Information processing apparatus, information processing method, display control apparatus, and display control method
JP6641045B1 (ja) コンテンツ生成システム、及びコンテンツ生成方法
KR101781353B1 (ko) 무결성 디지털 녹취 파일 생성 방법
KR102036721B1 (ko) 녹음 음성에 대한 빠른 검색을 지원하는 단말 장치 및 그 동작 방법
US20050016364A1 (en) Information playback apparatus, information playback method, and computer readable medium therefor
JP2018151533A (ja) 通信端末、通信プログラム及び通信方法
JP2009260718A (ja) 画像再生装置及び画像再生処理プログラム
JP2020064300A (ja) 備忘録作成システム、備忘録作成方法、および備忘録作成システムのログ管理サーバのプログラム
KR20160106239A (ko) 실시간 조율이 가능한 악보생성 어플리케이션을 구비한 모바일 단말기
JP2005352330A (ja) 音声分割記録装置
JP3944830B2 (ja) スピーチ近似データによる字幕用データ作成・編集支援システム
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
KR102274275B1 (ko) 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법
KR20150055921A (ko) 동영상 재생 제어 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant