KR101156934B1 - 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기 - Google Patents
키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기 Download PDFInfo
- Publication number
- KR101156934B1 KR101156934B1 KR1020090094397A KR20090094397A KR101156934B1 KR 101156934 B1 KR101156934 B1 KR 101156934B1 KR 1020090094397 A KR1020090094397 A KR 1020090094397A KR 20090094397 A KR20090094397 A KR 20090094397A KR 101156934 B1 KR101156934 B1 KR 101156934B1
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- recording
- word
- file
- recording file
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 114
- 239000000284 extract Substances 0.000 claims description 16
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- ONTQJDKFANPPKK-UHFFFAOYSA-L chembl3185981 Chemical compound [Na+].[Na+].CC1=CC(C)=C(S([O-])(=O)=O)C=C1N=NC1=CC(S([O-])(=O)=O)=C(C=CC=C2)C2=C1O ONTQJDKFANPPKK-UHFFFAOYSA-L 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- STZCRXQWRGQSJD-UHFFFAOYSA-N sodium;4-[[4-(dimethylamino)phenyl]diazenyl]benzenesulfonic acid Chemical compound [Na+].C1=CC(N(C)C)=CC=C1N=NC1=CC=C(S(O)(=O)=O)C=C1 STZCRXQWRGQSJD-UHFFFAOYSA-N 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/036—Insert-editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기에 관한 것으로서, 휴대기기를 통해 녹음을 하는 경우 자주 반복되는 단어를 키워드로 자동 저장하여 녹음파일을 생성하고 녹음파일의 재생 시 키워드를 시각적으로 표시하여 녹음내용의 검색 등에 키워드를 활용할 수 있도록 한다. 본 발명에 따른 녹음파일 생성 방법은, 녹음기능이 실행되면 녹음파일을 생성하고 마이크와 오디오 처리부로부터 음성 데이터를 수신하여 녹음파일 안에 삽입하며, 키워드 생성기능이 실행되면 음성 데이터로부터 단어를 추출하고 추출된 단어 중에서 키워드 선정기준에 따라 키워드를 선정하여 녹음파일 안에 삽입한다. 본 발명에 따른 녹음파일 재생 방법은, 녹음재생기능이 실행되면 녹음파일로부터 음성 데이터를 추출하여 오디오 처리부와 스피커를 통해 출력하고, 녹음파일로부터 키워드를 추출하여 키워드 표시방식에 따라 키워드를 표시한 후, 특정 키워드가 선택되면 해당 녹음시점으로 이동한다.
휴대기기, 녹음, 키워드, 음성 데이터, 발생빈도, 화자
Description
본 발명은 휴대기기를 이용한 녹음 기술에 관한 것으로서, 좀더 구체적으로는 휴대기기를 통해 녹음을 하는 경우 자주 반복되는 단어를 키워드로 자동 저장하여 녹음파일을 생성하고 녹음파일의 재생 시 키워드를 시각적으로 표시하여 녹음내용의 검색 등에 키워드를 활용할 수 있도록 하는 기술에 관한 것이다.
정보통신 기술의 발전에 따라 휴대폰이 상용화된 지는 이미 오래되었으며, 근래에는 MP3 플레이어, PMP(Portable Multimedia Player) 등 다양한 유형의 휴대용 멀티미디어 기기도 젊은 사용자 층을 중심으로 보편화되어 있다. 일반적으로 이러한 휴대기기는 언제 어디서나 간편하게 음성을 녹음하여 녹음파일을 생성하는 녹음기능을 제공하고 있다.
그런데 단순히 음성만 녹음된 녹음파일은 재생 중 사용자가 내용 검색을 원할 경우 빨리 감기 등의 기본적인 기능을 통해서만 검색이 가능하다. 따라서 녹음파일의 전체 내용을 직접 들어보지 않고서는 어떤 내용이 어느 시간대에 녹음되어 있는지 알 수 없으므로, 사용자가 원하는 부분을 빠르게 찾아서 해당 시간대로 곧바로 이동하는 것이 불가능하다.
이와 같이 종래의 녹음기능은 검색이 매우 불편하고 효율적인 검색이 어렵다는 단점이 있다. 이로 인해 녹음파일의 활용도가 떨어지는 문제점도 나타나고 있다. 그러므로 녹음파일의 검색 효율성과 활용도를 높이기 위한 방안이 필요하다.
따라서 본 발명의 목적은 전술한 종래기술의 문제점을 해결하기 위한 것으로, 휴대기기를 통해 녹음을 하는 경우 자주 반복되는 단어를 키워드로 자동 저장하여 녹음파일을 생성하고 녹음파일의 재생 시 키워드를 시각적으로 표시하여 녹음내용의 검색 등에 키워드를 활용할 수 있도록 함으로써 녹음파일의 검색 편리성과 효율성을 높이기 위한 것이다.
또한, 본 발명의 다른 목적은 화자 구분 없이 또는 화자별로 키워드를 선택적으로 저장할 수 있도록 하여 녹음파일의 검색 효율성 및 활용도를 높이기 위한 것이다.
이러한 목적을 달성하기 위하여, 본 발명에 따른 휴대기기는 오디오 처리부, 저장부, 제어부, 표시부를 포함하여 구성된다.
상기 오디오 처리부는 녹음기능이 실행되면 마이크를 통해 음성 데이터를 수신하고, 녹음재생기능이 실행되면 상기 음성 데이터를 스피커를 통해 출력한다. 상 기 저장부는 상기 음성 데이터를 포함하여 생성된 녹음파일, 키워드 선정기준, 키워드 표시방식을 저장한다. 상기 제어부는 상기 음성 데이터로부터 단어를 추출하고, 상기 추출된 단어 중에서 상기 키워드 선정기준에 따라 키워드를 선정하고, 상기 선정된 키워드를 상기 녹음파일 안에 삽입한다. 상기 표시부는 상기 키워드를 상기 키워드 표시방식에 따라 시각적 요소로 표시한다.
본 발명에 따른 휴대기기에 있어서, 상기 제어부는, 상기 녹음기능이 실행되면 활성화되어 상기 녹음파일을 생성하여 상기 저장부에 저장하는 녹음파일 생성기; 상기 녹음재생기능이 실행되면 활성화되어 상기 저장부로부터 상기 녹음파일을 추출하는 녹음파일 재생기; 상기 음성 데이터를 문자 데이터로 변환하는 음성-문자 변환기; 상기 변환된 문자 데이터로부터 상기 단어를 추출하는 단어 추출기; 상기 추출된 단어별로 발생빈도를 산출하고, 상기 추출된 단어 중에서 상기 키워드 선정기준에 따라 상기 키워드를 선정하는 키워드 선별기를 포함할 수 있다.
이 경우, 상기 제어부는 상기 음성 데이터를 분석하여 화자별 발언구간을 분할하는 음성 분석기를 더 포함할 수 있으며, 상기 단어 추출기는 상기 화자별 발언구간으로부터 화자별로 단어를 추출하고, 상기 키워드 선별기는 상기 화자별로 추출된 단어를 이용하여 상기 키워드를 화자별로 선정할 수 있다.
또한, 본 발명의 휴대기기에서, 상기 키워드 선정기준은, 상기 발생빈도가 정해진 임계치를 초과하는 단어를 상기 키워드로 선정하는 방식과, 정해진 개수만큼의 상기 키워드를 상기 발생빈도 순으로 선정하는 방식 중 적어도 하나를 포함할 수 있다.
또한, 상기 키워드 표시방식은, 상기 키워드들을 발생시간 순서 및 발생빈도 순서 중 적어도 하나에 따라 목록 형태로 보여주는 리스트 방식, 상기 녹음파일에 해당하는 진행막대를 시각적으로 보여주면서 상기 키워드들을 발생시간에 따라 상기 진행막대에 결부시켜 보여주는 책갈피 방식, 상기 키워드들을 자유롭게 분포시켜 시각적으로 보여주되 발생빈도에 따라 속성을 달리하여 보여주는 구름 방식 중 적어도 하나를 포함할 수 있다.
한편, 본 발명에 따른 휴대기기를 이용한 녹음파일 생성 방법은, 녹음기능이 실행되면 녹음파일을 생성하고 마이크와 오디오 처리부로부터 음성 데이터를 수신하여 상기 녹음파일 안에 삽입하는 단계; 키워드 생성기능이 실행되면 상기 음성 데이터로부터 단어를 추출하는 단계; 상기 추출된 단어 중에서 키워드 선정기준에 따라 키워드를 선정하는 단계; 및 상기 선정된 키워드를 상기 녹음파일 안에 삽입하는 단계를 포함하여 구성된다.
이러한 녹음파일 생성 방법에서, 상기 단어 추출 단계는 상기 음성 데이터를 문자 데이터로 변환하고 상기 변환된 문자 데이터로부터 상기 단어를 추출하는 단계일 수 있다.
이 경우, 상기 단어 추출 단계는, 상기 변환된 문자 데이터로부터 키워드 후보 단어를 직접 추출하는 방식과, 상기 변환된 문자 데이터로부터 무의미한 음절을 제거하는 방식 중 적어도 하나에 의해 수행될 수 있다.
또한, 녹음파일 생성 방법에서, 상기 단어 추출 단계는 상기 음성 데이터를 분석하여 화자별 발언구간을 분할하고 상기 화자별 발언구간으로부터 화자별로 상 기 단어를 추출하는 단계일 수 있다.
또한, 상기 키워드 선정 단계는 상기 추출된 단어별로 발생빈도를 산출하고 상기 발생빈도를 이용하여 상기 키워드 선정기준에 따라 상기 키워드를 선정하는 단계일 수 있다.
이 경우, 상기 키워드 선정기준은, 상기 발생빈도가 정해진 임계치를 초과하는 단어를 상기 키워드로 선정하는 방식과, 정해진 개수만큼의 상기 키워드를 상기 발생빈도 순으로 선정하는 방식 중 적어도 하나를 포함할 수 있다.
다른 한편, 본 발명에 따른 휴대기기를 이용한 녹음파일 재생 방법은, 녹음재생기능이 실행되면 녹음파일로부터 음성 데이터를 추출하여 오디오 처리부와 스피커를 통해 출력하는 단계; 상기 녹음파일로부터 키워드를 추출하여 키워드 표시방식에 따라 키워드를 표시하는 단계; 및 상기 키워드 중 특정 키워드가 선택되면 상기 선택된 키워드의 녹음시점으로 이동하는 단계를 포함하여 구성된다.
이러한 녹음파일 재생 방법에서, 상기 키워드 표시방식은, 상기 키워드들을 발생시간 순서 및 발생빈도 순서 중 적어도 하나에 따라 목록 형태로 보여주는 리스트 방식, 상기 녹음파일에 해당하는 진행막대를 시각적으로 보여주면서 상기 키워드들을 발생시간에 따라 상기 진행막대에 결부시켜 보여주는 책갈피 방식, 상기 키워드들을 자유롭게 분포시켜 시각적으로 보여주되 발생빈도에 따라 속성을 달리하여 보여주는 구름 방식 중 적어도 하나를 포함할 수 있다.
본 발명에 따르면, 휴대기기를 통해 녹음을 하는 경우 자주 반복되는 단어를 키워드로 자동 저장함으로써, 녹음내용을 검색할 때 키워드들을 활용할 수 있으므로 검색 편리성과 효율성을 높일 수 있는 이점이 있다.
또한, 본 발명은 화자 구분 없이 또는 화자별로 키워드들을 선택적으로 저장할 수 있으므로 녹음파일의 검색 효율성 및 활용도를 높일 수 있는 이점이 있다.
또한, 본 발명은 녹음파일의 재생 시 키워드들을 다양한 방식의 시각적 요소로 표시함으로써 사용상의 편리성과 활용도를 향상시킬 수 있다.
또한, 본 발명은 녹음내용의 검색뿐만 아니라 조회, 분류 등에도 키워드를 활용할 수 있다.
이하, 첨부 도면을 참조하여 본 발명의 실시예를 보다 상세하게 설명하고자 한다. 실시예를 설명함에 있어서 본 발명이 속하는 기술 분야에 잘 알려져 있고 본 발명과 직접적으로 관련이 없는 기술 내용에 대해서는 가급적 설명을 생략한다. 이는 불필요한 설명을 생략함으로써 본 발명의 핵심을 흐리지 않고 더욱 명확히 전달하기 위함이다. 한편, 첨부 도면을 통틀어 동일하거나 대응하는 구성요소에는 동일한 참조번호를 부여한다.
본 발명은 휴대기기를 이용해 녹음을 할 때 자주 반복되는 단어를 추출하고 이를 키워드로 자동 저장하여 녹음파일을 생성하는 기술에 관한 것이며, 또한 녹음파일을 재생할 때 키워드를 시각적으로 표시함으로써 녹음내용을 검색할 때 키워드를 활용할 수 있도록 하는 기술에 관한 것이다. 이렇게 함으로써 녹음파일에 대한 접근, 검색, 분류 등의 후속작업이 쉬어지고 녹음기능의 활용 폭이 넓어지게 된다.
본 발명에서 키워드 선정기준은 두 가지가 가능하다. 첫째는 발생빈도가 미리 정해진 임계치를 초과하는 경우를 키워드로 선정하는 것이고, 둘째는 미리 정해진 개수만큼의 키워드를 발생빈도 순으로 선정하는 것이다. 이러한 경우, 키워드 선정을 위한 임계치나 개수는 사용자가 직접 설정하거나 변경할 수 있도록 할 수 있다.
또한, 본 발명에서 키워드 선정대상은 다음 두 가지가 가능하다. 첫째는 화자(즉, 발언자) 구분 없이 전체 화자가 키워드 선정대상이 될 수 있고, 둘째는 화자분석을 통해 화자마다 독립적인 키워드 선정대상이 될 수도 있다. 키워드 선정대상은 사용자에 의해 선택이 가능하도록 할 수 있다.
또한, 본 발명에서 녹음파일 재생 시 키워드 표시방식은 다음 세 가지가 가능하다. 첫째는 리스트 방식으로, 선정된 키워드들을 발생시간 순서 및/또는 발생빈도 순서에 따라 목록 형태로 보여주는 방식이다. 둘째는 책갈피 방식으로, 전체 녹음파일에 해당하는 진행막대를 시각적으로 보여주면서 키워드들을 발생시간에 따라 진행막대에 결부시켜 보여주는 방식이다. 셋째는 구름 방식으로, 키워드들을 자유롭게 분포시켜 시각적으로 보여주되, 발생빈도에 따라 크기나 색상 등의 속성을 달리하여 보여주는 방식이다. 이러한 키워드 표시방식은 사용자 선택이 가능하도록 할 수 있고, 세 가지 방식 중 일부가 혼합하여 사용될 수도 있다.
먼저, 본 발명에 대한 이해를 돕기 위해, 키워드가 포함되어 생성된 녹음파일을 재생하는 경우의 사용자 인터페이스에 대하여 설명한다. 도 1은 본 발명에 따른 키워드가 삽입된 녹음파일의 재생 화면을 예시적으로 보여주는 도면이다. 휴대 기기 사용자가 휴대기기(100)를 통해 녹음을 완료한 후 키워드 생성 기능을 선택하면 키워드가 선정되어 녹음파일에 삽입된다. 도 1은 이와 같이 키워드가 삽입된 녹음파일을 재생하는 경우의 화면 예시이다. 그러나 도 1에 도시된 휴대기기의 화면 구성은 단지 설명을 위한 하나의 예일 뿐, 본 발명이 이러한 구성으로 한정되는 것은 아니다.
휴대기기의 표시부(160) 화면에는 하나 이상의 재생관련 항목들이 표시되는데, 예를 들어 재생 중임을 알려주는 문자 또는 기호(11), 재생 진행 정도를 알려주는 진행막대(12), 전체 녹음시간 및 현재 재생시각(13), 재생관련 제어버튼(14), 음량조절버튼(15), 재생 중인 녹음파일의 제목(18) 등이 표시된다. 녹음파일의 재생 중이 아니라 녹음 중이라면 이러한 재생관련 항목들은 녹음관련 항목들로 변경되어 표시될 수 있다.
표시부(160)에는 또한 키워드 리스트(16)가 표시될 수 있다. 전술한 바와 같이, 녹음파일 재생 시 키워드 표시방식은 리스트 방식, 책갈피 방식, 구름 방식이 있으며, 키워드 표시방식이 리스트 방식일 경우, 키워드 리스트(16)는 녹음파일에 포함된 키워드들을 보여준다. 키워드 리스트(16)는 다음 표 1에 예시된 것과 같이 발생시간 순서 및/또는 발생빈도 순서에 따라 나타난다. 표 1에서 키워드가 시간 순으로 표시되는 경우 키워드의 녹음시점이 함께 표시될 수도 있으며, 키워드가 빈도 순으로 표시되는 경우 키워드의 발생회수가 함께 표시될 수도 있다. 한편, 키워드가 화자별로 선정될 경우 키워드 리스트(16)는 표 2에 예시된 것과 같이 화자별 및 전체 키워드의 목록이 보여질 수 있다.
시간 순 | 빈도 순 |
우리나라 | 특허 |
재산권 | 발명 |
발명 | 우리나라 |
특허 | 재산권 |
발명 | |
특허 | |
특허 |
시간 순 | 빈도 순 | |
화자 A | 우리나라 | 특허 |
재산권 | 우리나라 | |
특허 | 재산권 | |
화자 B | 관심 | 발명 |
발명 | 관심 | |
발명 | ||
화자 C | 특허 | 특허 |
우리나라 | ||
특허 | ||
전체 | 우리나라 | 특허 |
재산권 | 발명 | |
관심 | 우리나라 |
키워드 리스트(16)에 키워드들이 발생시간 순으로 표시될 경우, 사용자가 원하는 키워드를 선택하면 해당 키워드가 발생한 특정 녹음시점에서 녹음파일의 재생이 시작된다. 예를 들어, 표 1에서 키워드 '특허'는 리스트의 4번째, 6번째, 7번째에 각각 나타나고 있는데, 그 발생시점(즉, 녹음시점)이 각각 7분 5초, 11분 23초, 13분 47초라 가정하자. 만일 리스트의 4번째에 나타난 '특허'를 선택하면, 7분 5초의 시점에서 재생이 시작되고, 7번째에 나타난 '특허'를 선택하면 13분 47초의 시점에서 재생이 시작된다. 즉, 동일한 키워드라도 어떤 시점의 키워드를 선택하느냐에 따라 재생 시작위치가 달라진다.
또한, 키워드들이 발생빈도 순으로 표시될 경우, 사용자가 원하는 키워드를 선택하면 해당 키워드가 발생한 녹음시점들에서 순차적으로 녹음파일이 특정 시간만큼씩 재생된다. 표 1의 예에서 키워드 '특허'를 선택하면 '특허'라는 단어가 녹음된 7분 5초, 11분 23초, 13분 47초에서 각각 30초씩 순차적으로 재생된다. 또한, 재생 시작위치는 반드시 해당 키워드의 녹음시점으로 국한될 필요는 없고, 녹음시점의 일정 시간 전이 될 수도 있다. 예를 들어, 키워드의 녹음시점보다 5초 전부터 재생이 시작되도록 설정될 수 있다.
키워드 리스트(16)에서 시간 순으로 나열된 키워드는 녹음파일 중 현재 재생위치를 기준으로 변동하면서 표시될 수도 있다. 표 1의 예에서 리스트의 2번째와 3번째에 각각 나타난 '재산권'과 '발명'의 녹음시점이 각각 3분 35초, 4분 48초라 가정하고 현재 재생위치가 4분 10초라면, 키워드 리스트(16) 상에서는 아직 재생되지 않은 3번째 키워드 '발명'부터 표시된다. 다만, 이 경우 스크롤 바가 함께 표시되어 현재 재생위치보다 이전의 키워드도 찾아볼 수 있도록 하는 것이 바람직하다. 또한, 표 2의 화자별 키워드 리스트는 화자별로 키워드들의 펼침/숨김 기능이 부여될 수도 있다.
한편, 키워드 표시방식이 책갈피 방식일 경우, 키워드들은 책갈피(17) 형태로 진행막대(12)에 연결되어 표시된다. 책갈피 방식은 전술한 리스트 방식에서 키워드들이 발생시간 순으로 리스트(16)에 나열되는 것과 내용상 동일하지만, 그 표시형식이 달라진 것이다. 키워드 책갈피(17)는 전체 녹음파일 중에서 키워드가 발생한 위치를 시각적으로 확인할 수 있으며, 사용자가 특정 책갈피를 선택하면 해당 녹음시점에서 녹음파일이 재생된다. 키워드 책갈피(17)는 다양한 유형의 시각적 요소로 구현될 수 있으며, 숨김 기능이 부여되어 입력수단의 근접이나 선택에 의해 표시되도록 할 수도 있다.
아울러, 도 1에 예시된 것처럼, 키워드 표시방식으로 리스트 방식과 책갈피 방식을 함께 사용할 수도 있다. 이 경우, 키워드 리스트(16)에서 특정 키워드를 선택하면 선택된 키워드에 해당하는 책갈피(17)들만 진행막대(12)에 표시되도록 할 수도 있다. 예를 들어, 표 1과 같은 키워드 리스트(16)에서 키워드 '발명'을 선택하면, 진행막대(12)에는 '발명'에 해당하는 책갈피(17)들만 나타나는 식이다.
한편, 도 2는 본 발명에 따른 녹음파일 재생 시 키워드 표시방식 중 하나인 구름 방식의 예시 도면이다. 도 2를 참조하면, 키워드들은 표시부의 특정 표시영역(19)에 구름처럼 분포하여 불규칙적으로 표시될 수 있다. 구름 방식은 전술한 리스트 방식에서 키워드들이 발생빈도 순으로 리스트(16)에 나열되는 것과 내용상 동일하지만, 그 표시형식이 달라진 것이다. 이 경우, 키워드들은 발생빈도에 따라 글자 크기와 굵기, 색상 등의 속성이 다르게 부여되어 표시될 수 있다. 즉, 발생빈도가 클수록 글자 크기와 굵기가 크게 표시되도록 설정될 수 있다. 다음 표 3은 구름 방식에서 발생빈도와 표시속성 간의 대응관계를 나타낸 예이다. 한편, 구름 방식은 전술한 리스트 방식 또는 책갈피 방식과 함께 사용될 수 있다.
발생빈도(1분당) | 글자 크기 | 글자 굵기 | 글자 색상 |
5회 이상 | 16 | 2.5 | 빨강 |
4회~5회 | 14 | 2.0 | 주황 |
3회~4회 | 12 | 1.5 | 자주 |
2회~3회 | 10 | 1.0 | 파랑 |
이상의 설명은 키워드가 삽입된 녹음파일을 재생하는 경우에 키워드가 어떤 형식으로 표시되고 어떻게 활용될 수 있는지에 대한 것이다. 전술한 키워드 선정기준, 선정대상, 표시방식은 사용자에게 메뉴 형식으로 제공되어 사용자가 선택하도록 할 수도 있다. 이 밖에도, 녹음파일을 재생하기 전에 키워드를 먼저 조회하거나 입력하여 녹음파일을 재생할 수도 있고, 키워드를 활용해 다수의 녹음파일들을 분류할 수도 있다. 또 한편, 재생하기 위한 녹음파일을 선택할 때에도 키워드가 개별 녹음파일들과 함께 표시되도록 함으로써, 녹음파일 재생 전에도 키워드들을 미리 확인할 수 있도록 할 수 있다.
이하, 도 3을 참조하여 본 발명에 따른 휴대기기를 설명한다. 도 3은 본 발명의 실시예에 따른 휴대기기의 구성을 나타내는 블록도이다.
도 3을 참조하면, 휴대기기(100)는 마이크(110), 스피커(120), 오디오 처리부(130), 저장부(140), 키입력부(150), 표시부(160), 제어부(170)를 포함하여 구성된다. 특히, 제어부(170)는 녹음파일 생성기(171), 녹음파일 재생기(172), 음성 분석기(173), 음성-문자 변환기(174), 단어 추출기(175), 키워드 선별기(176)를 포함하며, 저장부(140)는 녹음파일(142) 및 키워드 규칙 DB(148)를 저장한다. 녹음파일(142)은 음성 데이터(144)와 키워드(146)를 포함한다.
마이크(110)는 주변의 음성 데이터를 수집하여 오디오 처리부(130)로 보내고, 오디오 처리부(130)는 마이크(110)로부터 수신된 아날로그 신호 형태의 음성 데이터를 디지털 음성신호로 변환하여 제어부(170)로 출력한다. 또한, 오디오 처리부(130)는 제어부(170)로부터 입력된 디지털 음성신호를 아날로그 신호로 변환하여 스피커(120)를 통해 출력한다. 특히, 본 발명에서 오디오 처리부(130)는 녹음기능이 실행될 때 마이크(110)로부터 음성 데이터를 수신하여 처리하고 제어부(170)의 녹음파일 생성기(171)로 전달한다. 또한, 오디오 처리부(130)는 재생기능이 실행될 때 제어부(170)의 녹음파일 재생기(172)로부터 음성 데이터를 수신하여 처리하고 스피커(120)를 통해 출력한다.
저장부(140)는 휴대기기(100)의 기능과 관련된 각종 프로그램과 어플리케이션을 저장하며, 기능 수행에 필요한 데이터 및 기능 수행 중에 발생하는 데이터를 저장한다. 저장부(140)는 데이터를 일시 저장하는 하나 이상의 버퍼를 포함할 수 있으며, 별도의 외부저장매체를 더 포함할 수도 있다. 특히, 본 발명에서 저장부(140)는 녹음파일(142)과 키워드 규칙 DB(148)를 저장한다. 녹음파일(142)은 녹음기능이 수행되면 녹음파일 생성기(171)에 의해 생성되며, 음성 데이터(144)와 키워드(146)를 포함한다. 키워드(146)는 녹음파일(142)의 태그 영역에 삽입될 수 있으나, 반드시 이에 한정되는 것은 아니다. 키워드 규칙 DB(148)는 키워드 선정을 위한 선정기준, 선정대상, 표시방법과 관련된 규칙들을 포함한다. 또한, 키워드 규칙 DB(148)는 단어 추출 방식 및 관련 데이터를 포함할 수 있다. 이들에 대해서는 뒤에서 구체적으로 설명한다.
키입력부(150)는 사용자의 입력에 따라 해당 입력신호를 생성하여 제어부(170)로 전달한다. 키입력부(150)는 통상적인 키패드 외에 터치패드, 휠 키 등의 다양한 포인팅 입력장치들이 사용될 수 있고, 터치스크린의 형태로 구현될 수도 있다. 특히, 본 발명에서 키입력부(150)는 녹음 또는 재생 기능의 실행, 녹음완료, 키워드 생성, 화자별 키워드 생성, 키워드 규칙 설정 및 변경 등에 대한 사용자 입력을 수신하고 그 신호를 생성할 수 있다.
표시부(160)는 제어부(170)의 제어 하에 휴대기기(100)의 각종 메뉴를 비롯하여 사용자가 입력한 정보 또는 사용자에게 제공하는 정보를 표시한다. 표시부(160)는 터치스크린의 형태로 구현되어 전술한 키입력부(150)의 기능을 수행할 수도 있다. 특히, 본 발명에서 표시부(160)는 녹음기능 실행 중과 재생 중에 녹음/재생관련 항목들을 표시하며, 녹음파일(142) 안에 삽입된 키워드(146)를 표시방식에 따라 여러 시각적 요소로 표시한다.
제어부(170)는 휴대기기(100)에 대한 전반적인 제어 기능을 수행한다. 특히, 본 발명의 제어부(170)는 녹음파일 생성기(171), 녹음파일 재생기(172), 음성 분석기(173), 음성-문자 변환기(174), 단어 추출기(175), 키워드 선별기(176)를 포함하며, 이들은 소프트웨어의 형태로 구현되어 저장부(140)에 저장될 수 있고, 녹음기능, 키워드 생성기능, 녹음재생기능이 실행될 때 제어부(170)에 의해 선택적으로 활성화될 수 있다.
녹음파일 생성기(171)는 녹음기능이 실행되면 활성화되고, 녹음파일(142)을 생성하여 저장부(140)에 저장한다. 또한, 녹음파일 생성기(171)는 마이크(110)와 오디오 처리부(130)를 통해 음성 데이터(144)를 수신하고 이를 녹음파일(142) 안에 삽입한다. 한편, 녹음파일 생성기(171)는 음성 파일 형태의 녹음파일(142) 대신에, 후술할 음성-문자 변환기(174)를 통해 변환된 문자 데이터를 이용하여 텍스트 파일 형태의 녹음파일을 저장할 수도 있다.
녹음파일 재생기(172)는 재생기능이 실행되면 활성화되고, 저장부(140)로부터 특정 녹음파일(142)을 추출한다. 또한, 녹음파일 재생기(172)는 녹음파일(142) 안의 음성 데이터(144)를 추출하여 오디오 처리부(130)와 스피커(120)를 통해 출력하며, 녹음파일(142) 안의 키워드(146)를 추출하여 표시부(160)를 통해 출력한다.
음성 분석기(173)는 키워드 선정대상이 화자별인 경우 키워드 생성기능이 실행되면 활성화되고, 녹음파일(142)의 음성 데이터(144)를 분석하여 화자별 발언구간을 분할한다. 화자별 구간 분할을 위한 음성 데이터 분석은 공지기술인 음성 데이터(144)의 파형분석을 통해 수행할 수 있다.
음성-문자 변환기(174)는 키워드 생성기능이 실행되면 활성화되고, 음성-문자 변환 기술을 이용하여 녹음파일(142)의 음성 데이터(144)를 문자 데이터로 변환한다. 음성-문자 변환기(174) 및 음성-문자 변환 기술은 공지기술이므로 설명을 생략한다.
단어 추출기(175)는 키워드 생성기능이 실행되면 활성화되고, 변환된 문자 데이터로부터 키워드 선정을 위한 단어를 추출한다. 단어 추출은 문자 데이터로부터 의미 있는 단어만을 추려내는 것으로, 문자 데이터로부터 키워드 후보 단어를 직접 추출하는 방식과, 문자 데이터로부터 무의미한 음절을 제거하는 방식이 모두 가능하다. 이에 대해서는 뒤에서 다시 설명할 것이다.
키워드 선별기(176)는 키워드 생성기능이 실행되면 활성화되고, 추출된 단어별로 발생빈도를 산출한 후, 미리 설정된 키워드 선정기준에 따라 키워드를 선별한다. 이에 대해서도 뒤에서 다시 구체적으로 설명한다.이하, 본 발명의 휴대기기를 이용한 녹음파일 생성 방법을 설명한다. 이하의 설명으로부터, 전술한 휴대기기(100)의 구성과 작용 또한 보다 명료해질 것이다. 도 4는 본 발명의 실시예에 따른 휴대기기를 이용한 녹음파일 생성 방법을 나타내는 흐름도이다.
도 3과 도 4를 참조하면, 먼저 사용자 선택에 의해 휴대기기(100)의 녹음기능이 실행된다(S11 단계). 즉, 사용자가 키입력부(150)를 통해 녹음기능을 선택하면, 제어부(170)는 키입력부(150)로부터 사용자의 선택신호를 수신하고 녹음파일 생성기(171)를 활성화시킨다.
활성화된 녹음파일 생성기(171)는 녹음파일(142)를 생성하여 저장부(140)에 저장하고(S12 단계), 마이크(110)와 오디오 처리부(130)를 통해 음성 데이터(144)를 수신하여 녹음파일(142) 안에 삽입한다(S13 단계). 이 단계에서 제어부(170)는 녹음진행 상황 등을 사용자에게 알리기 위해 표시부(160)를 통해 녹음관련 항목들을 표시할 수 있다.
한편, 다른 실시예에서, 녹음파일 생성기(171)는 생성된 녹음파일(142)과 녹음 중 수신되는 음성 데이터(144)를 버퍼에 임시 저장하고, 녹음이 완료되면 사용자로부터 저장 여부를 확인한 뒤에 녹음파일(142)을 저장부(140)에 저장할 수도 있다. 또한, S13 단계에서 오디오 처리부(130)는 음성 주파수 대역 내의 음성 데이터만을 선택적으로 수신함으로써 음성 외의 잡음을 감소시킬 수 있다.
녹음기능이 실행되는 중에 키입력부(150)를 통해 사용자로부터 녹음완료 신호가 수신되면(S14 단계), 제어부(170)는 키워드 생성기능의 실행 여부를 확인한다(S15 단계). 이때, 키워드 생성기능은 녹음완료와 동시에 자동으로 설정되어 있을 수도 있고, 사용자 선택에 의존할 수도 있다. 따라서 제어부(170)는 S15 단계에서 먼저 키워드 자동생성기능이 설정되어 있는지 판단하고, 자동생성 기능이 설정되어 있지 않으면 키입력부(150)를 통해 사용자로부터 키워드 생성 명령이 수신되는지 판단할 수 있다. 그러나 이와 같이 두 번의 판단 단계로 이루어지는 S15 단계는 하나의 실시예일뿐, 반드시 이에 국한되는 것은 아니다. 다른 실시예에서 S15 단계는 키워드 자동생성 기능의 설정 여부를 확인하는 단계만으로 이루어질 수 있고, 또 다른 실시예에서 S15 단계는 사용자가 키워드 생성을 선택하는지 여부를 확인하는 단계만으로 이루어질 수도 있다.
키워드 생성기능이 실행되지 않았으면, 즉 키워드 자동생성 기능이 설정되지 않았고 일정 시간 동안 사용자에 의한 선택도 없으면, 제어부(170)는 S20 단계로 진행하여 통상적인 경우와 마찬가지로 바로 녹음파일을 저장한다.
만약 키워드 생성기능이 실행되면, 즉 키워드 자동생성 기능이 설정되어 있거나 일정 시간 내에 사용자로부터 키워드 생성 기능이 선택되면, 제어부(170)는 음성-문자 변환기(174)를 활성화하고, 음성-문자 변환기(174)는 공지의 음성-문자 변환 기술을 이용하여 녹음파일(142)의 음성 데이터(144)를 문자 데이터로 변환한다(S16 단계).
이어서, 키워드 생성기능의 실행에 따라 제어부(170)에 의해 활성화된 단어 추출기(175)는 음성-문자 변환기(174)가 변환한 문자 데이터로부터 키워드 선정을 위한 단어를 추출한다(S17 단계). 녹음파일(142)의 음성 데이터(144)는 음향 등의 비음성어를 비롯하여 발언자의 발언내용 전체를 그대로 포함하고 있기 때문에, 키워드 선정 작업을 위해서는 음성 데이터(144)가 변환된 문자 데이터로부터 의미 있는 단어만을 먼저 추려내는 것이 바람직하다.
단어 추출은 여러 가지 방식이 사용 가능하며, 키워드 규칙 DB(148)는 특정 추출 방식 및 관련 데이터를 미리 저장할 수 있다. 단어 추출의 한가지 방식은 문자 데이터로부터 키워드 후보 단어를 직접 추출하는 것이다. 이때, 키워드 후보 단어는 명사, 대명사 등의 특정 품사만으로 국한할 수도 있다. 이와 같이 키워드 후보 단어를 직접 추출하는 경우, 키워드 규칙 DB(148)는 후보 단어들에 대한 사전을 미리 저장하고 있다. 단어 추출의 다른 한가지 방식은 문자 데이터로부터 무의미한 음절을 제거하는 것이다. 예를 들어, 비음성어, 조사, 보조용언, 접미사, 어미 등이 무의미 음절에 해당한다. 이와 같이 무의미 음절을 제거하여 남게 되는 문자열을 단어로 추출할 수 있으며, 이 경우 키워드 규칙 DB(148)는 제거할 무의미 음절에 대한 사전 또는 규칙을 미리 저장하고 있다.
단어 추출 후, 제어부(170)의 키워드 선별기(176)는 추출된 단어별로 발생빈도를 산출한다(S18 단계). 키워드 선별기(176)도 키워드 생성기능이 실행되면 제어부(170)에 의해 활성화된다. 발생빈도란 해당 단어가 기준시간 내에 몇 번 발언되었는지를 나타낸다. 예를 들어, 전체 녹음시간이 55분이고 '특허'란 단어와 '발명'이란 단어가 각각 187회, 154회 발언되었다면, 1분당 발생빈도는 각각 '3.4', '2.8'이다.
이어서, 키워드 선별기(176)는 키워드 규칙 DB(148)에서 키워드 선정기준을 확인하고 그 기준에 따라 키워드를 선별한다(S19 단계). 만약 키워드 선정기준이 임계치인 경우, 키워드 선별기(176)는 발생빈도가 임계치를 초과하는 단어만을 키워드로 선정한다. 예를 들어 임계치가 '분당 3회'로 설정되어 있고 '특허'와 '발명'이란 단어의 분당 발생빈도가 각각 '3.4', '2.8'이라면, '특허'란 단어는 임계치를 초과하므로 키워드로 선정되지만, '발명'이란 단어는 임계치에 미치지 못하므로 키워드로 선정되지 않는다. 키워드 선정을 위한 임계치도 키워드 규칙 DB(148)에 미리 저장된다.
만일 키워드 선정기준이 임계치가 아니라 개수이면, 키워드 선별기(176)는 미리 정해진 개수만큼 발생빈도 순으로 키워드를 선정한다. 예를 들어 키워드 규칙 DB(148)에 저장된 키워드 선정개수가 5개로 설정되어 있으면, 발생빈도가 가장 높은 단어부터 차례로 5개의 단어가 키워드로 선정된다.
키워드가 선정되면, 키워드 선별기(176)는 녹음파일(142) 안에 키워드(146)를 삽입하여 저장한다(S20 단계). 한편, 키워드 선정 후 녹음파일을 저장하기 전에, 제어부(170)는 선정된 키워드를 표시부(160)에 출력하여 사용자의 확인을 요청할 수도 있다. 즉, 키워드 선별기(176)가 선정한 키워드들의 목록을 보여주고 사용자로부터 각 키워드의 저장 여부에 대한 선택을 입력 받을 수 있다.
지금까지 설명한 실시예는 화자 구분 없이 키워드를 선정하는 방식이나, 다른 실시예의 경우 화자별로 키워드를 선정하는 것도 가능하다. 도 5는 본 발명의 다른 실시예에 따른 휴대기기를 이용한 녹음파일 생성 방법을 나타내는 흐름도이다.
도 3과 도 5를 참조하면, 녹음 완료 후 제어부(170)는 전술한 실시예와 마찬가지로 키워드 생성기능의 실행 여부를 확인한다(S15 단계). 키워드 생성기능이 실행되지 않으면, 제어부(170)는 S20 단계로 진행하여 통상적인 경우와 마찬가지로 바로 녹음파일을 저장한다.
만약 키워드 생성기능이 실행되면, 제어부(170)는 키워드 선정대상이 화자별인지 확인한다(S21 단계). 이때, 화자별 키워드 선정은 키워드 규칙 DB(148)에 미리 설정되어 있을 수도 있고, 사용자 선택에 의존할 수도 있다. 따라서 제어부(170)는 S21 단계에서 먼저 키워드 규칙 DB(148)를 확인하여 키워드 선정대상이 화자별인지 확인하고, 화자별이 아니면 일정 시간 동안 키입력부(150)를 통해 사용자로부터 화자별 키워드 생성 명령이 수신되는지 판단할 수 있다. 그러나 이와 같이 두 번의 판단 단계로 이루어지는 S21 단계는 하나의 실시예일뿐, 반드시 이에 국한되는 것은 아니다.
키워드 선정대상이 화자별이 아니면, 즉 키워드 규칙 DB(148)에 키워드 선정대상이 화자별이라고 설정되지도 않았고 일정 시간 동안 사용자에 의한 선택도 없으면, 제어부(170)는 S16 단계로 진행하여 전술한 실시예와 동일한 과정을 수행한다.
키워드 선정대상이 화자별이면, 즉 키워드 규칙 DB(148)에 키워드 선정대상이 화자별이라고 설정되어 있거나 일정 시간 내에 사용자로부터 화자별 키워드 생성 기능이 선택되면, 제어부(170)는 음성 분석기(173)를 활성화하고, 음성 분석기(173)는 공지의 음성분석 기술을 이용하여 녹음파일(142)의 음성 데이터(144)를 분석하고(S22 단계), 화자별 발언구간을 분할한다(S23 단계). 일반적으로 화자마다 특유의 음색이 있고 이는 음성 데이터의 파형에 해당하므로, 화자별 구간 분할을 위한 음성 데이터 분석은 음성 데이터(144)의 파형분석을 통해 수행할 수 있다.
예를 들어, 전체 녹음구간이 15분 55초이고 화자가 A, B, C라면, 화자별 구간은 다음 표 4와 같이 분할될 수 있다.
화자 | 구간 |
A | 0:00~3:15, 6:05~8:29, 11:10~13:40 |
B | 3:16~4:32, 10:13~11:09, 15:03~15:55 |
C | 4:33~6:04, 8:30~10:12, 13:41~15:02 |
이어서, 제어부(170)는 음성-문자 변환기(174)를 활성화하고, 음성-문자 변환기(174)는 전술한 실시예의 S16 단계와 마찬가지로 녹음파일(142)의 음성 데이터(144)를 문자 데이터로 변환한다(S24 단계).
이어서, 제어부(170)에 의해 활성화된 단어 추출기(175)는 전술한 실시예의 S17 단계와 마찬가지로 문자 데이터로부터 단어를 추출한다(S25 단계). 다만, 전술한 S17 단계와 달리, S25 단계에서는 화자별로, 즉 분할된 화자별 구간으로부터 각각 단어를 추출한다.
단어 추출 후, 제어부(170)에 의해 활성화된 키워드 선별기(176)는 전술한 실시예의 S18 단계와 유사하게 단어별로 발생빈도를 산출한다(S26 단계). 다만, S26 단계의 발생빈도 산출은 화자별로 수행된다. 예를 들어, '특허'란 단어가 55분 동안 화자 A, B, C에 의해 각각 93회, 32회, 62회 발언되었다면, 1분당 발생빈도는 각각 '1.69', '0.58', '1.13'이다.
이어서, 키워드 선별기(176)는 전술한 실시예의 S19 단계와 유사하게 키워드 규칙 DB(148)에서 키워드 선정기준을 확인하고 그 기준에 따라 키워드를 선별한다(S27 단계). 다만, S27 단계의 키워드 선별은 화자별로 수행된다. 만약 키워드 선정기준이 임계치인 경우, 키워드 선별기(176)는 화자별로 발생빈도가 임계치를 초과하는 단어를 화자별 키워드로 선정한다. 예를 들어, 임계치가 '분당 1회'로 설정되고 화자 A, B, C의 '특허'란 단어의 분당 발생빈도가 각각 '1.69', '0.58', '1.13'이라면, 화자 A와 C의 경우 임계치를 초과하므로 키워드로 선정되지만, 화자 B의 경우는 임계치에 미치지 못하므로 키워드로 선정되지 않는다. 이와 같이, 화자별로 키워드를 선정하는 경우의 임계치는 전술한 실시예처럼 화자 구분 없이 키워드를 선정하는 경우의 임계치보다 작은 것이 바람직하다. 또한, 화자별 키워드 선정의 임계치는 화자의 수에 반비례하여 정해질 수 있다.
만일 키워드 선정기준이 임계치가 아니라 개수이면, 키워드 선별기(176)는 미리 정해진 개수만큼 발생빈도 순으로 화자별 키워드를 선정한다. 예를 들어 키워드 규칙 DB(148)에 저장된 키워드 선정개수가 3개로 설정되어 있으면, 화자 각각에 대하여 발생빈도가 가장 높은 단어부터 차례로 3개의 단어가 키워드로 선정된다.
이와 같이 키워드가 선정되면, 제어부(170)는 녹음파일(142) 안에 화자별 키워드(146)를 삽입하여 저장한다(S28 단계).
한편, 이 실시예의 설명에서 전술한 실시예와 동일한 경우는 설명을 생략하였다.
지금까지는 키워드 생성을 비롯한 녹음파일의 생성 방법에 대하여 설명하였다. 이하에서는 키워드가 삽입된 녹음파일의 재생 방법에 대하여 실시예를 통해 설명한다.
도 6은 본 발명의 실시예에 따른 휴대기기를 이용한 녹음파일 재생 방법을 나타내는 흐름도이다.
도 3과 도 6을 참조하면, 먼저 사용자 선택에 의해 휴대기기(100)의 녹음재생기능이 실행된다(S31 단계). 즉, 사용자가 키입력부(150)를 통해 특정 녹음파일과 그 재생기능을 선택하면, 제어부(170)는 키입력부(150)로부터 사용자의 선택신호를 수신하고 녹음파일 재생기(172)를 활성화시킨다.
활성화된 녹음파일 재생기(172)는 사용자가 선택한 녹음파일을 저장부(140)로부터 추출하고(S32 단계), 녹음파일(142)로부터 음성 데이터(144)를 추출하여 오디오 처리부(130)와 스피커(120)를 통해 출력한다(S33 단계). 이때, 제어부(170)는 재생진행 상황 등을 사용자에게 알리기 위해 표시부(160)를 통해 재생관련 항목들을 표시할 수 있다.
이어서, 녹음파일 재생기(172)는 키워드 규칙 DB(148)에서 키워드 표시방식을 확인하고(S34 단계), 녹음파일(142)로부터 키워드(146)를 추출하여 미리 정해진 키워드 표시방식에 따라 키워드(146)를 표시부(160)에 표시한다(S35 단계). 키워드 표시방식에는 전술한 바와 같이 리스트 방식, 책갈피 방식, 구름 방식이 있으며, 이들을 혼합한 방식도 가능하다.
이어서, 녹음파일 재생기(172)는 특정 키워드의 선택 여부를 확인한다(S36 단계). 사용자가 키입력부(150)를 통해 특정 키워드를 선택하면, 녹음파일 재생기(172)는 키입력부(150)로부터 사용자의 선택신호를 수신하고 선택된 키워드의 녹음시점으로 이동한 후(S37 단계) 다시 S33 단계를 수행한다. 특정 키워드의 선택이 없으면 녹음파일 재생기(172)는 다른 명령(예를 들어 재생관련 제어명령)을 대기한다(S38 단계).
지금까지 실시예를 통하여 본 발명에 따른 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기에 대하여 설명하였다. 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으며, 비록 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.
본 발명에 따른 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기는 녹음기능을 구비한 각종 휴대기기, 이동통신단말, 무선단말 등에 유용하게 적용할 수 있다.
도 1은 본 발명에 따른 키워드가 삽입된 녹음파일의 재생 화면을 예시적으로 보여주는 도면이다.
도 2는 본 발명에 따른 녹음파일 재생 시 키워드 표시방식 중 하나인 구름 방식의 예시 도면이다.
도 3은 본 발명의 실시예에 따른 휴대기기의 구성을 나타내는 블록도이다.
도 4는 본 발명의 실시예에 따른 휴대기기를 이용한 녹음파일 생성 방법을 나타내는 흐름도이다.
도 5는 본 발명의 다른 실시예에 따른 휴대기기를 이용한 녹음파일 생성 방법을 나타내는 흐름도이다.
도 6은 본 발명의 실시예에 따른 휴대기기를 이용한 녹음파일 재생 방법을 나타내는 흐름도이다.
<도면의 주요부분에 대한 설명>
100: 휴대기기 110: 마이크
120: 스피커 130: 오디오 처리부
140: 저장부 142: 녹음파일
144: 음성 데이터 146: 키워드
148: 키워드 규칙 DB 150: 키입력부
160: 표시부 170: 제어부
171: 녹음파일 생성기 172: 녹음파일 재생기
173: 음성 분석기 174: 음성-문자 변환기
175: 단어 추출기 176: 키워드 선별기
Claims (13)
- 녹음기능이 실행되면 마이크를 통해 음성 데이터를 수신하고, 녹음재생기능이 실행되면 상기 음성 데이터를 스피커를 통해 출력하는 오디오 처리부;상기 음성 데이터를 포함하여 생성된 녹음파일, 기 설정된 키워드 선정기준, 키워드 표시방식을 저장하는 저장부;상기 음성 데이터로부터 단어를 추출하고, 상기 추출된 단어 중에서 상기 키워드 선정기준에 따라 키워드를 선정하고, 상기 선정된 키워드를 상기 녹음파일 안에 삽입하는 제어부; 및상기 키워드를 상기 키워드 표시방식에 따라 시각적 요소로 표시하는 표시부;를 포함하며, 상기 키워드 선정기준은발생빈도가 정해진 임계치를 초과하는 단어를 상기 키워드로 선정하는 방식, 정해진 개수만큼의 상기 키워드를 상기 발생빈도 순으로 선정하는 방식 중 적어도 하나로 상기 저장부의 키워드 규칙 DB에 저장되는 것을 특징으로 하는 휴대기기.
- 청구항 1에 있어서,상기 제어부는,상기 녹음기능이 실행되면 활성화되어 상기 녹음파일을 생성하여 상기 저장부에 저장하는 녹음파일 생성기;상기 녹음재생기능이 실행되면 활성화되어 상기 저장부로부터 상기 녹음파일을 추출하는 녹음파일 재생기;상기 음성 데이터를 문자 데이터로 변환하는 음성-문자 변환기;상기 변환된 문자 데이터로부터 상기 단어를 추출하는 단어 추출기;상기 추출된 단어별로 발생빈도를 산출하고, 상기 추출된 단어 중에서 상기 키워드 선정기준에 따라 상기 키워드를 선정하는 키워드 선별기;를 포함하는 것을 특징으로 하는 휴대기기.
- 청구항 2에 있어서,상기 제어부는 상기 음성 데이터를 분석하여 화자별 발언구간을 분할하는 음성 분석기를 더 포함하며, 상기 단어 추출기는 상기 화자별 발언구간으로부터 화자별로 단어를 추출하고, 상기 키워드 선별기는 상기 화자별로 추출된 단어를 이용하여 상기 키워드를 화자별로 선정하는 것을 특징으로 하는 휴대기기.
- 삭제
- 청구항 1에 있어서,상기 키워드 표시방식은, 상기 키워드들을 발생시간 순서 및 발생빈도 순서 중 적어도 하나에 따라 목록 형태로 보여주는 리스트 방식, 상기 녹음파일에 해당하는 진행막대를 시각적으로 보여주면서 상기 키워드들을 발생시간에 따라 상기 진 행막대에 결부시켜 보여주는 책갈피 방식, 상기 키워드들을 자유롭게 분포시켜 시각적으로 보여주되 발생빈도에 따라 속성을 달리하여 보여주는 구름 방식 중 적어도 하나를 포함하는 것을 특징으로 하는 휴대기기.
- 녹음기능이 실행되면 녹음파일을 생성하고 마이크와 오디오 처리부로부터 음성 데이터를 수신하여 상기 녹음파일 안에 삽입하는 단계;키워드 생성기능이 실행되면 상기 음성 데이터로부터 단어를 추출하는 단계;상기 추출된 단어 중에서 기 설정된 키워드 선정기준에 따라 키워드를 선정하는 단계; 및상기 선정된 키워드를 상기 녹음파일 안에 삽입하는 단계;를 포함하며, 상기 키워드 선정기준은발생빈도가 정해진 임계치를 초과하는 단어를 상기 키워드로 선정하는 방식, 정해진 개수만큼의 상기 키워드를 상기 발생빈도 순으로 선정하는 방식 중 적어도 하나로 키워드 규칙 DB에 저장되는 것을 특징으로 하는 휴대기기를 이용한 녹음파일 생성 방법.
- 청구항 6에 있어서,상기 단어 추출 단계는 상기 음성 데이터를 문자 데이터로 변환하고 상기 변환된 문자 데이터로부터 상기 단어를 추출하는 단계인 것을 특징으로 하는 휴대기기를 이용한 녹음파일 생성 방법.
- 청구항 7에 있어서,상기 단어 추출 단계는, 상기 변환된 문자 데이터로부터 키워드 후보 단어를 직접 추출하는 방식과, 상기 변환된 문자 데이터로부터 무의미한 음절을 제거하는 방식 중 적어도 하나에 의해 수행되는 것을 특징으로 하는 휴대기기를 이용한 녹음파일 생성 방법.
- 청구항 6에 있어서,상기 단어 추출 단계는 상기 음성 데이터를 분석하여 화자별 발언구간을 분할하고 상기 화자별 발언구간으로부터 화자별로 상기 단어를 추출하는 단계인 것을 특징으로 하는 휴대기기를 이용한 녹음파일 생성 방법.
- 청구항 6에 있어서,상기 키워드 선정 단계는 상기 추출된 단어별로 발생빈도를 산출하고 상기 발생빈도를 이용하여 상기 키워드 선정기준에 따라 상기 키워드를 선정하는 단계인 것을 특징으로 하는 휴대기기를 이용한 녹음파일 생성 방법.
- 청구항 10에 있어서,상기 키워드 선정기준은, 상기 발생빈도가 정해진 임계치를 초과하는 단어를 상기 키워드로 선정하는 방식과, 정해진 개수만큼의 상기 키워드를 상기 발생빈도 순으로 선정하는 방식 중 적어도 하나를 포함하는 것을 특징으로 하는 휴대기기를 이용한 녹음파일 생성 방법.
- 녹음재생기능이 실행되면 녹음파일로부터 음성 데이터를 추출하여 오디오 처리부와 스피커를 통해 출력하는 단계;키워드 규칙 DB에서 키워드 표시방식을 확인하는 단계;상기 녹음파일로부터 키워드를 추출하는 단계;기 설정된 키워드 표시방식에 따라 상기 추출된 키워드를 표시하는 단계; 및상기 키워드 중 특정 키워드가 선택되면 상기 선택된 키워드의 녹음시점으로 이동하는 단계;를 포함하며, 상기 이동하는 단계는상기 키워드가 발생시간 순으로 표시되는 경우, 사용자가 원하는 키워드를 선택하면, 해당되는 키워드가 발생한 특정 녹음시점에서 녹음파일을 재생하거나, 상기 키워드가 발생빈도 순으로 표시되는 경우, 사용자가 원하는 키워드를 선택하면, 해당되는 키워드가 발생한 녹음시점들에서 순차적으로 녹음파일을 기 설정된 시간 동안 재생하는 단계;를 포함하는 것을 특징으로 하는 휴대기기를 이용한 녹음파일 재생 방법.
- 청구항 12에 있어서,상기 키워드 표시방식은, 상기 키워드들을 발생시간 순서 및 발생빈도 순서 중 적어도 하나에 따라 목록 형태로 보여주는 리스트 방식, 상기 녹음파일에 해당하는 진행막대를 시각적으로 보여주면서 상기 키워드들을 발생시간에 따라 상기 진행막대에 결부시켜 보여주는 책갈피 방식, 상기 키워드들을 자유롭게 분포시켜 시각적으로 보여주되 발생빈도에 따라 속성을 달리하여 보여주는 구름 방식 중 적어도 하나를 포함하는 것을 특징으로 하는 휴대기기를 이용한 녹음파일 재생 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090094397A KR101156934B1 (ko) | 2009-10-05 | 2009-10-05 | 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090094397A KR101156934B1 (ko) | 2009-10-05 | 2009-10-05 | 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110037115A KR20110037115A (ko) | 2011-04-13 |
KR101156934B1 true KR101156934B1 (ko) | 2012-06-20 |
Family
ID=44044644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090094397A KR101156934B1 (ko) | 2009-10-05 | 2009-10-05 | 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101156934B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101755648B1 (ko) * | 2015-10-23 | 2017-07-10 | 도용남 | 비가청 주파수 대역을 이용한 데이터 송수신 시스템 및 방법 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016060296A1 (ko) * | 2014-10-15 | 2016-04-21 | 엘지전자 주식회사 | 음향 정보 녹음 장치 및 그 제어 방법 |
KR101590078B1 (ko) * | 2014-11-27 | 2016-02-01 | 성균관대학교산학협력단 | 음성 아카이빙 장치 및 방법 |
KR101705228B1 (ko) * | 2016-08-22 | 2017-02-09 | 백승빈 | 전자문서생성장치 및 그 동작 방법 |
KR102529262B1 (ko) * | 2017-03-20 | 2023-05-08 | 삼성전자주식회사 | 전자 장치 및 제어 방법 |
WO2018174397A1 (ko) * | 2017-03-20 | 2018-09-27 | 삼성전자 주식회사 | 전자 장치 및 제어 방법 |
KR101940252B1 (ko) * | 2017-07-24 | 2019-01-18 | 에스케이브로드밴드주식회사 | 녹취서비스를 제공하기 위한 시스템 및 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020010819A (ko) * | 2000-07-31 | 2002-02-06 | 김동주 | 휴대용 멀티미디어 학습장치 및 방법 |
KR20070112681A (ko) * | 2006-05-22 | 2007-11-27 | 엘지전자 주식회사 | 이동통신 단말기의 멀티미디어 파일 검색 장치 및 방법 |
-
2009
- 2009-10-05 KR KR1020090094397A patent/KR101156934B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020010819A (ko) * | 2000-07-31 | 2002-02-06 | 김동주 | 휴대용 멀티미디어 학습장치 및 방법 |
KR20070112681A (ko) * | 2006-05-22 | 2007-11-27 | 엘지전자 주식회사 | 이동통신 단말기의 멀티미디어 파일 검색 장치 및 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101755648B1 (ko) * | 2015-10-23 | 2017-07-10 | 도용남 | 비가청 주파수 대역을 이용한 데이터 송수신 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20110037115A (ko) | 2011-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101156934B1 (ko) | 키워드가 삽입된 녹음파일 생성 및 재생 방법과 그 휴대기기 | |
US10692504B2 (en) | User profiling for voice input processing | |
US7792831B2 (en) | Apparatus, system and method for extracting structure of song lyrics using repeated pattern thereof | |
KR20080000203A (ko) | 음성인식을 이용한 음악 파일 검색 방법 | |
KR20060120476A (ko) | 재생 장치, 프로그램 및 재생 제어방법 | |
JP2005266198A (ja) | 音響情報再生装置および音楽データのキーワード作成方法 | |
JP2013020411A (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR101100191B1 (ko) | 멀티미디어 재생장치와 이를 이용한 멀티미디어 자료검색방법 | |
US20100017381A1 (en) | Triggering of database search in direct and relational modes | |
KR20110053397A (ko) | 검색 키워드를 이용한 멀티미디어 파일 검색 방법 및 그 휴대기기 | |
CN108305622A (zh) | 一种基于语音识别的音频摘要文本创建方法及其创建装置 | |
CN104125334A (zh) | 一种信息处理方法及电子设备 | |
JP2007257341A (ja) | 音声データ再生装置および音声データ再生装置のデータ表示方法 | |
US20080005673A1 (en) | Rapid file selection interface | |
JP2004289530A (ja) | 記録再生装置 | |
KR100849848B1 (ko) | 음성 출력 장치 및 방법 | |
JP2006189799A (ja) | 選択可能な音声パターンの音声入力方法及び装置 | |
KR20110038776A (ko) | 녹음파일의 키워드 관련정보 획득 방법 및 그 휴대기기 | |
KR20080051876A (ko) | 전자사전 검색이 가능한 멀티미디어 파일 재생장치 및검색방법 | |
KR20080024876A (ko) | 오디오 구간 검색장치와 방법 | |
KR101576683B1 (ko) | 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법 | |
KR100707727B1 (ko) | 휴대용 파일 재생기 | |
KR102274275B1 (ko) | 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법 | |
KR102266061B1 (ko) | 음성 텍스트 변환 기술과 시간 정보를 이용하여 음성 데이터의 요약을 가능하게 하는 전자 장치 및 그 동작 방법 | |
JP4042743B2 (ja) | リクエスト装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150527 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160530 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180530 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190521 Year of fee payment: 8 |