KR20120107306A - 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체 - Google Patents

컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체 Download PDF

Info

Publication number
KR20120107306A
KR20120107306A KR1020110024931A KR20110024931A KR20120107306A KR 20120107306 A KR20120107306 A KR 20120107306A KR 1020110024931 A KR1020110024931 A KR 1020110024931A KR 20110024931 A KR20110024931 A KR 20110024931A KR 20120107306 A KR20120107306 A KR 20120107306A
Authority
KR
South Korea
Prior art keywords
text
voice
user
speech
content
Prior art date
Application number
KR1020110024931A
Other languages
English (en)
Inventor
윤기범
고용지
김동훈
배종필
안영진
조정식
이기연
박주현
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to KR1020110024931A priority Critical patent/KR20120107306A/ko
Publication of KR20120107306A publication Critical patent/KR20120107306A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 컨텐츠 제공 시스템 및 그의 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 관한 것으로, 더욱 상세하게는 화면에 표시된 텍스트 중 음성으로 변환하여 제공 가능한 부분을 구별되게 표시하고 상기 표시한 텍스트 중에서 사용자가 선택한 부분부터 음성으로 변환하여 제공받을 수 있게 하는 컨텐츠 제공 시스템 및 그의 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 관한 것이다.

Description

컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체{Contents service system and storage medium for providing TTS}
본 발명은 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체에 관한 것으로, 더욱 상세하게는 문자 음성 변환이 이루어지는 부분을 사용자가 임의로 선택 가능하여 사용자 편의성을 높일 수 있는 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체에 관한 것이다.
개인용 컴퓨터와 초고속 인터넷 서비스의 확산으로 인하여, 다양한 멀티미디어 컨텐츠로의 접근이 용이하게 되었고, 교육 분야에서도 온라인을 이용한 다양한 컨텐츠와 학습방법들이 개발되고 있다.
최근에는 문자 음성 자동변환 기술의 발달로 어학 학습 장치에서 선택된 문자를 바로 소리로 바꿔 전달하는 TTS(Text to speech) 기능이 많이 이용되고 있다. 여기서, TTS 기능은 약 10만 단어가 들어있는 전자사전과 500여 개의 문법규칙을 적용하여 문장을 자동 분석해 합성음으로 변환하는 기술을 의미한다.
하지만, 기존의 TTS 기능은 TTS가 이루어질 영역이 미리 설정되어 있어서, 사용자가 TTS를 요청하면, 설정된 영역의 문장 전체에 대한 음성 출력이 이루어졌다. 따라서, 사용자가 원하는 부분을 자유롭게 선택하여 음성 출력할 수 없는 불편이 있었다.
본 발명의 목적은, 문자 음성 변환이 이루어지는 부분을 사용자가 임의로 선택 가능하여 사용자 편의성을 높일 수 있는 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체를 제공하는데 있다.
본 발명은 과제를 해결하기 위한 수단으로서, 컨텐츠를 단말 장치로 제공하되, 사용자의 문자 음성 변환 요청에 따라 컨텐츠에서 음성으로 변환 가능한 텍스트를 다른 텍스트와 구별되도록 표시하고, 표시된 텍스트 중에서 사용자가 선택한 위치부터 음성으로 변환하여 제공하는 서비스 장치; 및 서비스 장치로부터 텍스트가 변환된 음성을 사용자에게 출력하는 단말 장치를 포함하는 것을 특징으로 하는 컨텐츠 제공 시스템을 제공한다.
본 발명은 과제를 해결하기 위한 수단으로서, 컨텐츠를 사용자에게 제공하고, 사용자의 음성 변환 요청에 따라서 컨텐츠 내에서 음성으로 변환 가능한 텍스트를 다른 텍스트와 구별되도록 표시하고, 표시된 텍스트 중에서 사용자가 선택한 위치부터 음성으로 변환하도록 제어하는 제어부; 및 텍스트 및 변환된 음성을 출력하는 출력부를 포함하는 것을 특징으로 하는 단말 장치를 제공한다.
본 발명에 의한 단말 장치에 있어서, 제어부는 화면으로 출력된 텍스트 중 음성 변환이 가능한지 여부를 판단하여 음성 변환이 가능한 텍스트를 다른 텍스트와 구별하여 표시할 수 있도록 하는 TTS 영역 추출 모듈을 더 포함하는 것을 특징으로 한다.
본 발명에 의한 단말 장치에 있어서, 제어부는 TTS 영역 추출 모듈에 의해 추출된 텍스트 중에서 사용자가 선택한 위치의 단어부터 음성 변환을 실행하는 TTS 변환 모듈을 더 포함하는 것을 특징으로 한다.
본 발명에 의한 단말 장치에 있어서, 제어부는 입력부를 통해 사용자로부터 문자를 음성으로 변환하여 제공받기 원하는 텍스트를 입력 받고, 입력 받은 텍스트를 음성으로 변환 가능한 텍스트로 표시하는 것을 특징으로 한다.
본 발명에 의한 단말 장치에 있어서, 외부 장치와 통신하여 데이터를 송수신하는 통신부를 더 포함하고, 제어부는 통신부를 통해 외부 장치로부터 컨텐츠를 전송 받는 것을 특징으로 한다.
본 발명은 과제를 해결하기 위한 수단으로서, 사용자의 서비스 이용 권한을 인증하는 인증부; 및 인증부에서 서비스 이용 권한이 있는 것으로 확인된 사용자의 요청에 따라서, 특정 컨텐츠에서 음성 변환이 가능한 텍스트를 추출하여 컨텐츠의 다른 텍스트와 구별되게 표시되도록 사용자의 단말 장치로 제공하고, 추출한 텍스트 중에서 사용자로부터 선택 받은 위치부터 음성으로 변환하여 단말 장치로 제공하는 서비스 제공부를 포함하는 것을 특징으로 하는 서비스 장치를 제공한다.
본 발명에 의한 서비스 장치에 있어서, 서비스 제공부는 컨텐츠에 포함되어 있는 텍스트 중 음성 변환이 가능한 텍스트를 추출하는 TTS 영역 추출 모듈을 더 포함하는 것을 특징으로 한다.
본 발명에 의한 서비스 장치에 있어서, 서비스 제공부는 TTS 영역 추출 모듈에서 추출한 텍스트 중에서 사용자에 의해 선택된 단어부터 음성으로 변환하는 TTS 변환 모듈을 더 포함하는 것을 특징으로 한다.
본 발명은 과제를 해결하기 위한 수단으로서, 하나 이상의 텍스트를 포함하는 컨텐츠를 실행하는 단계; 사용자의 문자 음성 변환 기능 제공 요청에 따라, 컨텐츠에서 음성으로 변환 가능한 텍스트를 컨텐츠의 다른 부분과 구별되게 표시하는 단계; 구별되게 표시된 텍스트 상에서 어느 한 부분을 사용자로부터 선택 받는 단계; 표시된 텍스트 중에서 사용자로부터 선택된 부분부터 음성으로 변환하는 단계; 및 변환된 음성을 출력하는 단계를 포함하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체를 제공한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 구별되게 표시하는 단계는 음성으로 변환 가능한 텍스트를 컨텐츠 위에 형성된 팝업 창을 통해 표시하는 단계인 것을 특징으로 한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 음성으로 변환하는 단계는 텍스트 중에서 사용자로부터 선택된 부분부터 단어 또는 문장 또는 문단단위로 음성으로 변환하는 것을 특징으로 한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 음성으로 변환하는 단계는 단어 단위로 변환하는 경우, 사용자로부터 선택된 부분을 포함하는 하나의 단어를 음성으로 변환하여 제공하는 것을 특징으로 한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 음성으로 변환하는 단계는 문장 단위로 변환하는 경우, 사용자로부터 선택된 부분을 포함하는 문장에 대하여, 문장의 처음부터 끝까지를 음성으로 변환하는 것을 특징으로 한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 음성으로 변환하는 단계는 문단 단위로 변환하는 경우, 사용자로부터 선택된 부분을 포함하는 문단에 대하여, 문단의 처음부터 끝까지를 음성으로 변환하는 것을 특징으로 한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 컨텐츠의 다른 부분과 구별되게 표시하는 단계 이전에 사용자로부터 하나 이상의 텍스트를 입력 받는 단계를 더 포함하고, 컨텐츠의 다른 부분과 구별되게 표시하는 단계에서, 입력 받은 텍스트를 컨텐츠의 다른 부분과 구별되게 표시하는 것을 특징으로 한다.
본 발명에 의한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서, 구별되게 표시된 텍스트에 있어서, 음성으로 출력중인 부분을 하이라이트로 표시하는 단계를 더 포함하는 것을 특징으로 한다.
본 발명에 따르면, 사용자가 문자 음성 변환 기능 제공 모드를 선택하여 문자 음성 변환이 가능한 텍스트가 다른 텍스트와 구별되어 표시되면, 그 중에서 문자를 음성으로 변환하여 제공받길 원하는 텍스트를 선택하여 선택한 텍스트부터 문자를 음성으로 전환한 음성데이터를 출력 받을 수 있어 학습 효과를 향상시킬 수 있다.
더하여, 본 발명은 더 간단하고 쉬운 조작을 통해서 여러 문장 및 문단으로 이루어진 컨텐츠에서 사용자가 원하는 문장부터 문자 음성 변환시킬 수 있고, 문자 음성 변환 기능 제공 시 문장 단위로 하이라이트되어 표시될 수 있으므로 편리하게 사용할 수 있다.
도 1은 본 발명의 제1 실시 예에 따른 문자 음성 변환 기능 제공을 위한 단말 장치의 구성을 나타낸 블록도이다.
도 2는 본 발명의 제1 실시 예에 따른 문자 음성 변환 기능 제공 방법을 나타낸 순서도이다.
도 3은 본 발명의 제1 실시 예에 따른 문자 음성 변환 기능 제공 방법 중 사용자가 텍스트의 특정 부분 선택 시 음성 변환 출력을 실행하는 과정을 더 구체적으로 나타낸 순서도이다.
도 4는 본 발명의 제2 실시 예에 따른 문자 음성 변환 서비스 제공 시스템을 도시한 블록도이다.
도 5는 본 발명의 제2 실시 예에 따른 문자 음성 변환 서비스 제공 시스템에 있어서, 서비스 장치의 구성을 나타낸 블록도이다.
도 6는 본 발명의 제2 실시 예에 따른 문자 음성 변환 기능 제공 방법을 나타낸 흐름도이다.
도 7, 도 8, 도 9는 본 발명에 따라서 제공되는 문자 음성 변환 기능 제공 화면의 일 예를 보인 예시도이다.
이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 다만, 하기의 설명 및 첨부된 도면에서 본 발명의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 또한, 도면 전체에 걸쳐 동일한 구성 요소들은 가능한 한 동일한 도면 부호로 나타내고 있음에 유의하여야 한다.
이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
본 발명의 제1 실시 예에 있어서, 문자 음성 변환 기능 제공은 단말 장치를 기반으로 이루어질 수 있다.
도 1은 본 발명의 제1 실시 예에 따른 문자 음성 변환 기능 제공을 위한 단말 장치의 구성을 나타낸 블록도이다.
여기서, 본 발명이 적용되는 단말 장치(100)는, 사용자가 이용하는 다양한 형태의 정보 처리 장치일 수 있으며, 예를 들면, PC(Personal Computer), 노트북 컴퓨터, 휴대폰(mobile phone), 태블릿 PC, 내비게이션(navigation), 스마트폰(smart phone), PDA(Personal Digital Assistants), PMP(Portable Multimedia Player) 또는 DVB(Digital Video Broadcasting)와 같은 디지털방송 수신기를 포함할 수 있다. 물론 이는 예시에 불과할 뿐이며, 상술한 예 이외에도 현재 개발되어 상용화되었거나 향후 개발될 모든 통신이 가능한 장치를 포함하는 개념으로 해석되어야 한다.
도 1을 참조하면, 본 발명에 따른 단말 장치(100)는 입력부(110)와, 출력부(120)와, 통신부(130)와, 저장부(140)와, 제어부(150)를 포함한다.
입력부(110)는 사용자의 조작에 따라서 단말 장치(100)를 제어하거나 동작하기 위한 사용자 입력 신호를 발생하는 수단으로서, 다양한 방식의 입력 수단으로 구현될 수 있다. 예를 들어, 입력부(110)는 키 입력 수단, 터치 입력 수단, 제스처 입력 수단, 음성 입력 수단 중에서 하나 이상을 포함할 수 있다. 키 입력 수단은, 키 조작에 따라서 해당 키에 대응하는 신호를 발생시키는 것으로서, 키패드, 키보드가 해당된다. 터치 입력 수단은, 사용자가 특정 부분을 터치하는 동작을 감지하여 입력 동작을 인식하는 것으로서, 터치 패드, 터치 스크린, 터치 센서를 들 수 있다. 제스처 입력 수단은, 사용자의 동작, 예를 들어, 단말 장치를 흔들거나 움직이는 동작, 단말 장치에 접근하는 동작, 눈을 깜빡이는 동작 등 지정된 특정 동작을 특정 입력 신호로 인식하는 것으로서, 지자기 센서, 가속도 센서, 카메라, 고도계, 자이로 센서, 근접 센서 중에서 하나 이상을 포함하여 이루어질 수 있다.
출력부(120)는 단말 장치(100)의 동작 상태 및 동작 결과를 표시하는 출력 수단으로서, 본 발명에 있어서, 특정 컨텐츠의 텍스트 및 텍스트가 변환된 음성을 출력한다. 이러한 출력부(120)는 텍스트로 이루어진 컨텐츠를 화면으로 출력하는 디스플레이부(121)와 상기 텍스트가 변환된 음성을 출력하는 사운드 출력부(122)를 포함한다.
디스플레이부(121)는 사용자에 의해 선택된 컨텐츠를 볼 수 있도록 화면에 출력하는 수단으로, 예를 들면, LCD((Liquid Crystal Display), TFT-LCD(Thin Film Transistor-Liquid Crystal Display), LED(Light Emitting Diodes), OLED(Organic Light Emitting Diodes), AMOLED(Active Matrix Organic Light Emitting Diodes), 플렉시블 디스플레이(flexible display), 3차원 디스플레이 중에서 어느 하나가 될 수 있다.
사운드 출력부(122)는 사용자의 선택에 따라 텍스트가 음성으로 변환되어 생성된 음성파일을 가청음으로 출력하는 수단으로서, 예를 들면 유무선 이어폰, 유무선 스피커, 단말 장치에 내장된 스피커 중에서 어느 하나가 될 수 있다.
통신부(130)는 네트워크를 통해서 외부 장치와 데이터를 송수신하는 수단으로서, 문자를 음성으로 변환하기 위한 컨텐츠를 다른 외부 장치로부터 전달받기 위해 이용될 수 있다. 통신부(130)는 WLAN(Wireless LAN), 와이 파이(Wi-Fi), 와이브로(Wireless Broadband, Wibro), 와이맥스(World Interoperability for Microwave Access, Wimax), HSDPA(High Speed Downlink Packet Access) 등) 또는 근거리 무선통신(블루투스(Bluetooth), Zigbee, RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband) 등) 또는 근거리 유선통신(USB 등) 중에서 하나 이상의 방식으로 구현될 수 있다.
저장부(140)는 단말 장치(100)의 동작에 필요한 데이터 혹은 프로그램을 저장하는 수단으로서, 기본적으로 단말 장치(100)의 운용 프로그램(OS) 및 하나 이상의 응용 프로그램을 저장할 수 있다. 더하여, 본 발명에 있어서, 저장부(140)는 문자 음성 변환 기능 제공을 위한 하나 이상의 텍스트를 포함한 컨텐츠를 저장한다. 여기서, 컨텐츠는, 다양한 형태의 문서 파일로 존재할 수 있고, 문자를 음성으로 변환할 수 있는 텍스트가 포함되어 있다. 이러한 저장부(140)는, 램(RAM, Read Access Memory), 롬(ROM, Read Only Memory), 하드디스크(HDD, Hard Disk Drive), 플래시 메모리, CD-ROM, DVD와 같은 모든 종류의 저장 매체를 포함할 수 있다.
제어부(150)은 단말 장치(100)의 동작 전반을 제어하는 것으로서, 기본적으로 상기 저장부(140)에 저장한 운영 프로그램을 기반으로 동작하여 단말 장치(100)의 기본적인 플랫폼 환경을 구축하고, 사용자의 선택에 따라서 응용 프로그램을 실행하여 임의 기능을 제공한다. 본 발명에 있어서, 제어부(150)는, 화면에 표시된 하나 이상의 텍스트를 음성으로 변환이 가능한지 판단하여 음성 변환이 가능한 텍스트를 다른 텍스트와 구별하여 표시할 수 있도록 하고, 사용자로부터 상기 음성 변환이 가능한 텍스트 중에서 문자를 음성으로 변환하여 제공받기 원하는 텍스트를 선택 받아 선택된 텍스트를 음성으로 변환하여 출력하도록 제어한다. 이러한 제어부(150)는 TTS 변환 모듈(151)과, TTS 영역 추출 모듈(152) 중 하나 이상을 포함할 수 있다.
상기 TTS 변환 모듈(151)과 TTS 영역 추출 모듈(152)은 소프트웨어 혹은 하드웨어 혹은 소프트웨어와 하드웨어의 조합에 의해 구현될 수 있는 것으로서, 예를 들면, 프로그램 형태로 저장부(140)에 저장되어 있다가 상기 제어부(150)에 의해 실행됨에 의해 구현될 수 있다.
상기 TTS 영역 추출 모듈(152)은, 화면에 표시된 하나 이상의 텍스트를 음성으로 변환 가능한지 판단하여 음성 변환이 가능한 텍스트를 다른 텍스트와 구별하여 표시할 수 있도록 한다.
상기 TTS 변환 모듈(151)은, 화면에 표시되어 있는 하나 이상의 텍스트가 상기 TTS 영역 추출 모듈(152)에 의해 음성 변환이 가능한 텍스트가 다른 텍스트와 구별되어 표시되면, 사용자로부터 상기 음성 변환이 가능한 텍스트 중에서 문자를 음성으로 변환하여 제공받기 원하는 텍스트를 선택 받아 선택된 텍스트를 음성으로 변환한다.
상기 '모듈'은 소프트웨어 또는 Field Programmable Gate Array(FPGA) 또는 주문형 반도체(Application Specific Integrated Circuit, ASIC)과 같은 하드웨어 구성요소를 의미하며, 모듈은 어떤 역할들을 수행한다. 그렇지만 모듈은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. 모듈은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 따라서, 일 예로서 모듈은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 모듈들에서 제공되는 기능은 더 작은 수의 구성요소들 및 모듈들로 결합되거나 추가적인 구성요소들과 모듈들로 더 분리될 수 있다.
상술한 구성을 포함하는 단말 장치(100)는 하나 이상의 텍스트로 구성된 컨텐츠를 사용자가 선택한 텍스트 부분부터 음성으로 변환하여 제공해 준다.
도 2는 본 발명의 제1 실시 예에 따른 문자 음성 변환 기능 제공 방법을 나타낸 순서도이다.
도 2를 참조하면, 단말 장치(100)는 사용자의 선택에 따라 텍스트로 이루어진 컨텐츠를 저장부(140) 또는 외부 저장 장치로부터 불러와 출력부(120)의 디스플레이부(121)를 통하여 화면에 표시한다(S105). 또는 사용자가 입력부(110)를 통하여 하나 이상의 텍스트를 직접 입력하여 화면에 표시할 수 있다. 이는 단말 장치(100)가 입력부(110)를 통해서 사용자로부터 출력하기를 원하는 하나 이상의 텍스트가 포함된 컨텐츠를 입력 받음에 의해 이루어질 수 있다.
도 7과 같이 상기 텍스트로 이루어진 컨텐츠가 화면에 출력된 후, 사용자의 선택에 따라 문자 음성 변환 기능 제공 요청이 입력부(110)를 통해 입력되는 경우(S110), 단말 장치(100)의 화면은 도 8과 같은 문자 음성 변환 기능 제공을 위한 창이 뜨거나 화면이 전환 된다(S130).
도 7, 도 8, 도 9는 본 발명에 따라서 제공되는 문자 음성 변환 기능 제공 화면의 일 예를 보인 예시도이다.
도 7은 문자 음성 변환 제공을 요청하기 전 텍스트가 포함된 컨텐츠의 실행화면(10)으로 컨텐츠(12)에 하나 이상의 텍스트가 포함되어 있고, 상단에는 메뉴 또는 타이틀(11)이 존재하고, 하단에 TTS 요청 버튼(13)이 존재하여 사용자 요청에 따라 상기 컨텐츠(12)의 텍스트에 대하여 문자 음성 변환을 제공할 수 있다.
도 8은 사용자로부터 문자 음성 변환 제공을 요청 받았을 때의 문자 음성 변환 제공 화면(20)이다. 상기 문자 음성 변환 제공 화면(20)은 팝업창으로 제공될 수도 있고 기존 화면(10)에서 문자 음성 변환 가능한 텍스트만 진하게 음영 처리되거나 색이 다르게 표시된 화면으로 전환될 수도 있다. 컨텐츠(12)의 메뉴 또는 타이틀 영역(21)은 상단에 위치하고, 그 아래에 문자 음성 변환 제공이 가능한 텍스트를 추출하여 표시한다(22).
도 9는 사용자로부터 문자 음성 변환 제공을 요청 받았을 때의 문자 음성 변환 제공 화면의 실시 예이다. 상단의 메뉴 또는 타이틀 영역(21)에 전체듣기 요청 버튼(21a)과 종료 요청 버튼(21b)이 존재한다. 음성 변환 제공이 가능한 문장, 단어 등에 대하여 손으로 터치하거나 포인터로 선택하면 그 부분부터 음성 변환이 제공된다.
다시 도 2를 참조하면, 단계(S110)에서의 음성 변환 출력 선택에 의하여, 문자 음성 변환 기능 제공 모드로 전환되면, 제어부(150)의 TTS 영역 추출 모듈(152)은 사용자에 의해 선택되어 화면에 출력된 상기 하나 이상의 텍스트 중에서 문자 음성 변환 기능 제공 가능한 부분을 판단하여 그 부분을 문자 음성 변환 기능 제공이 불가능한 텍스트와 구별하여 도 8 또는 도 9와 같이 디스플레이부(121)에 표시한다(S130). 이때, 문자 음성 변환 기능 제공 가능한 부분이 제공 불가능한 부분과 구별되도록 색상을 다르게 하거나 음영을 반전시키거나, 제공 불가능한 부분은 흐리게 처리하는 방법을 쓸 수 있다. 또는 문자 음성 변환 기능 제공 가능한 부분만을 별도의 팝업 창을 띄워 출력할 수 있다.
또한, 문자 음성 변환 기능 제공을 요청 받아 실행 중인 컨텐츠에 대하여 문자 음성 변환 기능 제공을 위한 팝업 창이 뜨거나 화면이 전환 되었을 때, 사용자가 텍스트를 직접 입력하여 입력된 텍스트가 음성으로 변환되어 제공받을 수 있다. 사용자가 텍스트를 직접 입력하고자 하는 경우이면(S115), 사용자로부터 텍스트를 입력 받아, 문자 음성 변환 기능 제공이 가능한 부분을 판단하여 문자 음성 변환 기능 제공이 가능한 텍스트를 다른 텍스트와 구별하여 표시한다(S125). 사용자가 텍스트를 직접 입력하는 경우, 텍스트 입력을 완료 후에 문자 음성 변환 기능 제공 가능 여부 판단을 요청하여 원하는 텍스트를 선택하여 선택된 텍스트는 음성으로 변환되어 제공받을 수 있다.
문자 음성 변환 기능 제공 가능한 텍스트가 다른 텍스트와 구별되어 표시되어 있을 때(S125), 사용자는 입력부(110)를 통하여 원하는 기능을 선택하게 되는데, 문자 음성 변환 기능 제공 가능한 텍스트 중에서 특정 부분을 클릭하거나(S130), 전체듣기를 선택하거나(S145), 일시 정지를 선택할 수 있다(S155).
사용자가 문자 음성 변환 기능 제공 가능한 텍스트 중에서 특정 텍스트를 선택한 경우(S130), 사용자가 선택한 텍스트 부분부터 TTS 변환 모듈(151)에 의해 음성으로 변환되어 사운드 출력부(122)에 의해 가청음으로 출력된다(S135). 이때, 문자 음성 변환 기능 제공 중인 부분을 단어 또는 문장 단위로 하이라이트 하여 디스플레이 화면에 표시할 수 있다.
텍스트가 변환된 음성이 출력 중에(S135), 사용자가 종료 또는 다른 메뉴를 요청하는 경우이면(S140), 문자 음성 변환 기능 제공은 중지되어, 사용자가 요청한 대로 화면이 전환된다. 여기서 다른 메뉴는 이전 화면이나 메인 메뉴, 다른 컨텐츠의 실행 등을 의미한다. 그러나 단말 장치(100)에서 멀티태스킹을 지원하는 경우이면, 문자 음성 변환 기능 제공이 일시 정지되거나 계속 사운드 출력부(122)에 의해 출력되면서, 다른 프로그램 또는 컨텐츠를 실행할 수 있으므로, 창을 최소화한 후, 다른 화면으로 전환할 수 있다.
사용자가 선택한 부분의 텍스트의 문자 음성 변환 기능 제공이 완료된 경우, 종료 또는 다른 메뉴를 선택하지 않은 한, 문자를 음성으로 변환 가능한 텍스트 부분을 표시(S125)하였던 문자를 음성으로 변환하여 제공 받기 원하는 텍스트를 선택하기 전 단계로 되돌아가게 된다.
상기 특정 텍스트를 선택하는 단계(S130)에서 사용자가 특정 텍스트를 선택하는 방법은 도 3에서 도시하고 있다. 도 3의 본 발명에 의한 텍스트 선택 방법에 따라 사용자가 특정 텍스트 부분을 선택하면, 선택한 부분부터 텍스트가 음성으로 변환되어 가청음으로 출력되는데 음성으로 변환되어 출력되는 범위는 도 3에 도시된 본 발명에 의한 텍스트 선택 방법에 따라 사용자가 선택할 수 있다. 도 3의 자세한 설명은 도 2의 설명 후에 후술하기로 한다.
한편, 상기 단계(S125)에서, 문자 음성 변환 기능 제공을 위한 화면(도 8)에서 TTS 영역 추출 모듈(152)에 의해 문자 음성 변환 기능 제공이 가능한 텍스트가 다른 텍스트와 구별되어 표시되어 있는 상태에 있을 때, 사용자는 텍스트의 특정부분을 선택하지 않고, 전체 텍스트에 대한 문자 음성 변환 기능 제공을 요청할 수 있다(S145). 이와 같이, 전체 듣기가 선택되면, 텍스트의 처음부터 음성으로 변환하여 제공한다(S150).
상기 전체 텍스트에 대한 문자 음성 변환 기능 제공 요청은 문자 음성 변환 기능 제공을 위한 화면에서 문자 음성 변환을 이미 제공 중인 경우에도 가능하다. 이때에는 제공 중이던 문자 음성 변환 출력은 중지하고, 문장 전체가 문자 음성 변환 기능 제공이 가능하다고 판단된 문장 중 첫 문장부터 문자를 음성으로 변환하여 제공하게 된다.
상기 단계(S135, S150)에서 문자 음성 변환 기능 제공 중에 사용자가 일시 정지를 요청하면(S155), 문자 음성 변환 기능 제공이 일시 정지되고(S160), 이때 일시 정지된 부분부터 재생하기를 요청 하면(S165) 일시 정지된 텍스트 부분부터 음성으로 변환 출력된다(S170). 이때, 일시 정지된 텍스트 부분에서의 문장의 처음 또는 단어의 처음부터 시작될 수 있다. 상기 재생 요청은 일시 정지를 요청하였을 때, 일시 정지 버튼이 재생 버튼으로 변환되고, 변환된 재생 버튼을 선택함으로써 이루어지거나, 재생 버튼을 별도로 생성하여 일시 정지 상태에서 재생 버튼을 선택함으로써 일시 정지된 부분부터 다수 음성 변환이 이루어질 수 있다.
한편, 일시 정지된 상태에 있을 때에도(S160), 문자를 음성으로 변환하여 제공 중(S135)일 때와 동일하게 사용자의 입력이 있을 수 있다. 텍스트의 특정부분을 선택하여 음성으로 변환하여 제공받거나, 종료 또는 다른 메뉴를 선택하거나, 텍스트 전체에 대한 문자 음성 변환 기능 제공을 요청할 수 있다.
도 3은 본 발명의 제1 실시 예에 따른 문자 음성 변환 기능 제공 방법 중 사용자가 텍스트의 특정 부분 선택 시 음성 변환 출력을 실행하는 과정을 더 구체적으로 나타낸 순서도이다.
도 3을 참조하면, 본 발명에서 제1 실시 예에 따른 문자 음성 변환 기능 제공 방법은 단어, 문장 또는 문단 단위로 음성 변환을 제공할 수 있다.
이를 위하여, 텍스트를 선택하기 전에 음성 변환 제공 단위를 설정하여야 한다(S305). 사용자는 단어, 문장, 문단 중에서 선택할 수 있다. 상기 단계(S305)는 도 2에서 사용자가 텍스트의 특정 부분을 선택하는 단계(S130) 이전에 이루어질 수 있다.
이와 같이 음성 변환 제공 단위의 설정이 이루어진 후, 도 2의 단계(S105~S130)가 실행되어, 텍스트의 특정 부분이 선택되면(S310), 본 발명에 따른 단말 장치(100)는 상기 단계(S305)에서 설정된 단위에 따라서 음성 변환 출력을 실행한다.
더 구체적으로는, 단어 단위로 음성 변환 단위가 설정된 경우(S315), 단말 장치(100)는 사용자가 선택한 부분과 매칭되는 한 단어를 추출하여 음성 변환하여 출력한다(S320).
문장 단위로 음성 변환 단위가 설정된 경우(S325), 단말 장치(100)는 선택된 부분과 매칭되는 단어를 포함하는 문장을 추출하고, 추출된 문장을 처음부터 끝까지 음성 변환하여 출력한다(S330). 다만, 문장 단위로 문자 음성 변환이 제공되는 것이므로 선택한 문장 전체가 TTS 영역 추출 모듈에 의해 문자 음성 변환 기능 제공이 가능한 경우에만 문장을 선택하여 문자를 음성으로 변환하여 제공받을 수 있다.
문단 단위로 음성 변환 단위가 설정된 경우(S335), 선택된 부분과 매칭되는 단어를 포함하는 문단을 추출하여 해당 문단의 처음부터 끝까지 음성으로 변환하여 출력한다(S340). 이때에도 문장 단위로 문자 음성 변환을 제공하여 문장 전체가 TTS 영역 추출 모듈에 의해 문자 음성 변환 기능 제공이 가능한 문장에 대하여 음성으로 변환하여 제공한다.
음성변환 단위 설정 시 단어, 문장, 문단 모두 선택하지 않은 경우에는 단말 장치(100)는 선택된 부분과 매칭되는 단어부터 표시된 텍스트의 끝까지 음성 변환하여 출력한다(S345). 더하여, 본 발명의 제2 실시 예에 따르면, 본 발명에 의한 문자 음성 변환 기능 제공은 서버 기반 컴퓨팅 방식으로 이루어질 수 있다. 여기서, 서비스 기반 컴퓨팅 방식은, 네트워크를 매개로 연결된 임의의 장치에서 본 발명에 따른 문자 음성 변환 기능 제공을 위한 기록 매체의 처리가 이루어지고, 단말 장치에서는 입출력만 이루어지는 방식을 의미한다. 이하에서는 설명의 편의를 위해 본 발명에 따른 문자를 음성으로 변환하여 제공하는 장치를, 서비스 장치로 구분하기로 한다.
도 4는 본 발명의 제2 실시 예에 따른 문자 음성 변환 서비스 제공 시스템을 도시한 블록도이다.
도 4를 참조하면, 본 발명에 따른 문자 음성 변환 서비스 제공 시스템은, 네트워크(300)를 매개로 연결된 단말장치(100) 및 서비스 장치(200)로 이루어진다.
서비스 장치(200)는 본 발명에 따른 문자 음성 변환 기능 제공을 네트워크(300)를 통해 서비스하는 장치로서, 특히 문자 음성 변환 기능 제공이 가능한지 여부를 판단하여 문자 음성 변환이 제공 가능한 텍스트를 다른 텍스트와 구별하여 단말 장치(100)가 표시할 수 있게 하고, 텍스트를 음성으로 변환하여 생성된 음성파일을 단말 장치(100)에 제공한다.
단말 장치(100)는, 네트워크(300)를 통해서 상기 서비스 장치(200)에 접속하여, 상기 서비스 장치(200)로부터 문자 음성 변환 기능 제공 모드 화면(도 7)에서 표시된 텍스트가 문자 음성 변환이 제공 가능한지 여부를 판단 받아 이를 표시하고, 사용자가 본 발명에 의한 텍스트 선택 방법에 따라 선택한 텍스트 또는 텍스트 전체를 음성으로 변환한 것을 전송 받아 사용자에게 출력한다.
본 발명의 제2 실시 예에 있어서, 단말 장치(100)는 문자 음성 변환 기능 제공 시 화면 및 음성의 출력 기능만을 수행하므로, 이하에서 서비스 장치(200)를 위주로 설명하기로 한다.
도 5는 본 발명의 제2 실시 예에 따른 문자 음성 변환 서비스 제공 시스템에 있어서, 서비스 장치(200)의 구성을 나타낸 블록도이다.
도 5를 참조하면, 서비스 장치(200)는 인증부(210)와, 서비스 제공부(220)와, 저장부(230)를 포함한다.
인증부(210)는 네트워크(300)를 통해서 서비스 장치(200)에 접속한 또는 서비스를 요청한 사용자의 서비스 이용 권한을 인증한다. 상기 인증부(220)에 의하여 인증된 사용자에 한하여 본 발명에 따른 서비스, 즉, 문자 음성 변환 기능 제공 서비스가 제공될 수 있다.
서비스 제공부(220)는, 상기 인증부(210)에서 서비스 이용권한이 있는 것으로 확인된 사용자의 요청에 따라서, 선택된 컨텐츠의 선택된 텍스트에 대하여 문자를 음성으로 변환하여 제공한다. 이때, 변환된 음성은 네트워크(200)를 통해서 단말 장치(100)로 전송된 후, 단말 장치(100)에 의해 출력된다.
이러한 서비스 제공부(220)는, 본 발명에 따른 문자 음성 변환 기능 제공을 위한 TTS 변환 모듈(221)과 TTS 영역 추출 모듈(222) 중에서 하나 이상을 포함하여 이루어질 수 있다. TTS 변환 모듈(221)은 사용자가 선택한 텍스트에 대하여 TTS 변환 기술에 의해 변환된 음성을 생성한다. TTS 영역 추출 모듈(222)은 상기 TTS 변환 모듈(221)로 음성으로 변환될 수 있는 텍스트인지 판단하여 판단 정보를 단말 장치(100)에 제공함으로써 단말 장치(100)가 문자 음성 변환 기능 제공 가능한 텍스트를 다른 텍스트와 구별하여 표시할 수 있도록 한다.
더하여, 서비스 제공부(220)는, 상기 문자 음성 변환 기능 제공을 위해 필요한 하나 이상의 컨텐츠 또는 하나 이상의 텍스트를 포함한 컨텐츠를 사용자, 즉, 단말 장치(100)로부터 수신할 수 있다. 예를 들어, 서비스를 요청한 단말 장치(100)로 텍스트 또는 컨텐츠의 제공을 요청하고, 이에 따라서 단말 장치(100)로부터 전송되는 텍스트 또는 컨텐츠를 수신할 수 있다. 상기 텍스트 또는 컨텐츠는 사용자가 직접 단말 장치(100)의 입력부(110)를 통해 입력된 것이거나, 저장부(140)에 저장되어 있는 것일 수 있다.
저장부(230)는 서비스 장치(200)의 동작을 위한 데이터 및 프로그램을 저장하는 수단으로서, 특히, 본 발명에 따른 문자 음성 변환 기능 제공을 위하여 하나 이상의 텍스트가 포함된 컨텐츠를 저장한다. 상기 서비스 장치(200)의 저장부(230)도 램(RAM, Read Access Memory), 롬(ROM, Read Only Memory), 하드디스크(HDD, Hard Disk Drive), 플래시 메모리, CD-ROM, DVD 뿐만 아니라, 네트워크 접근 스토리지(NAS, Network Access Storage)와 같이 모든 종류의 저장 매체를 포함할 수 있다.
도 6은 본 발명의 제2 실시 예에 따른 문자 음성 변환 기능 제공 방법을 나타낸 흐름도이다.
이하에서 도 6을 기반으로 본 발명의 제2 실시 예에 따른 문자 음성 변환 서비스 제공 시스템에서의 문자 음성 변환 기능 제공 과정을 설명한다.
도 6을 참조하면, 단말 장치(100)가 사용자 입력 신호에 따라서 서비스 장치(200)에 하나 이상의 텍스트를 포함한 컨텐츠를 요청한다(S405). 서비스 장치(200)는 단말 장치(100)가 요청한 컨텐츠에 대하여 저장부(230)에서 추출하여 전송하여 준다(S410). 이때 상기 컨텐츠는 문자를 음성으로 변환할 수 있는 하나 이상의 텍스트를 포함할 수 있다.
저장되어 있는 컨텐츠를 불러올 수도 있으나, 사용자가 단말 장치의 입력부(110)를 통하여 하나 이상의 텍스트를 직접 입력하여 화면에 표시할 수 있다. 이는 단말 장치(100)가 입력부(110)를 통해서 사용자로부터 출력하기를 원하는 하나 이상의 텍스트가 포함된 컨텐츠를 입력 받음에 의해 이루어질 수 있다.
단말 장치(100)는 상기 단계(S410)에서 전송 받은 컨텐츠를 불러와 화면에 표시할 수 있다(S415). 이때 사용자가 화면에 표시된 텍스트에 대하여 문자를 음성으로 변환하여 제공받기 위해 문자 음성 변환 기능 제공을 요청하면(S420), 문자를 음성으로 변환하여 제공하기 위한 화면으로 전환 시 문자 음성 변환 기능 제공 가능 텍스트를 다른 텍스트와 구별하여 표시해 주기 위하여 단말 장치(100)는 서비스 장치(200)에 상기 텍스트에 대한 문자 음성 변환 기능 제공 가능여부 판단을 요청한다(S425). 그리고 서비스 장치(200)는 사용자가 실행 중인 컨텐츠에 포함된 텍스트에 대하여 TTS 영역 추출 모듈(222)에 의해 문자 음성 변환 기능 제공 가능여부를 판단하고(S430), 단말 장치(100)에 문자 음성 변환 기능 제공 가능한 부분을 알려준다(S435). 그러면 단말 장치(100)는 실행 중인 컨텐츠에 포함된 텍스트 중에서 문자 음성 변환 기능 제공 가능한 부분을 문자 음성 변환 기능 제공이 불가능한 부분과 구별되게 표시한다(S440).
사용자는 문자 음성 변환 기능 제공이 가능하다고 표시된 텍스트 중에서 도 3에 도시된 본 발명에 의한 텍스트 선택 방법에 따라 특정 텍스트 부분을 선택하거나, 전체 듣기를 선택하여 원하는 텍스트에 대하여 음성으로 변환하여 들을 수 있다. 사용자가 특정 텍스트를 선택하거나 전체 듣기를 선택하면(S445), 단말 장치(100)는 사용자가 원하는 텍스트에 대하여 문자를 음성으로 변환하여 제공하여 줄 것을 서비스 장치(200)에 요청한다(S450). 그리고 TTS 변환 모듈(221)은 텍스트를 음성으로 변환하고(S455) 변환된 음성을 서비스 장치는(200) 단말 장치(100)에 제공하여 준다(S460).
단말 장치(100)는 상기 텍스트가 변환된 음성을 사운드 출력부(122)를 통하여 사용자에게 제공해 준다(S465). 이때 제공 중인 텍스트에 대하여 문장 또는 단어 단위로 하이라이트하여 표시할 수 있다.
또한 본 발명의 제2 실시 예에 따른 문자 음성 변환 기능 제공 중에서도 제1 실시 예와 동일하게 도 2에 도시된 바와 같이 문자 음성 변환 기능 제공 중에 텍스트 특정 부분을 다시 선택하거나, 전체 듣기를 선택하거나, 종료, 일시 정지, 다른 메뉴를 선택할 수 있다.
또한 본 발명의 제2 실시 예에 따른 문자 음성 변환 기능 제공 중에서도 제1 실시 예와 동일하게 도 3에 의한 텍스트 선택 방법에 의해 선택된 텍스트의 단위에 따라서 문자를 음성으로 변환하여 제공하는 방법이 달라질 수 있다.
한편, 상술한 서비스 장치(200)는 클라우드 컴퓨팅 방식으로 동작하는 하나 이상의 서버로 구현될 수 있다. 즉, 상기 서비스 장치(200)는 클라우드 컴퓨팅 개념으로 본 발명에 따른 문자 음성 변환 기능을 제공할 수 있다.
여기서, 클라우드 컴퓨팅이란 인터넷 기술을 활용하여 가상화된 IT 자원, 예를 들어, 하드웨어(서버, 스토리지, 네트워크 등), 소프트웨어(데이터베이스, 보안, 웹 서버 등), 서비스, 데이터 등을 온 디맨드(on demand) 방식으로 서비스하는 기술을 의미한다.
따라서, 본 발명에 의한 서비스 장치(200)는 본 발명에 따른 문자 음성 변환 서비스를 제공하는데 필요한, 하드웨어, 소프트웨어, 서비스, 데이터 중에서 하나 이상을 포함하는 컴퓨팅 자원을 단말 장치(100) 에 제공한다.
이에 따라서, 단말 장치(100)는 상기 서비스 장치(200)에서 제공하는 컴퓨팅 자원을 통해서 하나 이상의 텍스트로 이루어진 컨텐츠에서 특정 텍스트를 음성으로 변환하여 사용자에게 출력할 수 있다.
본 발명에 따른 문자 음성 변환 기능 제공을 위한 기록 매체는 다양한 컴퓨터 수단을 통하여 판독 가능한 소프트웨어 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM, Random Access Memory), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시 예에 대하여 개시하였으나, 여기에 개시된 실시 예외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다. 또한, 본 명세서와 도면에서 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다.
본 발명에 따르면, 단말 장치는 사용자가 문자 음성 변환 기능 제공 모드를 선택하여 문자 음성 변환이 가능한 텍스트가 다른 텍스트와 구별되어 표시되면, 그 중에서 문자를 음성으로 변환하여 제공받길 원하는 텍스트를 선택하여 선택한 텍스트부터 문자를 음성으로 전환한 음성데이터를 출력 받을 수 있어 학습 효과를 향상시킬 수 있다.
여러 문장 및 문단으로 이루어진 컨텐츠에서 사용자가 원하는 문장부터 문자 음성 변환시킬 수 있고, 문자 음성 변환 기능 제공 시 문장 단위로 하이라이트되어 표시될 수 있으므로 편리하게 사용할 수 있다.
100: 단말 장치 110: 입력부 120: 출력부
121: 디스플레이부 122: 사운드출력부 130: 접속부
140: 저장부 141: 컨텐츠 150: 제어부
151: TTS 변환 모듈 152: TTS 영역 추출 모듈
200: 서비스 장치 210: 인증부 220: 서비스제공부
221: TTS 변환 모듈 222: TTS 영역 추출 모듈
230: 저장부 231: 컨텐츠 300: 네트워크
10: 단말 장치의 디스플레이부 11: 메뉴 또는 타이틀 영역
12: 컨텐츠 제공 화면 13: TTS 요청 버튼 20: 문자 음성 변환 제공 화면
21: 메뉴 또는 타이틀 영역 21a: 전체듣기 버튼
21b: 종료 버튼 22: 문자 음성 변환 가능 텍스트 표시 영역

Claims (17)

  1. 컨텐츠를 단말 장치로 제공하되, 사용자의 문자 음성 변환 요청에 따라 상기 컨텐츠에서 음성으로 변환 가능한 텍스트를 다른 텍스트와 구별되도록 표시하고, 상기 표시된 텍스트 중에서 사용자가 선택한 위치부터 음성으로 변환하여 제공하는 서비스 장치; 및
    상기 서비스 장치로부터 텍스트가 변환된 음성을 사용자에게 출력하는 단말 장치를 포함하는 것을 특징으로 하는 컨텐츠 제공 시스템.
  2. 컨텐츠를 사용자에게 제공하고, 사용자의 음성 변환 요청에 따라서 상기 컨텐츠 내에서 음성으로 변환 가능한 텍스트를 다른 텍스트와 구별되도록 표시하고, 상기 표시된 텍스트 중에서 사용자가 선택한 위치부터 음성으로 변환하도록 제어하는 제어부; 및
    상기 텍스트 및 변환된 음성을 출력하는 출력부를 포함하는 것을 특징으로 하는 단말 장치.
  3. 제2항에 있어서, 상기 제어부는
    화면으로 출력된 텍스트 중 음성 변환이 가능한지 여부를 판단하여 음성 변환이 가능한 텍스트를 다른 텍스트와 구별하여 표시할 수 있도록 하는 TTS 영역 추출 모듈을 더 포함하는 것을 특징으로 하는 단말 장치.
  4. 제3항에 있어서, 상기 제어부는
    상기 TTS 영역 추출 모듈에 의해 추출된 텍스트 중에서 사용자가 선택한 위치의 단어부터 음성 변환을 실행하는 TTS 변환 모듈을 더 포함하는 것을 특징으로 하는 단말 장치.
  5. 제2항에 있어서,
    문자 음성 변환 기능 제공을 위한 사용자의 요청을 입력 받기 위한 입력부를 더 포함하고,
    상기 제어부는 상기 입력부를 통해 사용자로부터 문자를 음성으로 변환하여 제공받기 원하는 텍스트를 입력 받고, 입력 받은 텍스트를 상기 음성으로 변환 가능한 텍스트로 표시하는 것을 특징으로 하는 단말 장치.
  6. 제2항에 있어서,
    외부 장치와 통신하여 데이터를 송수신하는 통신부를 더 포함하고,
    상기 제어부는 상기 통신부를 통해 외부 장치로부터 상기 컨텐츠를 전송 받는 것을 특징으로 하는 단말 장치.
  7. 사용자의 서비스 이용 권한을 인증하는 인증부; 및
    상기 인증부에서 서비스 이용 권한이 있는 것으로 확인된 사용자의 요청에 따라서, 특정 컨텐츠에서 음성 변환이 가능한 텍스트를 추출하여 상기 컨텐츠의 다른 텍스트와 구별되게 표시되도록 상기 사용자의 단말 장치로 제공하고, 상기 추출한 텍스트 중에서 사용자로부터 선택 받은 위치부터 음성으로 변환하여 상기 단말 장치로 제공하는 서비스 제공부를 포함하는 것을 특징으로 하는 서비스 장치.
  8. 제7항에 있어서, 상기 서비스 제공부는
    상기 컨텐츠에 포함되어 있는 텍스트 중 음성 변환이 가능한 텍스트를 추출하는 TTS 영역 추출 모듈을 더 포함하는 것을 특징으로 하는 서비스 장치.
  9. 제7항에 있어서, 상기 서비스 제공부는
    상기 TTS 영역 추출 모듈에서 추출한 텍스트 중에서 사용자에 의해 선택된 단어부터 음성으로 변환하는 TTS 변환 모듈을 더 포함하는 것을 특징으로 하는 서비스 장치.
  10. 하나 이상의 텍스트를 포함하는 컨텐츠를 실행하는 단계;
    사용자의 문자 음성 변환 기능 제공 요청에 따라, 상기 컨텐츠에서 음성으로 변환 가능한 텍스트를 상기 컨텐츠의 다른 부분과 구별되게 표시하는 단계;
    상기 구별되게 표시된 텍스트 상에서 어느 한 부분을 사용자로부터 선택 받는 단계;
    상기 표시된 텍스트 중에서 상기 사용자로부터 선택된 부분부터 음성으로 변환하는 단계; 및
    상기 변환된 음성을 출력하는 단계를 실행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  11. 제10항에 있어서, 상기 구별되게 표시하는 단계는
    상기 음성으로 변환 가능한 텍스트를 상기 컨텐츠 위에 형성된 팝업 창을 통해 표시하는 단계인 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  12. 제10항에 있어서, 상기 음성으로 변환하는 단계는
    상기 텍스트 중에서 상기 사용자로부터 선택된 부분부터 단어 또는 문장 또는 문단 단위로 음성으로 변환하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  13. 제12항에 있어서, 상기 음성으로 변환하는 단계는
    단어 단위로 변환하는 경우, 상기 사용자로부터 선택된 부분을 포함하는 하나의 단어를 음성으로 변환하여 제공하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  14. 제12항에 있어서, 상기 음성으로 변환하는 단계는
    문장 단위로 변환하는 경우, 상기 사용자로부터 선택된 부분을 포함하는 문장에 대하여, 상기 문장의 처음부터 끝까지를 음성으로 변환하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  15. 제12항에 있어서, 상기 음성으로 변환하는 단계는
    문단 단위로 변환하는 경우, 상기 사용자로부터 선택된 부분을 포함하는 문단에 대하여, 상기 문단의 처음부터 끝까지를 음성으로 변환하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  16. 제10항에 있어서, 상기 컨텐츠의 다른 부분과 구별되게 표시하는 단계 이전에
    사용자로부터 하나 이상의 텍스트를 입력 받는 단계를 더 포함하고,
    상기 컨텐츠의 다른 부분과 구별되게 표시하는 단계에서, 상기 입력 받은 텍스트를 컨텐츠의 다른 부분과 구별되게 표시하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  17. 제10항에 있어서,
    상기 구별되게 표시된 텍스트에 있어서, 음성으로 출력 중인 부분을 하이라이트로 표시하는 단계를 더 포함하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
KR1020110024931A 2011-03-21 2011-03-21 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체 KR20120107306A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110024931A KR20120107306A (ko) 2011-03-21 2011-03-21 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110024931A KR20120107306A (ko) 2011-03-21 2011-03-21 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체

Publications (1)

Publication Number Publication Date
KR20120107306A true KR20120107306A (ko) 2012-10-02

Family

ID=47279323

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110024931A KR20120107306A (ko) 2011-03-21 2011-03-21 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체

Country Status (1)

Country Link
KR (1) KR20120107306A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101704250B1 (ko) * 2015-08-26 2017-02-08 한국공항공사 Atis 메시지 전송 시스템 및 atis 메시지 전송 방법
WO2017191995A1 (ko) * 2016-05-03 2017-11-09 주식회사 앰버스 언어 학습을 위한 채팅 방법 및 채팅 시스템
WO2019199030A1 (ko) * 2018-04-11 2019-10-17 삼성전자 주식회사 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법
KR20200085104A (ko) * 2019-01-04 2020-07-14 엘지전자 주식회사 디스플레이 디바이스 및 그 제어 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101704250B1 (ko) * 2015-08-26 2017-02-08 한국공항공사 Atis 메시지 전송 시스템 및 atis 메시지 전송 방법
WO2017191995A1 (ko) * 2016-05-03 2017-11-09 주식회사 앰버스 언어 학습을 위한 채팅 방법 및 채팅 시스템
WO2019199030A1 (ko) * 2018-04-11 2019-10-17 삼성전자 주식회사 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법
US11537360B2 (en) 2018-04-11 2022-12-27 Samsung Electronics Co., Ltd. System for processing user utterance and control method of same
KR20200085104A (ko) * 2019-01-04 2020-07-14 엘지전자 주식회사 디스플레이 디바이스 및 그 제어 방법

Similar Documents

Publication Publication Date Title
US10475464B2 (en) Method and apparatus for connecting service between user devices using voice
CA2970725C (en) Headless task completion within digital personal assistants
US9811313B2 (en) Voice-triggered macros
JP6125088B2 (ja) 複数のデバイス上でコンテンツを提供すること
US10048748B2 (en) Audio-visual interaction with user devices
KR102390853B1 (ko) 컨텐츠 제공 방법 및 이를 수행하는 전자 장치
US11693531B2 (en) Page display position jump method and apparatus, terminal device, and storage medium
JP6450768B2 (ja) オンスクリーンキーボード用クイックタスク
US11183188B2 (en) Voice assistant-enabled web application or web page
US20160139691A1 (en) Electronic-Scribed Input
KR20130041505A (ko) 터치 디바이스에서 검색 기능 제공 방법 및 장치
CA2878922A1 (en) User interface apparatus and method for user terminal
US20140068517A1 (en) User interface apparatus in a user terminal and method for supporting the same
US9639526B2 (en) Mobile language translation of web content
AU2013222043A1 (en) Method and apparatus for providing intelligent service using inputted character in a user device
KR20150077580A (ko) 음성 인식 기반 서비스 제공 방법 및 그 장치
KR20120107306A (ko) 컨텐츠 제공 시스템 및 그의 문자 음성 변환 기능 제공을 위한 기록 매체
US10747755B2 (en) Method for providing immediate result for user input, and apparatus therefor
US20180136904A1 (en) Electronic device and method for controlling electronic device using speech recognition
US10254940B2 (en) Modifying device content to facilitate user interaction
KR102219886B1 (ko) 단어학습 프로그램을 실행하는 단말장치
US11823589B2 (en) Interactive device-based teaching of language
US11403534B2 (en) Acquiring entity webpage link based on topological relationship graph
KR20160121302A (ko) 사용자 인터페이스 제공 시스템 및 방법
KR20120112951A (ko) 컨텐츠 제공 방법, 시스템 및 그의 단말기

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination