KR20210021501A - 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램 - Google Patents

커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20210021501A
KR20210021501A KR1020210018775A KR20210018775A KR20210021501A KR 20210021501 A KR20210021501 A KR 20210021501A KR 1020210018775 A KR1020210018775 A KR 1020210018775A KR 20210018775 A KR20210018775 A KR 20210018775A KR 20210021501 A KR20210021501 A KR 20210021501A
Authority
KR
South Korea
Prior art keywords
voice data
processor
game
voice
data
Prior art date
Application number
KR1020210018775A
Other languages
English (en)
Inventor
박승제
서호
안수남
Original Assignee
넷마블 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 넷마블 주식회사 filed Critical 넷마블 주식회사
Priority to KR1020210018775A priority Critical patent/KR20210021501A/ko
Publication of KR20210021501A publication Critical patent/KR20210021501A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/85Providing additional services to players
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/45Controlling the progress of the video game
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 개시의 몇몇 실시예에 따른, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 게임 서버의 프로세서로 하여금 이하의 동작들을 수행하기 위한 명령들을 포함하며, 상기 동작들은: 복수의 유저 단말 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신하는 동작; 상기 복수의 유저 단말 각각으로부터 수신한 상기 음성 데이터를 필터링 하여, 후보 음성 데이터를 획득하는 동작; 상기 복수의 유저 단말 각각으로부터 상기 후보 음성 데이터에 대한 피드백 신호를 수신하는 동작; 상기 피드백 신호에 기초하여, 상기 후보 음성 데이터 중 상기 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정하는 동작; 및 상기 기본 음성 데이터를 상기 제 1 콘텐츠에 적용하는 동작;을 포함할 수 있다.

Description

커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램{A GAME SERVER AND A COMPUTER PROGRAM PROVIDING CUSTOM VOICE}
본 개시는 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램에 관한 것이다.
최근 IT기술의 급격한 발달과 함께 게임 산업이 함께 성장하고 있다. 이러한 게임 산업이 성장함에 따라, 게임 서비스를 제공하는 게임 업체 또한 폭발적으로 생성되고 있다. 한편, 게임 서비스를 제공하는 게임 업체의 증가로 인해, 게임 서비스 시장의 경쟁이 치열해지고 있다. 이에 따라, 게임 업체들은 각자 제공하는 게임의 경쟁력을 갖추기 위한 노력을 지속적으로 하고 있다. 특히, 게임 업체들은 게임 유저의 흥미를 유발할 수 있는 요소에 대한 탐색을 지속적으로 수행하고 있다.
예를 들어, 수많은 동시 접속자들이 게임 내에서 미션이나 퀘스트를 수행함으로써 진행되는 MMORPG(Massively Multiplayer Online Role Playing Game)는 게임의 원활한 진행을 위해 게임의 스토리를 이해하고, 게임의 스토리와 관련된 퀘스트(미션)를 수행하는 것이 중요하다.
여기서, 게임 서비스를 제공하는 게임 업체들은 자신이 제공하는 게임의 경쟁력을 갖추기 위해 게임 내에 존재하는 캐릭터의 음성을 성우의 목소리로 제공한다. 구체적으로, 게임 업체들은 게임 유저에게 게임의 스토리를 안내하거나, 게임 유저가 게임 내 퀘스트를 수행할 때, 게임 내에 존재하는 캐릭터의 음성을 성우의 목소리로 제공한다. 예를 들어, 일반적인 게임 서비스에서는 게임 내에 존재하는 NPC(Non-Player Character)가 게임 스토리를 안내할 때, 텍스트와 함께 미리 녹음된 성우의 목소리를 제공한다. 다른 예를 들어, 일반적인 게임 서비스에서는 게임 내에 존재하는 NPC가 퀘스트 진행과 관련된 정보를 제공할 때, 텍스트와 함께 미리 녹음된 성우의 목소리를 제공한다.
따라서, 게임의 스토리를 안내하는 음성, 또는 게임 내 퀘스트를 안내하기 위한 음성의 다양성을 확보하는 방법에 대한 필요성이 당업계에 존재할 수 있다.
대한민국 공개특허공보 제10-2019-0029757호
본 개시는 전술한 배경기술에 대응하여 안출된 것으로, 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램을 제공하는 것을 목적으로 한다.
본 개시의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 바와 같은 과제를 해결하기 위한 본 개시의 몇몇 실시예에 따라, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 게임 서버의 프로세서로 하여금 이하의 동작들을 수행하기 위한 명령들을 포함하며, 상기 동작들은: 복수의 유저 단말 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신하는 동작; 상기 복수의 유저 단말 각각으로부터 수신한 상기 음성 데이터를 필터링 하여, 후보 음성 데이터를 획득하는 동작; 상기 복수의 유저 단말 각각으로부터 상기 후보 음성 데이터에 대한 피드백 신호를 수신하는 동작; 상기 피드백 신호에 기초하여, 상기 후보 음성 데이터 중 상기 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정하는 동작; 및 상기 기본 음성 데이터를 상기 제 1 콘텐츠에 적용하는 동작;을 포함할 수 있다.
또한, 상기 복수의 유저 단말 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신하는 동작은, 상기 복수의 유저 단말 중 제 1 유저 단말로부터 게임 화면 상에 디스플레이된 상기 제 1 콘텐츠와 관련된 녹음하기 버튼에 대한 입력 신호를 수신하는 동작; 상기 입력 신호에 응답하여, 상기 제 1 유저 단말에 디스플레이된 상기 게임 화면에서 녹음 화면이 출력되도록 야기하는 동작; 및 상기 제 1 유저 단말에 디스플레이된 상기 게임 화면에서 상기 녹음 화면이 출력된 후, 상기 제 1 유저 단말로부터 상기 제 1 콘텐츠와 관련된 상기 제 1 유저의 제 1 음성 데이터를 수신하는 동작;을 포함할 수 있다.
또한, 상기 녹음 화면은, 상기 제 1 콘텐츠에 대응하는 대본 표시 영역을 포함할 수 있다.
또한, 상기 복수의 유저 단말 각각으로부터 수신한 상기 음성 데이터를 필터링 하여, 후보 음성 데이터를 획득하는 동작은, 상기 음성 데이터를 음성 인식 모델에 입력함으로써, 텍스트 데이터를 획득하는 동작; 및 상기 텍스트 데이터에 기초하여, 상기 후보 음성 데이터를 결정하는 동작;을 포함할 수 있다.
또한, 상기 텍스트 데이터에 기초하여, 후보 음성 데이터를 획득하는 동작은, 메모리에 사전 저장된 적어도 하나의 텍스트를 포함하는 제 1 문장과 상기 텍스트 데이터에 포함된 제 2 문장을 비교하는 동작; 상기 제 1 문장과 상기 제 2 문장을 비교하여, 상기 제 1 문장과 상기 제 2 문장 사이에서 상기 적어도 하나의 텍스트의 일치율을 산출하는 동작; 및 상기 일치율이 기 설정된 정도 이상인 제 2 문장을 포함하는 텍스트 데이터와 관련된 음성 데이터를 상기 후보 음성 데이터로 결정하는 동작;을 포함할 수 있다.
또한, 상기 텍스트 데이터에 기초하여, 후보 음성 데이터를 획득하는 동작은, 메모리에 사전 저장된 적어도 하나의 텍스트를 포함하는 제 1 문장과 제 1 텍스트 데이터에 포함된 제 3 문장을 비교하여 상기 제 1 문장과 상기 제 3 문장 사이에서 상기 적어도 하나의 텍스트의 제 1 일치율을 산출하는 동작 - 상기 제 1 텍스트 데이터는 상기 복수의 유저 단말 중 제 2 유저 단말로부터 수신한 제 2 음성 데이터를 상기 음성 인식 모델에 입력하여 획득된 텍스트 데이터임-; 상기 제 1 문장과 제 2 텍스트 데이터에 포함된 제 4 문장을 비교하여 상기 제 1 문장과 상기 제 4 문장 사이에서 상기 적어도 하나의 텍스트의 제 2 일치율을 산출하는 동작 - 상기 제 2 텍스트 데이터는 상기 복수의 유저 단말 중 제 3 유저 단말로부터 수신한 제 3 음성 데이터를 상기 음성 인식 모델에 입력하여 획득된 텍스트 데이터임-; 및 상기 제 1 일치율이 기 설정된 정도 이상이고, 상기 제 2 일치율이 상기 기 설정된 정도 미만인 경우, 상기 제 2 음성 데이터를 상기 후보 음성 데이터로 결정하는 동작;을 포함할 수 있다.
또한, 상기 복수의 유저 단말 각각으로부터 상기 후보 음성 데이터에 대한 피드백 신호를 수신하는 동작은, 상기 복수의 유저 단말 중 제 4 유저 단말로부터 게임 화면 상에 디스플레이된 음성듣기 버튼에 대한 입력 신호를 수신하는 동작; 상기 입력 신호에 응답하여, 상기 제 4 유저 단말에 디스플레이된 상기 게임 화면에서 음성 듣기 화면이 출력되도록 야기하는 동작; 및 상기 제 4 유저 단말에 표시된 상기 게임 화면에서 상기 음성 듣기 화면이 출력된 후, 상기 제 4 유저 단말로부터 상기 후보 음성 데이터에 대한 피드백 신호를 수신하는 동작;을 포함할 수 있다.
또한, 상기 음성 듣기 화면은: 상기 복수의 유저 단말 각각으로부터 수신한 상기 음성 데이터를 필터링 하여 획득된 상기 후보 음성 데이터의 리스트 출력 영역; 및 상기 리스트에 포함된 상기 후보 음성 데이터에 대한 스코어를 입력하는 스코어 입력 영역;을 포함할 수 있다.
또한, 상기 피드백 신호는, 상기 후보 음성 데이터에 대한 스코어를 포함하고, 상기 피드백 신호에 기초하여, 상기 후보 음성 데이터 중 상기 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정하는 동작은, 상기 피드백 신호를 이용하여 상기 후보 음성 데이터 중 상기 스코어가 가장 높은 제 1 후보 음성 데이터를 상기 기본 음성 데이터로 결정하는 동작;을 포함할 수 있다.
또한, 상기 스코어가 기 설정된 점수 이상인 제 2 후보 음성 데이터를 상기 제 1 콘텐츠에 추가로 적용할 수 있는 선택 음성 데이터로 결정하는 동작;을 더 포함할 수 있다.
또한, 제 5 유저 단말로부터 상기 선택 음성 데이터 중 제 1 선택 음성 데이터를 선택하는 제 1 선택 신호를 수신한 경우, 상기 제 5 유저 단말에서 상기 제 1 콘텐츠를 디스플레이할 때, 상기 제 1 선택 음성 데이터가 출력되도록 세팅(setting)하는 동작; 및 제 6 유저 단말로부터 상기 선택 음성 데이터 중 제 2 선택 음성 데이터를 선택하는 제 2 선택 신호를 수신한 경우, 상기 제 6 유저 단말에서 상기 제 1 콘텐츠를 디스플레이할 때, 상기 제 2 선택 음성 데이터가 출력되도록 세팅하는 동작;을 더 포함할 수 있다.
전술한 바와 같은 과제를 해결하기 위한 본 개시의 몇몇 실시예에 따라, 게임 서버가 개시된다. 상기 게임 서버는: 복수의 유저 단말 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신하는 통신부; 및 상기 복수의 유저 단말 각각으로부터 수신한 상기 음성 데이터를 필터링 하여, 후보 음성 데이터를 획득하는 프로세서;를 포함하고, 상기 통신부는, 상기 복수의 유저 단말 각각으로부터 상기 후보 음성 데이터에 대한 피드백 신호를 수신하고, 상기 프로세서는, 상기 피드백 신호에 기초하여, 상기 후보 음성 데이터 중 상기 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정하고, 상기 기본 음성 데이터를 상기 제 1 콘텐츠에 적용할 수 있다.
본 개시에서 얻을 수 있는 기술적 해결 수단은 이상에서 언급한 해결 수단들로 제한되지 않으며, 언급하지 않은 또 다른 해결 수단들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 개시는 게임을 플레이하는 유저들의 엔터테인먼트적 요소를 증대시키기 위한 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램을 제공할 수 있다.
본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다.
도 1은 본 개시의 몇몇 실시예에 따른 복수의 유저 단말과 통신하는 게임 서버의 블록 구성도를 도시한다.
도 2는 본 개시의 몇몇 실시예에 따른 게임 서버가 기본 음성 데이터를 제 1 콘텐츠에 적용하는 방법의 일례를 설명하기 위한 흐름도이다.
도 3은 본 개시의 몇몇 실시예에 따른 게임 서버가 제 1 유저 단말로부터 제 1 음성 데이터를 수신하는 방법의 일례를 설명하기 위한 흐름도이다.
도 4는 본 개시의 몇몇 실시예에 따른 게임 화면의 일례를 설명하기 위한 도면이다.
도 5는 본 개시의 몇몇 실시예에 따른 녹음 화면의 일례를 설명하기 위한 도면이다.
도 6은 본 개시의 몇몇 실시예에 따른 게임 서버가 후보 음성 데이터를 결정하는 방법의 일례를 설명하기 위한 흐름도이다.
도 7은 본 개시의 몇몇 실시예에 따른 게임 서버가 후보 음성 데이터에 대한 피드백 신호를 수신하는 방법의 일례를 설명하기 위한 흐름도이다.
도 8은 본 개시의 몇몇 실시예에 따른 음성 듣기 화면의 일례를 설명하기 위한 도면이다.
도 9는 본 개시의 몇몇 실시예에 따른 게임 서버가 선택 음성 데이터를 결정하는 방법의 일례를 설명하기 위한 흐름도이다.
도 10은 본 개시의 몇몇 실시예에 따른 음성 선택 화면의 일례를 설명하기 위한 도면이다.
도 11은 본 개시의 몇몇 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나 이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 감지될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다. 구체적으로, 본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다.
또한, 다양한 양상들 및 특징들이 하나 이상의 장치들, 단말들, 서버들, 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 단말들, 서버들, 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 단말들, 서버들, 디바이스들, 컴포넌트들, 모듈들 등의 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.
본 명세서에서 사용되는 용어 "컴퓨터 프로그램" "컴포넌트", "모듈", "시스템" 등은 서로 호환가능하게 사용될 수 있으며, 그리고 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다.
또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
이하, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략한다. 또한, 본 명세서에 개시된 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않는다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.
비록 제1, 제2 등이 다양한 소자나 구성요소들을 서술하기 위해서 사용되나, 이들 소자나 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 소자나 구성요소를 다른 소자나 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 소자나 구성요소는 본 개시의 기술적 사상 내에서 제2 소자나 구성요소 일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
더불어, 본 명세서에서 사용되는 용어 "정보" 및 "데이터"는 종종 서로 상호교환 가능하도록 사용될 수 있다.
이하의 설명에서 사용되는 구성 요소에 대한 접미사 “모듈” 및 “부”는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
본 개시의 목적 및 효과, 그리고 그것들을 달성하기 위한 기술적 구성들은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조7하면 명확해질 것이다. 본 개시를 설명하는데 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 개시에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다.
그러나 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있다. 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시는 청구항의 범주에 의해 정의될 뿐이다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 개시의 몇몇 실시예에 따른 복수의 유저 단말과 통신하는 게임 서버의 블록 구성도를 도시한다.
도 1을 참조하면, 게임 서버(100) 및 복수의 유저 단말(200)은 네트워크를 통해, 본 개시의 몇몇 실시예들에 따른 커스텀 음성을 제공하는 게임 서비스를 위한 데이터를 상호 송수신할 수 있다.
게임 서버(100)는, 예를 들어, 마이크로프로세서, 메인프레임 컴퓨터, 디지털 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨터 시스템 또는 컴퓨터 디바이스를 포함할 수 있다. 그리고, 게임 서버(100)는 복수의 유저 단말(200) 각각에 커스텀 음성을 제공하는 게임 서비스를 제공할 수 있다.
복수의 유저 단말(200) 각각은, 예를 들어, PC(personal computer), 노트북(note book), 모바일 단말기(mobile terminal), 스마트 폰(smart phone), 태블릿 PC(tablet pc) 및 웨어러블 디바이스(wearable device) 등을 포함할 수 있으며, 유/무선 네트워크에 접속할 수 있는 모든 종류의 단말을 포함할 수 있다. 그리고, 복수의 유저 단말(200) 각각은 게임 서버(100)가 제공하는 커스텀 음성을 제공하는 게임 서비스를 제공받을 수 있다.
도 1에 도시된 바와 같이, 복수의 유저 단말(200)은 제 1 유저 단말(210), 제 2 유저 단말(220), 제 3 유저 단말(230), 제 4 유저 단말(240), 제 5 유저 단말(250) 및 제 6 유저 단말(260)을 포함할 수 있다. 다만, 상술한 복수의 유저 단말(200) 각각은 본 개시의 설명의 편의를 위해 표현된 것이므로, 복수의 유저 단말(200)은 위에서 열거된 유저 단말의 개수 보다 많거나, 또는 적을 수 있다.
본 개시의 몇몇 실시예들에 따른 네트워크는 공중전화 교환망(PSTN:Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.
또한, 여기서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다.
본 개시의 실시예들에 따른 네트워크는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN:Personal Area Network), 근거리 통신망(WAN:Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW:World Wide Web)일 수 있으며, 적외선(IrDA:Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다.
본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
본 개시의 몇몇 실시예에 따르면, 게임 서버(100)는 통신부(110), 메모리(120) 및 프로세서(130)를 포함할 수 있다. 다만, 상술한 구성 요소들은 게임 서버(100)를 구현하는데 있어서 필수적인 것은 아니어서, 게임 서버(100)는 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
게임 서버(100)의 통신부(110)는 게임 서버(100)와 통신 시스템 사이, 또는 게임 서버(100)와 복수의 유저 단말(200) 사이의 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 또한, 상기 통신부(110)는, 게임 서버(100)를 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함할 수 있다.
본 개시의 몇몇 실시예에 따르면, 게임 서버(100)의 통신부(110)는 복수의 유저 단말(200) 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신할 수 있다.
구체적으로, 통신부(110)는 복수의 유저 단말(200) 중 제 1 유저 단말(210)로부터 녹음하기 버튼에 대한 입력 신호를 수신할 수 있다. 여기서, 녹음하기 버튼은 게임 화면 상에 디스플레이된 제 1 콘텐츠와 관련된 버튼일 수 있다.
이 경우, 프로세서(130)는 입력 신호에 응답하여, 제 1 유저 단말(210)에 디스플레이된 게임 화면에서 녹음 화면이 출력되도록 야기할 수 있다. 구체적으로, 프로세서(130)는 게임 화면에서 녹음 화면으로 전환시키는 제어 신호를 제 1 유저 단말(210)로 전송하도록 통신부(110)를 제어할 수 있다. 여기서, 녹음 화면은 제 1 콘텐츠에 대응하는 대본 표시 영역을 포함할 수 있다.
상술한 게임 화면 및 녹음 화면에 대한 설명은 도 4 및 도 5를 참조하여 자세히 후술한다.
본 명세서에서, 복수의 유저 단말(200) 각각에서 디스플레이되는 제 1 콘텐츠는, 게임 상에서 유저의 스토리 진행과 관련된 콘텐츠, 유저의 퀘스트 진행과 관련된 콘텐츠, 유저의 미션 진행과 관련된 콘텐츠, 유저의 튜토리얼 진행과 관련된 콘텐츠 중 적어도 하나일 수 있다. 다만, 제 1 콘텐츠는 상술한 예시에 한정되는 것은 아니고 게임과 관련된 다양한 콘텐츠가 제 1 콘텐츠가 될 수 있다.
한편, 통신부(110)는 제 1 유저 단말(210)에 녹음 화면이 출력된 후, 제 1 유저 단말(210)로부터 제 1 콘텐츠와 관련된 제 1 유저의 제 1 음성 데이터를 수신할 수 있다.
메모리(120)는 프로세서(130)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들을 임시 또는 영구 저장할 수도 있다. 메모리(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적 어도 하나의 타입의 저장매체를 포함할 수 있다. 이러한 메모리(120)는 프로세서(130)에 제어에 의하여 동작 될 수 있다.
본 개시의 몇몇 실시예에 따르면, 메모리(120)는 게임 서비스로 제공되는 제 1 콘텐츠와 관련하여 적어도 하나의 텍스트를 포함하는 제 1 문장을 저장하고 있을 수 있다. 여기서, 제 1 문장은 프로세서(130)가 후보 음성 데이터를 획득하기 위해 필터링을 수행할 때 사용될 수 있다.
본 명세서에서, 게임 서버(100)가 복수의 유저 단말(200) 각각으로부터 수신하는 음성 데이터는 문장 형태를 가질 수 있다. 그리고, 음성 인식 모델은 음향 모델(Acoustic Model)과 언어 모델(Language Model)을 포함할 수 있다. 음향 모델은 음성의 신호적인 특성을 모델링한 것을 의미한다. 언어 모델은 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링한 것을 의미한다. 다만, 음성 인식 모델은 상술한 예시에 한정되지 않는다.
본 개시의 몇몇 실시예에 따르면, 프로세서(130)는 음성 인식 모델에 포함된 언어 모델을 이용하여, 음성 데이터에 대응하는 텍스트 데이터를 획득할 수 있다.
여기서, 음성 데이터에 대응하는 텍스트 데이터는 유저가 녹음한 음성을 문자화 한 데이터일 수 있다. 구체적으로, 텍스트 데이터는 유저가 녹음한 음성을 문자화 한 복수의 텍스트들을 포함할 수 있다. 또한, 텍스트 데이터는 텍스트들이 연결된 문장들을 포함할 수 있다. 여기서, 복수의 텍스트들은 복수의 음절들을 의미할 수 있다.
예를 들어, 게임 유저는 제 1 콘텐츠와 관련된 NPC의 대사로서, “오랜만이야, 소협. 무신의 비보를 찾는 일은 잘 해?”와 같은 대사를 녹음할 수 있다. 이 경우, 음성 데이터에 대응하는 텍스트 데이터는 “오”, “랜”, “만”, “이”, “야”, “소”, “협”, “무”, “신”, “의”, “비”, “보”, “를”, “찾”, “는”, “일”, “은”, “잘”, “해”와 같은 복수의 텍스트들을 포함할 수 있다. 또한, 음성 데이터에 대응하는 텍스트 데이터는 상기 복수의 텍스트들을 연결한 “오랜만이야, 소협. 무신의 비보를 찾는 일은 잘 해?”와 같은 문장을 포함할 수 있다. 다만, 이에 한정되는 것은 아니다.
상술한 바와 같이, 프로세서(130)는 복수의 유저 단말(200) 각각으로부터 수신한 음성 데이터를 필터링 할 수 있다. 또한, 프로세서(130)는 제 1 콘텐츠와 관련된 음성 데이터를 필터링하여 후보 음성 데이터를 획득할 수 있다.
구체적으로, 프로세서(130)는 복수의 유저 단말(200) 각각으로부터 수신한 음성 데이터를 음성 인식 모델에 입력할 수 있다. 그리고, 프로세서(130)는 음성 인식 모델의 출력으로써 음성 데이터에 대응하는 텍스트 데이터를 획득할 수 있다. 이 경우, 프로세서(130)는 텍스트 데이터에 기초하여, 후보 음성 데이터를 획득할 수 있다.
좀더 구체적으로, 프로세서(130)는 메모리(120)에 사전 저장된 제 1 문장과 텍스트 데이터에 포함된 제 2 문장을 비교할 수 있다. 또한, 프로세서(130)는 제 1 문장과 제 2 문장을 비교하여, 제 1 문장과 제 2 문장 사이에서 적어도 하나의 텍스트의 일치율을 산출할 수 있다. 그리고, 프로세서(130)는 일치율이 기 설정된 정도 이상인 제 2 문장을 포함하는 텍스트 데이터를 인식할 수 있다. 또한, 프로세서(130)는 인식된 텍스트 데이터와 관련된 음성 데이터를 후보 음성 데이터로 결정할 수 있다.
여기서, 제 1 문장은 유저가 녹음한 제 2 문장과 비교하기 위해 메모리(120)에 사전 저장된 문장으로서, 제 1 콘텐츠와 관련된 문장일 수 있다. 구체적으로, 제 1 문장은 제 1 콘텐츠에 적용할 음성과 대응될 수 있다. 예를 들어, 제 1 문장은 제 1 콘텐츠와 관련된 NPC의 대사에 포함된 문장일 수 있다. 다만, 이에 한정되는 것은 아니다.
그리고, 제 2 문장은 음성 데이터에 포함된 유저의 음성과 대응될 수 있다. 예를 들어, 제 2 문장은 제 1 콘텐츠와 관련된 NPC의 대사를 유저가 읽음으로써 녹음된 문장일 수 있다. 다만, 이에 한정되는 것은 아니다.
상술한 프로세서(130)가 제 1 문장과 제 2 문장 사이에서 적어도 하나의 텍스트의 일치율을 산출하고, 후보 음성 데이터를 결정하는 설명은 도 6을 참조하여 자세히 후술한다.
본 개시의 몇몇 실시예에 따르면, 후보 음성 데이터는 통신부(110)를 통해 복수의 유저 단말(200)로 전송되어, 상기 복수의 유저 단말(200)을 통해 복수의 게임 유저에게 제공될 수 있다.
한편, 통신부(110)는 복수의 유저 단말(200) 각각으로부터 후보 음성 데이터에 대한 피드백 신호를 수신할 수 있다.
구체적으로, 통신부(110)는 복수의 유저 단말(200) 중 제 4 유저 단말(240)로부터 게임 화면 상에 디스플레이된 음성듣기 버튼에 대한 입력 신호를 수신할 수 있다.
이 경우, 프로세서(130)는 입력 신호에 응답하여, 제 4 유저 단말(240)에 디스플레이된 게임 화면에서 음성 듣기 화면이 출력되도록 야기할 수 있다. 구체적으로, 프로세서(130)는 게임 화면에서 음성 듣기 화면으로 전환시키는 제어 신호를 제 4 유저 단말(240)로 전송하도록 통신부(110)를 제어할 수 있다. 여기서, 음성 듣기 화면은 후보 음성 데이터의 리스트 출력 영역 및 상기 리스트에 포함된 후보 음성 데이터에 대한 스코어를 입력하는 스코어 입력 영역을 포함할 수 있다.
상술한 음성 듣기 화면에 대한 설명은 도 8을 참조하여 자세히 후술한다.
한편, 통신부(110)는 제 4 유저 단말(240)에 음성 듣기 화면이 출력된 후, 제 4 유저 단말(240)로부터 후보 음성 데이터에 대한 피드백 신호를 수신할 수 있다.
여기서, 피드백 신호는 후보 음성 데이터 각각에 대한 스코어, 좋아요, 또는 싫어요 여부 등을 포함할 수 있다. 다만, 피드백 신호는 이에 한정되는 것은 아니고, 후보 음성 데이터 각각에 대하여, 유저의 선호도를 인식할 수 있는 어떠한 신호도 될 수 있다. 예를 들어, 피드백 신호는 후보 음성 데이터 각각에 대한 등급(예컨대, Good Grade, Not Bad Grade, Bad Grade 등)을 포함할 수도 있다.
즉, 복수의 게임 유저들은 후보 음성 데이터에 대한 다양한 방식의 선호도 표현을 피드백 신호로서 게임 서버(100)에게 제공할 수 있다.
예를 들어, 제 4 유저는 제 4 유저 단말(240)을 통해 후보 음성 데이터를 인식할 수 있다. 그리고, 제 4 유저는 제 4 유저 단말(240)을 통해, 후보 음성 데이터에 대한 선호도에 따라 좋아요 또는, 싫어요를 입력할 수 있다. 이 경우, 제 4 유저 단말(240)은 후보 음성 데이터에 대한 좋아요 또는 싫어요를 포함하는 피드백 신호를 게임 서버(100)로 전송할 수 있다. 다만, 이에 한정되는 것은 아니고, 상술한 바와 같이, 제 4 유저 단말(240)은 후보 음성 데이터에 대한 등급 및 스코어를 더 포함하는 피드백 신호를 게임 서버(100)로 전송할 수도 있다.
한편, 프로세서(130)는 피드백 신호에 기초하여, 후보 음성 데이터 중 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정할 수 있다. 그리고, 프로세서(130)는 결정된 기본 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
일례로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터 각각에 대한 스코어를 인식할 수 있다. 또한, 프로세서(130)는 스코어가 가장 높은 제 1 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
다른 일례로, 프로세서(130)는 피드백 신호에 포함된 좋아요 여부를 인식할 수 있다. 또한, 프로세서(130)는 좋아요 횟수가 가장 높은 제 1 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
또 다른 일례로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터 각각에 대한 스코어와 좋아요 횟수의 평균 점수를 산출할 수 있다. 구체적으로, 프로세서(130)는, 평균 점수를 산출할 때, 스코어는 그대로 반영하고, 좋아요 1회당 20점으로 반영할 수 있다. 예를 들어, 프로세서(130)는 스코어가 90점이고, 좋아요가 3회인 경우, 스코어 90점과 좋아요 3회를 점수로 산출한 60점의 평균인 75점을 평균 점수로 산출할 수 있다. 한편, 프로세서(130)는 스코어와 좋아요 횟수의 평균 점수가 가장 높은 제 1 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
본 개시의 다른 몇몇 실시예에 따르면, 프로세서(130)는 피드백 신호에 기초하여, 후보 음성 데이터 중 제 1 콘텐츠에 적용할 수 있는 선택 음성 데이터를 결정할 수 있다.
일례로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터 각각에 대한 스코어를 인식할 수 있다. 또한, 프로세서(130)는 스코어가 기 설정된 점수 이상인 제 2 후보 음성 데이터를 제 1 콘텐츠에 추가로 적용할 수 있는 선택 음성 데이터로 결정할 수 있다. 한편, 프로세서(130)는 스코어가 기 설정된 점수 미만인 제 3 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 없도록 후보 음성 데이터 리스트에서 삭제할 수 있다.
다른 일례로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터 각각에 대한 좋아요 여부를 인식할 수 있다. 또한, 프로세서(130)는 좋아요 횟수가 기 설정된 횟수 이상인 제 2 후보 음성 데이터를 제 1 콘텐츠에 추가로 적용할 수 있는 선택 음성 데이터로 결정할 수 있다. 한편, 프로세서(130)는 싫어요 횟수가 기 설정된 횟수 이상인 제 3 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 없도록 후보 음성 데이터 리스트에서 삭제할 수 있다.
상술한 바와 같이, 프로세서(130)는 후보 음성 데이터 중 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정할 수 있다. 그리고, 프로세서(130)는 결정된 기본 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
이 경우, 프로세서(130)는 제 1 콘텐츠에 대응하는 문장들 중 기 설정된 문장은 메모리(120)에 사전 저장된 음성 데이터를 적용할 수 있다. 그리고, 프로세서(130)는 상기 기 설정된 문장이 아닌 나머지 문장에 대하여 기본 음성 데이터를 적용할 수 있다.
예를 들어, 프로세서(130)는 게임 내 NPC(Non-Player Character)의 대사 중 첫 문장은 메모리(120)에 사전 저장된 성우의 음성 데이터를 적용할 수 있다. 그리고, 프로세서(130)는 게임 내 NPC의 대사 중 첫 문장 이후의 대사들은 유저가 녹음한 음성 데이터를 적용할 수 있다.
다만, 상술한 예시에 한정되는 것은 아니고, 게임 서버(100)의 프로세서(130)는 제 1 콘텐츠에 대응하는 모든 문장에 대응하여 유저가 녹음한 음성 데이터를 적용할 수도 있다. 또한, 프로세서(130)는 제 1 콘텐츠에 관련된 적합한 유저의 음성 데이터가 없는 경우, 제 1 콘텐츠에 대응하는 모든 문장에 대응하여 사전 저장된 성우의 음성 데이터를 적용할 수도 있다. 또한, 프로세서(130)는 제 1 콘텐츠에 관련된 적합한 유저의 음성 데이터가 없는 경우, 제 1 콘텐츠에 대응하는 모든 문장에 대응하여 별도의 음성 데이터를 적용하지 않을 수도 있다.
최근 개발되고 있는 게임들은 게임의 경쟁력을 갖추기 위해 게임의 스토리가 점차 방대해지고 있다. 게임의 스토리가 점차 방대해짐에 따라, 게임의 스토리와 관련된 퀘스트 또한 증가되는 추세이다.
한편, 일반적인 게임 서비스는 게임의 스토리를 안내하는 음성이나, 게임 내 퀘스트를 안내하기 위한 음성을 모두 성우의 목소리로 제공한다. 이 경우, 게임 내 유저에게 제공되는 안내 음성이 한 명의 성우 목소리로 구성될 수 있다. 즉, 일반 적인 게임 서비스는 게임 내 유저에게 제공되는 안내 음성이 단일적으로 구성되어 게임을 수행하는 유저가 지루함을 느낄 우려가 있다.
본 개시에 따른 게임 서버(100)는 유저의 음성 데이터를 수집하고, 적절한 필터링을 거쳐 게임 유저에게 제공한다. 즉, 본 개시에 따른 게임 서버(100)는 게임 유저에게 제공되는 안내 음성의 다양성을 확보할 수 있다. 따라서, 본 개시에 따른 게임 서버(100)는 게임 유저의 흥미를 고취시킬 수 있다.
한편, 게임 서비스 제공 업체가 방대해진 게임 스토리에 대응하여 다수의 성우 목소리를 제공하기 위해서는 높은 비용(예컨대, 목소리 녹음 비용)을 소모할 수 있다.
한편, 본 개시에 따른 게임 서버(100)는 게임 유저로부터 수집한 음성 데이터를 제공하기 때문에, 게임 내에서 제공할 다양한 음성을 확보하기 위한 비용을 감소시킬 수 있다.
프로세서(130)는 통상적으로 게임 서버(100)의 전반적인 동작을 제어한다. 프로세서(130)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(120)에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.
프로세서(130)는 메모리(120)에 저장된 응용 프로그램을 구동하기 위하여, 도 2와 함께 살펴본 구성요소들 중 적어도 일부를 제어할 수 있다. 나아가, 프로세서(130)는 상기 응용 프로그램의 구동을 위하여, 게임 서버(100)에 포함된 구성요소들 중 적어도 둘 이상을 서로 조합하여 동작시킬 수 있다.
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 및 저장매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시예들이 프로세서(130) 자체로 구현될 수 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(120)에 저장되고, 프로세서(130)에 의해 실행될 수 있다.
도 2는 본 개시의 몇몇 실시예에 따른 게임 서버가 기본 음성 데이터를 제 1 콘텐츠에 적용하는 방법의 일례를 설명하기 위한 흐름도이다.
도 2를 참조하면, 게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신할 수 있다(S100).
구체적으로, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 중 제 1 유저 단말(210)로부터 제 1 콘텐츠와 관련된 상기 제 1 유저의 제 1 음성 데이터를 수신할 수 있다. 또한, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 중 제 2 유저 단말(220)로부터 제 1 콘텐츠와 관련된 상기 제 2 유저의 제 2 음성 데이터를 수신할 수 있다.
즉, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신할 수 있다.
상술한 프로세서(130)가 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 제 1 콘텐츠와 관련된 음성 데이터를 수신하는 방법에 대한 설명은 도 3을 참조하여 좀더 자세히 후술한다.
한편, 게임 서버(100)의 프로세서(130)는 복수의 유저 단말(200) 각각으로부터 수신한 음성 데이터를 필터링 하여, 후보 음성 데이터를 결정할 수 있다(S200).
구체적으로, 프로세서(130)는 복수의 유저 단말(200) 각각으로부터 수신한 음성 데이터를 텍스트 데이터로 변환할 수 있다. 그리고, 프로세서(130)는 텍스트 데이터에 기초하여, 후보 음성 데이터를 결정할 수 있다.
좀더 구체적으로, 프로세서(130)는 메모리(120)에 사전 저장된 제 1 콘텐츠에 대응하는 대본과 텍스트 데이터를 비교할 수 있다. 그리고, 프로세서(130)는 비교를 통해 일치율을 산출할 수 있다. 이 경우, 프로세서(130)는 일치율이 기 설정된 정도 이상인 텍스트 데이터에 대응하는 음성 데이터를 후보 음성 데이터로 획득할 수 있다.
상술한 프로세서(130)가 일치율에 기초하여, 후보 음성 데이터를 결정하는 방법에 대한 설명은 도 6을 참조하여 좀더 자세히 후술한다.
게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 후보 음성 데이터에 대한 피드백 신호를 수신할 수 있다(S300).
구체적으로, 프로세서(130)는 복수의 유저 단말(200) 각각의 특정 입력 신호에 대응하여, 후보 음성 데이터를 상기 복수의 유저 단말(200) 각각 제공할 수 있다.
후보 음성 데이터가 복수의 유저 단말(200) 각각에 제공된 후, 프로세서(130)는 복수의 유저 단말(200)로부터 상기 후보 음성 데이터에 대한 피드백 신호를 수신할 수 있다.
상술한 프로세서(130)가 통신부(110)를 통해 복수의 유저 단말(200)로부터 후보 음성 데이터에 대한 피드백 신호를 수신하는 방법에 대한 설명은 도 7을 참조하여 좀더 자세히 후술한다.
게임 서버(100)의 프로세서(130)는 피드백 신호에 기초하여, 후보 음성 데이터 중 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정할 수 있다(S400). 그리고, 프로세서(130)는 결정된 기본 음성 데이터를 제 1 콘텐츠에 적용할 수 있다(S500).
일례로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터 각각에 대한 스코어를 인식할 수 있다. 또한, 프로세서(130)는 스코어가 가장 높은 제 1 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
다른 일례로, 프로세서(130)는 피드백 신호에 포함된 '좋아요' 여부를 인식할 수 있다. 또한, 프로세서(130)는 좋아요 횟수가 가장 높은 제 1 후보 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
따라서, 게임 서버(100)는 일반적인 성우의 목소리가 아닌 유저들의 음성 데이터를 제 1 콘텐츠에 적용시킴으로써, 색다른 게임 환경을 제공할 수 있다. 또한, 게임 서버(100)는 색다른 게임 환경 제공을 통해 게임을 플레이하는 유저들의 엔터테인먼트적 요소를 증대시킬 수 있다.
상술한 프로세서(130)가 기본 음성 데이터를 결정하는 방법에 대한 설명은 도 9를 참조하여 좀더 자세히 후술한다.
본 개시의 다른 몇몇 실시예에 따르면, 게임 서버(100)의 프로세서(130)는 기본 음성 데이터로 결정된 음성 데이터를 제공한 유저에게 리워드를 제공할 수 있다.
일례로, 프로세서(130)는 기본 음성 데이터로 결정된 음성 데이터를 제공한 유저의 캐릭터에 특수 효과가 표시되도록 세팅할 수 있다.
다른 일례로, 프로세서(130)는 기본 음성 데이터로 결정된 음성 데이터를 제공한 유저의 계정에 게임 내에서 사용 가능한 사이버 머니(예컨대, 캐시)를 지급할 수 있다.
따라서, 게임 서버(100)는 복수의 유저들에게 제 1 콘텐츠에 대응하는 음성 데이터 제공하도록 유도할 수 있다.
도 3은 본 개시의 몇몇 실시예에 따른 게임 서버가 제 1 유저 단말로부터 제 1 음성 데이터를 수신하는 방법의 일례를 설명하기 위한 흐름도이다.
도 3을 참조하면, 게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 제 1 유저 단말(210)로부터 게임 화면 상에 디스플레이된 제 1 콘텐츠와 관련된 녹음하기 버튼에 대한 입력 신호를 수신할 수 있다(S110).
이 경우, 프로세서(130)는 입력 신호에 응답하여, 제 1 유저 단말에 디스플레이된 게임 화면에서 녹음 화면이 출력되도록 야기할 수 있다(S120).
구체적으로, 프로세서(130)는 게임 화면에서 녹음 화면으로 전환시키는 제어 신호를 제 1 유저 단말(210)로 전송하도록 통신부(110)를 제어할 수 있다. 여기서, 녹음 화면은 제 1 콘텐츠에 대응하는 대본 표시 영역을 포함할 수 있다.
따라서, 게임 서버(100)는 게임 유저가 제 1 콘텐츠와 관련된 음성을 녹음할 때 대본을 확인하고, 쉽게 읽을 수 있도록 게임 화면에 표시함으로써, 음성 녹음에 대한 진입 장벽을 낮출 수 있다.
한편, 프로세서(130)는 제 1 유저 단말(210)에 녹음 화면이 출력된 후, 통신부(110)를 통해 제 1 유저 단말(210)로부터 제 1 콘텐츠와 관련된 제 1 유저의 제 1 음성 데이터를 수신할 수 있다(S130). 여기서, 제 1 음성 데이터는 제 1 유저 단말(210) 상에 표시되는 녹음 화면의 대본을 제 1 유저가 읽음으로써 녹음된 음성 데이터일 수 있다.
상술한 게임 화면 및 녹음 화면에 대한 설명은 이하 도 4 및 도 5를 참조하여 자세히 후술한다.
도 4는 본 개시의 몇몇 실시예에 따른 게임 화면의 일례를 설명하기 위한 도면이다.
도 4를 참조하면, 게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각에서 게임 화면이 디스플레이되도록 야기할 수 있다.
구체적으로, 프로세서(130)는 게임 화면을 출력하도록 제어하는 제어 신호를 복수의 유저 단말(200) 각각으로 전송하도록 통신부(110)를 제어할 수 있다.
이 경우, 복수의 유저 단말(200) 각각은 도 4에 도시된 바와 같은 게임 화면(300)을 출력할 수 있다.
본 개시의 몇몇 실시예에 따르면, 게임 화면(300)은 백그라운드 영역(304), 팝업 화면 영역(305), 대사 표여 영역(306), 녹음하기 버튼(301), 음성듣기 버튼(302) 및 음성선택 버튼(303) 중 적어도 하나를 포함할 수 있다. 다만, 상술한 구성 요소들은 게임 화면(300)을 구현하는데 있어서 필수적인 것은 아니어서, 게임 화면(300)은 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
먼저, 게임 화면(300)의 백그라운드 영역(304)에는 게임의 전반적인 내용이 표시될 수 있다. 예를 들어, 백그라운드 영역(304)에는 게임 내 캐릭터 및 게임 내 환경 등이 표시될 수 있다. 또한, 백그라운드 영역(304)은 게임 내 캐릭터 또는 NPC 등의 대사 표시 영역(306)을 포함할 수 있다.
그리고, 게임 화면(300)의 백그라운드 영역(304) 상의 일부에는 다양한 게임 서비스를 위한 버튼들이 표시될 수 있다. 구체적으로, 도 4에 도시된 바와 같이, 녹음하기 버튼(301), 음성 듣기 버튼(302) 및 음성 선택 버튼(303)이 표시될 수 있다.
한편, 프로세서(130)는 통신부(110)를 통해 상기 게임 화면(300)에 포함될 수 있는 녹음하기 버튼(301), 음성듣기 버튼(302) 및 음성선택 버튼(303) 각각에 대한 입력 신호를 수신할 수 있다.
일례로, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 녹음하기 버튼(301)에 대한 입력 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 녹음하기 버튼(301)에 대한 입력 신호에 응답하여, 상기 복수의 유저 단말(200) 각각에 디스플레이된 게임 화면(300)에서 녹음 화면이 출력되도록 야기할 수 있다. 여기서, 녹음 화면은 백그라운드 영역(304)에 포함된 팝업 화면 표시 영역(305) 상에 출력될 수 있다.
상술한 녹음 화면에 대한 설명은 도 5를 참조하여 좀더 자세히 후술한다.
다른 일례로, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 음성듣기 버튼(302)에 대한 입력 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 음성듣기 버튼(302)에 대한 입력 신호에 응답하여, 상기 복수의 유저 단말(200) 각각에 디스플레이된 게임 화면(300)에서 음성 듣기 화면이 출력되도록 야기할 수 있다. 여기서, 음성 듣기 화면은 백그라운드 영역(304)에 포함된 팝업 화면 표시 영역(305) 상에 출력될 수 있다.
상술한 음성 듣기 화면에 대한 설명은 도 8을 참조하여 좀더 자세히 후술한다.
또 다른 일례로, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 음성선택 버튼(303)에 대한 입력 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 음성선택 버튼(303)에 대한 입력 신호에 응답하여, 상기 복수의 유저 단말(200) 각각에 디스플레이된 게임 화면(300)에서 음성 선택 화면이 출력되도록 야기할 수 있다. 여기서, 음성 선택 화면은 백그라운드 영역(304)에 포함된 팝업 화면 표시 영역(305) 상에 출력될 수 있다.
상술한 음성 선택 화면에 대한 설명은 도 10을 참조하여 좀더 자세히 후술한다.
한편, 상술한 팝업 표시 영역(305) 상에 녹음 화면, 음성 듣기 화면 또는 음성 선택 화면 등이 표시되는 경우, 백그라운드 영역(304) 상에 표시되고 있었던 게임 내 캐릭터 및 게임 내 환경 등은 일시정지 상태로 표시될 수 있다.
다만, 이에 한정되는 것은 아니고, 팝업 표시 영역(305) 상에 녹음 화면, 음성 듣기 화면 또는 음성 선택 화면 등이 표시되더라도, 백그라운드 영역(304) 상에 표시되고 있었던 게임 내 캐릭터 및 게임 내 환경 등은 팝업 표시 영역(305)을 제외한 백그라운드 영역(304) 상에서 움직이는 상태를 유지할 수도 있다.
도 5는 본 개시의 몇몇 실시예에 따른 녹음 화면의 일례를 설명하기 위한 도면이다.
본 개시의 몇몇 실시예에 따르면, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 중 제 1 유저 단말(210)로부터 녹음하기 버튼(301)에 대한 입력 신호를 수신할 수 있다.
이 경우, 프로세서(130)는 제 1 유저 단말(210)로부터 수신된 녹음하기 버튼(301)에 대한 입력 신호에 응답하여, 상기 제 1 유저 단말(210)에 디스플레이된 게임 화면(300)에서 녹음 화면(310)이 도 5와 같이 출력되도록 야기할 수 있다.
구체적으로, 프로세서(130)는 게임 화면(300)에서 녹음 화면(310)으로 전환시키는 제어 신호를 제 1 유저 단말(210)로 전송하도록 통신부(110)를 제어할 수 있다.
좀더 구체적으로, 프로세서(130)는 게임 화면(300)의 팝업 표시 영역(305)에 녹음 화면(310)이 출력되도록 통신부(110)를 통해 제어 신호를 제 1 유저 단말(210)로 전송할 수 있다.
이 경우, 복수의 유저 단말(200) 중 제 1 유저 단말(210)은 도 5에 도시된 바와 같은 녹음 화면(310)을 출력할 수 있다. 여기서, 녹음 화면(310)은 사용자 인터렉션이 가능한 화면으로써, 특정 버튼을 통해 유저의 음성을 녹음할 수 있다. 다만, 이에 한정되지 않는다.
본 개시의 몇몇 실시예에 따르면, 녹음 화면(310)은 대본 표시 영역(311) 및 녹음시작 및 녹음정지 버튼(312) 중 적어도 하나를 포함할 수 있다. 다만, 상술한 구성 요소들은 녹음 화면(310)을 구현하는데 있어서 필수적인 것은 아니어서, 녹음 화면(310)은 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
한편, 제 1 유저 단말(210)은 제 1 유저가 녹음을 완료한 경우, 상기 제 1 유저의 제 1 음성 데이터를 게임 서버(100)로 전송할 수 있다.
구체적으로, 제 1 유저 단말(210)은 녹음시작 및 녹음정지 버튼(312)에 대한 입력 신호를 수신함에 따라, 제 1 유저의 녹음 완료 여부를 인식할 수 있다. 그리고, 제 1 유저 단말(210)은 인식된 제 1 유저의 녹음 완료 여부에 따라, 제 1 유저의 제 1 음성 데이터를 게임 서버(100)로 전송할 수 있다.
즉, 게임 서버(100)의 프로세서(130)는 제 1 유저 단말(210)에 녹음 화면(310)이 출력된 후, 통신부(110)를 통해 제 1 유저 단말(210)로부터 제 1 콘텐츠와 관련된 제 1 유저의 제 1 음성 데이터를 수신할 수 있다.
한편, 게임을 플레이하는 유저는 제 1 콘텐츠와 관련된 음성을 녹음하기 위해 별도의 페이지에 접속할 필요 없이, 게임 화면(300)에서 녹음하기 버튼(301)을 통해 간편하게 자신의 음성을 녹음할 수 있다.
본 개시의 다른 몇몇 실시예에 따르면, 녹음 화면(310)은 필터 효과 버튼(미도시)을 포함할 수 있다. 이 경우, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 중 제 1 유저 단말(210)로부터 필터 효과 버튼에 대한 입력 신호를 수신할 수 있다.
이 경우, 프로세서(130)는 제 1 유저 단말(210)로부터 수신된 필터 효과 버튼에 대한 입력 신호에 응답하여, 제 1 유저의 목소리에 필터 효과를 적용시킬 수 있다.
구체적으로, 프로세서(130)는 제 1 유저 단말(210)로부터 수신한 제 1 음성 데이터를 음성 변환하여, 필터 효과를 적용시킬 수 있다. 좀더 구체적으로, 프로세서(130)는 제 1 음성 데이터를 음성 변조 필터에 입력할 수 있다. 그리고, 프로세서(130)는 음성 변조 필터의 출력으로써, 필터 효과가 적용된 제 1 음성 데이터를 획득할 수 있다.
다만, 이에 한정되는 것은 아니고, 프로세서(130)는 필터 효과가 적용된 상태로 녹음된 제 1 유저의 제 1 음성 데이터를 제 1 유저 단말(210)로부터 수신할 수도 있다. 여기서, 필터 효과는 예를 들어, 유저의 목소리를 여성의 목소리, 남성의 목소리 또는 특정 캐릭터의 목소리 등으로 변환시키는 효과를 의미할 수 있다.
상술한 바와 같이, 게임 서버(100)의 프로세서(130)는 복수의 유저들에게 특색 있는 녹음 환경을 제공하여, 복수의 유저들에게 제 1 콘텐츠에 대응하는 음성 데이터 제공하도록 유도할 수 있다.
제 1 콘텐츠와 관련된 음성을 녹음하기 위해 별도의 페이지에 접속할 필요 없이, 게임 화면(300)에서 녹음하기 버튼(301)을 통해 간편하게 자신의 음성을 녹음할 수 있다.
도 6은 본 개시의 몇몇 실시예에 따른 게임 서버가 후보 음성 데이터를 결정하는 방법의 일례를 설명하기 위한 흐름도이다.
도 6을 참조하면, 게임 서버(100)의 프로세서(130)는 음성 데이터를 음성 인식 모델에 입력함으로써, 텍스트 데이터를 획득할 수 있다(S210). 여기서, 음성 데이터는 복수의 유저 단말(200) 각각으로부터 수신한 데이터일 수 있다. 그리고, 음성 데이터는 문장 형태를 가질 수 있다.
또한, 프로세서(130)가 사용하는 음성 인식 모델은 음향 모델(Acoustic Model)과 언어 모델(Language Model)을 포함할 수 있다. 음향 모델은 음성의 신호적인 특성을 모델링한 것을 의미한다. 언어 모델은 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링한 것을 의미한다. 다만, 음성 인식 모델은 상술한 예시에 한정되지 않는다.
본 개시의 몇몇 실시예에 따르면, 프로세서(130)는 음성 인식 모델에 포함된 언어 모델을 이용하여, 음성 데이터에 대응하는 텍스트 데이터를 획득할 수 있다.
구체적으로, 프로세서(130)는 STT(Speech to text) 기술을 구현하는 음성 인식 모델에 음성 데이터를 입력할 수 있다. 그리고, 프로세서(130)는 상기 음성 인식 모델의 출력 값으로써 음성 데이터에 대응하는 텍스트 데이터를 획득할 수 있다.
도 1에서 상술한 바와 같이, 음성 데이터에 대응하는 텍스트 데이터는 유저가 녹음한 음성을 문자화 한 데이터일 수 있다. 구체적으로, 텍스트 데이터는 유저가 녹음한 음성을 문자화 한 복수의 텍스트들을 포함할 수 있다. 또한, 텍스트 데이터는 텍스트들이 연결된 문장들을 포함할 수 있다. 여기서, 복수의 텍스트들은 복수의 음절들을 의미할 수 있다.
예를 들어, 게임 유저는 제 1 콘텐츠와 관련된 NPC의 대사로서, “오랜만이야, 소협. 무신의 비보를 찾는 일은 잘 해?”와 같은 대사를 녹음할 수 있다. 이 경우, 음성 데이터에 대응하는 텍스트 데이터는 “오”, “랜”, “만”, “이”, “야”, “소”, “협”, “무”, “신”, “의”, “비”, “보”, “를”, “찾”, “는”, “일”, “은”, “잘”, “해”와 같은 복수의 텍스트들을 포함할 수 있다. 또한, 음성 데이터에 대응하는 텍스트 데이터는 상기 복수의 텍스트들을 연결한 “오랜만이야, 소협. 무신의 비보를 찾는 일은 잘 해?”와 같은 문장을 포함할 수 있다. 다만, 이에 한정되는 것은 아니다.
본 개시의 몇몇 실시예에 따르면, 프로세서(130)는 메모리(120)에 사전 저장된 제 1 문장과 텍스트 데이터에 포함된 제 2 문장을 비교할 수 있다. 여기서, 제 1 문장 및 제 2 문장은 제 1 콘텐츠와 관련된 문장일 수 있다. 예를 들어, 제 1 문장은 게임 내 NPC의 대사와 관련된 문장을 포함할 수 있다. 제 2 문장은 게임 내 NPC의 대사를 유저가 읽음으로써 녹음된 문장을 포함할 수 있다.
제 1 문장은 적어도 하나의 텍스트를 포함할 수 있다. 예를 들어, 제 1 문장은 “오랜만이에요, 소협. 무신의 비보를 찾는 일은 잘 하고 계신가요?”일 수 있다. 이 경우, 제 1 문장에 포함되는 적어도 하나의 텍스트는, “오”, “랜”, “만”, “이”, “에”, 요”, “소”, “협”, “무”, “신”, “의”, “비”, ”보”, “를”, “찾”, “는”, “일”, “은”, “잘”, “하”, ”고”, “계”, “신”, “가”, “요”일 수 있다. 즉, 제 1 문장에 포함된 적어도 하나의 텍스트는, 제 1 문장에 포함된 음절들을 의미할 수 있다.
제 2 문장은 예를 들어, “오랜만이야, 소협. 무신의 비보를 찾는 일은 잘 해?”일 수 있다. 이 경우, 제 2 문장에 포함되는 적어도 하나의 텍스트는 “오”, “랜”, “만”, “이”, “야”, “소”, “협”, “무”, “신”, “의”, “비”, “보”, “를”, “찾”, “는”, “일”, “은”, “잘”, “해”일 수 있다. 즉, 제 2 문장에 포함된 적어도 하나의 텍스트는, 제 2 문장에 포함된 음절들을 의미할 수 있다.
이 경우, 프로세서(130)는 제 1 문장과 제 2 문장 사이에서 적어도 하나의 텍스트의 일치율을 산출할 수 있다(S230).
구체적으로, 프로세서(130)는 제 1 문장에 포함되는 텍스트와 제 2 문장에 포함되는 적어도 하나의 텍스트 각각을 각 텍스트의 순서에 기초하여 비교할 수 있다. 그리고, 프로세서(130)는 제 2 문장에 포함된 적어도 하나의 텍스트가 제 1 문장에 포함된 적어도 하나의 텍스트와 일치하는 정도 또는, 상이한 정도에 따라, 일치율을 산출할 수 있다.
예를 들어, 제 1 문장은 “오랜만이에요, 소협. 무신의 비보를 찾는 일은 잘 하고 계신가요?”이고, 제 2 문장은 “오랜만이야, 소협. 무신의 비보를 찾는 일은 잘 해?”인 경우, 제 1 문장에 포함된 25 개의 텍스트 중 일치하는 텍스트가 17개 일 수 있다.
이 경우, 프로세서(130)는, 제 1 문장에 포함된 25 개의 텍스트 중 제 2 문장에 포함된 텍스트와 일치하는 텍스트가 17개이므로, '17/25'의 일치율을 산출할 수 있다. 또는, 프로세서(130)는 '17/25'의 백분율인 '68%'를 일치율로 산출할 수 있다.
본 개시의 몇몇 실시예에 따르면, 프로세서(130)는 일치율이 기 설정된 정도 이상인 경우(S240, Yes), 제 2 문장을 포함하는 텍스트 데이터와 관련된 음성 데이터를 후보 음성 데이터로 결정할 수 있다(S250).
예를 들어, 프로세서(130)는 일치율이 60% 이상인 경우, 제 2 문장을 포함하는 텍스트와 관련된 음성 데이터를 후보 음성 데이터로 결정할 수 있다.
한편, 프로세서(130)는, 일치율이 기 설정된 정도 미만인 경우(S240, No), 제 2 문장을 포함하는 텍스트 데이터와 관련된 음성 데이터를 후보 음성 데이터에서 제외시킬 수 있다.
예를 들어, 프로세서(130)는 일치율이 60% 미만인 경우, 제 2 문장을 포함하는 텍스트와 관련된 음성 데이터를 후보 음성 데이터에서 제외시킬 수 있다.
일례로, 프로세서(130)는 메모리(120)에 사전 저장된 제 1 문장과 제 1 텍스트 데이터에 포함된 제 3 문장을 비교할 수 있다. 또한, 프로세서(130)는 제 1 문장과 제 3 문장 사이에서 적어도 하나의 텍스트의 제 1 일치율을 산출할 수 있다. 여기서, 제 1 텍스트 데이터는 복수의 유저 단말(200) 중 제 2 유저 단말로부터 수신한 제 2 음성 데이터를 상기 음성 인식 모델에 입력하여 획득된 텍스트 데이터일 수 있다.
또한, 프로세서(130)는 제 1 문장과 제 2 텍스트 데이터에 포함된 제 4 문장을 비교할 수 있다. 또한, 프로세서(130)는 제 1 문장과 제 4 문장 사이에서 상기 적어도 하나의 텍스트의 제 2 일치율을 산출할 수 있다. 여기서, 제 2 텍스트 데이터는 복수의 유저 단말(200) 중 제 3 유저 단말(230)로부터 수신한 제 3 음성 데이터를 상기 음성 인식 모델에 입력하여 획득된 텍스트 데이터일 수 있다.
이 경우, 프로세서(130)는 상기 제 1 일치율이 기 설정된 정도(예컨대, 60%) 이상이고, 상기 제 2 일치율이 기 설정된 정도 미만인 경우, 제 2 음성 데이터만 후보 음성 데이터로 결정할 수 있다. 그리고, 프로세서(130)는 제 3 음성 데이터를 후보 음성 데이터에서 제외시킬 수 있다.
즉, 프로세서(130)는 제 1 콘텐츠에 대응하는 대사를 유저가 녹음한 음성 데이터에 상기 제 1 콘텐츠에 대응하는 내용이 적절히 포함되었는지 여부를 인식할 수 있다. 또한, 프로세서(130)는 제 1 콘텐츠에 대응하는 내용이 적절히 포함된 음성 데이터만 필터링하여, 음성 데이터의 품질을 확보할 수 있다.
본 개시의 다른 몇몇 실시예에 따르면, 게임 서버(100)의 프로세서(130)는 음성 데이터를 필터링할 때, 음성 인식 모델에 포함된 언어 모델을 이용하여, 음성 데이터에 대응하는 텍스트 데이터를 획득할 수 있다.
이 경우, 프로세서(130)는 음성 데이터에 비속어가 포함되었는지 여부를 인식할 수 있다. 또한, 프로세서(130)는 음성 데이터에 비속어가 포함된 경우, 상기 비속어가 포함된 음성 데이터를 후보 음성 데이터에서 제외시킬 수 있다.
구체적으로, 프로세서(130)는 메모리(120)에 사전 저장된 비속어 텍스트와 상기 음성 데이터에 대응하는 적어도 하나의 텍스트를 비교할 수 있다. 그리고, 프로세서(130)는 음성 데이터에 대응하는 적어도 하나의 텍스트 중 상기 비속어 텍스트와 일치하는 텍스트가 존재하는 경우, 상기 음성 데이터를 후보 음성 데이터에서 제외시킬 수 있다.
따라서, 게임 서버(100)는 비속어가 포함된 음성 데이터를 제외시킴으로써, 보다 쾌적한 게임 환경을 보존할 수 있다.
도 7은 본 개시의 몇몇 실시예에 따른 게임 서버가 후보 음성 데이터에 대한 피드백 신호를 수신하는 방법의 일례를 설명하기 위한 흐름도이다.
도 7을 참조하면, 게임 서버(100)의 프로세서(130)는 복수의 유저 단말(200) 중 제 4 유저 단말(240)로부터 음성듣기 버튼에 대한 입력 신호를 수신할 수 있다(S310).
이 경우, 프로세서(130)는 입력 신호에 응답하여, 제 4 유저 단말(240)에 디스플레이된 게임 화면에서 음성 듣기 화면이 출력되도록 야기할 수 있다(S320).
구체적으로, 프로세서(130)는 게임 화면에서 음성 듣기 화면으로 전환시키는 제어 신호를 제 4 유저 단말(240)로 전송하도록 통신부(110)를 제어할 수 있다. 여기서, 음성 듣기 화면은 후보 음성 데이터의 리스트 출력 영역 및 상기 리스트에 포함된 후보 음성 데이터에 대한 스코어를 입력하는 스코어 입력 영역 중 적어도 하나를 포함할 수 있다.
한편, 프로세서(130)는 제 4 유저 단말(240)에 음성 듣기 화면이 출력된 후, 통신부(110)를 통해 후보 음성 데이터에 대한 피드백 신호를 수신할 수 있다(S330). 여기서, 피드백 신호는 후보 음성 데이터 각각에 대한 스코어, 좋아요, 또는 싫어요 여부 등을 포함할 수 있다.
피드백 신호에 포함된 '좋아요' 또는, '싫어요'는 게임 유저가 특정 후보 음성 데이터에 대한 선호도에 따라 게임 유저가 입력한 정보일 수 있다. 예를 들어, 제 4 유저는 제 4 유저 단말(240)을 통해 후보 음성 데이터를 인식할 수 있다. 그리고, 제 4 유저는 제 4 유저 단말(240)을 통해, 후보 음성 데이터에 대한 선호도에 따라 좋아요 또는, 싫어요를 입력할 수 있다. 이 경우, 제 4 유저 단말(240)은 후보 음성 데이터에 대한 좋아요 또는 싫어요를 포함하는 피드백 신호를 게임 서버(100)로 전송할 수 있다.
따라서, 게임 서버(100)는 게임 유저에게 다양한 방식(여기서, 스코어, 좋아요 또는 싫어요 등)으로 피드백을 제공받을 수 있다. 한편, 게임 유저는 다양한 방식 중 편리한 방식을 선택하여, 피드백을 게임 서버(100)로 제공할 수 있다.
상술한 음성 듣기 화면에 대한 설명은 이하 도 8을 참조하여 자세히 후술한다.
도 8은 본 개시의 몇몇 실시예에 따른 음성 듣기 화면의 일례를 설명하기 위한 도면이다.
도 8을 참조하면, 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 중 제 4 유저 단말(240)로부터 음성듣기 버튼(302)에 대한 입력 신호를 수신할 수 있다.
이 경우, 프로세서(130)는 제 4 유저 단말(240)로부터 수신된 음성듣기 버튼(302)에 대한 입력 신호에 응답하여, 상기 제 4 유저 단말(240)에 디스플레이된 게임 화면(300)에서 음성 듣기 화면(320)이 출력되도록 야기할 수 있다.
구체적으로, 프로세서(130)는 게임 화면(300)에서 음성 듣기 화면(320)으로 전환시키는 제어 신호를 제 4 유저 단말(240)로 전송하도록 통신부(110)를 제어할 수 있다.
좀더 구체적으로, 프로세서(130)는 게임 화면(300)의 팝업 표시 영역(305)에 음성 듣기 화면(320)이 출력되도록 통신부(110)를 통해 제어 신호를 제 4 유저 단말(240)로 전송할 수 있다.
이 경우, 복수의 유저 단말(200) 중 제 4 유저 단말(240)은 도 8에 도시된 바와 같은 음성 듣기 화면(320)을 출력할 수 있다. 여기서, 음성 듣기 화면(320)은 사용자 인터렉션이 가능한 화면으로써, 유저는 특정 버튼을 통해 후보 음성 데이터에 대응하는 음성을 청취할 수 있다. 또한, 유저는 특정 입력 영역을 통해, 후보 음성 데이터에 대한 피드백을 입력할 수 있다. 다만, 이에 한정되지 않는다.
본 개시의 몇몇 실시예에 따르면, 음성 듣기 화면(320)은 후보 음성 데이터의 리스트(321)를 포함할 수 있다. 그리고, 후보 음성 데이터의 리스트(321)는 닉네임 항목, 재생 버튼 입력 영역(322), 좋아요 및 싫어요 버튼 입력 영역(323), 스코어 입력 영역(324) 중 적어도 하나를 포함할 수 있다. 다만, 상술한 구성 요소들은 음성 듣기 화면(320)을 구현하는데 있어서 필수적인 것은 아니어서, 음성 듣기 화면(320)은 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
본 개시의 몇몇 실시예에 따르면, 제 4 유저 단말(240)은 재생 버튼 입력 영역(322)에 포함된 적어도 하나의 재생 버튼에 대한 입력 신호를 인식할 수 있다. 그리고, 제 4 유저 단말(240)은 입력 신호에 응답하여, 상기 적어도 하나의 재생 버튼에 대응하는 후보 음성 데이터를 음향으로 출력할 수 있다.
한편, 제 4 유저 단말(240)은 제 4 유저가 스코어 입력을 완료한 경우, 입력된 스코어를 포함하는 피드백 신호를 게임 서버(100)로 전송할 수 있다.
구체적으로, 제 4 유저 단말(240)은 스코어 입력 영역(324)에 스코어가 모두 입력되었는지 여부를 인식할 수 있다. 그리고, 제 4 유저 단말(240)은 스코어가 모두 입력되었다고 인식함에 따라, 스코어를 포함하는 피드백 신호를 게임 서버(100)로 전송할 수 있다.
추가적으로, 제 4 유저 단말(240)은 좋아요 및 싫어요 표시 영역(323)에 포함된 좋아요 버튼 또는 싫어요 버튼에 대한 입력 신호를 인식할 수 있다. 그리고, 제 4 유저 단말(240)은 좋아요 버튼 또는 싫어요 버튼에 대한 입력 신호를 게임 서버(100)로 전송할 수 있다.
즉, 게임 서버(100)의 프로세서(130)는 제 4 유저 단말(240)에 음성 듣기 화면(320)이 출력된 후, 통신부(110)를 통해 제 4 유저 단말(240)로부터 후보 음성 데이터에 대한 피드백 신호를 수신할 수 있다.
한편, 게임을 플레이하는 유저는 후보 음성 데이터에 대한 피드백을 제공하기 위해 별도의 페이지에 접속할 필요 없이, 게임 화면(300)에서 음성듣기 버튼(302)을 통해 간편하게 피드백 정보를 입력할 수 있다.
도 9는 본 개시의 몇몇 실시예에 따른 게임 서버가 선택 음성 데이터를 결정하는 방법의 일례를 설명하기 위한 흐름도이다.
도 9를 참조하면, 게임 서버(100)의 프로세서(130)는 후보 음성 데이터에 대한 피드백 신호에 기초하여, 제 1 후보 음성 데이터를 기본 음성 데이터로 결정할 수 있다(S410). 여기서, 기본 음성 데이터는 제 1 콘텐츠에 기본으로 적용되는 음성 데이터를 의미한다.
구체적으로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터에 대한 스코어를 이용하여, 스코어가 가장 높은 제 1 후보 음성 데이터를 인식할 수 있다. 그리고, 프로세서(130)는 스코어가 가장 높은 제 1 후보 음성 데이터를 기본 음성 데이터로 결정할 수 있다.
상술한 바와 같이, 프로세서(130)는 후보 음성 데이터 중 제 1 콘텐츠에 적용할 기본 음성 데이터를 결정할 수 있다. 그리고, 프로세서(130)는 결정된 기본 음성 데이터를 제 1 콘텐츠에 적용할 수 있다.
이 경우, 프로세서(130)는 제 1 콘텐츠에 대응하는 문장들 중 기 설정된 문장은 메모리(120)에 사전 저장된 음성 데이터를 적용할 수 있다. 그리고, 프로세서(130)는 상기 기 설정된 문장이 아닌 나머지 문장에 대하여 기본 음성 데이터를 적용할 수 있다.
예를 들어, 프로세서(130)는 게임 내 NPC의 대사 중 첫 문장은 메모리(120)에 사전 저장된 성우의 음성 데이터를 적용할 수 있다. 그리고, 프로세서(130)는 게임 내 NPC의 대사 중 첫 문장 이후의 대사들은 유저가 녹음한 음성 데이터를 적용할 수 있다.
다만, 상술한 예시에 한정되는 것은 아니고, 게임 서버(100)의 프로세서(130)는 제 1 콘텐츠에 대응하는 모든 문장에 대응하여 유저가 녹음한 음성 데이터를 적용할 수도 있다. 또한, 프로세서(130)는 제 1 콘텐츠에 관련된 적합한 유저의 음성 데이터가 없는 경우, 제 1 콘텐츠에 대응하는 모든 문장에 대응하여 사전 저장된 성우의 음성 데이터를 적용할 수도 있다. 또한, 프로세서(130)는 제 1 콘텐츠에 관련된 적합한 유저의 음성 데이터가 없는 경우, 제 1 콘텐츠에 대응하는 모든 문장에 대응하여 별도의 음성 데이터를 적용하지 않을 수도 있다.
한편, 프로세서(130)는 후보 음성 데이터에 대한 피드백 신호에 기초하여, 제 2 후보 음성 데이터를 선택 음성 데이터로 결정할 수 있다(S420). 여기서, 선택 음성 데이터는 제 1 콘텐츠에 추가로 적용할 수 있는 음성 데이터를 의미한다.
구체적으로, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터에 대한 스코어를 이용하여, 스코어가 기 설정된 점수 이상인 제 2 후보 음성 데이터를 인식할 수 있다. 그리고, 프로세서(130)는 스코어가 기 설정된 점수 이상인 적어도 하나의 제 2 후보 음성 데이터를 선택 음성 데이터로 결정할 수 있다.
본 개시의 다른 몇몇 실시예에 따르면, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터에 좋아요 횟수를 이용하여, 좋아요 횟수가 가장 많은 제 1 후보 음성 데이터를 인식할 수 있다. 그리고, 프로세서(130)는 좋아요 횟수가 가장 많은 제 1 후보 음성 데이터를 기본 음성 데이터로 결정할 수 있다.
한편, 프로세서(130)는 피드백 신호에 포함된 후보 음성 데이터에 대한 좋아요 횟수를 이용하여, 좋아요 횟수가 기 설정된 횟수 이상인 적어도 하나의 제 2 후보 음성 데이터를 인식할 수 있다. 그리고, 프로세서(130)는 좋아요 횟수가 기 설정된 횟수 이상인 적어도 하나의 제 2 후보 음성 데이터를 선택 음성 데이터로 결정할 수 있다.
즉, 게임 서버(100)의 프로세서(130)는 복수의 유저 단말(200) 각각으로부터 수신한 피드백 신호를 이용하여 기본 음성 데이터 및 선택 음성 데이터를 결정할 수 있다.
게임 서버(100)의 프로세서(130)는 게임을 플레이하는 유저들의 피드백에 따라, 인기도가 높은 음성 데이터를 선택 음성 데이터로 제 1 콘텐츠와 함께 제공할 수 있다. 뿐만 아니라, 프로세서(130)는 인기도가 가장 높은 음성 데이터를 기본 음성 데이터로 제 1 콘텐츠와 함께 제공할 수 있다. 따라서, 게임을 플레이하는 유저는 게임 내에서 제공되는 다양한 음성을 통해 보다 흥미롭게 게임을 즐길 수 있다.
본 개시의 몇몇 실시예에 따르면, 게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 선택 음성 데이터를 선택하는 선택 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 복수의 유저 단말(200) 각각에서 디스플레이되는 제 1 콘텐츠와 상기 선택 신호에 대응하는 선택 음성 데이터가 연동되어 출력되도록 세팅할 수 있다.
일례로, 프로세서(130)는 통신부(110)를 통해 제 5 유저 단말(250)로부터 선택 음성 데이터 중 제 1 선택 음성 데이터를 선택하는 제 1 선택 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 제 5 유저 단말(250)에서 제 1 콘텐츠를 디스플레이할 때, 제 1 선택 음성 데이터가 출력되도록 세팅(setting)할 수 있다.
다른 일례로, 프로세서(130)는 통신부(110)를 통해 제 6 유저 단말(260)로부터 선택 음성 데이터 중 제 2 선택 음성 데이터를 선택하는 제 2 선택 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 제 6 유저 단말(260)에서 제 1 콘텐츠를 디스플레이할 때, 제 2 선택 음성 데이터가 출력되도록 세팅할 수 있다.
본 개시의 다른 몇몇 실시예에 따르면, 게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 특정 유저의 음성 데이터를 선택하는 선택 신호를 수신할 수 있다. 이 경우, 프로세서(130)는 복수의 유저 단말(200) 각각에서 디스플레이되는 제 1 콘텐츠와 상기 특정 유저의 음성 데이터가 연동되어 출력되도록 세팅할 수 있다.
본 개시의 몇몇 실시예에 따르면, 게임 서버(100)의 프로세서(130)는 복수의 유저 단말(200) 각각에서 기본 음성 데이터 또는 선택 음성 데이터를 제 1 콘텐츠와 연동하여 출력되도록 세팅하는 경우, 상기 기본 음성 데이터 또는 선택 음성 데이터를 제공한 유저의 닉네임이 게임 화면의 일 영역에 표시되도록 세팅할 수 있다.
예를 들어, 프로세서(130)는 제 8 유저 단말에서 제 1 콘텐츠를 디스플레이할 때, 기본 음성 데이터가 출력되도록 세팅하는 것과 연동하여, 상기 제 1 콘텐츠 화면의 일 영역에 “- 본 음성은 '세나'님에 의해 제공되었습니다. -“ 등과 같은 메시지를 표시하도록 세팅할 수 있다.
따라서, 게임 서버(100)는 복수의 유저들에게 제 1 콘텐츠에 대응하는 음성 데이터 제공하도록 유도할 수 있다.
전술한 도 2, 도 3, 도 6, 도 7 및 도 9의 설명에서 상술한 각 단계는 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 또한, 전술한 단계는 본 개시의 실시예에 불과할 뿐, 본 개시의 권리 범위는 이에 한정되지 않는다.
도 10은 본 개시의 몇몇 실시예에 따른 음성 선택 화면의 일례를 설명하기 위한 도면이다.
도 10을 참조하면, 게임 서버(100)의 프로세서(130)는 통신부(110)를 통해 복수의 유저 단말(200) 각각으로부터 음성선택 버튼(303)에 대한 입력 신호를 수신할 수 있다.
이 경우, 프로세서(130)는 복수의 유저 단말(200) 각각으로부터 수신된 음성선택 버튼(303)에 대한 입력 신호에 응답하여, 상기 복수의 유저 단말 각각에 디스플레이된 게임 화면(300)에서 음성 선택 화면(330)이 출력되도록 야기할 수 있다.
구체적으로, 프로세서(130)는 게임 화면(300)에서 음성 선택 화면(330)으로 전환시키는 제어 신호를 상기 복수의 유저 단말(200) 각각으로 전송하도록 통신부(110)를 제어할 수 있다.
좀더 구체적으로, 프로세서(130)는 게임 화면(300)의 팝업 표시 영역(305)에 음성 선택 화면(330)이 출력되도록 통신부(110)를 통해 제어 신호를 복수의 유저 단말(200) 각각으로 전송할 수 있다.
이 경우, 복수의 유저 단말(200) 각각은 도 10에 도시된 바와 같은 음성 선택 화면(330)을 출력할 수 있다. 여기서, 음성 선택 화면(330)은 사용자 인터렉션이 가능한 화면으로써, 유저는 특정 버튼을 통해 기본 음성 데이터 및 선택 음성 데이터에 대응하는 음성을 청취할 수 있다. 또한, 유저는 특정 선택 박스를 통해, 게임 내 특정 콘텐츠에 적용할 기본 음성 데이터 및 선택 음성 데이터 중 적어도 하나를 선택할 수 있다. 다만, 이에 한정되지 않는다.
본 개시의 몇몇 실시예에 따르면, 음성 선택 화면(330)은 기본 음성 데이터 및 선택 음성 데이터에 대한 리스트(331)를 포함할 수 있다. 그리고, 기본 음성 데이터 및 선택 음성 데이터에 대한 리스트(331)는, 재생 버튼 입력 영역(332), 인기 순위 표시 영역(333), 체크박스 표시 영역(334) 중 적어도 하나를 포함할 수 있다. 다만, 상술한 구성 요소들은 음성 선택 화면(330)을 구현하는데 있어서 필수적인 것은 아니어서, 음성 선택 화면(330)은 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.
본 개시의 몇몇 실시예에 따르면, 복수의 유저 단말(200) 중 제 7 유저 단말은 재생 버튼 입력 영역(332)에 포함된 적어도 하나의 재생 버튼에 대한 입력 신호를 인식할 수 있다. 그리고, 제 7 유저 단말은 입력 신호에 응답하여, 상기 적어도 하나의 재생 버튼에 대응하는 기본 음성 데이터 또는 선택 음성 데이터를 음향으로 출력할 수 있다.
한편, 제 7 유저 단말은 제 7 유저가 체크박스 표시 영역(334)에 포함된 적어도 하나의 박스에 체크를 한 경우, 체크된 박스에 대응하는 선택 신호를 게임 서버(100)로 전송할 수 있다.
즉, 게임 서버(100)의 프로세서(130)는 제 7 유저 단말에 음성 선택 화면(330)이 출력된 후, 통신부(110)를 통해 제 7 유저 단말로부터 선택 신호를 수신할 수 있다. 그리고, 프로세서(130)는 선택 신호에 대응하는 선택 음성 데이터를 상기 제 7 유저 단말에서 디스플레이되는 제 1 콘텐츠와 연동하여 출력되도록 세팅할 수 있다.
한편, 게임을 플레이하는 제 1 콘텐츠에 적용할 음성 데이터를 선택하기 위해 별도의 페이지에 접속할 필요 없이, 게임 화면(300)에서 음성선택 버튼(303)을 통해 간편하게 제 1 콘텐츠에 적용할 음성 데이터를 선택할 수 있다.
도 11은 본 개시 내용의 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
본 개시가 일반적으로 하나 이상의 컴퓨터 상에서 실행될 수 있는 컴퓨터 실행가능 명령어와 관련하여 전술되었지만, 당업자라면 본 개시가 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로서 구현될 수 있다는 것을 잘 알 것이다.
일반적으로, 본 명세서에서의 모듈은 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조, 기타 등등을 포함한다. 또한, 당업자라면 본 개시의 방법이 단일-프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알 것이다.
본 개시의 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.
컴퓨터는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 일시적(transitory) 및 비일시적(non-transitory) 매체, 이동식 및 비-이동식 매체를 포함한다. 제한이 아닌 예로서, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다.
컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 일시적 및 비-일시적 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터등을 구현하고 모든 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.
컴퓨터(1102)를 포함하는 본 개시의 여러가지 측면들을 구현하는 예시적인 환경(1100)이 나타내어져 있으며, 컴퓨터(1102)는 처리 장치(1104), 시스템 메모리(1106) 및 시스템 버스(1108)를 포함한다. 시스템 버스(1108)는 시스템 메모리(1106)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(1104)에 연결시킨다. 처리 장치(1104)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(1104)로서 이용될 수 있다.
시스템 버스(1108)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(1106)는 판독 전용 메모리(ROM)(1110) 및 랜덤 액세스 메모리(RAM)(1112)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(1110)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(1102) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(1112)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.
컴퓨터(1102)는 또한 내장형 하드 디스크 드라이브(HDD)(1114)(예를 들어, EIDE, SATA)―이 내장형 하드 디스크 드라이브(1114)는 또한 적당한 섀시(도시 생략) 내에서 외장형 용도로 구성될 수 있음―, 자기 플로피 디스크 드라이브(FDD)(1116)(예를 들어, 이동식 디스켓(1118)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), 및 광 디스크 드라이브(1120)(예를 들어, CD-ROM 디스크(1122)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(1114), 자기 디스크 드라이브(1116) 및 광 디스크 드라이브(1120)는 각각 하드 디스크 드라이브 인터페이스(1124), 자기 디스크 드라이브 인터페이스(1126) 및 광 드라이브 인터페이스(1128)에 의해 시스템 버스(1108)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(1124)는 예를 들어, USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘다를 포함한다.
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(1102)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 저장 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 저장 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 개시의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.
운영 체제(1130), 하나 이상의 애플리케이션 프로그램(1132), 기타 프로그램 모듈(1134) 및 프로그램 데이터(1136)를 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(1112)에 저장될 수 있다. 운영 체제, 애플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(1112)에 캐싱될 수 있다. 본 개시가 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(1138) 및 마우스(1140) 등의 포인팅 장치를 통해 컴퓨터(1102)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(1108)에 연결되어 있는 입력 장치 인터페이스(1142)를 통해 처리 장치(1104)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.
모니터(1144) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(1146) 등의 인터페이스를 통해 시스템 버스(1108)에 연결된다. 모니터(1144)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.
컴퓨터(1102)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(1148) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1148)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(1102)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(1150)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(1152) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(1154)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(1156)를 통해 로컬 네트워크(1152)에 연결된다. 어댑터(1156)는 LAN(1152)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(1152)은 또한 무선 어댑터(1156)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 모뎀(1158)을 포함할 수 있거나, WAN(1154) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(1154)을 통해 통신을 설정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(1158)은 직렬 포트 인터페이스(1142)를 통해 시스템 버스(1108)에 연결된다. 네트워크화된 환경에서, 컴퓨터(1102)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(1150)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.
컴퓨터(1102)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.
Wi-Fi(Wireless Fidelity)는 유선 없이도 인터넷 등으로의 연결을 가능하게 해준다. Wi-Fi는 이러한 장치, 예를 들어, 컴퓨터가 실내에서 및 실외에서, 즉 기지국의 통화권 내의 아무 곳에서나 데이터를 전송 및 수신할 수 있게 해주는 셀 전화와 같은 무선 기술이다. Wi-Fi 네트워크는 안전하고 신뢰성 있으며 고속인 무선 연결을 제공하기 위해 IEEE 802.11(a,b,g, 기타)이라고 하는 무선 기술을 사용한다. 컴퓨터를 서로에, 인터넷에 및 유선 네트워크(IEEE 802.3 또는 이더넷을 사용함)에 연결시키기 위해 Wi-Fi가 사용될 수 있다. Wi-Fi 네트워크는 비인가 2.4 및 5 GHz 무선 대역에서, 예를 들어, 11Mbps(802.11a) 또는 54 Mbps(802.11b) 데이터 레이트로 동작하거나, 양 대역(듀얼 대역)을 포함하는 제품에서 동작할 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 저장 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

Claims (1)

  1. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020210018775A 2021-02-10 2021-02-10 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램 KR20210021501A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210018775A KR20210021501A (ko) 2021-02-10 2021-02-10 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210018775A KR20210021501A (ko) 2021-02-10 2021-02-10 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020190044339A Division KR102216880B1 (ko) 2019-04-16 2019-04-16 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
KR20210021501A true KR20210021501A (ko) 2021-02-26

Family

ID=74687856

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210018775A KR20210021501A (ko) 2021-02-10 2021-02-10 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR20210021501A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190029757A (ko) 2016-09-21 2019-03-20 제이에프이 스틸 가부시키가이샤 강의 연속 주조 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190029757A (ko) 2016-09-21 2019-03-20 제이에프이 스틸 가부시키가이샤 강의 연속 주조 방법

Similar Documents

Publication Publication Date Title
CN103189114B (zh) 在线环境中的情境聊天消息生成方法和系统
CN103190124B (zh) 基于行为和运用的情境聊天
US7627536B2 (en) Dynamic interaction menus from natural language representations
JP4395687B2 (ja) 情報処理装置
US10218770B2 (en) Method and system for sharing speech recognition program profiles for an application
JP2006146182A (ja) 音声コマンドを明瞭化する集中化された方法およびシステム
US20030036431A1 (en) Entertainment system, recording medium
CN107040452A (zh) 一种信息处理方法、装置和计算机可读存储介质
US20230123535A1 (en) Online machine learning-based dialogue authoring environment
KR102216880B1 (ko) 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램
JP4625057B2 (ja) 仮想空間情報要約作成装置
KR20210021501A (ko) 커스텀 음성을 제공하는 게임 서버 및 컴퓨터 프로그램
CN113946604B (zh) 分阶段围棋教学方法、装置、电子设备及存储介质
CN108114469A (zh) 基于对话的游戏交互方法、装置、终端及游戏交互模型
KR102604990B1 (ko) 게임 제공 장치 및 방법
KR20200130225A (ko) 게임 효과음 출력 시스템, 서버 및 게임 효과음 출력 방법
KR102548641B1 (ko) 대화형 게임에서 대화셋을 제공하는 방법
KR102329749B1 (ko) 게임 캐릭터 제어 서버, 시스템 및 방법
US20230381665A1 (en) Importing agent personalization data to possess in-game non-player characters
KR102619836B1 (ko) 말풍선 배치 기법
KR102622621B1 (ko) 대화형 게임을 제공하는 방법
Eriksson Onboarding Users to a Voice User Interface: Comparing Different Teaching Methods for Onboarding New Users to Intelligent Personal Assistants
KR102363979B1 (ko) 구간 저장 장치, 시스템 및 방법
Bejdaoui et al. Communicating across the gap: consoles and community
KR102336067B1 (ko) 게임 내 플레이 상황에 대응하는 음성 데이터를 생성하기 위한 컴퓨터 프로그램

Legal Events

Date Code Title Description
A107 Divisional application of patent