KR20240081674A - Apparatus and method for providing text reading services - Google Patents
Apparatus and method for providing text reading services Download PDFInfo
- Publication number
- KR20240081674A KR20240081674A KR1020220164798A KR20220164798A KR20240081674A KR 20240081674 A KR20240081674 A KR 20240081674A KR 1020220164798 A KR1020220164798 A KR 1020220164798A KR 20220164798 A KR20220164798 A KR 20220164798A KR 20240081674 A KR20240081674 A KR 20240081674A
- Authority
- KR
- South Korea
- Prior art keywords
- voice data
- presented content
- user
- acquired voice
- reading
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013515 script Methods 0.000 claims abstract description 12
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Machine Translation (AREA)
Abstract
텍스트 리딩 서비스 제공 장치 및 방법이 개시된다. 텍스트 리딩 서비스 제공 방법은, 영상 및 스크립트를 포함하는 리딩(reading)용 콘텐츠를 수집하는 단계, 사용자로부터 리딩 참여 요청을 받는 단계, 리딩 참여 요청에 따라 수집된 리딩용 콘텐츠 중에서 사용자가 리딩할 콘텐츠를 선택하여 제시하는 단계, 제시된 콘텐츠에 대한 사용자의 음성 데이터를 획득하는 단계, 제시된 콘텐츠와 획득된 음성 데이터의 일치 여부를 판단하는 단계, 판단 결과, 제시된 콘텐츠와 획득된 음성 데이터가 일치하는 경우, 사용자에게 리워드를 제공하는 단계 및 제시된 콘텐츠와 획득된 음성 데이터가 일치함에 따라 획득된 음성 데이터를 데이터베이스에 저장하는 단계를 포함한다.An apparatus and method for providing a text reading service are disclosed. The method of providing a text reading service includes the steps of collecting reading content including videos and scripts, receiving a request for reading participation from the user, and selecting content for the user to read from among the reading content collected according to the reading participation request. A step of selecting and presenting, a step of acquiring the user's voice data for the presented content, a step of determining whether the presented content matches the acquired voice data, determination result, if the presented content and the acquired voice data match, the user It includes providing a reward to the user and storing the acquired voice data in a database as the presented content matches the acquired voice data.
Description
본 발명은 텍스트 리딩 서비스 제공 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for providing text reading services.
최근, 인공지능(AI: Artificial Intelligence) 기술의 발달과 높은 관심으로 인공지능은 많은 분야에 적용되거나 연구되고 있다. 인공지능은 일반적으로 인간의 학습능력, 추론능력, 지각능력이 필요한 작업을 할 수 있도록 컴퓨터 시스템을 구현하려는 컴퓨터과학의 세부분야 중 하나이다. 또한, 인공지능은 지능을 갖고 있는 기능을 갖춘 컴퓨터 시스템이며, 인간의 지능이 기계 등에 인공적으로 구현된 것이다.Recently, with the development and high interest in artificial intelligence (AI) technology, artificial intelligence is being applied or studied in many fields. Artificial intelligence is a subfield of computer science that seeks to implement computer systems to perform tasks that generally require human learning, reasoning, and perception abilities. Additionally, artificial intelligence is a computer system with intelligent functions, and human intelligence is artificially implemented in machines, etc.
이러한 인공지능의 구현을 위해서는 인공지능이 학습을 하게 해야 한다. 인공지능의 학습을 위해서는 방대한 양의 학습 데이터가 필요한데, 학습 데이터의 수집을 위해서는 많은 비용이 소요된다.In order to implement such artificial intelligence, artificial intelligence must be allowed to learn. For artificial intelligence learning, a huge amount of learning data is required, and collecting the learning data costs a lot of money.
따라서, 인공지능의 학습 데이터 수집을 효율적으로 할 수 있는 방안이 요구된다.Therefore, a method to efficiently collect learning data for artificial intelligence is required.
본 발명은 한 사용자로부터 리딩용 콘텐츠를 수집하고, 리워드 제공을 이용하여 다른 사용자가 수집된 리딩용 콘텐츠를 읽도록 유도하여 음성 데이터를 획득하는 텍스트 리딩 서비스 제공 장치 및 방법을 제공하기 위한 것이다.The present invention is intended to provide an apparatus and method for providing a text reading service that collects reading content from one user, induces other users to read the collected reading content using reward provision, and obtains voice data.
본 발명의 일 측면에 따르면, 사용자 단말과 연동하는 텍스트 리딩 서비스 제공 장치가 수행하는 텍스트 리딩 서비스 제공 방법이 개시된다.According to one aspect of the present invention, a method for providing a text reading service performed by a text reading service providing device that cooperates with a user terminal is disclosed.
본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 방법은, 영상 및 스크립트를 포함하는 리딩(reading)용 콘텐츠를 수집하는 단계, 사용자로부터 리딩 참여 요청을 받는 단계, 상기 리딩 참여 요청에 따라 상기 수집된 리딩용 콘텐츠 중에서 상기 사용자가 리딩할 콘텐츠를 선택하여 제시하는 단계, 상기 제시된 콘텐츠에 대한 상기 사용자의 음성 데이터를 획득하는 단계, 상기 제시된 콘텐츠와 획득된 음성 데이터의 일치 여부를 판단하는 단계, 상기 판단 결과, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치하는 경우, 상기 사용자에게 리워드를 제공하는 단계 및 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치함에 따라 상기 획득된 음성 데이터를 데이터베이스에 저장하는 단계를 포함한다.A method of providing a text reading service according to an embodiment of the present invention includes the steps of collecting reading content including a video and a script, receiving a reading participation request from a user, and reading the collected reading according to the reading participation request. Selecting and presenting content to be read by the user from content for use, obtaining voice data of the user for the presented content, determining whether the presented content matches the acquired voice data, and a result of the determination , providing a reward to the user when the presented content and the acquired voice data match, and storing the acquired voice data in a database as the presented content and the acquired voice data match. do.
상기 제시된 콘텐츠에 대한 사용자의 음성 데이터를 획득하는 단계는, 상기 제시된 콘텐츠에 대한 상기 사용자의 리딩 소리를 내장된 마이크를 통해 입력받아 상기 음성 데이터를 획득한 상기 사용자 단말로부터 상기 음성 데이터를 수신한다.In the step of acquiring the user's voice data for the presented content, the voice data is received from the user terminal that has acquired the voice data by receiving the user's reading sound for the presented content through a built-in microphone.
상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치 여부를 판단하는 단계는, STT(Speech To Text) 기술을 이용하여 상기 획득된 음성 데이터를 텍스트로 변환하는 단계, 상기 획득된 음성 데이터로부터 변환된 텍스트를 편집하는 단계, 레벤슈타인 알고리즘(Levenshtein Distance)을 이용하여 상기 제시된 콘텐츠와 상기 편집된 텍스트의 유사도를 산출하는 단계 및 상기 산출된 유사도를 백분율로 환산하여 상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치율을 산출하는 단계를 포함한다.The step of determining whether the presented content matches the acquired voice data includes converting the acquired voice data into text using STT (Speech To Text) technology, and converting the acquired voice data into text. An editing step, calculating the similarity between the presented content and the edited text using the Levenshtein algorithm (Levenshtein Distance), and converting the calculated similarity into a percentage to obtain a matching rate between the presented content and the acquired voice data. Includes calculating steps.
상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치 여부를 판단하는 단계는, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치율이 미리 설정된 임계치 이상인 경우, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치하는 것으로 간주하는 단계 및 상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치율이 미리 설정된 임계치 미만인 경우, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 불일치하는 것으로 간주하는 단계를 더 포함한다.In the step of determining whether the presented content matches the acquired voice data, if the coincidence rate between the presented content and the acquired voice data is more than a preset threshold, the presented content and the acquired voice data are considered to match. and, if the coincidence rate between the presented content and the acquired voice data is less than a preset threshold, determining that the presented content and the acquired voice data do not match.
상기 텍스트 리딩 서비스 제공 방법은, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 불일치하는 경우, 상기 획득된 음성 데이터를 폐기하는 단계를 더 포함한다.The text reading service providing method further includes discarding the acquired voice data when the presented content and the acquired voice data do not match.
본 발명의 다른 측면에 따르면, 사용자 단말과 연동하는 텍스트 리딩 서비스 제공 장치가 개시된다.According to another aspect of the present invention, an apparatus for providing a text reading service that operates in conjunction with a user terminal is disclosed.
본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치는, 명령어를 저장하는 메모리 및 상기 명령어를 실행하는 프로세서를 포함하되, 상기 명령어는, 영상 및 스크립트를 포함하는 리딩(reading)용 콘텐츠를 수집하는 단계, 사용자로부터 리딩 참여 요청을 받는 단계, 상기 리딩 참여 요청에 따라 상기 수집된 리딩용 콘텐츠 중에서 상기 사용자가 리딩할 콘텐츠를 선택하여 제시하는 단계, 상기 제시된 콘텐츠에 대한 상기 사용자의 음성 데이터를 획득하는 단계, 상기 제시된 콘텐츠와 획득된 음성 데이터의 일치 여부를 판단하는 단계, 상기 판단 결과, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치하는 경우, 상기 사용자에게 리워드를 제공하는 단계 및 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치함에 따라 상기 획득된 음성 데이터를 데이터베이스에 저장하는 단계를 포함하는 텍스트 리딩 서비스 제공 방법을 수행한다.An apparatus for providing a text reading service according to an embodiment of the present invention includes a memory for storing instructions and a processor for executing the instructions, wherein the instructions include collecting reading content including images and scripts. , receiving a reading participation request from a user, selecting and presenting content to be read by the user from among the collected reading content according to the reading participation request, and obtaining the user's voice data for the presented content. , determining whether the presented content matches the acquired voice data; as a result of the determination, if the presented content and the acquired voice data match, providing a reward to the user; and providing a reward to the user. A method of providing a text reading service is performed, including the step of storing the obtained voice data in a database as the obtained voice data matches.
본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치 및 방법은, 한 사용자로부터 리딩용 콘텐츠를 수집하고, 리워드 제공을 이용하여 다른 사용자가 수집된 리딩용 콘텐츠를 읽도록 유도하여 음성 데이터를 획득함으로써, 사용자에게 광고 대행 서비스를 제공함과 동시에, 다양한 단어에 대한 음성 데이터를 수집할 수 있다.An apparatus and method for providing a text reading service according to an embodiment of the present invention collects reading content from one user, uses reward provision to induce other users to read the collected reading content, and obtains voice data, In addition to providing advertising agency services to users, voice data for various words can be collected.
도 1은 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치가 수행하는 텍스트 리딩 서비스 제공 방법을 나타낸 흐름도.
도 2는 도 1의 S150 단계의 세부 단계를 나타낸 흐름도.
도 3은 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치와 연동하는 사용자 단말이 출력하는 화면을 예시하여 나타낸 도면.
도 4는 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치의 구성을 개략적으로 예시하여 나타낸 도면.1 is a flowchart showing a text reading service providing method performed by a text reading service providing device according to an embodiment of the present invention.
Figure 2 is a flowchart showing detailed steps of step S150 in Figure 1.
Figure 3 is a diagram showing an example of a screen output by a user terminal interoperating with a text reading service providing device according to an embodiment of the present invention.
Figure 4 is a diagram schematically illustrating the configuration of a text reading service providing device according to an embodiment of the present invention.
본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.As used herein, singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, terms such as “consists of” or “comprises” should not be construed as necessarily including all of the various components or steps described in the specification, and some of the components or steps may be included in the specification. It may not be included, or it should be interpreted as including additional components or steps. In addition, terms such as "... unit" and "module" used in the specification refer to a unit that processes at least one function or operation, which may be implemented as hardware or software, or as a combination of hardware and software. .
이하, 본 발명의 다양한 실시예들을 첨부된 도면을 참조하여 상술하겠다. Hereinafter, various embodiments of the present invention will be described in detail with reference to the attached drawings.
도 1은 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치가 수행하는 텍스트 리딩 서비스 제공 방법을 나타낸 흐름도이고, 도 2는 도 1의 S150 단계의 세부 단계를 나타낸 흐름도이고, 도 3은 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치와 연동하는 사용자 단말이 출력하는 화면을 예시하여 나타낸 도면이다.FIG. 1 is a flowchart showing a text reading service providing method performed by a text reading service providing device according to an embodiment of the present invention, FIG. 2 is a flowchart showing detailed steps of step S150 of FIG. 1, and FIG. 3 is a flowchart of the present invention. This is a diagram showing an example of a screen output by a user terminal that interacts with a text reading service providing device according to an embodiment.
본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치는 네트워크 연결 가능한 서버를 통해 구현될 수 있다. 예를 들어, 서버는 텍스트 리딩 서비스 제공 기능을 수행할 수 있으며, 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치를 포함하여 구성될 수 있다.The text reading service providing device according to an embodiment of the present invention may be implemented through a server capable of connecting to a network. For example, the server may perform a text reading service providing function and may be configured to include a text reading service providing device according to an embodiment of the present invention.
본 명세서에서 서버란 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 방법을 수행하는 컴퓨팅 디바이스로서, 하나 또는 둘 이상의 물리적 개체일 수 있다. 서버가 복수의 물리적 개체로 나뉘어 구현될 때, 각각의 물리적 개체의 관리 주체는 서로 상이할 수 있다. 서버에는 각각의 데이터베이스에 대응되는 정보를 저장하는 소프트웨어 및 하드웨어의 기능적 구조적 결합을 의미하는 DB가 포함될 수 있으며, DB는 적어도 하나의 테이블로 구현될 수도 있으며, 데이터베이스에 저장된 정보를 검색, 저장, 및 관리하기 위한 별도의 DBMS(Database Management System)을 더 포함할 수도 있다. 또한, 링크드 리스트(linked-list), 트리(Tree), 관계형 데이터베이스의 형태 등 다양한 방식으로 구현될 수 있으며, 데이터베이스에 대응되는 정보를 저장할 수 있는 모든 데이터 저장매체 및 데이터 구조를 포함한다.In this specification, a server is a computing device that performs a method for providing a text reading service according to an embodiment of the present invention, and may be one or two or more physical entities. When a server is divided into multiple physical entities and implemented, the management entity of each physical entity may be different. The server may include a DB, which refers to a functional and structural combination of software and hardware that stores information corresponding to each database. The DB may be implemented as at least one table, and the information stored in the database can be searched, stored, and It may also include a separate DBMS (Database Management System) for management. Additionally, it can be implemented in various ways, such as in the form of a linked-list, tree, or relational database, and includes all data storage media and data structures that can store information corresponding to the database.
한편, 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치는 사용자 단말(300)과 연동하여, 본 발명의 실시예에 따른 텍스트 리딩 서비스를 사용자에게 제공할 수 있다.Meanwhile, the text reading service providing device according to the embodiment of the present invention can link with the
이하, 도 1을 중심으로, 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 방법에 대하여 설명하되, 도 2 및 도 3을 참조하기로 한다.Hereinafter, a method for providing a text reading service according to an embodiment of the present invention will be described, focusing on FIG. 1, with reference to FIGS. 2 and 3.
S110 단계에서, 텍스트 리딩 서비스 제공 장치는, 리딩(reading)용 콘텐츠를 수집한다. 여기서, 리딩용 콘텐츠는 영상 및 스크립트를 포함할 수 있다.In step S110, the text reading service providing device collects reading content. Here, reading content may include video and script.
예를 들어, 텍스트 리딩 서비스 제공 장치는 광고를 원하는 사용자로부터 소정의 요금을 받고 광고 콘텐츠를 업로드 받을 수 있다. 여기서, 사용자는 온라인 결제 또는 이벤트 참여 등을 통해 포인트를 구매하고, 구매한 포인트로 업로드 비용을 지불하고 광고 콘텐츠를 텍스트 리딩 서비스 제공 장치로 업로드할 수 있다.For example, a text reading service providing device can upload advertising content for a small fee from a user who wants to advertise. Here, the user can purchase points through online payment or event participation, pay upload fees with the purchased points, and upload advertising content to a text reading service providing device.
S120 단계에서, 텍스트 리딩 서비스 제공 장치는, 사용자로부터 리딩 참여 요청을 받는다.In step S120, the text reading service providing device receives a reading participation request from the user.
S130 단계에서, 텍스트 리딩 서비스 제공 장치는, 리딩 참여 요청에 따라 수집된 리딩용 콘텐츠 중에서 사용자가 리딩할 콘텐츠를 선택하여 제시한다.In step S130, the text reading service providing device selects and presents content to be read by the user from among the reading content collected in response to the reading participation request.
예를 들어, 텍스트 리딩 서비스 제공 장치는 수집된 리딩용 콘텐츠 중에서 리딩할 콘텐츠를 랜덤하게 선택하거나, 정렬순, 최근생성순, 오래된 생성순 등과 같이 미리 설정된 순서대로 선택할 수 있다.For example, the text reading service providing device may randomly select content to be read from among the collected reading content, or select it in a preset order, such as sort order, most recent creation order, oldest creation order, etc.
S140 단계에서, 텍스트 리딩 서비스 제공 장치는, 제시된 콘텐츠에 대한 사용자의 음성 데이터를 획득한다.In step S140, the text reading service providing device acquires the user's voice data for the presented content.
예를 들어, 도 3을 참조하면, 사용자 단말(300)은 광고보기에 참여하면 리워드(포인트)를 제공받을 수 있음을 알리는 상품 광고 화면을 출력하고, 참여하기 버튼을 통해 사용자로부터 리딩 참여 요청을 받아 텍스트 리딩 서비스 제공 장치로 전송할 수 있다. 이어, 텍스트 리딩 서비스 제공 장치는 리딩 참여 요청에 따라 리딩할 스크립트를 포함하는 콘텐츠 및 음성 데이터 획득 명령을 사용자 단말(300)로 전송할 수 있다. 이어, 사용자 단말(300)은 음성 데이터 획득 명령의 수신에 따라 도 3에 도시된 바와 같이, 리딩 지시 메시지, 리딩할 스크립트 및 마이크 버튼을 화면에 출력할 수 있다. 이에 따라, 사용자는 사용자 단말(300)의 화면을 확인한 후, 리딩 지시 메시지에 따라 마이크 버튼을 누르고 제시된 스크립트를 소리내어 읽을 수 있다. 이때, 사용자 단말(300)은 내장된 마이크를 이용하여 제시된 스크립트에 대한 사용자의 리딩 소리를 입력받아 음성 데이터를 획득하고, 도 3에 도시된 바와 같이, STT(Speech To Text) 기술을 이용하여 획득된 음성 데이터를 텍스트로 변환하여 화면에 출력(나의 대사)하고, 획득된 음성 데이터를 텍스트 리딩 서비스 제공 장치로 전송할 수 있다.For example, referring to FIG. 3, the
S150 단계에서, 텍스트 리딩 서비스 제공 장치는, 제시된 콘텐츠와 획득된 음성 데이터의 일치 여부를 판단한다.In step S150, the text reading service providing device determines whether the presented content matches the acquired voice data.
이하, 도 2를 참조하여, S150 단계의 세부 단계에 대하여 설명하기로 한다.Hereinafter, with reference to FIG. 2, detailed steps of step S150 will be described.
S151 단계에서, 텍스트 리딩 서비스 제공 장치는, STT(Speech To Text) 기술을 이용하여 획득된 음성 데이터를 텍스트로 변환한다.In step S151, the text reading service providing device converts the acquired voice data into text using STT (Speech To Text) technology.
S152 단계에서, 텍스트 리딩 서비스 제공 장치는, 획득된 음성 데이터로부터 변환된 텍스트를 편집한다.In step S152, the text reading service providing device edits the text converted from the acquired voice data.
즉, 텍스트 리딩 서비스 제공 장치는 변환된 텍스트에서 영문(소문자 및 대문자), 한글 및 숫자를 제외한 특수문자, 띄어쓰기용 공백 등을 제거한다.In other words, the text reading service providing device removes English letters (lowercase and uppercase letters), Korean letters, special characters other than numbers, spaces for spacing, etc. from the converted text.
예를 들어, 변환된 텍스트가 "안녕? 너는 밥을 먹었니?!"라고 가정하면, "안녕너는밥을먹었니"로 편집될 수 있다.For example, assuming the converted text is "Hello? Have you eaten?!", it can be edited to "Hello, have you eaten?"
S153 단계에서, 텍스트 리딩 서비스 제공 장치는, 레벤슈타인 알고리즘(Levenshtein Distance)을 이용하여 제시된 콘텐츠와 편집된 텍스트의 유사도를 산출한다.In step S153, the text reading service providing device calculates the similarity between the presented content and the edited text using the Levenshtein algorithm (Levenshtein Distance).
S154 단계에서, 텍스트 리딩 서비스 제공 장치는, 산출된 유사도를 백분율로 환산하여 제시된 콘텐츠와 획득된 음성 데이터의 일치율을 산출한다.In step S154, the text reading service providing device converts the calculated similarity into a percentage to calculate the matching rate between the presented content and the acquired voice data.
다른 실시예에 따르면, 텍스트 리딩 서비스 제공 장치는 하나의 문장에 대하여 2개 이상의 단어가 다른 경우, 0점으로 처리하고, 하나의 문장에 대하여 특수문자만 제외된 경우, 만점으로 처리할 수 있다.According to another embodiment, the text reading service providing device may process one sentence as 0 points if two or more words are different, and may process it as a full score if only special characters are excluded for one sentence.
예를 들어, 제시된 콘텐츠의 스크립트가 [동해물과 백두산이 마르고 닳도록]이고, 음성 데이터로부터 변환된 텍스트가 [해물과 백두산이 마르고 닭도록]이거나 [동행물과 두산이 마르고 닭도록]인 경우, 2개 이상의 단어가 다르므로, 0점으로 처리될 수 있다. 그리고, 제시된 콘텐츠의 스크립트가 [아버지 "밥 먹었니?"]이고, 음성 데이터로부터 변환된 텍스트가 [아버지 밥 먹었니]인 경우, 특수문자만 제외되었으므로, 50점으로 처리될 수 있다.For example, if the script of the presented content is [Let the East Sea and Mt. Baekdu dry and wear down], and the text converted from the voice data is [Let the seafood and Mt. Baekdu dry and grow] or [Until the companions and Mt. Baekdu dry and grow]. , Since two or more words are different, it can be treated as 0 points. Also, if the script of the presented content is [Father, "Have you eaten?"] and the text converted from voice data is [Father, have you eaten?], only special characters are excluded, so it can be processed as 50 points.
다시, 도 1을 참조하면, S160 단계에서, 텍스트 리딩 서비스 제공 장치는, S150 단계에서의 판단 결과, 제시된 콘텐츠와 획득된 음성 데이터의 일치율이 미리 설정된 임계치 이상인 경우, 제시된 콘텐츠와 획득된 음성 데이터가 일치하는 것으로 간주하고, 사용자에게 소정의 리워드를 제공한다.Referring again to FIG. 1, in step S160, if the match rate between the presented content and the acquired voice data is greater than or equal to a preset threshold as a result of the determination in step S150, the text reading service providing device determines that the presented content and the acquired voice data are It is considered a match, and a certain reward is provided to the user.
S170 단계에서, 텍스트 리딩 서비스 제공 장치는, 제시된 콘텐츠와 획득된 음성 데이터가 일치함에 따라 획득된 음성 데이터를 데이터베이스에 저장한다.In step S170, the text reading service providing device stores the acquired voice data in the database as the presented content matches the acquired voice data.
S180 단계에서, 텍스트 리딩 서비스 제공 장치는, S150 단계에서의 판단 결과, 제시된 콘텐츠와 획득된 음성 데이터의 일치율이 미리 설정된 임계치 미만인 경우, 제시된 콘텐츠와 획득된 음성 데이터가 불일치하는 것으로 간주하고, 획득된 음성 데이터를 폐기한다.In step S180, if, as a result of the determination in step S150, the match rate between the presented content and the acquired voice data is less than a preset threshold, the text reading service providing device considers the presented content and the acquired voice data to be inconsistent, and Discard voice data.
도 4는 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치의 구성을 개략적으로 예시하여 나타낸 도면이다.Figure 4 is a diagram schematically illustrating the configuration of a text reading service providing device according to an embodiment of the present invention.
도 4를 참조하면, 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 장치는 프로세서(10), 메모리(20), 통신부(30) 및 인터페이스부(40)를 포함한다.Referring to FIG. 4, a text reading service providing device according to an embodiment of the present invention includes a
프로세서(10)는 메모리(20)에 저장된 처리 명령어를 실행시키는 CPU 또는 반도체 소자일 수 있다.The
메모리(20)는 다양한 유형의 휘발성 또는 비휘발성 기억 매체를 포함할 수 있다. 예를 들어, 메모리(20)는 ROM, RAM 등을 포함할 수 있다.
예를 들어, 메모리(20)는 본 발명의 실시예에 따른 텍스트 리딩 서비스 제공 방법을 수행하는 명령어들을 저장할 수 있다.For example, the
통신부(30)는 통신망을 통해 다른 장치들과 데이터를 송수신하기 위한 수단이다.The
인터페이스부(40)는 네트워크에 접속하기 위한 네트워크 인터페이스 및 사용자 인터페이스를 포함할 수 있다.The
한편, 전술된 실시예의 구성 요소는 프로세스적인 관점에서 용이하게 파악될 수 있다. 즉, 각각의 구성 요소는 각각의 프로세스로 파악될 수 있다. 또한 전술된 실시예의 프로세스는 장치의 구성 요소 관점에서 용이하게 파악될 수 있다.Meanwhile, the components of the above-described embodiment can be easily understood from a process perspective. In other words, each component can be understood as a separate process. Additionally, the processes of the above-described embodiments can be easily understood from the perspective of the components of the device.
또한 앞서 설명한 기술적 내용들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예들을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 하드웨어 장치는 실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Additionally, the technical contents described above may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination. Program instructions recorded on the medium may be specially designed and configured for the embodiments or may be known and available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -Includes optical media (magneto-optical media) and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, etc. Examples of program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc. A hardware device may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
상기한 본 발명의 실시예는 예시의 목적을 위해 개시된 것이고, 본 발명에 대한 통상의 지식을 가지는 당업자라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가가 가능할 것이며, 이러한 수정, 변경 및 부가는 하기의 특허청구범위에 속하는 것으로 보아야 할 것이다.The above-described embodiments of the present invention have been disclosed for illustrative purposes, and those skilled in the art will be able to make various modifications, changes, and additions within the spirit and scope of the present invention, and such modifications, changes, and additions will be possible. should be regarded as falling within the scope of the patent claims below.
10: 프로세서
20: 메모리
30: 통신부
40: 인터페이스부10: processor
20: memory
30: Department of Communications
40: interface part
Claims (6)
영상 및 스크립트를 포함하는 리딩(reading)용 콘텐츠를 수집하는 단계;
사용자로부터 리딩 참여 요청을 받는 단계;
상기 리딩 참여 요청에 따라 상기 수집된 리딩용 콘텐츠 중에서 상기 사용자가 리딩할 콘텐츠를 선택하여 제시하는 단계;
상기 제시된 콘텐츠에 대한 상기 사용자의 음성 데이터를 획득하는 단계;
상기 제시된 콘텐츠와 획득된 음성 데이터의 일치 여부를 판단하는 단계;
상기 판단 결과, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치하는 경우, 상기 사용자에게 리워드를 제공하는 단계; 및
상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치함에 따라 상기 획득된 음성 데이터를 데이터베이스에 저장하는 단계를 포함하는 텍스트 리딩 서비스 제공 방법.
In a method of providing a text reading service performed by a text reading service providing device linked to a user terminal,
Collecting reading content including videos and scripts;
Receiving a reading participation request from a user;
selecting and presenting content to be read by the user from among the collected reading content in response to the reading participation request;
Obtaining the user's voice data for the presented content;
determining whether the presented content matches the acquired voice data;
As a result of the determination, if the presented content matches the acquired voice data, providing a reward to the user; and
A method of providing a text reading service, including the step of storing the acquired voice data in a database as the presented content matches the acquired voice data.
상기 제시된 콘텐츠에 대한 사용자의 음성 데이터를 획득하는 단계는,
상기 제시된 콘텐츠에 대한 상기 사용자의 리딩 소리를 내장된 마이크를 통해 입력받아 상기 음성 데이터를 획득한 상기 사용자 단말로부터 상기 음성 데이터를 수신하는 것을 특징으로 하는 텍스트 리딩 서비스 제공 방법.
According to paragraph 1,
The step of acquiring the user's voice data for the presented content is,
A method of providing a text reading service, comprising receiving the user's reading sound for the presented content through a built-in microphone and receiving the voice data from the user terminal that has acquired the voice data.
상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치 여부를 판단하는 단계는,
STT(Speech To Text) 기술을 이용하여 상기 획득된 음성 데이터를 텍스트로 변환하는 단계;
상기 획득된 음성 데이터로부터 변환된 텍스트를 편집하는 단계;
레벤슈타인 알고리즘(Levenshtein Distance)을 이용하여 상기 제시된 콘텐츠와 상기 편집된 텍스트의 유사도를 산출하는 단계; 및
상기 산출된 유사도를 백분율로 환산하여 상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치율을 산출하는 단계를 포함하는 것을 특징으로 하는 텍스트 리딩 서비스 제공 방법.
According to paragraph 1,
The step of determining whether the presented content matches the acquired voice data includes:
Converting the obtained voice data into text using STT (Speech To Text) technology;
editing text converted from the acquired voice data;
calculating the similarity between the presented content and the edited text using the Levenshtein algorithm (Levenshtein Distance); and
A method for providing a text reading service, comprising converting the calculated similarity into a percentage to calculate a matching rate between the presented content and the acquired voice data.
상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치 여부를 판단하는 단계는,
상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치율이 미리 설정된 임계치 이상인 경우, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치하는 것으로 간주하는 단계; 및
상기 제시된 콘텐츠와 상기 획득된 음성 데이터의 일치율이 미리 설정된 임계치 미만인 경우, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 불일치하는 것으로 간주하는 단계를 더 포함하는 것을 특징으로 하는 텍스트 리딩 서비스 제공 방법.
According to paragraph 3,
The step of determining whether the presented content matches the acquired voice data includes:
If the matching rate between the presented content and the acquired voice data is greater than a preset threshold, considering the presented content and the acquired voice data to match; and
If the coincidence rate between the presented content and the acquired voice data is less than a preset threshold, determining that the presented content and the acquired voice data do not match is a method for providing a text reading service.
상기 텍스트 리딩 서비스 제공 방법은,
상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 불일치하는 경우, 상기 획득된 음성 데이터를 폐기하는 단계를 더 포함하는 것을 특징으로 하는 텍스트 리딩 서비스 제공 방법.
According to paragraph 1,
The method of providing the text reading service is,
If there is a discrepancy between the presented content and the acquired voice data, the method further includes discarding the acquired voice data.
명령어를 저장하는 메모리; 및
상기 명령어를 실행하는 프로세서를 포함하되,
상기 명령어는,
영상 및 스크립트를 포함하는 리딩(reading)용 콘텐츠를 수집하는 단계;
사용자로부터 리딩 참여 요청을 받는 단계;
상기 리딩 참여 요청에 따라 상기 수집된 리딩용 콘텐츠 중에서 상기 사용자가 리딩할 콘텐츠를 선택하여 제시하는 단계;
상기 제시된 콘텐츠에 대한 상기 사용자의 음성 데이터를 획득하는 단계;
상기 제시된 콘텐츠와 획득된 음성 데이터의 일치 여부를 판단하는 단계;
상기 판단 결과, 상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치하는 경우, 상기 사용자에게 리워드를 제공하는 단계; 및
상기 제시된 콘텐츠와 상기 획득된 음성 데이터가 일치함에 따라 상기 획득된 음성 데이터를 데이터베이스에 저장하는 단계를 포함하는 텍스트 리딩 서비스 제공 방법을 수행하는 것을 특징으로 하는 텍스트 리딩 서비스 제공 장치.In a text reading service providing device that interfaces with a user terminal,
Memory for storing instructions; and
Including a processor that executes the instructions,
The command is:
Collecting reading content including videos and scripts;
Receiving a reading participation request from a user;
selecting and presenting content to be read by the user from among the collected reading content in response to the reading participation request;
Obtaining the user's voice data for the presented content;
determining whether the presented content matches the acquired voice data;
As a result of the determination, if the presented content matches the acquired voice data, providing a reward to the user; and
A text reading service providing method comprising the step of storing the acquired voice data in a database as the presented content matches the acquired voice data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220164798A KR20240081674A (en) | 2022-11-30 | 2022-11-30 | Apparatus and method for providing text reading services |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220164798A KR20240081674A (en) | 2022-11-30 | 2022-11-30 | Apparatus and method for providing text reading services |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240081674A true KR20240081674A (en) | 2024-06-10 |
Family
ID=91482229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220164798A KR20240081674A (en) | 2022-11-30 | 2022-11-30 | Apparatus and method for providing text reading services |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20240081674A (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102446970B1 (en) | 2021-09-03 | 2022-09-23 | (주) 아하 | An electronic podium system that performs AI control technology in cloud environment and includes a self-sterilization function |
-
2022
- 2022-11-30 KR KR1020220164798A patent/KR20240081674A/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102446970B1 (en) | 2021-09-03 | 2022-09-23 | (주) 아하 | An electronic podium system that performs AI control technology in cloud environment and includes a self-sterilization function |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10824874B2 (en) | Method and apparatus for processing video | |
CN111177569B (en) | Recommendation processing method, device and equipment based on artificial intelligence | |
CN107680019B (en) | Examination scheme implementation method, device, equipment and storage medium | |
CN107797984B (en) | Intelligent interaction method, equipment and storage medium | |
WO2020088058A1 (en) | Information generating method and device | |
CN109583904A (en) | Training method, impaired operation detection method and the device of abnormal operation detection model | |
CN111866610B (en) | Method and apparatus for generating information | |
WO2018196718A1 (en) | Image disambiguation method and device, storage medium, and electronic device | |
Laraba et al. | Dance performance evaluation using hidden Markov models | |
CN110796089A (en) | Method and apparatus for training face-changing model | |
CN110297897B (en) | Question-answer processing method and related product | |
CN112000776A (en) | Topic matching method, device and equipment based on voice semantics and storage medium | |
US20230410222A1 (en) | Information processing apparatus, control method, and program | |
CN110633410A (en) | Information processing method and device, storage medium, and electronic device | |
CN114338586A (en) | Message pushing method and device, electronic equipment and storage medium | |
CN113988954A (en) | Financing product marketing method and device | |
CN113138977A (en) | Transaction conversion analysis method, device, equipment and storage medium | |
CN107977367B (en) | Text display method and server | |
CN111127057B (en) | Multi-dimensional user portrait recovery method | |
KR20240081674A (en) | Apparatus and method for providing text reading services | |
CN112507214B (en) | User name-based data processing method, device, equipment and medium | |
CN112949305B (en) | Negative feedback information acquisition method, device, equipment and storage medium | |
WO2018072577A1 (en) | Text generation method and server | |
CN115048504A (en) | Information pushing method and device, computer equipment and computer readable storage medium | |
CN113497953A (en) | Music scene recognition method, device, server and storage medium |