KR20160029587A - 단위 또는 약어의 풀네임 음성출력 방법 및 장치 - Google Patents

단위 또는 약어의 풀네임 음성출력 방법 및 장치 Download PDF

Info

Publication number
KR20160029587A
KR20160029587A KR1020140119361A KR20140119361A KR20160029587A KR 20160029587 A KR20160029587 A KR 20160029587A KR 1020140119361 A KR1020140119361 A KR 1020140119361A KR 20140119361 A KR20140119361 A KR 20140119361A KR 20160029587 A KR20160029587 A KR 20160029587A
Authority
KR
South Korea
Prior art keywords
unit
abbreviation
full name
voice
database
Prior art date
Application number
KR1020140119361A
Other languages
English (en)
Inventor
박안나
손병준
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020140119361A priority Critical patent/KR20160029587A/ko
Priority to US14/846,331 priority patent/US20160071511A1/en
Publication of KR20160029587A publication Critical patent/KR20160029587A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L2013/083Special characters, e.g. punctuation marks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

단위 또는 약어의 풀네임 음성출력 방법 및 장치가 개시된다.
그 단위 또는 약어의 풀네임 음성출력 방법은, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하는 단계; 검출된 단위 또는 약어를 풀 네임(full name, original word) 데이터베이스에서 검색하여 검출된 단위 또는 약어의 풀 네임을 획득하는 단계; 및 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하는 단계를 포함한다.
본 발명에 의하면, 텍스트 내용을 문맥을 분석하여 적합한 용어로 음성 변환함으로써, 상황에 맞는 정확한 의미 정보를 전달해 줄 수 있다. 이는 일반 사용자 뿐만 아니라 웹페이지에 대한 접근성이 떨어지는 시각 장애인에게 큰 도움을 제공할 수 있다.  또한 웹페이지 뿐 아니라 모바일에서 시각 장애인의 접근성을 위한 스마트(smart)한 토크백(talkback) 서비스를 제공해 줄 수 있어서 3rd party의 애플케이션(application)까지도 의미에 맞게 읽어 줄 수 있다. 이를 통해 웹 페이지 Reader는 사용자에게 보다 직관적인 인터페이스를 제공할 수 있어 사용자의 서비스 편의를 증대시킬 수 있다.

Description

단위 또는 약어의 풀네임 음성출력 방법 및 장치{Method and apparatus of Smart Text Reader for converting Web page through TTS}
본 발명은 텍스트의 음성출력에 관한 것으로서, 특히 텍스트에 포함된 단위 또는 약어의 풀네임(full name) 음성 출력 방법 및 장치에 관한 것이다.
수식, 기호, 표, 도형 또는 그림이 상존하는 서책의 문자지식을 청취 가능한 음성지식으로 전환하거나 역으로 음성지식을 문자지식으로 변환하기 위해, 전문 지식의 수식과 기호 표현을 음성단어로 대응시켜 음성표현으로 바꾸고 이 음성표현을 음성으로 전환하거나 역으로 음성지식을 전문 문자지식으로 변환하여 지식습득매개체, 예를 들어인터넷 웹, 모바일 단말기 등을 통하여 전문지식 습득에 활용하였다.
또한, 인터넷 웹 페이지 내에 존재하는 문자 지식, 예를 들어 문자, 수식, 기호, 표, 도형 또는 그림 정보를 음성으로 표현하는 메타 태그(Meta Tag)의 키워드(Keyword)를 추가로 사용함으로써 기존의 웹 검색 엔진의 불완전한 색인 자료에 의한 정보 확인과 검색이 가능하다.
종래의 문자지식을 음성지식으로 전환하는 장치는 문자 형태를 빛을 이용하여 판독하는 광학문자인식부를 이용하는 경우가 있다. 이 때 광학문자인식을 이용하게 되면 인식에 필요한 부분과 필요하지 않은 부분을 일일이 가려 내야 하는 번거로움이 있고, 고정된 형식의 문자에 대해서만 판별 가능하며 시간이 많이 걸리고 오인식의 문제점을 가지고 있다.
또한 종래의 방법은 문자 지식을 음성으로 변환함에 있어서 서버가 연동되는 매핑 테이블 DB가 필요했다. 이는 많은 용량을 필요로 하며 매핑테이블 DB에 지속적으로 접근해야 하는 부담이 있다.
그리고 종래의 방법으로는 하나의 단위, 약어에 해당하는 여러 개의 의미가 나왔을 때 선택 기준에 대한 가이드가 없어서 중의어에 대해서는 음성 지식으로 전환하는 데 한계가 있다.
본 발명이 해결하고자 하는 과제는, 텍스트를 음성으로 합성하는 과정에서, 약어 또는 단위, 예를 들어 길이, 무게, 면적, 체적, 힘, 압력, 밀도, 온도, 속도, 시간, 점성도, 에너지, 수학기호 등의 정보를 웹 브라우저 상에서 문맥에 적합한 해당 풀네임(Full name, original word) 으로 읽어 주는, 단위 또는 약어의 풀네임 음성출력 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 과제는 텍스트를 음성으로 합성하는 과정에서, 약어 또는 단위, 예를 들어 길이, 무게, 면적, 체적, 힘, 압력, 밀도, 온도, 속도, 시간, 점성도, 에너지, 수학기호 등의 정보를 웹 브라우저 상에서 문맥에 적합한 해당 풀네임(Full name, original word) 으로 읽어 주는, 단위 또는 약어의 풀네임 음성출력 장치를 제공하는 것이다.
상기 기술적 과제를 이루기 위한 본 발명의 일측면에 의한, 단위 또는 약어의 풀네임 음성출력 방법은, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하는 단계; 상기 검출된 단위 또는 약어를 풀 네임(full name, original word) 데이터베이스에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하는 단계; 및 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하는 단계를 포함한다.
상기 단위 또는 약어 검출 단계는 텍스트를, 의미를 갖는 문자열 단위로 파싱하는 단계; 및 상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출하는 것을 포함할 수 있다. 상기 파싱된 의미를 갖는 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표' 중 어느 하나에 속하면 단위 또는 약어로 검출한다.
또 다른 예로 '기호 + 숫자 + 알파벳' 이 있는 경우에도 단위 또는 약어로 간주한다. 이 밖에도 더 많은 예가 발생할 수 있다.
상기 파싱 단계는 웹페이지가 HTML로 이루어진 경우 HTML 페이지를 획득하는 단계; 및 상기 획득된 HTML 페이지로부터 XML 분석기 또는 정규 표현식을 이용하여 텍스트 만을 추출하는 단계; 및 상기 추출된 텍스트를 의미있는 문자열 단위로 파싱하는 단계를 포함한다.
상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 단계를 더 포함할 수 있다.
상기 풀 네임 선택 단계는 문맥에서 키워드들을 추출하는 단계; 연관어 데이터베이스를 검색하는 단계; 및 상기 추출된 키워드들과 연관어 데이터베이스 검색 결과를 이용하여 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 단계를 포함한다. 상기 연관어 데이터 베이스는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 데이터베이스이다.
상기 음성출력은 상기 단위 또는 약어가 풀 네임(full name)으로 변환되면, 상기 변환된 풀 네임을 음성 형태로 전환하여 음성으로 출력하거나 상기 단위 또는 약어가 풀 네임(full name)으로 변환되면, 상기 변환된 풀 네임을 음성형태로 변환하지 않고, 음성형태로 변환될 단어의 수를 카운트하여 소정 개수가 되면, 상기 소정 갯수의 단어를 음성 형태로 전환하여 음성으로 출력한다.
상기 다른 기술적 과제를 이루기 위한 본 발명의 일 측면에 의한, 단위 또는 약어의 풀네임 음성출력 장치는, 하나 이상의 프로세서; TTS(Text To Speech) 프로그램 및 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있는 풀 네임 데이터베이스가 저장되어 있는 메모리; 및 상기 TTS 프로그램의 실행 결과를 음성으로 출력하는 음성 출력부를 포함하는 장치로서, 상기 TTS 프로그램은 하나 이상의 프로세서에 의해 실행되도록 구성될 수 있다.
상기 TTS 프로그램은 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하기 위한 명령어; 상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 데이터베이스에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하기 위한 명령어; 및 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하기 위한 명령어를 포함한다.
상기 단위 또는 약어를 검출하기 위한 명령어는 텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하는 명령어; 및 상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출하기 위한 명령어를 포함한다.
상기 파싱된 의미를 갖는 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표' 중 어느 하나에 속하면 단위 또는 약어로 검출한다.
또 다른 예로 '기호 + 숫자 + 알파벳' 이 있는 경우에도 단위 또는 약어로 간주한다. 이 밖에도 더 많은 예가 발생할 수 있다.
상기 파싱하기 위한 명령어는 웹페이지가 HTML로 이루어진 경우 HTML 페이지를 가져오기 위한 명령어; XML 분석기 또는 정규 표현식을 이용하여 텍스트 정보만을 추출하기 위한 명령어; 및 상기 추출된 텍스트 정보를 의미를 갖는 문자열 단위로 파싱하기 위한 명령어를 포함할 수 있다.
상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하기 위한 명령어를 포함할 수 있다.
상기 검색된 풀 네임 중 하나를 선택하기 위한 명령어는 문맥에서 키워드들을 추출하기 위한 명령어; 연관어 데이터베이스를 검색하기 위한 명령어; 및 상기 추출된 키워드들과 연관어 데이터베이스 검색 결과를 이용하여 문맥에 적합한 의미를 갖는 단위 또는 약어를 선택하기 위한 명령어를 포함할 수 있다. 상기 연관어 데이터 베이스는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 데이터베이스이다.
상기 다른 기술적 과제를 이루기 위한 본 발명의 다른 측면에 의한, 단위 또는 약어의 풀네임 음성출력 장치는, TTS(Text To Speech) 프로그램 및 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있는 풀 네임 데이터베이스를 저장하고 있는 저장부; 상기 TTS 프로그램을 실행하고, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하고, 상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 사전에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하며, 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 변환하는 제어부; 및 상기 음성형태로 변환된 풀 네임을 음성으로 출력하는 음성출력부를 포함한다.
상기 제어부는 텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하고, 상기 파싱된 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 이루어질 때, 상기 파싱된 문자열을 단위 또는 약어로 검출할 수 있다.
상기 제어부는 상기 파싱된 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표' 중 어느 하나에 속하면 단위 또는 약어로 검출한다.
또 다른 예로 '기호 + 숫자 + 알파벳' 이 있는 경우에도 단위 또는 약어로 간주한다. 이 밖에도 더 많은 예가 발생할 수 있다.
상기 제어부는 상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택한다.
이 때, 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 연관어 데이터베이스가 상기 저장부에 저장되고, 상기 제어부는 상기 검색된 풀 네임 중 하나를 선택하기 위해, 문맥에서 키워드들을 추출하고, 상기 연관어 데이터베이스를 검색하고, 상기 추출된 키워드들과 상기 연관어 데이터베이스 검색 결과를 이용하여 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택한다.
본 발명의 실시예에 따른, 단위 또는 약어의 풀네임 음성출력 방법 및 장치에 의하면, 광학문자인식부 대신 웹페이지에서 직접 텍스트를 파싱하여 오인식률을 낮추고, 처리 속도를 향상시킬 수 있다.
또한 기존의 DB 서버를 사용하지 않고 모바일에 특화된 버전으로 자체적으로 풀네임 DB를 모바일에 보유하여 매핑테이블 DB에 접근하는 번거로움을 덜 수 있으며, 수행 속도를 향상시킬 수 있다.
본 발명에서는 문맥을 분석하여 정확한 뜻을 추정하여 해당 단위, 약어의 적절한 풀 네이밍(full naming)을 해 줌으로써 검출된 단위, 약어 등이 2가지 이상의 뜻을 포함하는 중의어에 대해서도 처리할 수 있다.
본 발명에 의하면, 웹 페이지에서 텍스트를 읽어 단위,약어 등의 문맥에 맞는 전문 용어로 전환한 후 이를 음성으로 전환하여 주는 서비스를 제공함으로써 사용자의 편의성을 도모할 수 있다. 웹 페이지의 텍스트 내용을 문맥을 분석하여 적합한 용어로 음성 변환함으로써, 종래의 단순 텍스트 정보가 아닌 상황에 맞는 정확한 의미 정보를 전달해 줄 수 있다.
이는 일반 사용자 뿐만 아니라 웹페이지에 대한 접근성이 떨어지는 시각 장애인에게 큰 도움을 제공할 수 있다.  
본 발명을 통해 웹페이지 뿐 아니라 모바일에서 시각 장애인의 접근성을 위한 smart한 talkback 서비스 또한 제공해 줄 수 있어서 3rd party의 어플리케이션(Application)까지도 의미에 맞게 읽어 줄 수 있다. 이를 통해 웹 페이지 Reader는 사용자에게 보다 직관적인 인터페이스를 제공할 수 있어 사용자의 서비스 편의를 증대시킬 수 있다.
일반적으로 현재까지는 광학 문자 인식을 기반으로 하였을 때, DB 접근에 따른 연산량 로드(load)와 오인식의 위험을 가지고 있다. 따라서 광학 문자 인식 기반이 아닌 다른 방식으로 텍스트를 얻어 낼 수 있는 방안을 찾는 것이 요구되는데, 본 발명에 의하면, 특히 일반인의 경우 직접 웹페이지를 보기 힘든 운전 중이거나, 요리 중인 상황은 물론, 아예 웹 페이지를 볼 수 없는 시각 장애인을 위하여도 단위, 약어 등의 전문 지식을 알맞은 단어로 읽어 주는 기능은 매우 유용한 기능이 될 것이다.
도 1은 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 장치의 일실시예의 구성을 블록도로 나타낸 것이다.
도 2는 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 장치의 다른 실시예의 구성을 블록도로 나타낸 것이다.
도 3은 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 방법에 대한 일 실시예를 흐름도로 나타낸 것이다.
도 4는 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 방법에 대한 흐름도를 보다 구체적으로 나타낸 것이다.
도 5는 단위 또는 약어 검출 알고리즘의 일 예를 흐름도로 나타낸 것이다.
도 6a 내지 도 6d는 어휘의 의미와 주변 문맥에 나타나는 어휘 간 연관성의 예를 나타낸 것이다.
이하, 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
본 발명은 웹 페이지에서 선택한 부분에서 텍스트를 추출하여 음성으로 합성하고, 이를 출력한다. 이 과정에서 단위, 예를 들어 길이, 무게, 면적, 체적, 힘, 압력, 밀도, 온도, 속도, 시간, 점성도, 에너지, 수학기호와 약어 등의 정보를 웹 브라우저 상에서 해당 풀네임(Full name, original word)으로 적합한 표현으로 잘 읽어 줄 수 있도록 한다.
또한 약어나 단위가 2개 이상의 의미를 가지는 중의어인 경우에는 문맥을 분석하여 적합한 의미를 선택할 수 있도록 하는 모듈을 구성하여 문맥에 어울리는 단어를 선택하여 읽어 주도록 한다.
그러나 현재까지는 텍스트를 파싱하여 단위, 약어가 나왔을 경우 중의어에 대해서 적합한 풀네임(full name)으로 전환하여 음성 출력을 해주지 못하는 한계가 있었다.  이러한 어려움을 극복하기 위하여 문맥 분석을 통하여 적절한 풀네임(Full name)을 찾아 주는 것이 필요하다.
본 발명은 웹 페이지를 음성 정보로 읽어 주는 서비스를 제공하는 방법에 있어서 단위, 약어, 표, 그림 등 전문 지식을 해당 내용을 분석하여 상황에 맞는 용어로 읽어 줄 수 있다.
도 1은 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 장치의 일실시예의 구성을 블록도로 나타낸 것이다.
도 1을 참조하면, 상기 일 실시예에 따른 단위 또는 약어의 풀네임 음성출력 장치는 하나 이상의 프로세서(100), 메모리(120) 및 음성출력부(140)을 포함한다.
메모리(120)는 TTS(Text To Speech) 프로그램(122) 및 풀 네임 데이터베이스(124)를 저장하고 있다. 그리고 연관어 DB(126)가 메모리(120)에 더 저장될 수 있다. 풀 네임 데이터 베이스(124)는 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있다.
음성출력부(140)는 TTS 프로그램(122)의 실행 결과를 음성으로 출력한다.
상기 TTS 프로그램(122)은 하나 이상의 프로세서(100)에 의해 실행되도록 구성되며, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하기 위한 명령어, 상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 데이터베이스(124)에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하기 위한 명령어 및 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하기 위한 명령어를 포함한다.
상기 단위 또는 약어를 검출하기 위한 명령어는 텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하는 명령어 및 상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출하기 위한 명령어를 포함할 수 있다. 상기 파싱된 의미를 갖는 이하, 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 일 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
본 발명은 웹 페이지에서 선택한 부분에서 텍스트를 추출하여 음성으로 합성하고, 이를 출력한다. 이 과정에서 단위, 예를 들어 길이, 무게, 면적, 체적, 힘, 압력, 밀도, 온도, 속도, 시간, 점성도, 에너지, 수학기호와 약어 등의 정보를 웹 브라우저 상에서 해당 풀네임(Full name, original word)으로 적합한 표현으로 잘 읽어 줄 수 있도록 한다.
또한 약어나 단위가 2개 이상의 의미를 가지는 중의어인 경우에는 문맥을 분석하여 적합한 의미를 선택할 수 있도록 하는 모듈을 구성하여 문맥에 어울리는 단어를 선택하여 읽어 주도록 한다.
그러나 현재까지는 텍스트를 파싱하여 단위, 약어가 나왔을 경우 중의어에 대해서 적합한 풀네임(full name)으로 전환하여 음성 출력을 해주지 못하는 한계가 있었다.  이러한 어려움을 극복하기 위하여 문맥 분석을 통하여 적절한 풀네임(Full name)을 찾아 주는 것이 필요하다.
본 발명은 웹 페이지를 음성 정보로 읽어 주는 서비스를 제공하는 방법에 있어서 단위, 약어, 표, 그림 등 전문 지식을 해당 내용을 분석하여 상황에 맞는 용어로 읽어 줄 수 있다.
도 1은 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 장치의 일실시예의 구성을 블록도로 나타낸 것이다.
도 1을 참조하면, 상기 일 실시예에 따른 단위 또는 약어의 풀네임 음성출력 장치는 하나 이상의 프로세서(100), 메모리(120) 및 음성출력부(140)을 포함한다.
메모리(120)는 TTS(Text To Speech) 프로그램(122) 및 풀 네임 데이터베이스(124)를 저장하고 있다. 그리고 연관어 DB(126)가 메모리(120)에 더 저장될 수 있다. 풀 네임 데이터 베이스(124)는 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있다.
음성출력부(140)는 TTS 프로그램(122)의 실행 결과를 음성으로 출력한다.
상기 TTS 프로그램(122)은 하나 이상의 프로세서(100)에 의해 실행되도록 구성되며, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하기 위한 명령어, 상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 데이터베이스(124)에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하기 위한 명령어 및 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하기 위한 명령어를 포함한다.
상기 단위 또는 약어를 검출하기 위한 명령어는 텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하는 명령어 및 상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출하기 위한 명령어를 포함할 수 있다. 상기 파싱된 의미를 갖는 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표' 중 어느 하나에 속하면 단위 또는 약어로 검출한다.
또 다른 예로 '기호 + 숫자 + 알파벳' 이 있는 경우에도 단위 또는 약어로 간주한다. 이 밖에도 더 많은 예가 발생할 수 있다.
상기 파싱하기 위한 명령어들은 웹페이지가 HTML로 이루어진 경우에는 HTML 페이지를 가져오기 위한 명령어, XML 분석기 또는 정규 표현식을 이용하여 텍스트 정보만을 추출하기 위한 명령어 및 상기 추출된 텍스트 정보를 의미를 갖는 문자열 단위로 파싱하기 위한 명령어를 포함할 수 있다.
그리고 상기 풀 네임 데이터베이스(124)의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 명령어를 더 포함할 수 있다.
상기 검색된 풀 네임 중 하나를 선택하기 위한 명령어는 문맥에서 키워드들을 추출하기 위한 명령어, 연관어 데이터베이스를 검색하기 위한 명령어 및 상기 추출된 키워드들과 연관어 데이터베이스 검색 결과를 이용하여 문맥에 적합한 의미를 갖는 단위 또는 약어를 선택하기 위한 명령어를 포함할 수 있다.
연관어 데이터 베이스(126)는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 것이다.
도 2는 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 장치의 다른 실시예의 구성을 블록도로 나타낸 것이다.
상기 다른 실시예에 따른 단위 또는 약어의 풀네임 음성출력 장치는 하나 이상의 제어부(200), 저장부(220) 및 음성출력부(240)을 포함한다.
도 2를 참조하면, 저장부(220)는 TTS(Text To Speech) 프로그램(222) 및 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있는 풀 네임 데이터베이스(224)를 저장하고 있다. 저장부(220)에는 연관어 데이터베이스(226)가 저장될 수 있다. 연관어 데이터베이스(226)는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 데이터 베이스이다.
제어부(200)는 TTS 프로그램(222)을 실행하고, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하고, 상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 데이터 베이스(224)에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하며, 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 변환한다.
제어부(200)는 텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하고, 상기 파싱된 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 이루어질 때, 상기 파싱된 문자열을 단위 또는 약어로 검출할 수 있다.
상기 파싱된 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표' 중 어느 하나에 속하면 단위 또는 약어로 검출한다.
또 다른 예로 '기호 + 숫자 + 알파벳' 이 있는 경우에도 단위 또는 약어로 간주한다. 이 밖에도 더 많은 예가 발생할 수 있다.
또한 풀네임 데이터베이스(224)의 검색 결과 두 개 이상의 풀 네임이 검색되면, 제어부(200)는 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택한다.
제어부(200)는 상기 검색된 풀 네임 중 하나를 선택하기 위해, 문맥에서 키워드들을 추출하고, 연관어 데이터베이스(226)를 검색하고, 상기 추출된 키워드들과 연관어 데이터베이스(226) 검색 결과를 이용하여 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택한다. 그리고 음성출력부(240)는 음성형태로 변환된 풀 네임을 음성으로 출력한다.
도 3은 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 방법에 대한 일 실시예를 흐름도로 나타낸 것이다. 도 3을 참조하면, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출한다.(S300 단계) 상기 검출된 단위 또는 약어를 풀 네임(full name, original word) 데이터베이스(124, 224)에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득한다.(S320 단계) 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력한다.(S340 단계)
상기 단위 또는 약어 검출은 텍스트를, 의미를 갖는 문자열 단위로 파싱하고, 상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출한다. 상기 파싱된 의미를 갖는 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표' 중 어느 하나에 속하면 단위 또는 약어로 검출한다.
또 다른 예로 '기호 + 숫자 + 알파벳' 이 있는 경우에도 단위 또는 약어로 간주한다. 이 밖에도 더 많은 예가 발생할 수 있다.
그리고 웹페이지에서의 상기 파싱은 웹페이지가 HTML로 이루어진 경우 HTML 페이지를 획득하고, 상기 획득된 HTML 페이지로부터 XML 분석기 또는 정규 표현식을 이용하여 텍스트 만을 추출한 후, 상기 추출된 텍스트를 의미있는 문자열 단위로 파싱한다.
또한 상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택한다. 이 때 문맥에 기초한 풀네임 선택은 문맥에서 키워드들을 추출하고, 연관어 데이터베이스를 검색하여 상기 추출된 키워드들과 연관어 데이터베이스 검색 결과를 이용하여 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택할 수 있다.
여기서, 상기 연관어 데이터 베이스(126, 226)는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 데이터베이스이다.
또한 상기 음성출력은 상기 단위 또는 약어가 풀 네임(full name)으로 변환되면, 바로 바로 상기 변환된 풀 네임을 음성 형태로 전환하여 음성으로 출력할 수 있다. 또한 상기 단위 또는 약어가 풀 네임(full name)으로 변환되면, 상기 변환된 풀 네임을 음성형태로 변환하지 않고, 음성형태로 변환될 단어의 수를 카운트하여 소정 개수가 되면, 상기 소정 갯수의 단어를 음성 형태로 전환하여 음성으로 출력할 수도 있다.
도 4는 본 발명에 의한 단위 또는 약어의 풀네임 음성출력 방법에 대한 흐름도를 보다 구체적으로 나타낸 것이다. 본 발명은 웹페이지의 텍스트 정보 중 단위, 약어 등을 문맥에 맞는 풀 네임으로 전환하여 음성으로 출력한다. 본 실시예에서는 웹페이지를 예로 들었지만, 본 발명은 웹페이지에 한정되지 않고, 모바일 기기, TV, 가전제품, 네비게이션 등의 텍스트에도 적용할 수 있다.
이하, 설명의 편의상 웹 페이지에 있는 단위나 약어를 음성으로 출력하는 것을 예로 들어 설명하기로 한다.
웹페이지로부터 텍스트 정보를 추출하여 텍스트를 불러온다. (S400단계) 보다 상세하게는 웹페이지에서 텍스트 정보를 추출해 내는 것으로 시작된다. 웹 페이지의 텍스트 데이터 추출을 위해 웹페이지가 HTML로 이루어진 경우 일반적으로 HTML 페이지를 가져온 후 XML 분석기(parser) 또는 정규 표현식을 이용하여 텍스트 정보만을 파싱하여 추출한다.
이렇게 텍스트가 추출되면, 텍스트를 불러와서 의미를 갖는 문자열 단위인 토큰 단위로 파싱한다.(S405단계) 여기서 파싱이란 일련의 문자열을 의미 있는 토큰(token)으로 분해하고, 이들로 이루어진 파스 트리(Parse Tree)를 만드는 과정을 일컫는다.
파싱이 되면, 토큰에 단위나 약어가 있는지 체크하여 단위나 약어를 빠르게 검출한다.(S410단계) 웹페이지에서 추출한 텍스트 중에서 단위와 약어를 신속, 정확하게 검출하는 것이 중요하다. 본 발명의 실시예로는 다음과 같은 것들이 존재한다. 이 밖에도 다양한 경우가 존재할 수 있다. 본 발명의 실시예로는 다음과 같은 경우에 해당하면 단위 또는 약어로 판단한다.
도 5는 본 발명의 실시예에서 단위 또는 약어를 검출하는 케이스를 흐름도로 나타낸 것이다.
토큰이 입력되면, 토큰이 '숫자 + 알파벳'를 포함하는 경우, 예를 들어 10m, 10Kg, 10mm 등인 경우 단위로 인식한다.(S510단계) 토큰이 '숫자 + 알파벳이 아닌 기호'를 포함하는 경우, 예를 들어 10℃ 등인 경우 단위로 인식한다.(S520단계)
토큰이 '알파벳이 아닌 기호 + 숫자'를 포함하는 경우, 예를 들어 NW10 등인 경우 단위로 인식한다.(S530단계) 토큰이 대·소문자 사이에 '/'를 포함하는 경우, 예를 들어 N/C , m/s 등인 경우 약어 또는 단어로 인식한다.(S540단계)
토큰이 대문자들의 결합으로 이루어진 경우, 예를 들어 CPA 등인 경우에는 약어로 인식한다.(S550단계) 토큰이 '대문자+소문자+마침표' 로 이루어진 경우, 예를 들어 Dr. 등인 경우에는 약어로 인식한다.(S560단계)
토큰이 '대문자+마침표+대문자+마침표+...'로 이루어진 경우, 예를 들어 U.S.A 등인 경우에는 약어로 인식한다.(S570 단계)
상기와 같이 카테고리별로 분류해 두고 해당 경우 별로 각각의 카테고리에 접근하게 되면 검색 시간을 단축시킬 수 있다.  
이상의 과정을 통해 단위나 약어가 검출되면 풀네임 데이터베이스(124, 224)를 검색한다.(S415 단계) 풀네임 데이터 베이스에서 단위, 약어에 해당하는 단어가 검색되었을 경우 그 뜻을 매칭시켜 준다. 여기에서 풀네임 데이터 베이스 검색 방법은 먼저 데이터베이스를 구성하고 문장에서 단위 및 약어를 자동으로 검출하여 데이터 베이스에 있는 의미로 연결시켜 읽어 주는 기능을 일컫는다.
검색결과 검출된 풀네임이 복수개 즉, 검색어가 중의어 인지 여부를 판단한다.(S420단계) 여기에서 검색어가 하나의 의미만을 가질 경우에는 해당되는 뜻을 출력하여 full naming(S440단계)을 해 준다.
중의어이면, 텍스트의 문맥에서 키워드를 추출한다.(S425단계) 그리고 연관어 DB를 검색한다.(S430단계) 추출된 키워드와 연관어 DB 검색 결과를 기반으로 두 가지 이상의 의미 중 어떤 의미를 갖는 풀네임을 선택할지 판단하여 문맥에 적합한 풀네임을 선택한다.(S435단계) 즉, 풀 네임 데이터베이스에서 두 개 이상의 의미를 가질 경우에는 문맥에서 키워드를 추출(S425 단계)하여 적합한 의미 선택의 판단 기준으로 삼는다. 문맥에서 키워드 추출 방법으로는 해당 검색어와 가장 많이 함께 쓰이는 단어 순으로 연관어 DB를 구성한 뒤, 단락이나 웹페이지 전체 내의 문장과 매칭하여 그 확률 순으로 키워드를 추출해 낸다.
예를 들어 'cm'의 경우 앞부분에는 숫자가 나오고, 길이를 지칭하는 '길이, 가로, 세로, 폭...'등의 단어와 함께 나오는 경우가 많다. 또한 길이를 나타낼 때에는 소문자로 표기된다는 규칙이 존재한다. 따라서 'CM송, Construction Management' 등과는 쉽게 구분될 수 있다. 'CM'의 경우에도 문맥의 전후에서 함께 많이 나오는 단어 순으로 연관어를 검색(S430단계)하여 그 본래의 뜻을 정확하게 찾아낼 수 있다(S435단계). 이 때 연관어 DB를 구성하는 예로는 도 6a 내지 도 6d와 같이 나타날 수 있다. 같은 '사과'라는 단어라도 그 의미에 따라서 연관어들이 다르게 나타날 수 있으므로, 문맥에서 많이 검출되는 검색어 순위에 따라서 적합한 의미를 선택할 수 있다. 이 때 빠른 검색을 위하여는 명사, 동사 단위로 추출하여 우선 검색하는 방법을 택할 수 있다. 어휘 중의성 해소에는 관련된 각종 알고리즘들이 사용될 수 있다.
상술한 과정을 통해 선택된 적합한 의미를 이용하여 단위, 약어 full naming(S440단계)을 시도한다. 즉 상기 420단계에서 중의어가 아니거나 S435단계에서 문맥에 적합한 풀네임이 선택되면, 단위 또는 약어의 풀네임을 획득한다.(S440단계)
이렇게 처리된 결과를 이용하여 음성형태로 전환하는 단계(S445단계)에서는 텍스트 정보를 음성 데이터 형태로 바꾸어 준다. 마지막으로 이를 음성으로 출력하는 단계(S450단계)로 구성된다. 즉, 풀네임이 획득되면 음성 형태로 전환하고(S445단계), 전환된 음성을 출력한다.(S450단계)
이 때 음성 전환 방법은 여러 가지가 발생할 수 있다. 첫째로, 변환된 전체 문장을 한꺼번에 음성 형태로 전환하는 방법이다. 이는, 문장이 아주 길 경우 합성 속도가 느려지게 되는 결과를 초래할 수 있다.
둘째로, 토큰 단위로 흐름도를 거쳐서 각각 음성 형태로 전환하는 방법이다. 이는 단위, 약어 full naming모듈과 음성으로 변환된 문장 합성이 병렬 처리가 되기 때문에 문장이 긴 경우에도 유리하다. 이 밖에도 음성 전환을 하는 데 있어서 발생할 수 있는 순서 등을 모두 포함한다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
100 : 프로세서 120 : 메모리
122 : TTS 프로그램 124 : 풀네임 DB
126 : 연관어 DB 140 : 음성출력부
200 : 제어부 220 : 저장부
222 : TTS 프로그램 224 : 풀네임 DB
226 : 연관어 DB 240 : 음성출력부

Claims (20)

  1. 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하는 단계;
    상기 검출된 단위 또는 약어를 풀 네임(full name, original word) 데이터베이스에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하는 단계; 및
    상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하는 단계를 포함하는, 단위 또는 약어의 풀 네임(full name) 음성 출력방법.
  2. 제1항에 있어서, 상기 단위 또는 약어 검출 단계는
    텍스트를, 의미를 갖는 문자열 단위로 파싱하는 단계; 및
    상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출하는 것을 특징으로 하는, 단위 또는 약어의 풀네임(full name) 음성 출력방법.
  3. 제2항에 있어서,
    상기 파싱된 의미를 갖는 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표', '기호 + 숫자 + 알파벳' 중 어느 하나에 속하면 단위 또는 약어로 검출하는 단계를 포함하는 것을 특징으로 하는 단위 또는 약어의 풀네임(full name) 음성 출력방법.
  4. 제2항에 있어서, 상기 파싱 단계는
    웹페이지가 HTML로 이루어진 경우 HTML 페이지를 획득하는 단계;
    상기 획득된 HTML 페이지로부터 XML 분석기 또는 정규 표현식을 이용하여 텍스트 만을 추출하는 단계; 및
    상기 추출된 텍스트를 의미있는 문자열 단위로 파싱하는 단계를 포함하는 것을 특징으로 하는, 단위 또는 약어의 풀네임(full name) 음성 출력방법.
  5. 제1항에 있어서,
    상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 단계를 더 포함하는, 단위 또는 약어의 풀 네임(full name) 음성 출력방법.
  6. 제5항에 있어서, 상기 풀 네임 선택 단계는
    문맥에서 키워드들을 추출하는 단계;
    연관어 데이터베이스를 검색하는 단계; 및
    상기 추출된 키워드들과 연관어 데이터베이스 검색 결과를 이용하여 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 단계를 포함하고,
    상기 연관어 데이터 베이스는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 데이터베이스인 것을 특징으로 하는, 단위 또는 약어의 풀네임(full name) 음성 출력방법.
  7. 제1항에 있어서, 상기 음성출력은
    상기 단위 또는 약어가 풀 네임(full name)으로 변환되면, 상기 변환된 풀 네임을 음성 형태로 전환하여 음성으로 출력하는 것을 특징으로 하는 단위 또는 약어의 풀네임(full name) 음성 출력방법.
  8. 제1항에 있어서, 상기 음성출력은
    상기 단위 또는 약어가 풀 네임(full name)으로 변환되면, 상기 변환된 풀 네임을 음성형태로 변환하지 않고, 음성형태로 변환될 단어의 수를 카운트하여 소정 개수가 되면, 상기 소정 갯수의 단어를 음성 형태로 전환하여 음성으로 출력하는 것을 특징으로 하는 단위 또는 약어의 풀네임(full name) 음성 출력방법.
  9. 하나 이상의 프로세서;
    TTS(Text To Speech) 프로그램 및 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있는 풀 네임 데이터베이스가 저장되어 있는 메모리; 및
    상기 TTS 프로그램의 실행 결과를 음성으로 출력하는 음성 출력부를 포함하는 장치로서,
    상기 TTS 프로그램은 하나 이상의 프로세서에 의해 실행되도록 구성되며,
    상기 TTS 프로그램은
    음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하기 위한 명령어;
    상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 데이터베이스에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하기 위한 명령어; 및
    상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 전환하여 출력하기 위한 명령어를 포함하는, 단위 또는 약어의 풀 네임(full name) 음성 출력 장치.
  10. 제9항에 있어서, 상기 단위 또는 약어를 검출하기 위한 명령어는
    텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하는 명령어; 및
    상기 파싱된 의미를 갖는 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 구성될 때, 상기 파싱된 의미를 갖는 문자열을 단위 또는 약어로 검출하기 위한 명령어를 포함하는, 단위 또는 약어의 풀 네임(full name) 음성 출력 장치.
  11. 제10항에 있어서,
    상기 파싱된 의미를 갖는 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표', '기호 + 숫자 + 알파벳' 중 어느 하나에 속하면 단위 또는 약어로 검출하는 것을 특징으로 하는 단위 또는 약어의 풀 네임(full name) 음성 출력 장치.
  12. 제10항에 있어서, 상기 파싱하기 위한 명령어는
    웹페이지가 HTML로 이루어진 경우 HTML 페이지를 가져오기 위한 명령어; 및
    XML 분석기 또는 정규 표현식을 이용하여 텍스트 정보만을 추출하기 위한 명령어; 및
    상기 추출된 텍스트 정보를 의미를 갖는 문자열 단위로 파싱하기 위한 명령어를 포함하는, 단위 또는 약어의 풀네임(full name) 음성 출력 장치.
  13. 제9항에 있어서,
    상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하기 위한 명령어를 포함하는, 단위 또는 약어의 풀네임(full name) 음성 출력 장치.
  14. 제13항에 있어서, 상기 검색된 풀 네임 중 하나를 선택하기 위한 명령어는
    문맥에서 키워드들을 추출하기 위한 명령어;
    연관어 데이터베이스를 검색하기 위한 명령어; 및
    상기 추출된 키워드들과 연관어 데이터베이스 검색 결과를 이용하여 문맥에 적합한 의미를 갖는 단위 또는 약어를 선택하기 위한 명령어를 포함하고,
    상기 연관어 데이터 베이스는 검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 데이터베이스인 것을 특징으로 하는, 단위 또는 약어의 풀네임(full name) 음성 출력 장치.
  15. TTS(Text To Speech) 프로그램 및 단위 또는 약어와 상기 단위 또는 약어의 풀 네임(full name, original name)이 매칭되어 있는 풀 네임 데이터베이스를 저장하고 있는 저장부;
    상기 TTS 프로그램을 실행하고, 음성 출력하고자 하는 텍스트에서 단위 또는 약어를 검출하고, 상기 검출된 단위 또는 약어를 상기 풀 네임(full name, original word) 데이터 베이스에서 검색하여 상기 검출된 단위 또는 약어의 풀 네임을 획득하며, 상기 획득된 단위 또는 약어의 풀 네임을 음성형태로 변환하는 제어부; 및
    상기 음성형태로 변환된 풀 네임을 음성으로 출력하는 음성출력부를 포함하는, 단위 또는 약어의 풀 네임(full name) 음성 출력 장치.
  16. 제15항에 있어서, 상기 제어부는
    텍스트 정보를, 의미를 갖는 문자열 단위로 파싱하고, 상기 파싱된 문자열이 소정의 숫자, 알파벳, 기호, 마침표 및 대소문자의 배열 패턴으로 이루어질 때, 상기 파싱된 문자열을 단위 또는 약어로 검출하는 것을 특징으로 하는, 단위 또는 약어의 풀 네임(full name) 음성 출력 장치.
  17. 제16항에 있어서, 상기 제어부는
    상기 파싱된 문자열이 '숫자+ 알파벳', '숫자 + 알파벳이 아닌 기호', '알파벳이 아닌 기호 + 숫자', 대문자 또는 소문자 사이에 '/', 대문자들의 결합', '대문자 + 소문자 + 마침표', '대문자 + 마침표 + 대문자 + 마침표', '기호 + 숫자 + 알파벳' 중 어느 하나에 속하면 단위 또는 약어로 검출하는 것을 특징으로 하는, 단위 또는 약어의 풀네임(full name) 음성 출력 장치.
  18. 제15항에 있어서, 상기 제어부는
    상기 풀 네임 데이터베이스의 검색 결과가 두 개 이상의 풀 네임이 검색되면, 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 것을 특징으로 하는, 단위 또는 약어의 풀 네임(full name) 음성 출력장치.
  19. 제18항에 있어서,
    검색어와 함께 사용되는 단어들을 빈도 순으로 정렬해 놓은 연관어 데이터베이스가 상기 저장부에 저장되고,
    상기 제어부는
    상기 검색된 풀 네임 중 하나를 선택하기 위해, 문맥에서 키워드들을 추출하고, 상기 연관어 데이터베이스를 검색하고, 상기 추출된 키워드들과 상기 연관어 데이터베이스 검색 결과를 이용하여 문맥에 기초하여 상기 검색된 풀 네임 중 하나를 선택하는 것을 특징으로 하는, 단위 또는 약어의 풀네임(full name) 음성 출력 장치.
  20. 제1항 내지 제8항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체.
KR1020140119361A 2014-09-05 2014-09-05 단위 또는 약어의 풀네임 음성출력 방법 및 장치 KR20160029587A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140119361A KR20160029587A (ko) 2014-09-05 2014-09-05 단위 또는 약어의 풀네임 음성출력 방법 및 장치
US14/846,331 US20160071511A1 (en) 2014-09-05 2015-09-04 Method and apparatus of smart text reader for converting web page through text-to-speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140119361A KR20160029587A (ko) 2014-09-05 2014-09-05 단위 또는 약어의 풀네임 음성출력 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20160029587A true KR20160029587A (ko) 2016-03-15

Family

ID=55438070

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140119361A KR20160029587A (ko) 2014-09-05 2014-09-05 단위 또는 약어의 풀네임 음성출력 방법 및 장치

Country Status (2)

Country Link
US (1) US20160071511A1 (ko)
KR (1) KR20160029587A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180060971A (ko) * 2016-11-29 2018-06-07 삼성전자주식회사 사용자 입력에 기반한 문장을 제공하는 장치 및 방법
KR20180137031A (ko) * 2016-05-17 2018-12-26 구글 엘엘씨 입력 및/또는 출력이 인터넷유행어를 포함하는 사용자 인터페이스 입력에 응답하여 제시할 출력을 생성
US11475218B2 (en) 2016-11-29 2022-10-18 Samsung Electronics Co., Ltd. Apparatus and method for providing sentence based on user input

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9607030B1 (en) * 2016-09-23 2017-03-28 International Business Machines Corporation Managing acronyms and abbreviations used in the naming of physical database objects
US10699074B2 (en) * 2018-05-22 2020-06-30 Microsoft Technology Licensing, Llc Phrase-level abbreviated text entry and translation
US10430512B1 (en) * 2018-05-24 2019-10-01 Slack Technologies, Inc. Methods, apparatuses and computer program products for formatting messages in a messaging user interface within a group-based communication system
US10664658B2 (en) 2018-08-23 2020-05-26 Microsoft Technology Licensing, Llc Abbreviated handwritten entry translation
JP6749705B2 (ja) * 2019-01-25 2020-09-02 株式会社インタラクティブソリューションズ プレゼンテーション支援システム
CN112988108B (zh) * 2021-05-07 2021-08-10 浙江口碑网络技术有限公司 一种信息播放方法、装置、电子设备以及存储介质
CN113779997B (zh) * 2021-09-03 2023-10-10 珠海格力电器股份有限公司 实体识别方法、装置、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005050959A2 (en) * 2003-11-13 2005-06-02 Gh Llc Communication system and methods
US7412378B2 (en) * 2004-04-01 2008-08-12 International Business Machines Corporation Method and system of dynamically adjusting a speech output rate to match a speech input rate
US8538743B2 (en) * 2007-03-21 2013-09-17 Nuance Communications, Inc. Disambiguating text that is to be converted to speech using configurable lexeme based rules
US20080312928A1 (en) * 2007-06-12 2008-12-18 Robert Patrick Goebel Natural language speech recognition calculator
US9564120B2 (en) * 2010-05-14 2017-02-07 General Motors Llc Speech adaptation in speech synthesis
US8423365B2 (en) * 2010-05-28 2013-04-16 Daniel Ben-Ezri Contextual conversion platform
CN103229137B (zh) * 2010-09-29 2016-01-20 国际商业机器公司 基于上下文的首字母缩略词和缩写词的歧义消除
US20140039878A1 (en) * 2012-08-01 2014-02-06 Apollo Group, Inc. Symbolic-To-Natural Language Conversion
US9767789B2 (en) * 2012-08-29 2017-09-19 Nuance Communications, Inc. Using emoticons for contextual text-to-speech expressivity

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180137031A (ko) * 2016-05-17 2018-12-26 구글 엘엘씨 입력 및/또는 출력이 인터넷유행어를 포함하는 사용자 인터페이스 입력에 응답하여 제시할 출력을 생성
US10268683B2 (en) 2016-05-17 2019-04-23 Google Llc Generating output for presentation in response to user interface input, where the input and/or the output include chatspeak
US11238242B2 (en) 2016-05-17 2022-02-01 Google Llc Generating output for presentation in response to user interface input, where the input and/or the output include chatspeak
KR20180060971A (ko) * 2016-11-29 2018-06-07 삼성전자주식회사 사용자 입력에 기반한 문장을 제공하는 장치 및 방법
US11475218B2 (en) 2016-11-29 2022-10-18 Samsung Electronics Co., Ltd. Apparatus and method for providing sentence based on user input

Also Published As

Publication number Publication date
US20160071511A1 (en) 2016-03-10

Similar Documents

Publication Publication Date Title
KR20160029587A (ko) 단위 또는 약어의 풀네임 음성출력 방법 및 장치
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
US11182435B2 (en) Model generation device, text search device, model generation method, text search method, data structure, and program
EP3460678A1 (en) Antecedent determination method and apparatus
US20120179694A1 (en) Method and system for enhancing a search request
JP3983265B1 (ja) 辞書作成支援システム、方法及びプログラム
US9128907B2 (en) Language model generating device, method thereof, and recording medium storing program thereof
JP2004005600A (ja) データベースに格納された文書をインデックス付け及び検索する方法及びシステム
JP2011018330A (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
WO2008107305A2 (en) Search-based word segmentation method and device for language without word boundary tag
JP2004133880A (ja) インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法
US8583417B2 (en) Translation device and computer program product
KR101709055B1 (ko) 오픈 웹 질의응답을 위한 질문분석 장치 및 방법
JP2007514992A (ja) オーディオ対話システム及びボイスブラウズ方法
CN115687572A (zh) 一种数据信息的检索方法、装置、设备及存储介质
Abidi et al. An automatic learning of an algerian dialect lexicon by using multilingual word embeddings
CN112581327A (zh) 基于知识图谱的法律推荐方法、装置和电子设备
KR20170008357A (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
WO2020079752A1 (ja) 文献検索方法および文献検索システム
JP5300576B2 (ja) 検索装置、検索方法、および検索プログラム
JP2004240859A (ja) 言い換えシステム
CN109284364B (zh) 一种用于语音连麦互动的互动词汇更新方法及装置
JP2007264858A (ja) 人名性別判定プログラム、機械翻訳プログラム、人名性別判定装置、機械翻訳装置、人名性別判定処理方法および機械翻訳処理方法
CN112084777B (zh) 一种实体链接方法
JP3939264B2 (ja) 形態素解析装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid