KR20110015276A - Glasses-type announcement visualization apparatus using photochromic lens and method thereof - Google Patents

Glasses-type announcement visualization apparatus using photochromic lens and method thereof Download PDF

Info

Publication number
KR20110015276A
KR20110015276A KR1020090072914A KR20090072914A KR20110015276A KR 20110015276 A KR20110015276 A KR 20110015276A KR 1020090072914 A KR1020090072914 A KR 1020090072914A KR 20090072914 A KR20090072914 A KR 20090072914A KR 20110015276 A KR20110015276 A KR 20110015276A
Authority
KR
South Korea
Prior art keywords
voice
color
transparent
lens
text
Prior art date
Application number
KR1020090072914A
Other languages
Korean (ko)
Other versions
KR101062342B1 (en
Inventor
박상현
김양희
장호종
강현민
윤영규
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020090072914A priority Critical patent/KR101062342B1/en
Publication of KR20110015276A publication Critical patent/KR20110015276A/en
Application granted granted Critical
Publication of KR101062342B1 publication Critical patent/KR101062342B1/en

Links

Images

Classifications

    • GPHYSICS
    • G02OPTICS
    • G02CSPECTACLES; SUNGLASSES OR GOGGLES INSOFAR AS THEY HAVE THE SAME FEATURES AS SPECTACLES; CONTACT LENSES
    • G02C11/00Non-optical adjuncts; Attachment thereof
    • G02C11/10Electronic devices other than hearing aids
    • GPHYSICS
    • G02OPTICS
    • G02CSPECTACLES; SUNGLASSES OR GOGGLES INSOFAR AS THEY HAVE THE SAME FEATURES AS SPECTACLES; CONTACT LENSES
    • G02C7/00Optical parts
    • G02C7/02Lenses; Lens systems ; Methods of designing lenses
    • G02C7/08Auxiliary lenses; Arrangements for varying focal length
    • G02C7/081Ophthalmic lenses with variable focal length
    • G02C7/083Electrooptic lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/163Wearable computers, e.g. on a belt
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Ophthalmology & Optometry (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Optics & Photonics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Otolaryngology (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PURPOSE: A method and a device for visualizing a guide broadcasting using a discolored lens are provided to increase a voice recognition rate and a portability of the guide broadcasting visualizing device. CONSTITUTION: A voice preprocessing unit(152) performs preprocessing about an inputted voice. Through a preset voice pattern, a voice recognition unit(156) recognizes pre-processed voice. A character post-processing unit(158) adjusts output layout of a character corresponding to the recognized voice. According to neighboring brightness, a discolored transparent lens adjusts background color. A character display unit(160) outputs a post-processed character on inner surface of the discolored transparent lens.

Description

변색 렌즈를 이용한 안경형 안내방송 시각화 장치 및 방법{Glasses-type Announcement Visualization Apparatus Using Photochromic Lens and Method thereof}Glasses-type Announcement Visualization Apparatus Using Photochromic Lens and Method

본 발명은 변색 렌즈를 이용한 안경형 안내방송 시각화 장치에 관한 것이다. 구체적으로 본 발명은, 특화된 인식대상을 상대로 안내방송에 대한 음성인식률을 향상시키고, 주변 환경에 따라 변색 렌즈의 바탕색이 변하도록 하여 음성인식 결과로 표시되는 문자의 가독성을 높인 안경형 안내방송 시각화 장치 및 방법에 관한 것이다.The present invention relates to a spectacled announcement broadcasting device using a color changing lens. In detail, the present invention provides an eyeglass type guide visualization apparatus for improving the voice recognition rate for guide broadcasting to a specialized recognition target, and increasing the readability of characters displayed as a result of voice recognition by changing the background color of the color changing lens according to the surrounding environment. It is about a method.

인간은 다양한 수단을 사용하여 서로 정보전달 내지 의사소통을 하는데, 그 중 가장 널리 사용되는 수단은 바로 언어이다. 언어는 크게 음성언어와 문자언어로 나뉘며, 이들 각각은 고유한 특징을 지닌다. 청각에 의존하는 음성언어는 목소리를 내는 것만으로 정보를 전달할 수 있으므로 대면 상태에서 쉽고 빠른 의사전달이 가능하나, 이러한 실시간적인 특성 때문에 보존성이 약하다. 반면, 시각에 의존하는 문자언어는 문자화(literation) 과정을 거쳐야 하므로 의사전달의 즉시성은 떨어지 나, 상대적으로 보존성이 강하다는 특징이 있다.Humans communicate or communicate with each other using a variety of means, the most widely used of which is language. Languages are largely divided into phonetic and textual languages, each of which has its own characteristics. Voice language that relies on hearing can transmit information simply by making a voice, so it can communicate easily and quickly in a face-to-face state. On the other hand, since the text language that depends on the vision has to undergo a literation process, the instantaneous communication is inferior, but it is relatively conservative.

해당 언어에 능숙한 일반인들은 음성언어와 문자언어 양쪽을 모두 어려움 없이 사용하나, 사람에 따라서는 이들 중 어느 한 쪽을 선호하거나 또는 어느 한 쪽에 의한 의사전달만이 가능한 경우가 있다. 예컨대 청각 장애인들은 음성언어에 의한 소통이 불가능하고, 시각 장애인들은 문자언어에 의한 소통이 불가능하다. 외국인 등 특정 언어의 이해속도가 느린 사람들은 실시간적 이해가 요구되는 음성언어보다 천천히 이해할 수 있는 문자언어를 선호하는 경우가 있다.The general public who is fluent in the language can use both the spoken and written languages without difficulty, but some people prefer either one of them or only communicate by one. For example, hearing impaired people cannot communicate by voice language, and visually impaired people cannot communicate by text language. People who have a slow understanding of a specific language, such as foreigners, may prefer a text language that can be understood slowly over a voice language that requires real-time understanding.

한편, 음성언어와 문자언어는 둘 중 어느 한 쪽만이 사용되는 경우보다 양자가 동시에 사용되는 경우에 의미를 더욱 강력하게 전달할 수 있다. 음성언어와 문자언어 양자의 이해에 어려움이 없는 일반인들도 양자가 동시에 전달될 경우 해당 메시지를 더욱 빠르고 확실하게 이해할 수 있게 된다. 일반인들을 대상으로 하는 방송이나 각종 멀티미디어 컨텐츠들이 동영상, 음성과 함께 자막을 전송하는 것은 이러한 이유가 크다. 일반인들도 정보의 홍수 속에서 중요한 음성 키워드(keyword)를 시각화하여 의미를 전달 받을 필요가 있기 때문이다.On the other hand, the voice language and the text language can convey the meaning more strongly when both are used at the same time than when only one of them is used. Even ordinary people without difficulty in understanding both speech and text language can understand the message faster and more reliably if both are transmitted at the same time. This is why broadcasting and various multimedia contents for general public transmit subtitles along with video and audio. This is because the general public needs to visualize important voice keywords in the flood of information and receive meaning.

음성언어만으로 전달되는 메시지를 인식하여 문자메시지 형태로 표시해 준다면, 청각 장애인은 물론 일반인들의 의사전달 효율성을 높일 수 있다. 이는 그 동안 청각 장애인용 보조장치 내지 음성 시각화 기술 분야에서 주로 연구되어 왔다. 이 분야의 종래기술로는 음성인식 및 디스플레이 기술을 결합한 청각 장애인용 보조 장치가 있다. 이러한 장치 중에는 음성인식 결과를 투명 렌즈에 문자로 표시하는 웨어러블 디바이스(Wearable Device)의 형태로 제안된 예도 있으나, 음성인식 률, 휴대성 및 비용 등의 문제로 아직 널리 사용되지는 못하고 있는 실정이다.If the message is transmitted only in the voice language and is displayed in the form of a text message, the communication efficiency of the hearing impaired and the general public can be improved. This has been mainly studied in the field of hearing aids or voice visualization technology. Prior art in this field includes assistive devices for the hearing impaired, combining voice recognition and display technologies. Some of these devices have been proposed in the form of a wearable device that displays voice recognition results in text on a transparent lens. However, these devices have not been widely used due to problems such as voice recognition rate, portability, and cost.

한편, 현재 음성인식 기술이 일부 상용화되고 있으나, 아직 모든 음성에 대하여 완벽한 수준의 인식을 제공하지는 못하고 있다. 또한, 일반적으로 음성인식 대상의 범위를 넓힐수록 더욱 방대한 용량의 데이터가 필요하게 되며, 이는 장치의 무게 및 부피 증가를 수반한다. 음성인식 대상의 범위와 음성인식률 및 휴대성 간에는 트레이드-오프(trade-off) 관계가 있어서, 음성인식 대상을 넓힐수록 음성인식률 및 휴대성은 일반적으로 낮아지며, 반대로 음성인식 대상을 한정할수록 한정된 대상에 대하여 높은 수준의 음성인식률 및 휴대성을 제공하기에 유리해 진다.Meanwhile, some speech recognition technology is currently commercialized, but it does not yet provide a perfect level of recognition for all speech. Also, in general, the wider the range of speech recognition objects, the greater the volume of data required, which entails an increase in the weight and volume of the device. There is a trade-off relationship between the range of voice recognition targets, voice recognition rate, and portability, so that the wider the voice recognition target, the lower the voice recognition rate and portability in general. It is advantageous to provide a high level of speech recognition and portability.

지하철, 기차, 비행기, 관공서, 사파리(safari), 미술관, 박물관, 여행지 등 다양한 장소에서 안내방송은 대부분 불특정 다수의 일반인들을 대상으로 하여 음성언어로만 전달된다. 이 때문에 청각 장애인들은 이러한 형태의 안내방송의 사각지대에 속해 왔으며, 일반인들 역시 음성과 문자 양자를 모두 이용한 더 효율적인 정보전달의 기회를 제공받지 못해 왔다. 음성 형태의 안내방송은 일상적인 대화와 달리 청각 장애인들이 수화, 독순술(독화법), 필담 등을 이용하여 그 내용을 파악하는 것이 불가능하고, 내용 면에서 일상적인 대화에 비하여 중요한 정보를 더 많이 포함하고 있다는 특성이 있다. 그럼에도 불구하고 종래의 기술들은 음성 시각화 시스템을 개발함에 있어서, 음성인식 대상의 범위를 특화하지 않음으로 인하여 휴대성과 음성인식률 양자를 실질적으로 동시에 만족시키는 보조 장치를 제공하지 못했다.In various places, such as subways, trains, airplanes, government offices, safaris, galleries, museums, and destinations, announcements are mostly delivered in a spoken language for an unspecified number of ordinary people. Because of this, deaf people have been part of the blind spot of this type of announcement, and the public has not been offered the opportunity to communicate more efficiently using both voice and text. Voice announcements, unlike everyday conversations, make it impossible for the deaf to grasp their content using sign language, reading, and writing, and they contain more important information than ordinary conversations. There is a characteristic that it is doing. Nevertheless, in developing a speech visualization system, the prior arts do not provide a subsidiary device that substantially satisfies both portability and speech recognition rate because it does not specialize the range of speech recognition objects.

또한, 종래의 음성 시각화 기술은 밝은 곳과 어두운 곳에서 모두 동일한 방 식으로 문자를 표시한다는 점에서 주변 환경에 따라 사용자의 문자 가독성이 달라진다는 문제점이 있다. 음성언어는 입력 시기를 예측하기 어렵고 연속적으로 입력되는 특성이 있기 때문에, 휴대형 음성 표시 장치의 화면은 계속적으로 변화하게 된다. 음성언어의 이러한 특성에도 불구하고 주변의 밝기에 따라 그 인식결과인 문자의 가독성이 달라진다면, 입력되는 음성언어를 문자언어 형태로 전달 받는 사람의 입장에서 그 장치의 성능은 안정적이라고 보기 어렵다.In addition, the conventional voice visualization technology has a problem in that the text readability of the user varies depending on the surrounding environment in that the text is displayed in the same way in both bright and dark places. Since the voice language is difficult to predict the input time and has a characteristic of being continuously input, the screen of the portable voice display device is continuously changed. In spite of these characteristics of the voice language, if the readability of the character, which is the result of recognition, varies depending on the brightness of the surroundings, the performance of the device cannot be considered stable from the point of view of the person receiving the input voice language in the form of a text language.

상기 문제점을 해결하기 위하여 본 발명은, 안내방송에 특화하여 음성인식 및 시각화 기술을 적용함으로써, 휴대성과 음성인식률을 향상시킨 안경형 안내방송 시각화 장치 및 방법을 제공하는 것을 목적으로 한다.SUMMARY OF THE INVENTION In order to solve the above problems, an object of the present invention is to provide an eyeglass type guide broadcasting visualization apparatus and method which improves portability and voice recognition rate by applying voice recognition and visualization technology specifically for guide broadcasting.

또한, 주변의 밝기 변화에 따라 렌즈의 바탕색을 조절함으로써, 문자 가독성을 향상시킨 변색 렌즈를 이용한 안경형 안내방송 시각화 장치 및 방법을 제공하는 것을 목적으로 한다.In addition, an object of the present invention is to provide an eyeglass guide visual visualization apparatus and method using a color changing lens that improves character readability by adjusting a background color of a lens according to a change in ambient brightness.

상기 목적을 달성하기 위하여 본 발명의 일 측면은, 외부로부터 음성을 입력 받는 음성 입력부와, 상기 입력된 음성에 대하여 잡음제거 및 신호보상을 수행하는 음성 전처리부와, 기 설정된 음성패턴에 관한 정보를 저장하는 음성패턴 저장부와, 상기 음성패턴을 이용하여 상기 전처리된 음성을 인식하는 음성 인식부와, 상기 인식된 음성에 해당하는 문자의 출력 레이아웃을 조정하는 문자 후처리부와, 주변의 밝기에 따라 바탕색이 조절되는 변색 투명 렌즈, 및 상기 변색 투명 렌즈의 내측 표면에 상기 후처리된 문자를 출력하는 문자 표시부를 포함하는 변색 렌즈를 이용한 안경형 안내방송 시각화 장치를 제공한다.In order to achieve the above object, an aspect of the present invention provides a voice input unit for receiving a voice from an external device, a voice preprocessor for performing noise reduction and signal compensation on the input voice, and information on a preset voice pattern. A voice pattern storing unit for storing the voice pattern, a voice recognition unit for recognizing the preprocessed voice using the voice pattern, a text post-processing unit for adjusting the output layout of the text corresponding to the recognized voice, and brightness according to the surrounding brightness It provides a spectacle-type guide broadcasting visualization apparatus using a color change lens including a color change transparent lens, the background color is adjusted, and a text display unit for outputting the post-processed characters on the inner surface of the color change transparent lens.

또한, 상기 음성패턴은 안내방송의 실제 음원(sound source)으로부터 추출한 음성패턴이며, 상기 음성 인식에는 화자종속 음성인식 기법이 사용되는 변색 렌즈를 이용한 안경형 안내방송 시각화 장치를 제공한다.In addition, the voice pattern is a voice pattern extracted from the actual sound source (guide) of the announcement, and provides a visual guide broadcasting visualization device using a color changing lens that is used speaker-dependent speech recognition techniques for speech recognition.

또한, 상기 변색 투명 렌즈는 감광(photochromic) 또는 전기변색(electrochromic) 물질을 포함하여 형성되며, 상기 문자 표시부는 투명 디스플레이 패널을 포함하여 형성되는 변색 렌즈를 이용한 안경형 안내방송 시각화 장치를 제공한다.The discolored transparent lens may include a photochromic or electrochromic material, and the character display unit may provide a spectacles-type broadcast visualization apparatus using a discolored lens formed by including a transparent display panel.

또한, 상기 투명 디스플레이 패널은, 투명 유전체로 형성된 상판 및 하판과, 유리로 형성된 격벽과, 투명한 나노 형광체와, 산화 인듐 주석(Indium Tin Oxide, ITO)으로 형성된 전극을 포함하는 투명 광자 발광 디스플레이 패널인 변색 렌즈를 이용한 안경형 안내방송 시각화 장치를 제공한다.In addition, the transparent display panel is a transparent photonic light emitting display panel including an upper plate and a lower plate formed of a transparent dielectric, a partition formed of glass, a transparent nano phosphor, and an electrode formed of indium tin oxide (ITO). Provided is an eyeglass visualization system using a color changing lens.

또한, 상기 문자 후처리부는, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하고, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하는 변색 렌즈를 이용한 안경형 안내방송 시각화 장치를 제공한다.The character post-processing unit outputs the character in a light color when the discolored transparent lens is colored in a dark color, and outputs the character in a light color when the discolored transparent lens is colored in a dark color. Provides an eyeglass guide broadcasting visualization device.

또한, 상기 음성 입력부는 복수 개로서 상기 안내방송 시각화 장치의 좌측과 우측에 배치되며, 상기 문자 후처리부는 상기 음성 입력부 중 상기 입력된 음성이 가장 강하게 감지되는 방향에 대응하는 상기 변색 투명 렌즈의 내측 표면에 상기 문자를 출력하는 변색 렌즈를 이용한 안경형 안내방송 시각화 장치를 제공한다.In addition, the voice input unit may be disposed on the left and right sides of the guidance broadcasting visualization apparatus, and the text post-processing unit may be disposed inside the color-transparent transparent lens corresponding to a direction in which the input voice is most strongly detected among the voice input units. Provided is a spectacled announcement broadcasting device using a color changing lens that outputs the character on the surface.

상기 목적을 달성하기 위하여 본 발명의 다른 측면은, 외부로부터 음성을 입력 받는 음성입력 단계와, 상기 입력된 음성에 대하여 잡음제거 및 신호보상을 수행하는 음성전처리 단계와, 기 설정된 음성패턴에 관한 정보를 이용하여 상기 전처리된 음성을 인식하는 음성인식 단계와, 상기 인식된 음성에 해당하는 문자의 출력 레이아웃을 조정하는 문자후처리 단계와, 주변의 밝기에 따라 상기 문자가 출력될 변색 투명 렌즈의 바탕색을 조절하는 밝기조절 단계와, 상기 후처리된 문자를 상기 밝기조절된 변색 투명 렌즈의 내측 표면에 출력하는 문자표시 단계를 포함하는 안내방송 시각화 방법을 제공한다.In order to achieve the above object, another aspect of the present invention provides a voice input step of receiving a voice from outside, a voice preprocessing step of performing noise reduction and signal compensation on the input voice, and information on a preset voice pattern. A voice recognition step of recognizing the preprocessed voice, a text post-processing step of adjusting an output layout of a character corresponding to the recognized voice, and a background color of the color-transparent transparent lens to which the character is output according to ambient brightness And a character display step of outputting the post-processed character to the inner surface of the color faded transparent lens.

또한, 상기 음성패턴은 안내방송의 실제 음원(sound source)으로부터 추출한 음성패턴이며, 상기 음성 인식 단계에는 화자종속 음성인식 기법이 사용되는 안내방송 시각화 방법을 제공한다.In addition, the voice pattern is a voice pattern extracted from the actual sound source (sound source) of the guide broadcast, the voice recognition step provides a guide broadcast visualization method using a speaker-dependent voice recognition technique.

또한, 상기 문자 후처리 단계는, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하고, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하는 안내방송 시각화 방법을 제공한다.In addition, the text post-processing step, the broadcast to output the text in a light color when the color fading transparent lens is colored dark, and outputs the text in a light color when the color fading transparent lens is colored dark Provide visualization methods.

본 발명의 실시예에 따르면, 음성인식 대상이 안내방송 형태에 특화되어 안내방송 시각화 장치의 휴대성과 음성인식률이 향상되는 효과가 있다.According to an exemplary embodiment of the present invention, the voice recognition target is specialized in a guide broadcast form, so that the portability and voice recognition rate of the guide broadcast visualization device may be improved.

또한, 외부의 밝기 변화에 따라 문자 표시부의 바탕색이 조절되어 안정화된 문자 가독성을 제공할 수 있게 되는 효과가 있다.In addition, there is an effect that can provide a stable character readability by adjusting the background color of the character display unit in accordance with the external brightness change.

이하 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, when it is determined that a detailed description of a known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. The following terms are defined in consideration of the functions of the present invention, and may be changed according to the intentions or customs of the user, the operator, and the like. Therefore, the definition should be based on the contents throughout this specification.

도 1은 본 발명의 안내방송 시각화 장치의 일 실시예의 구성을 도시한 것이다. 본 실시예는 안경 형태로 구현된 것으로, 변색 투명 렌즈(110), 안경 다리(120), 음성 입력부(130)로 구성되어 있으며, 안경 다리(120)의 내부에 전원부(140), 안내방송 시각화부(150)를 포함한다.1 is a block diagram of an embodiment of a guide broadcasting visualization apparatus according to the present invention. The present embodiment is implemented in the form of glasses, it is composed of a color change transparent lens 110, glasses leg 120, the voice input unit 130, the power unit 140, guide broadcast visualization inside the glasses leg 120 The unit 150 is included.

본 실시예에서 변색 투명 렌즈(110), 안경 다리(120) 및 음성 입력부(130)는 한 쌍(110a, 110b)(120a, 120b)(130a, 130b)으로 형성되어 있으나, 이는 하나로 합쳐지거나 셋 이상으로 분리되어 형성될 수도 있다. 또한, 전원부(140) 및 안내방송 시각화부(150)도 안경 다리(120)의 외부에 형성될 수 있다. 변색 투명 렌즈(110), 안경 다리(120), 음성 입력부(130) 등의 외부 소재는 착용에 불편함이 없도록 보통의 안경에 사용되는 소재 또는 그보다 가벼운 소재를 사용할 수 있으며, 전원부(140)와 안내방송 시각화부(150)는 안경 전체 구조의 무게 균형을 맞출 수 있도록 서로 다른 안경 다리(120)에 분산되어 장착될 수 있다. 전원부(140)에는 수은 전지 등의 통상의 소형 배터리, 또는 안경 다리(120)에 내장할 수 있도록 맞춤형으로 설계된 전용 배터리가 사용될 수 있다.In this embodiment, the discolored transparent lens 110, the glasses leg 120 and the voice input unit 130 is formed of a pair (110a, 110b) (120a, 120b) (130a, 130b), which are merged into one or three It may be formed separately. In addition, the power supply unit 140 and the guide broadcast visualization unit 150 may also be formed outside the glasses leg 120. External materials such as the color change transparent lens 110, the glasses leg 120, the voice input unit 130, and the like may be used as materials used in ordinary glasses or lighter than the power unit 140 so that there is no inconvenience in wearing them. The announcement visualization unit 150 may be distributed and mounted on different glasses legs 120 to balance the weight of the entire structure of the glasses. The power supply unit 140 may be a conventional small battery such as a mercury cell, or a dedicated battery designed to be built in the glasses leg 120.

음성 입력부(130)는 외부로부터 음성을 입력 받는 역할을 하는 것으로, 감지된 음성 파동을 전기적 신호로 변환하는 역할을 한다. 음성 입력부(130)는 안경 본체에 장착된 소형 마이크(microphone) 또는 음성 감지 센서 등으로 구현되거나, 안경 본체와 분리되어 안내방송 시각화부(150)와 유무선 통신으로 음성 신호를 전달하는 별도의 모듈로 구현될 수 있다.The voice input unit 130 serves to receive voice from the outside and converts the detected voice wave into an electrical signal. The voice input unit 130 may be implemented as a small microphone or a voice detection sensor mounted on the glasses body, or may be separated from the glasses body and may be a separate module that transmits a voice signal through wired / wireless communication with the announcement broadcast visualization unit 150. Can be implemented.

안내방송 시각화부(150)는 마이크로 프로세서(micro processor) 등의 하드웨어로 구현될 수 있으며, 음성 전처리부(152), 음성패턴 저장부(154), 음성 인식부(156), 문자 후처리부(158)를 포함할 수 있다. 안내방송 시각화부(150) 내부의 구성은 뒤에서 자세히 설명된다.The announcement broadcast visualization unit 150 may be implemented in hardware such as a microprocessor, and includes a voice preprocessor 152, a voice pattern storage unit 154, a voice recognition unit 156, and a text postprocessor 158. ) May be included. The configuration of the guide broadcasting visualization unit 150 will be described in detail later.

변색 투명 렌즈(110)는 주변의 밝기에 따라 바탕색이 조절되는 투과성 소재로 형성된 투명한 렌즈이다. 실시예에 따라 변색 투명 렌즈(110)는 감광(photochromic) 또는 전기변색(electrochromic) 물질을 포함하여 형성될 수 있다.The color change transparent lens 110 is a transparent lens formed of a transparent material whose background color is adjusted according to the brightness of the surroundings. In some embodiments, the color-transparent transparent lens 110 may include a photochromic or electrochromic material.

감광 물질을 포함하여 형성된 변색 투명 렌즈(110)의 실시예 중 대표적인 것으로는, 감광 렌즈(photochromic lens) 또는 코닝 렌즈(Corning lens)라고도 불리우는 조광 렌즈가 있다. 조광 렌즈는 유리나 플라스틱 표면에 화학기상증착(Chemical Vapor Deposition, CVD) 또는 스퍼터링(Sputtering) 기술을 사용하여, 감광 물질인 염화 은(AgCl), 브롬화 은(AgBr), 요오드화 은(AgI) 등 할로겐화 은(Ag) 계열의 산화 박막을 형성함으로써 제조된다. 조광 렌즈는 실내 등 주변의 밝기가 어두운 곳에서는 무색에 가까운 엷은 색을 나타내나, 실외 등 주변의 밝기가 밝은 곳에서는 짙은 농도로 색이 바뀌는 특징이 있다. 광선의 조사량에 따라 조광 렌즈의 색이 변하는 것은, 렌즈 재질에 미세한 결정으로 분산된 할로겐화 은이 자외선의 양에 따라 서로 가역 반응을 하기 때문이다. 할로겐화 은 계열의 화합물이 자외선을 받으면 은(Ag)과 할로겐 원소가 각각의 미립자로 유리되는 착색반응이 일어나고, 자외선이 차단되고 적외선이나 가시광선을 받으면 유리되어 있던 은(Ag)과 할로겐 원소가 이온화되어 할로겐화 은(Ag)으로 다시 결합하는 탈색반응이 일어나는 것이다.A representative example of the color-transparent transparent lens 110 formed by including a photosensitive material is a dimming lens, also called a photochromic lens or a Corning lens. Dimming lenses use chemical vapor deposition (CVD) or sputtering techniques on glass or plastic surfaces, and are used silver halides such as silver chloride (AgCl), silver bromide (AgBr), and silver iodide (AgI). It is manufactured by forming an oxide thin film of the (Ag) series. The dimming lens has a light color that is almost colorless in a dark place such as an indoor environment, but the color of the dimming lens is dark in a bright place such as an outdoor area. The color of the dimming lens changes depending on the irradiation amount of light because the silver halides dispersed as fine crystals in the lens material react with each other depending on the amount of ultraviolet rays. When a silver halide-based compound receives ultraviolet rays, a coloring reaction occurs in which silver (Ag) and a halogen element are released into the respective fine particles, and when the ultraviolet ray is blocked and receives infrared or visible light, the free silver (Ag) and halogen element are ionized. This results in a decolorization reaction that recombines with silver halide (Ag).

또 다른 실시예로, 전기변색(electrochromic) 물질을 사용한 렌즈가 있는데, 이는 자외선 검출 시 유리나 플라스틱에 전기신호를 보내어 전기신호를 보낸 기판의 색이 외부의 빛에서도 시안성을 높일 수 있는 검은색 또는 갈색 등으로 바뀌는 현상을 이용한 것이다. 이러한 경우 안경에 자외선 감지 센서 등을 부착할 수 있다. 본 실시예에서는 산화 인듐 주석(Indium Tin Oxide, ITO) 계열의 유리판을 이용하여 화면부를 만들고 전기변색 소자 물질을 활용 하여 변색되도록 활용 할 수 있다. 예를 들면, 아래 화학식1과 같이 산화 텅스텐을 사용하고 기판에 일정 전압을 주어 전기적으로 증착시키는 방법이 사용될 수 있다.In another embodiment, there is a lens using an electrochromic material, which transmits an electric signal to glass or plastic when ultraviolet rays are detected, so that the color of the substrate to which the electric signal is transmitted may increase cyanity even in external light. It's used to turn brown. In this case, an ultraviolet sensor may be attached to the glasses. In the present embodiment, the screen portion may be made by using an indium tin oxide (ITO) -based glass plate, and may be used to discolor using an electrochromic device material. For example, a method of using the tungsten oxide and giving a predetermined voltage to the substrate as shown in Formula 1 below, may be used to deposit.

W + H₂O₂→ WOx + H₂O + H₂O₂W + H₂O₂ → WOx + H₂O + H₂O₂

문자 표시부(160)는 변색 투명 렌즈의 내측 표면에 상기 후처리된 문자를 출력하는 투명한 디스플레이 소자이다. 도 1을 참조하면, 본 실시예에서 문자 표시부(160)는 한쪽 변색 투명 렌즈(110b)의 내측 하단 표면에만 형성되는 것으로 도시되어 있으나, 실시예에 따라 문자 표시부(160)는 양쪽 변색 투명 렌즈(110)에 모두 형성될 수도 있고 형성되는 위치 및 면적도 다양하게 설정될 수 있다. 실시예에 따라 문자 표시부(160)는 투명 디스플레이 패널로 구현될 수 있는데, 투명 디스플레이 패널 형태의 문자 표시부(160)의 세부 구성은 뒤에서 자세히 설명된다.The character display unit 160 is a transparent display device for outputting the post-processed character on the inner surface of the color change transparent lens. Referring to FIG. 1, in the present exemplary embodiment, the character display unit 160 is formed only on the inner bottom surface of the one color change transparent lens 110b. However, according to the embodiment, the character display unit 160 may include both color change transparent lenses ( All may be formed in the 110, and the location and area to be formed may be variously set. According to an exemplary embodiment, the character display unit 160 may be implemented as a transparent display panel. A detailed configuration of the character display unit 160 in the form of a transparent display panel will be described in detail later.

도 2는 안내방송 시각화부의 일 실시예의 개략적인 구성을 도시한 블록도이다.2 is a block diagram illustrating a schematic configuration of an embodiment of a guide broadcast visualization unit.

음성 전처리부(152)는 음성 입력부(130)에서 입력 받은 음성 신호에 대하여 잡음제거 및 신호보상을 수행하며, 인식에 필요한 특징 벡터 추출을 수행할 수 있다. 음성 전처리부(152)는 아날로그-디지털 변환기(Analog-Digital Converter) 및 디지털 신호처리기(digital signal processor) 등의 하드웨어를 포함할 수 있다. 음성 전처리부(152)에서 수행되는 전처리(preprocessing)는 음성 인식률을 높이기 위한 것으로, 프리-엠퍼시스(pre-emphasis), 윈도윙(windowing), 고속 푸리에 변환(Fast Fourier Transform, FFT), 에너지 분석 등을 통하여 수행되는 음성의 특징 벡터 내지 끝점 검출을 포함할 수 있다. 또한, 각종 필터링(filtering) 및 음성 신호처리(audio signal processing) 알고리즘을 적용하여 다양한 형태의 잡음제거 및 신호 보상(compensation)을 수행함으로써, 음성 인식부(156)가 순수하게 음성학적 특성에만 집중하여 음성인식을 수행하도록 지원할 수 있다. 음성 전처리부(154)가 잡음제거 및 신호보상을 통하여 입력 받은 음성 신호로부터 그 음성학적 특성만을 추출하는 기법으로는 LPC(Linear Predictive Coding), MFCC(Mel Frequency Cepstral Coefficients), 고역강조 추출법, 창 함수 추출법 등이 사용될 수 있다.The speech preprocessor 152 may perform noise reduction and signal compensation on the speech signal received from the speech input unit 130, and perform feature vector extraction required for recognition. The voice preprocessor 152 may include hardware such as an analog-to-digital converter and a digital signal processor. The preprocessing performed by the speech preprocessor 152 is to increase the speech recognition rate, and includes pre-emphasis, windowing, fast Fourier transform (FFT), and energy analysis. It may include the feature vector to the end point detection of the speech performed through. In addition, by applying various filtering and audio signal processing algorithms to perform various types of noise cancellation and signal compensation, the speech recognizer 156 concentrates purely on phonetic characteristics. It can support to perform voice recognition. The speech preprocessing unit 154 extracts only the phonetic characteristics from the speech signal received through noise reduction and signal compensation, LPC (Linear Predictive Coding), MFCC (Mel Frequency Cepstral Coefficients), high frequency emphasis extraction method, window function. Extraction methods and the like can be used.

음성패턴 저장부(154)는 기 설정된 음성패턴에 관한 정보를 저장한다. 실시예에 따라 저장되는 음성패턴으로는 공공장소, 사파리(safari), 미술관, 박물관, 여행지 등에서 방송되는 안내방송의 음원(sound source) 또는 그것을 녹음한 음성으로부터 추출한 실제 음성패턴이 사용될 수 있다. 여기서 안내방송이라 함은 사람의 목소리뿐만 아니라 경보음 등 다양한 형태로 정보 또는 경고 메시지를 전달하는 모든 형태의 소리를 포함할 수 있다. 특정 대화자의 음성을 인식하는 화자종속(speaker-dependent) 음성인식 기술의 인식률은, 대화자가 누구인지에 관계 없이 입력된 음성을 인식하는 화자독립(speaker-independent) 음성인식 기술의 인식률보다 일반적으로 높다. 이러한 점을 감안할 때, 지하철, 기차, 비행기, 관공서 등의 공공장소에서 사용되는 안내방송의 실제 음원 자체를 음성패턴으로 저장할 경우, 전체 시스템의 음성인식률을 화자종속 음성인식 기술의 인식률 수준으로 높일 수 있다는 장점이 있다.The voice pattern storage unit 154 stores information about a preset voice pattern. As the voice pattern stored according to the embodiment, the actual voice pattern extracted from a sound source of a guide broadcast broadcast in public places, safaris, art galleries, museums, tourist attractions, or the like and recorded voices may be used. Herein, the announcement may include all types of sounds for delivering information or warning messages in various forms such as alarm sounds as well as human voices. The recognition rate of speaker-dependent speech recognition technology that recognizes the voice of a particular speaker is generally higher than that of the speaker-independent speech recognition technology that recognizes the input voice regardless of who the dialogue is. . Considering this, when the actual sound source of the announcement used in public places such as subways, trains, airplanes, and public offices is stored as a voice pattern, the voice recognition rate of the entire system can be increased to the recognition rate of the speaker-dependent voice recognition technology. There is an advantage.

음성 인식부(156)는 저장된 음성패턴을 이용하여 전처리된 음성을 인식한다. 음성 인식 알고리즘으로는 화자종속 음성인식 기술에 기반한 템플릿 패턴 매칭(template pattern matching) 등 다양한 기법이 사용될 수 있다. 이러한 경우 음성 인식부(156)는 음성패턴 저장부(154)에 저장된 템플릿 음성패턴과 전처리된 음성에서 추출된 특징 벡터 내지 끝점의 패턴을 비교하여, 음성패턴 저장부(154)에 저장된 음성패턴 중 가장 정확도가 높은 음성패턴을 인식결과로 선택하게 된다. 템플릿 패턴 매칭 알고리즘으로는 DTW(Dynamic Time Warping), HMM(Hidden Markov chain), ANN(Artificial Nural Network) 등이 사용될 수 있다. 실시예에 따라 음성 인식부(156)는, 전처리된 음성의 패턴과 저장된 음성패턴 중 가장 유사도가 높은 음성패턴 간의 제1유사도와, 전처리된 음성의 패턴과 저장된 음성패턴 중 두 번째로 유사도가 높은 음성패턴 간의 제2유사도가, 기 설정된 일정 수준 이상의 차이를 가지는 경우에만 음성이 인식된 것으로 엄격하게 처리하도록 구현될 수도 있다.The speech recognizer 156 recognizes the preprocessed speech using the stored speech pattern. As a speech recognition algorithm, various techniques such as template pattern matching based on speaker-dependent speech recognition technology may be used. In this case, the speech recognition unit 156 compares the template speech pattern stored in the speech pattern storage unit 154 with the pattern of the feature vector or the end point extracted from the preprocessed speech, and among the speech patterns stored in the speech pattern storage unit 154. The most accurate speech pattern is selected as the recognition result. As a template pattern matching algorithm, DTW (Dynamic Time Warping), HMM (Hidden Markov chain), ANN (Artificial Nural Network) may be used. According to an exemplary embodiment, the speech recognizer 156 may include a first similarity between the pattern of the preprocessed voice and the voice pattern having the highest similarity among the stored voice patterns, and the second highest similarity between the preprocessed voice pattern and the stored voice pattern. The second similarity between the voice patterns may be implemented to be strictly processed as if the voice is recognized only when there is a difference of a predetermined level or more.

문자 후처리부(158)는 인식된 음성에 해당하는 문자의 출력 레이아웃(layout)을 조정한다. 문자의 출력 레이아웃에는 한 줄에 표시되는 문자의 수 및 표시 위치, 표시되는 문자의 글꼴, 크기 및 색상 등이 포함될 수 있다. 문자의 출력 레이아웃에 관한 설정을 조정함으로써 사용자가 음성인식 결과가 변환된 문자를 더 효과적으로 볼 수 있게 된다. 실시예에 따라 문자 후처리부(158)는 주변 밝기의 변화에 따라 반응하는 변색 투명 렌즈(110)의 색상 변화와 연동되도록 구성할 수 있다. 이러한 경우, 예컨대 변색 투명 렌즈(110)가 어두운 색상으로 착색되었을 때에는 문자의 색상을 밝게 하고, 투명하게 탈색되었을 때에는 문자의 색상을 어둡게 함으로써, 주변 환경의 변화에 민감하지 않고 안정적인 문자 가독성을 확보할 수 있게 된다. 또 다른 실시예에서는, 변색 투명 렌즈(110)의 양쪽 모두에 문자 표시부(160)를 구비하고, 음성 입력부(130)에서 감지된 음성 중 한쪽 음성 입력부(130)에서 감지된 신호의 세기가 다른 쪽의 신호의 세기보다 강한 경우, 신호가 강하게 감지되는 방향의 변색 투명 렌즈(110)에 해당 음성이 인식된 결과에 대응하는 문자를 표시하도록 할 수 있다. 이러한 경우 음성인식의 결과뿐만 아니라 음성이 들려오는 방향에 관한 정보도 함께 전달할 수 있다는 장점이 있다.The text post-processing unit 158 adjusts the output layout of the text corresponding to the recognized voice. The output layout of the characters may include the number and position of characters displayed on a line, the font, size and color of the displayed characters. By adjusting the settings regarding the output layout of the text, the user can more effectively see the text in which the voice recognition result is converted. According to an exemplary embodiment, the character post-processing unit 158 may be configured to interlock with a color change of the color changing transparent lens 110 that reacts to a change in ambient brightness. In this case, for example, when the discolored transparent lens 110 is colored in a dark color, the color of the text is brightened, and when the transparent color is bleached transparent, the color of the text is darkened, thereby ensuring stable character readability without being sensitive to changes in the surrounding environment. It becomes possible. In another embodiment, the character display unit 160 is provided at both sides of the color-transparent transparent lens 110, and the intensity of the signal detected by the voice input unit 130 is different from the voice detected by the voice input unit 130. If the signal is greater than the strength of the signal, the color corresponding to the strong color of the transparent lens 110 in the direction in which the signal is strongly detected may display a character corresponding to the result of the recognition of the voice. In this case, there is an advantage in that not only the result of speech recognition but also information on the direction in which voice is heard can be delivered.

도 3은 다양한 환경에서 본 발명의 안내방송 시각화 장치가 표시하는 화면을 도시한 것이다.3 illustrates a screen displayed by the announcement broadcasting visualization apparatus of the present invention in various environments.

도 3a는 낮에 기차역의 승강장에서 사용된 경우의 화면이다. 주변 밝기가 밝은 낮이기 때문에 변색 투명 렌즈(110)가 착색되며, 사용자의 오른쪽에서 음성이 더 강하게 감지되기 때문에 오른쪽 변색 투명 렌즈(110a)의 문자 표시부(160)에는 인식된 음성에 대응하는 문자“기차가 들어옵니다”가 표시된다.3A is a screen when used in a platform of a train station during the day. Since the ambient brightness is a bright day, the discolored transparent lens 110 is colored, and since the voice is more strongly detected at the right side of the user, the character display unit 160 of the right discolored transparent lens 110a displays a letter corresponding to the recognized voice. A train comes in ”is displayed.

도 3b는 밤에 주차장에서 사용된 경우의 화면이다. 주변 밝기가 어두운 밤이기 때문에 변색 투명 렌즈(110)가 탈색되며, 사용자의 왼쪽에서 음성이 더 강하게 감지되기 때문에 왼쪽 변색 투명 렌즈(110b)의 문자 표시부(160)에는 인식된 음성에 대응하는 문자“주차권을 뽑아주세요”가 표시된다.3B is a screen when used in a parking lot at night. Since the ambient brightness is dark at night, the discolored transparent lens 110 is discolored, and since the voice is more strongly detected at the left side of the user, the character display unit 160 of the left discolored transparent lens 110b has a letter corresponding to the recognized voice. Please pull parking ticket ”is displayed.

도 3c는 낮에 경보음이 울리는 장소에서 사용된 경우의 화면이다. 주변 밝기가 밝은 낮이기 때문에 변색 투명 렌즈(110)가 착색되며, 사용자의 왼쪽에서 음성이 더 강하게 감지되기 때문에 왼쪽 변색 투명 렌즈(110b)의 문자 표시부(160)에는 인식된 경보음에 대응하는 문자“[경보음] 삐- 삐-”가 표시된다. 실시예에 따라 인간의 음성이 아닌 경보음에 대해서는 별도의 표시를 하도록 구현할 수 있다.3C is a screen when used in a place where an alarm sounds during the day. Since the ambient brightness is a bright day, the discolored transparent lens 110 is colored, and since the voice is more strongly detected at the left side of the user, the character display unit 160 of the left discolored transparent lens 110b has a character corresponding to the recognized alarm sound. “[Alarm tone] beep- beep-” is displayed. According to an embodiment, an alarm sound that is not a human voice may be separately displayed.

도4는 문자 표시부에 사용되는 투명 디스플레이 패널의 일 실시예의 구성을 도시한 것이다. 상술한 바와 같이, 실시예에 따라 문자 표시부(160)는 투명 디스플레이 패널(Display Panel)로 구현될 수 있다. 구체적으로 투명 디스플레이 패널은, 도 4에 도시된 구조와 같이, 이산화 규소(SiO2)의 비율이 높은 투명 유전체 층(transparent dielectric layer)(414, 422)으로 형성된 상판(front plate)(410) 및 하판(rear plate)(420)과, 얇은 유리로 형성된 격벽(barrier rib)(미도시)과, 나노미터(nanometer, nm) 단위의 크기를 갖는 투명한 나노 형광체(phosphor)(424)와, 산화 인듐 주석(Indium Tin Oxide, ITO)으로 형성된 버스 전극(bus electrode)(414)을 포함하는 투명 광자발광 디스플레이 패널(Photoluminescence Display Panel)이 될 수 있다.4 shows the configuration of an embodiment of a transparent display panel used in the character display unit. As described above, the character display unit 160 may be implemented as a transparent display panel. Specifically, the transparent display panel includes a front plate 410 and a lower plate formed of transparent dielectric layers 414 and 422 having a high ratio of silicon dioxide (SiO 2), as shown in FIG. 4. (rear plate) 420, barrier ribs (not shown) formed of thin glass, transparent nanophosphors 424 having a size in nanometers (nm), and indium tin oxide It may be a transparent photoluminescence display panel including a bus electrode 414 formed of Indium Tin Oxide (ITO).

도 5는 본 발명의 안내방송 시각화 방법의 일 실시예를 도시한 흐름도이다.5 is a flowchart illustrating an embodiment of a guide broadcasting visualization method of the present invention.

본 발명의 일 실시예의 안내방송 시각화 방법은, 외부로부터 음성을 입력 받는 음성입력 단계(S100)와, 상기 입력된 음성에 대하여 잡음제거 및 신호보상을 수행하는 음성전처리 단계(S200)와, 기 설정된 음성패턴에 관한 정보를 이용하여 상기 전처리된 음성을 인식하는 음성인식 단계(S300)와, 상기 인식된 음성에 해당하는 문자의 출력 레이아웃을 조정하는 문자후처리 단계(S400)와, 주변의 밝기에 따라 상기 문자가 출력될 변색 투명 렌즈의 바탕색을 조절하는 밝기조절 단계(S500)와, 상기 후처리된 문자를 상기 밝기조절된 변색 투명 렌즈의 내측 표면에 출력하 는 문자표시 단계(S600)를 포함한다.The guide broadcasting visualization method according to an embodiment of the present invention includes a voice input step (S100) for receiving a voice from the outside, a voice preprocessing step (S200) for performing noise reduction and signal compensation on the input voice, and a preset Speech recognition step (S300) for recognizing the pre-processed voice using information on the speech pattern, post-text processing step (S400) for adjusting the output layout of the text corresponding to the recognized voice, and the brightness of the surroundings And a brightness adjustment step (S500) of adjusting a background color of the color fading transparent lens to which the text is output, and a character display step (S600) of outputting the post-processed text to the inner surface of the color fading transparent lens with brightness adjustment. do.

실시예에 따라, 음성패턴으로 공공장소의 안내방송의 음원으로부터 추출한 음성패턴이 사용되고, 음성 인식 단계(S300)에는 화자종속 음성인식 기법이 사용될 수 있다. 다른 실시예에 따르면, 문자 후처리 단계(S400)는, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하고, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하도록 하는 과정을 포함할 수 있다.According to an embodiment, a voice pattern extracted from a sound source of a guide broadcast in a public place is used as a voice pattern, and a speaker dependent voice recognition technique may be used in the voice recognition step S300. According to another embodiment, the text post-processing step (S400) outputs the text in a light color when the color fading transparent lens is colored in a dark color, and brightens the text when the color fading transparent lens is colored in a dark color. It may include a process of outputting in color.

상술한 본 발명의 실시예의 안내방송 시각화 장치 및 방법은, 음성인식 대상을 안내방송에 특화하여 음성인식률을 높이고 변색렌즈를 이용하여 인식결과인 문자의 가독성을 높인 것으로서, 청각 장애인을 위한 용도에 한정되지 않는다. 본 발명의 실시예의 안내방송 시각화 장치 및 방법은 음성언어를 인식하여 변색렌즈 상에 문자언어로 표시함으로써, 청각 장애인은 물론 일반인들에게도 음성과 문자 모두에 의한 효율적인 의사전달을 구현하기 위한 기술로 넓게 해석되어야 할 것이다.In the above-described guide broadcasting visualization apparatus and method of the present invention, the voice recognition target is specialized for guide broadcasting to increase the voice recognition rate and increase the readability of the recognition result using the color change lens, limited to the use for the hearing impaired It doesn't work. The guidance broadcasting visualization apparatus and method of the embodiment of the present invention is widely recognized as a technology for realizing efficient communication by voice and text to both the hearing impaired and the general public by recognizing the voice language and displaying it on the color lens on the color changing lens. It should be interpreted.

본 실시형태의 모듈, 기능 블록들 또는 수단들은 전자 회로, 집적 회로, ASIC (Application Specific Integrated Circuit) 등 공지된 다양한 소자들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수 있다.Modules, functional blocks or means of the present embodiment may be implemented in a variety of known elements, such as electronic circuits, integrated circuits, ASICs (Application Specific Integrated Circuit), each may be implemented separately, or two or more may be integrated into one Can be.

이상과 같이 본 발명의 이해를 위하여 그 실시예를 기술하였으나, 당업자라면 알 수 있듯이, 본 발명은 본 명세서에서 기술된 특정 실시예에 한정되는 것이 아니라, 본 발명의 범주를 벗어나지 않는 범위 내에서 다양하게 변형, 변경 및 대체될 수 있다. 예를 들어, 문자 대신 기타 LCD 등 디스플레이에 의해 표시될 수 있 는 그림, 영상 등에도 본 발명의 기술이 적용될 수 있다. 따라서, 본 발명의 진정한 사상 및 범주에 속하는 모든 변형 및 변경을 특허청구범위에 의하여 모두 포괄하고자 한다.Although the embodiments have been described for the understanding of the present invention as described above, it will be understood by those skilled in the art, the present invention is not limited to the specific embodiments described herein, but variously without departing from the scope of the present invention. May be modified, changed and replaced. For example, the technique of the present invention may be applied to a picture, an image, etc., which may be displayed by a display such as an LCD instead of a character. Therefore, it is intended that the present invention cover all modifications and variations that fall within the true spirit and scope of the present invention.

도 1은 본 발명의 안내방송 시각화 장치의 일 실시예의 구성을 도시한 것이다.1 is a block diagram of an embodiment of a guide broadcasting visualization apparatus according to the present invention.

도 2는 안내방송 시각화부의 일 실시예의 개략적인 구성을 도시한 블록도이다.2 is a block diagram illustrating a schematic configuration of an embodiment of a guide broadcast visualization unit.

도 3은 다양한 환경에서 본 발명의 안내방송 시각화 장치가 표시하는 화면을 도시한 것이다.3 illustrates a screen displayed by the announcement broadcasting visualization apparatus of the present invention in various environments.

도4는 문자 표시부에 사용되는 투명 디스플레이 패널의 일 실시예의 구성을 도시한 것이다.4 shows the configuration of an embodiment of a transparent display panel used in the character display unit.

도 5는 본 발명의 안내방송 시각화 방법의 일 실시예를 도시한 흐름도이다.5 is a flowchart illustrating an embodiment of a guide broadcasting visualization method of the present invention.

Claims (9)

외부로부터 음성을 입력 받는 음성 입력부와,A voice input unit for receiving a voice from the outside; 상기 입력된 음성에 대하여 잡음제거 및 신호보상을 수행하는 음성 전처리부와,A speech preprocessor for performing noise reduction and signal compensation on the input speech; 기 설정된 음성패턴에 관한 정보를 저장하는 음성패턴 저장부와,A voice pattern storage unit for storing information about a preset voice pattern; 상기 음성패턴을 이용하여 상기 전처리된 음성을 인식하는 음성 인식부와,A speech recognition unit for recognizing the preprocessed speech using the speech pattern; 상기 인식된 음성에 해당하는 문자의 출력 레이아웃을 조정하는 문자 후처리부와,A text post-processing unit for adjusting an output layout of a text corresponding to the recognized voice; 주변의 밝기에 따라 바탕색이 조절되는 변색 투명 렌즈, 및Discolored transparent lens whose background color is adjusted according to the surrounding brightness, and 상기 변색 투명 렌즈의 내측 표면에 상기 후처리된 문자를 출력하는 문자 표시부Character display unit for outputting the post-processed character on the inner surface of the color fading transparent lens 를 포함하는 변색 렌즈를 이용한 안경형 안내방송 시각화 장치.Glasses type announcement visualization device using a color changing lens including a. 제 1항에 있어서,The method of claim 1, 상기 음성패턴은 안내방송의 실제 음원(sound source)으로부터 추출한 음성패턴이며,The voice pattern is a voice pattern extracted from an actual sound source of the announcement, 상기 음성 인식에는 화자종속 음성인식 기법이 사용되는Speaker-dependent speech recognition technique is used for the speech recognition 변색 렌즈를 이용한 안경형 안내방송 시각화 장치.Eyeglass visual broadcasting system using a color changing lens. 제 1항에 있어서,The method of claim 1, 상기 변색 투명 렌즈는 감광(photochromic) 또는 전기변색(electrochromic) 물질을 포함하여 형성되며,The discolored transparent lens is formed by including a photochromic or electrochromic material, 상기 문자 표시부는 투명 디스플레이 패널을 포함하여 형성되는The character display unit is formed to include a transparent display panel 변색 렌즈를 이용한 안경형 안내방송 시각화 장치.Eyeglass visual broadcasting system using a color changing lens. 제 3항에 있어서,The method of claim 3, wherein 상기 투명 디스플레이 패널은, 투명 유전체로 형성된 상판 및 하판과, 유리로 형성된 격벽과, 투명한 나노 형광체와, 산화 인듐 주석(Indium Tin Oxide, ITO)으로 형성된 전극을 포함하는 투명 광자 발광 디스플레이 패널인The transparent display panel is a transparent photonic light emitting display panel including an upper plate and a lower plate formed of a transparent dielectric, a partition formed of glass, a transparent nano phosphor, and an electrode formed of indium tin oxide (ITO). 변색 렌즈를 이용한 안경형 안내방송 시각화 장치.Eyeglass visual broadcasting system using a color changing lens. 제 3항에 있어서,The method of claim 3, wherein 상기 문자 후처리부는, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하고, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하는The character post-processing unit outputs the character in a bright color when the color fading transparent lens is colored in a dark color, and outputs the character in a light color when the color fading transparent lens is colored in a dark color. 변색 렌즈를 이용한 안경형 안내방송 시각화 장치.Eyeglass visual broadcasting system using a color changing lens. 제 1항에 있어서,The method of claim 1, 상기 음성 입력부는 복수 개로서 상기 안내방송 시각화 장치의 좌측과 우측에 배치되며,The voice input unit is disposed on the left and right sides of the announcement broadcast apparatus as a plurality, 상기 문자 후처리부는 상기 음성 입력부 중 상기 입력된 음성이 가장 강하게 감지되는 방향에 대응하는 상기 변색 투명 렌즈의 내측 표면에 상기 문자를 출력하는The text post-processing unit outputs the text to an inner surface of the color fading transparent lens corresponding to a direction in which the input voice is most strongly detected among the voice input units. 변색 렌즈를 이용한 안경형 안내방송 시각화 장치.Eyeglass visual broadcasting system using a color changing lens. 외부로부터 음성을 입력 받는 음성입력 단계와,A voice input step of receiving a voice from the outside, 상기 입력된 음성에 대하여 잡음제거 및 신호보상을 수행하는 음성전처리 단계와,A voice preprocessing step of performing noise reduction and signal compensation on the input voice; 기 설정된 음성패턴에 관한 정보를 이용하여 상기 전처리된 음성을 인식하는 음성인식 단계와,A voice recognition step of recognizing the preprocessed voice using information on a preset voice pattern; 상기 인식된 음성에 해당하는 문자의 출력 레이아웃을 조정하는 문자후처리 단계와,A text post-processing step of adjusting an output layout of a text corresponding to the recognized voice; 주변의 밝기에 따라 상기 문자가 출력될 변색 투명 렌즈의 바탕색을 조절하는 밝기조절 단계와,A brightness adjustment step of adjusting a background color of the color-transparent transparent lens in which the text is output according to ambient brightness; 상기 후처리된 문자를 상기 밝기조절된 변색 투명 렌즈의 내측 표면에 출력 하는 문자표시 단계Character display step of outputting the post-processed character to the inner surface of the color fading transparent lens of the brightness control 를 포함하는 안내방송 시각화 방법.Announcement visualization method comprising a. 제 7항에 있어서,The method of claim 7, wherein 상기 음성패턴은 안내방송의 실제 음원(sound source)으로부터 추출한 음성패턴이며,The voice pattern is a voice pattern extracted from an actual sound source of the announcement, 상기 음성 인식 단계에는 화자종속 음성인식 기법이 사용되는In the speech recognition step, a speaker-dependent speech recognition technique is used. 안내방송 시각화 방법.How to visualize announcements. 제 7항에 있어서,The method of claim 7, wherein 상기 문자 후처리 단계는, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하고, 상기 변색 투명 렌즈가 어두운 색으로 착색될 경우 상기 문자를 밝은 색상으로 출력하는The post-processing of the text may include outputting the text in a light color when the color fading transparent lens is colored in a dark color, and outputting the text in light color when the color fading transparent lens is colored in a dark color. 안내방송 시각화 방법.How to visualize announcements.
KR1020090072914A 2009-08-07 2009-08-07 Eyeglass-guided visualization device using color change lens KR101062342B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090072914A KR101062342B1 (en) 2009-08-07 2009-08-07 Eyeglass-guided visualization device using color change lens

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090072914A KR101062342B1 (en) 2009-08-07 2009-08-07 Eyeglass-guided visualization device using color change lens

Publications (2)

Publication Number Publication Date
KR20110015276A true KR20110015276A (en) 2011-02-15
KR101062342B1 KR101062342B1 (en) 2011-09-05

Family

ID=43774128

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090072914A KR101062342B1 (en) 2009-08-07 2009-08-07 Eyeglass-guided visualization device using color change lens

Country Status (1)

Country Link
KR (1) KR101062342B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101455830B1 (en) * 2013-01-10 2014-11-04 숭실대학교산학협력단 Glasses and control method thereof
KR20160012369A (en) * 2014-07-24 2016-02-03 주식회사 네오펙트 Led glasses
US9429771B2 (en) 2013-07-18 2016-08-30 Samsung Display Co., Ltd. Eyeglasses including transparent display and controlling method thereof
JP2022188280A (en) * 2018-04-13 2022-12-20 リム,ソン-キュ Self-customized spectacle

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10123450A (en) * 1996-10-15 1998-05-15 Sony Corp Head up display device with sound recognizing function
JP4445283B2 (en) * 2004-02-16 2010-04-07 株式会社リコー Display system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101455830B1 (en) * 2013-01-10 2014-11-04 숭실대학교산학협력단 Glasses and control method thereof
US9429771B2 (en) 2013-07-18 2016-08-30 Samsung Display Co., Ltd. Eyeglasses including transparent display and controlling method thereof
KR20160012369A (en) * 2014-07-24 2016-02-03 주식회사 네오펙트 Led glasses
KR101869309B1 (en) * 2014-07-24 2018-06-20 주식회사 네오펙트 Led glasses for performance
JP2022188280A (en) * 2018-04-13 2022-12-20 リム,ソン-キュ Self-customized spectacle

Also Published As

Publication number Publication date
KR101062342B1 (en) 2011-09-05

Similar Documents

Publication Publication Date Title
US10073201B2 (en) See through near-eye display
US9779758B2 (en) Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors
CN105527710B (en) A kind of intelligence head-up-display system
Wölfel et al. Distant speech recognition
US6240392B1 (en) Communication device and method for deaf and mute persons
US8183997B1 (en) Displaying sound indications on a wearable computing system
Garnier et al. Hyper-articulation in Lombard speech: An active communicative strategy to enhance visible speech cues?
US20130094682A1 (en) Augmented reality sound notification system
EP1083769A1 (en) Speech converting device and method
US12007568B2 (en) Eyewear with integrated heads-up display
KR101062342B1 (en) Eyeglass-guided visualization device using color change lens
US9798145B2 (en) Method and apparatus for see-through near eye display
US20140236594A1 (en) Assistive device for converting an audio signal into a visual representation
JP2007334149A (en) Head mount display apparatus for hearing-impaired persons
JP2016515897A5 (en)
US20200126276A1 (en) Augmented Reality Display for a Vehicle
US20230260534A1 (en) Smart glass interface for impaired users or users with disabilities
US4414431A (en) Method and apparatus for displaying speech information
JP2023519495A (en) Hearing assistive device with smart audio focus control
KR20150026645A (en) Voice Recognition Application Program By Pattern Recognition Technology
CN1996092A (en) Focus-adjustable headset type display system with virtual keyboard and device therefor
Hennig Natural user interfaces and accessibility
Roberts et al. Biology
KR101455830B1 (en) Glasses and control method thereof
ES2245203B2 (en) ELECTRICAL OPTICAL ACOUSTIC TRANSDUCER SOUND DISPLAY FOR DEAF PEOPLE.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140724

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee