KR102302137B1 - 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법 - Google Patents

외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법 Download PDF

Info

Publication number
KR102302137B1
KR102302137B1 KR1020190137882A KR20190137882A KR102302137B1 KR 102302137 B1 KR102302137 B1 KR 102302137B1 KR 1020190137882 A KR1020190137882 A KR 1020190137882A KR 20190137882 A KR20190137882 A KR 20190137882A KR 102302137 B1 KR102302137 B1 KR 102302137B1
Authority
KR
South Korea
Prior art keywords
learner
sentence
conversation
speech
foreign language
Prior art date
Application number
KR1020190137882A
Other languages
English (en)
Other versions
KR20210051948A (ko
Inventor
박철순
강명수
강석태
김창은
이춘식
Original Assignee
주식회사 엘지씨엔에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지씨엔에스 filed Critical 주식회사 엘지씨엔에스
Priority to KR1020190137882A priority Critical patent/KR102302137B1/ko
Priority to JP2020179148A priority patent/JP7059492B2/ja
Priority to CN202011153817.4A priority patent/CN112819664A/zh
Publication of KR20210051948A publication Critical patent/KR20210051948A/ko
Application granted granted Critical
Publication of KR102302137B1 publication Critical patent/KR102302137B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/065Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)

Abstract

본 출원은 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법에 관한 것으로서, 본 발명의 일 실시예에 의한 외국어 학습장치는, 상기 학습자로부터 수신된 발화 음성에 대해 음성인식(STT: Speech to Text)을 수행하는 음성 AI(Aritificial Intelligence) 장치로부터 상기 학습자의 발화 음성 정보를 수신하고, 그에 대응하는 상기 가상화자의 발화 음성 정보를 상기 음성 AI 장치를 통해 음성합성(TTS: Text to Speech)하여 송신하는 인터페이스 모듈; 상기 학습자의 발화 음성 정보와 관련된 발화 이력의 로그를 저장하고 분석하는 학습자발화분석 모듈; 상기 학습자의 발화 음성 정보에 대하여 회화수준 산출 알고리즘 통해 적어도 하나 이상의 평가지표 별 점수를 연산하여 회화수준을 평가하는 평가 모듈; 및 학습 대화 흐름을 위한 시나리오 모델을 저장하고, 상기 학습자와 상기 가상화자가 학습 대화시 상기 시나리오 모델에 기초하여 상기 학습자의 발화 문장의 의도와 상기 평가 모듈에서 평가된 상기 학습자의 발화 음성 정보의 회화수준 따라 상기 가상화자의 답변 발화 문장을 결정하여 대화 흐름을 진행하는 학습대화 모듈을 포함할 수 있다.

Description

외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법 {Apparatus for studying foreign language and method for providing foreign language study service by using the same}
본 출원은 가상화자와의 대화를 통하여 외국어 회화학습을 수행할 수 있는 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법에 관한 것이다.
국제화 시대에 발맞추어 영어를 비롯한 다양한 외국어 교육에 대한 수요 및 공급은 지속적으로 늘어나고 있으며, 교육 방식에 대한 연구 및 개발도 더욱 활성화되고 있다. 특히, 조기 유학 인구 및 외국 거주 인구가 늘어나고, 국내에 거주하는 외국인의 수도 증가하면서 언어 능력, 특히 회화 능력의 중요성이 더욱 커지고 있다. 이러한 언어 능력은 종래의 주입식 교육으로는 향상되기 어려우며, 실제로 대화를 할 수 있는 능력을 키우기 위해 효율적인 교육 방식이 요구되어 왔다.
최근에는 컴퓨터 기술의 발달과 함께, 컴퓨터 및 네트워크를 이용한 언어 교육 방법이 다수 개발되었으나, 대화연습과 관련하여서는 컴퓨터를 상대로 혼자서 학습이 어렵기 때문에 효과적인 학습이 어렵다. 또한, 일부 어학업체들이 AI가 적용된 어플리케이션 기반의 회화 학습 서비스를 제공하고 있으나, 이는 어플리케이션에 저장되어 있는 단어, 단문 문장, 또는 단방향의 짧은 대화문을 학습하거나 그에 대한 발음을 모방 학습하는 수준에 그치며, 기술적 구현수준의 한계로 인해 인간과의 대화와 유사한 자유로운 대화를 통한 회화 학습이 불가능했다. 따라서, 아직까지는 자유로운 대화를 통한 회화 수업을 원하는 경우 대부분 오프라인 수업이나 원어민과의 튜터링, 전화/화상 영어 수업 등에 의존하고 있는 실정이다. 그러나 그러한 형태의 회화 수업은, 해당 시간동안에만 학습을 하게 되므로 충분한 대화 연습이 불가능하고, 충분한 대화 연습을 하기 위해서는 가격이 높아 경제적으로 부담이 되는 한계가 있다. 또한, 강사의 자질문제와 이직문제가 빈번하게 발생하여 지속적인 학습 품질 관리가 어렵다는 문제가 있었다.
본 출원은, 가상화자와의 자유로운 대화를 통하여 외국어 회화학습을 수행할 수 있는 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법을 제공하고자 한다.
본 출원은, 학습자의 발화문장의 의도 및 회화수준에 따라 해당 대화유형 또는 대화기능에 따라 복수의 대화흐름이 분기되어 자연스러운 대화를 수행할 수 있는 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법을 제공하고자 한다.
본 출원은, 학습자의 회화 수준에 대한 수치적인 분석을 제공하여, 학습자의 회화수준을 정확하게 진단하고, 그 회화수준에 따라 적절한 대화흐름을 생성하거나 부족한 표현의 복습 또는 추가학습을 가능하도록 할 수 있는 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법을 제공하고자 한다.
본 발명의 일 실시예에 의한 외국어 학습장치는, 학습자에게 가상화자와의 대화를 통해 외국어 학습 서비스 제공하는 외국어 학습 장치에 관한 것으로, 학습자로부터 수신된 발화 음성에 대하여 음성인식(STT: Speech to Text)을 수행하는 음성 AI(Aritificial Intelligence) 장치로부터 학습자의 발화 음성 정보를 수신하고, 그에 대응하는 상기 가상화자의 발화 음성 정보를 상기 음성 AI 장치를 통해 음성합성(TTS: Text to Speech)하여 송신하는 인터페이스 모듈; 상기 학습자의 발화 음성 정보와 관련된 발화 이력의 로그를 저장하고 분석하는 학습자발화분석 모듈; 상기 학습자의 발화 음성 정보에 대하여 회화수준 산출 알고리즘 통해 적어도 하나 이상의 평가지표 별 점수를 연산하여 회화수준을 평가하는 평가 모듈; 및 학습 대화 흐름을 위한 시나리오 모델을 저장하고, 상기 학습자와 상기 가상화자의 학습 대화시 상기 시나리오 모델에 기초하여 상기 학습자의 발화 문장의 의도와 상기 평가 모듈에서 평가된 상기 학습자의 발화 음성 정보의 회화수준 따라 상기 가상화자의 답변 발화 문장을 결정하여 대화 흐름을 진행하는 학습 대화 모듈을 포함할 수 있다.
본 발명의 일 실시예에 의한 외국어 학습 서비스 제공 방법은, 외국어 학습 장치가 학습자에게 가상화자와의 대화를 통해 외국어 학습 서비스 제공하는 방법에 관한 것으로, 학습자 단말을 통해 상기 학습자로부터 미리 설정된 복수의 외국어 학습 주제 중 어느 하나에 대한 선택 입력을 수신하는 단계; 상기 학습자 단말을 통해 상기 선택된 주제에 대응하는 적어도 하나의 시나리오 모델에 포함된 스크립트(script)문장을 화면 상에 표시하거나 상기 가상화자의 발화 음성으로 상기 학습자에게 제공하는 단계; 상기 스크립트 문장에 대응하여 발화한 상기 학습자의 발화 음성 정보를 수신하는 단계; 상기 학습자의 발화 음성 정보를 상기 시나리오 모델에 대응하여 미리 설정된 답변세트와 비교하고 회화수준 산출 알고리즘을 통해 적어도 하나 이상의 평가지표 별 점수를 연산하여 상기 학습자의 발화 음성 정보에 대한 회화 수준 점수를 산출하는 단계; 및 상기 시나리오 모델에 기초하여 상기 학습자의 발화 음성 정보에 대응하는 발화 문장의 의도와 상기 학습자의 발화 음성 정보의 평가된 회화수준 점수에 따라 상기 가상화자의 답변 발화문장을 결정하여 상기 학습자에게 제공하는 단계를 포함할 수 있다.
덧붙여 상기한 과제의 해결수단은, 본 발명의 특징을 모두 열거한 것이 아니다. 본 발명의 다양한 특징과 그에 따른 장점과 효과는 아래의 구체적인 실시형태를 참조하여 보다 상세하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 의한 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법에 의하면, 가상화자와의 자유로운 대화를 통하여 외국어 회화학습을 수행할 수 있으므로, 시간적, 공간적 제한이 없이 효율적으로 외국어 회화학습을 수행하는 것이 가능하다.
본 발명의 일 실시예에 의한 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법에 의하면, 학습자의 발화문장의 의도 및 회화 수준에 기초하여 해당 대화유형, 대화기능, 또는 주제에 따라 복수의 대화흐름이 분기되므로, 가상화자와 자연스럽게 대화를 수행하는 것이 가능하다. 따라서, 학습자는 실제 원어민과 대화하는 것과 같이 대화를 진행할 수 있으므로, 회화학습의 효과를 높일 수 있다.
본 발명의 일 실시예에 의한 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법에 의하면, 인공지능을 이용하여 학습자의 회화수준에 대한 수치적인 분석 및 진단을 수행하는 것이 가능하다. 따라서, 학습자의 수준에 따른 자유로운 대화나 회화학습 또는 맞춤형 학습콘텐츠 추천 등을 수행할 수 있다.
도1은 본 발명의 일 실시예에 의한 외국어 학습 시스템을 나타내는 개략도이다.
도2는 본 발명의 일 실시예에 의한 외국어 학습 장치를 나타내는 블록도이다.
도3은 본 발명의 일 실시예에 의한 외국어 학습 장치의 문장 유사도 알고리즘을 나타내는 개략도이다.
도4는 본 발명의 일 실시예에 의한 외국어 학습 장치에서 우수 학습자의 학습 대화로부터 추가 권장문장 선정을 나타내는 개략도이다.
도5는 본 발명의 일 실시예에 의한 외국어 학습 장치의 발화 문장의 의도에 따른 시나리오 모델의 진행경로 결정을 나타내는 개략도이다.
도 6은 본 발명의 일 실시예에 의한 외국어 학습 장치의 시나리오설계 모듈을 이용한 시나리오 모델 설계 방법을 나타내는 개략도이다.
도 7(a)는 본 발명의 일 실시예에 의한 외국어 학습 장치의 시나리오설계 모듈을 이용하여, 대화 흐름 설계에 필요한 각 기능 노드를 배치하여 설계된 시나리오 모델들을 나타내는 개략도이다.
도7(b)는 도 7(a)의 시나리오 모델에 외부 콘텐츠 서버로부터의 콘텐츠를 연계하여 신규 시나리오 모델을 구성하는 일실시예를 나타내는 개략도이다
도8 및 도9은 본 발명의 일 실시예에 의한 외국어 학습 방법을 나타내는 순서도이다.
이하, 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 바람직한 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예를 상세하게 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 유사한 기능 및 작용을 하는 부분에 대해서는 도면 전체에 걸쳐 동일한 부호를 사용한다.
덧붙여, 명세서 전체에서, 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 '직접적으로 연결'되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 '간접적으로 연결'되어 있는 경우도 포함한다. 또한, 어떤 구성요소를 '포함'한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
도1은 본 발명의 일 실시예에 의한 외국어 학습 시스템을 나타내는 개략도이다. 도1을 참조하면, 본 발명의 일 실시예에 의한 외국어 학습 시스템은 학습자 단말(1), 음성 AI 장치(10) 및 외국어 학습장치(100)를 포함할 수 있다.
이하 도1을 참조하여 본 발명의 일 실시예에 의한 외국어 학습 시스템을 설명한다.
학습자 단말(1)은 외국어 학습 어플리케이션을 비롯하여 다양한 종류의 어플리케이션 등을 실행할 수 있으며, 실행 중인 어플리케이션을 시각이나 청각 등으로 표시하여 사용자에게 제공할 수 있다. 사용자 단말(1)은 외국어 학습 어플리케이션 등을 시각적으로 표시하기 위한 디스플레이부를 포함할 수 있으며, 사용자의 입력을 수신하는 입력부, 서버 또는 다른 단말과 네트워크를 통해 통신하는 통신부, 적어도 하나의 프로그램 및 관련 데이터가 저장된 메모리, 및 프로그램을 실행하는 프로세서를 포함할 수 있다. 또한, 사용자가 발화하는 음성을 인식하는 마이크부와, 외국어 학습 어플리케이션 등에서 제공하는 음향을 출력하기 위한 스피커 등의 구성을 더 포함할 수 있다.
학습자 단말(1)은 도시한 바와 같이, 스마트폰, 태블릿 PC 등의 이동 단말기일 수 있으며, 실시예에 따라서는 데스크탑 등의 고정형 장치도 포함될 수 있다. 구체적으로, 학습자 단말(1)에는 휴대폰, 스마트 폰(Smart phone), 음성인식 스피커, 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등이 포함될 수 있다. 실시예에 따라서는, 학습자 단말(1)을 외국어 학습을 위해 전용의 단말장치로 구현하는 것도 가능하다.
한편, 학습자 단말(1)은 통신 네트워크를 통하여 외국어 학습 장치(100)와 연결될 수 있다. 여기서, 통신 네트워크는 유선 네트워크와 무선 네트워크를 포함할 수 있으며, 구체적으로, 근거리 네트워크(LAN: Local Area Network), 도시권 네트워크(MAN: Metropolitan Area Network), 광역 네트워크(WAN: Wide Area Network) 등 다양한 네트워크를 포함할 수 있다. 또한, 통신 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)을 포함할 수도 있다. 다만, 본 발명에 따른 통신 네트워크는 상기 열거된 네트워크에 국한되지 않으며, 공지의 무선 데이터 네트워크, 공지의 전화 네트워크, 공지의 유선 또는 무선 텔레비전 네트워크 등을 포함할 수 있다.
외국어 학습 장치(100)는 단일 또는 복수의 서비스 제공 서버(또는 서비스 제공자(Service Provider))일 수 있으며, 학습자 단말(1)에 설치가능한 외국어 학습 어플리케이션을 통하여 학습자 단말(1)과 연결될 수 있다. 외국어 학습 장치(100)는 학습자 단말(1)의 요청에 대응하여 외국어 학습 서비스를 제공할 수 있으며, 가상화자와 대화하는 형식의 외국어 학습 서비스를 제공하여, 학습자가 자연스럽게 외국어 회화 능력을 향상시키도록 할 수 있다. 여기서, 외국어 학습 장치(100)가 제공하는 외국어는 영어, 일어, 중국어 등 실시예에 따라 다양하게 선택될 수 있다.
외국어 학습 장치(100)는 학습자가 가상화자와 대화하는 형식으로 외국어 학습 서비스를 제공하기 위하여, 학습자 단말(1)로부터 제공받은 학습자의 음성을 음성인식(STT: Speech to Text)하여 문자로 변환하여 의도를 분석하고, 가상화자가 학습자에게 발화해야 하는 스크립트를 음성합성(TTS: Text to Speech)하여 학습자 단말(1)로 제공할 필요가 있다. 외국어 학습 장치(100) 또는 학습자 단말(1)이 직접 이와 같은 음성인식 및 음성합성을 수행하는 음성 AI 모듈을 포함할 수 있지만, 실시예에 따라서는, 음성인식 및 음성합성을 별도의 음성 AI 장치(10)가 수행하도록 구현하는 것도 가능하다. 음성 AI 장치(10)는 외부의 음성 AI 분석/처리 기능을 제공하는 서버일 수도 있다.
음성 AI 장치(10)는 음성인식 및 음성합성을 위한 API(Application Program Interface)를 지원할 수 있으므로, 학습자가 발화하면 학습자 단말(1)은 학습자의 음성을 음성 AI 장치(10)로 제공하여 학습자의 음성을 텍스트로 변환할 것을 요청할 수 있다. 이후, 음성 AI 장치(10)는 학습자의 음성에 대응하는 발화 음성 정보를 외국어 학습 장치(100)로 제공할 수 있다.
외국어 학습 장치(100)는 학습자의 발화 음성 정보에 대응하여 답변할 가상화자의 답변 발화 문장을 결정할 수 있으며, 답변 발화 문장을 음성 AI 장치(10)로 제공하여 답변 발화 문장을 음성으로 합성할 것을 요청할 수 있다. 이 경우, 음성 AI 장치(10)는 답변 발화 문장에 대응하는 음성을 합성하여 학습자 단말(1)로 제공할 수 있다.
음성 AI 장치(10)는 성우들이 녹음한 코퍼스(corpus)를 합성하는 등의 방식으로 텍스트에 대응하는 음성데이터를 생성할 수 있으며, 실시예에 따라서는 머신러닝(machine learning) 또는 딥러닝(deep learning) 등의 인공지능을 활용하는 것도 가능하다. 즉, 텍스트와 그에 대응하는 음성데이터를 머신러닝또는 딥러닝하여 음소에 대한 데이터 가중치를 계산하고, 데이터 가중치를 활용하여 음성합성을 수행할 수 있다. 실시예에 따라서는, 음성 AI 장치(10)에 캐시(cache) 등을 더 포함하여 음성합성요청을 최소화하도록 구현하는 것도 가능하다.
도2는 본 발명의 일 실시예에 의한 외국어 학습장치(100)를 나타내는 블록도이다. 도2를 참조하면 본 발명의 일 실시예에 의한 외국어 학습 장치(100)는, 인터페이스 모듈(110), 학습자발화분석 모듈(120), 평가 모듈(130), 학습대화 모듈(140), 학습기능 모듈(150) 및 시나리오설계 모듈(160)을 포함할 수 있다.
이하 도2를 참조하여 본 발명의 일 실시예에 의한 외국어 학습장치(100)를 설명한다.
인터페이스 모듈(110)은 외국어 학습장치(100)를 학습자 단말(1), 음성 AI 장치(10)에 연동되도록 구성될 수 있다. 인터페이스 모듈(110)은 학습자 단말(1)에서 학습자가 발화한 음성 또는 가상화자가 발화할 답변 음성에 대하여, 음성 AI 장치(10)를 통해 외국어 학습 서비스 제공을 위한 음성인식 및 음성합성, 의도분석 등이 수행되도록 제어할 수 있다. 일실시예에서, 학습자가 발화하면 인터페이스 모듈(110)은 외국어 학습 장치(100) 내부 또는 외부의 음성 AI 장치(10)로부터 학습자의 발화 음성을 음성인식(STT)하여 변환한 텍스트를 포함하는 발화 음성 정보를 수신할 수 있다. 또한, 외국어 학습장치(100)가 가상화자가 행할 답변 발화 문장을 선택하여 학습자에게 제공하고자 하는 경우, 인터페이스 모듈(110)은 텍스트 형태의 답변 발화 문장을 음성 AI 장치(10)로 전송할 수 있으며, 음성 AI 장치(10)는 답변 발화 문장을 음성합성(TTS)하여 학습자 단말(1)에게 음성으로 전송할 수 있다.
한편, 인터페이스 모듈(110)은 음성 AI 장치(10) 이외에 다양한 장치 등과 연동하도록 구현될 수 있다. 예를들어, 인터페이스 모듈(110)은 콘텐츠 제공 서버(미도시)와 연동하도록 구성될 수 있으며, 시나리오 모델과 결합하여 제공되는 상황 대화 콘텐츠, 답변세트 등 다양한 추가 학습 콘텐츠를 콘텐츠 제공서버로부터 수신하는 것도 가능하다. 또한, 인터페이스 모듈(110)은 다른 AI 서버, Open API(Application Program Interface) 서버와 연동하도록 구성될 수도 있다.
학습자발화분석 모듈(120)은 인터페이스 모듈(110)을 통해 입력되는 학습자의 발화 음성 정보를 저장할 수 있으며, 발화 음성 정보와 관련된 발화 이력의 로그 등을 생성하여 저장하고 분석할 수 있다. 여기서, 학습자 발화분석 모듈(120)은 각각의 학습자와, 각각의 학습자가 실행한 시나리오 모델 별로 구별하여 발화 음성 정보와 발화 이력을 생성할 수 있다.
평가 모듈(130)은 회화수준 산출 알고리즘을 이용하여 학습자의 회화수준을 평가할 수 있다. 즉, 평가 모듈(130)은 학습자의 발화 음성 정보에 회화수준 산출 알고리즘을 적용할 수 있으며, 회화수준 산출 알고리즘에 포함된 각각의 평가지표별로 점수를 산출할 수 있다. 이후, 평가지표별 점수를 이용하여 회화수준 점수를 산출할 수 있다. 여기서, 평가 모듈(130)은 학습자가 발화하는 문장 각각의 발화 음성정보에 대하여 회화수준을 평가하거나, 학습자의 대화문 전체에 대한 회화수준을 평가할 수 있다.
구체적으로, 평가 모듈(130)에서 활용하는 회화수준 산출 알고리즘에는, 문장유사도 알고리즘, 맥락유사도 알고리즘, 발화유창성 알고리즘 등이 포함될 수 있다.
먼저, 문장유사도 알고리즘은 학습자의 발화 음성 정보와, 저장된 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변 세트간의 문장유사도를 평가할 수 있다. 답변세트는 각 스크립트 문장에 대한 답변이 되는 대표문장과 대안적인 답변으로 적절한 다수의 권장문장을 포함할 수 있다. 따라서, 문장유사도 알고리즘은 학습자의 발화 음성 정보가 시나리오 모델에서 미리설정된 답변 세트들과 얼마나 유사한 답을 하는지를 판별하여, 학습자의 회화수준을 평가할 수 있다.
일실시예에 의하면, 문장유사도 알고리즘에서 먼저 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트들에 대한 단어간 의미유사성을 벡터값으로 환산하여 수치화하는 기법으로 학습하여, 유사도 판별모델을 생성할 수 있다. 도3에 도시한 바와 같이, 일실시예에서는 답변세트들에 word2vec 기법을 적용하여 학습하여 유사도 판별모델을 생성할 수 있다. 유사도 판별모델을 적용하면 학습자의 발화 음성 정보가 미리설정된 답변세트와 얼마나 유사한지를 수치적으로 표현하는 것이 가능하다. 따라서, 학습자의 발화 음성 정보를 유사도 판별모델에 적용하여 학습자의 발화 음성 정보와 답변세트 사이의 문장유사도 벡터 거리 값을 통해 학습자의 발화 음성 정보의 문장유사도 점수로 산출할 수 있다. 일실시예에서, 문장유사도 점수 기준값을 미리 설정한 후, 문장유사도 점수가 기준값 이상이면 적합한 것으로 판단하고, 기준값 미만인 경우에는 부적합한 것으로 판단하는 것도 가능하다. 일실시예에서, 복수의 문장유사도 레벨 구간 기준값을 미리 설정한 후, 문장유사도 점수가 어느 레벨 구간에 대응하는지 확인하여 문장유사도 평가지표에 대한 수준을 산출할 수도 있다.
맥락유사도 알고리즘은 학습자의 발화 음성 정보와, 학습자와 가상화자 간의 전후 질의 및 답변 사이의 대화 맥락유사도를 평가할 수 있다. 즉, 가상화자와 학습자 사이의 대화를 수행하는 경우, 학습자는 시나리오 모델에서 미리설정된 답변세트를 알지 못하므로, 답변세트에 포함되지 않은 임의의 답변을 수행할 수 있다. 이때, 학습자의 발화 내용이 답변세트에 포함되지는 않았으나, 대화의 전후 맥락상 적절한 내용일 수 있으므로, 학습자의 회화수준을 정확하게 평가하기 위해서는 맥락유사도를 판별할 필요가 있다.
맥락유사도 알고리즘에서는, 시나리오 모델 내에서 상황 또는 주제를 설명하는 스크립트 또는 대화문 내의 단어, 학습자에게 가이드를 제공하는 이전 스크립트 또는 대화문에 사용되는 단어, 및 이에 대응하여 이루어진 학습자의 발화문장 내 단어들을 연계하여 단어들 간의 의미유사성을 벡터값으로 환산하여 수치화하는 기법으로 학습하여 맥락판별 모델을 생성할 수 있다. 이후, 학습자의 발화 음성 정보를 맥락판별 모델에 적용하여 맥락유사도 점수를 산출할 수 있다. 일실시예에서, 맥락유사도 점수 기준값을 미리 설정한 후, 맥락유사도 점수가 기준값 이상이면 대화맥락이 유지된 것으로 판단하고, 기준값 미만인 경우에는 대화 맥락에 부적합한 것으로 판단할 수 있다. 또한, 복수의 맥락유사도 레벨 구간 기준값을 미리 설정한 후, 맥락유사도 점수가 어느 레벨 구간에 대응하는지 확인하여 맥락유사도 평가지표에 대한 수준을 산출하는 실시예도 가능하다.
발화유창성 알고리즘은 학습자의 발화 음성 정보의 발화 유창성을 발음 정확성 및 발화 속도 등을 포함하는 지표의 점수로 산출하여 판단할 수 있다.
즉, 발화유창성 알고리즘은 단일 또는 복수의 원어민의 기준 발화 음성의 발음 정보 및 발화 속도 정보 등을 학습하여 발화유창성 모델을 생성할 수 있으며, 학습자의 발화 음성 정보로부터 추출된 학습자의 발음 정보 및 발화 속도 등의 정보를 발화유창성 모델에 적용할 수 있다. 이때 학습자의 발음 정보 및 발화 속도 등의 정보를 기준 발화 음성의 발음 정보 및 발화 속도 등과 비교하여 그에 대한 지표값을 산출하고, 이를 통해 학습자의 발화유창성 점수를 산출할 수 있다. 일실시예로, 학습자의 발음 음성 파형과 기준발화 음성의 발음 음성 파형을 비교하여 발화유창성 점수를 산출할 수 있다.
문장유사도 알고리즘, 맥락유사도 알고리즘, 발화유창성 알고리즘 이외에도 학습자의 회화수준을 평가하기 위한 다른 평가지표 알고리즘이 평가 모듈(130)에 포함될 수도 있다.
한편, 평가 모듈(130)은, 문장유사도 알고리즘, 맥락유사도 알고리즘, 발화 유창성 알고리즘 등을 통해 산출한 평가지표 점수들을 입력하여 지도학습기법을 기반으로 평가모델을 생성할 수 있으며, 평가모델에 학습자의 발화 음성 정보를 입력하여 학습자의 회화수준 점수를 산출할 수 있다. 즉, 머신러닝 또는 딥러닝 기법을 활용하여, 각각의 평가지표 점수를 기초로 대응하는 회화수준 점수를 산출하는 것이 가능하다. 여기서, 평가모델을 생성하기 위해 지도학습 수행시 영어 강사들의 각각의 평가지표 점수들로부터 평가한 기존 평가데이터를 활용할 수 있다. 평가 모듈(130)에서 산출된 점수는 학습자가 바로 확인할 수 있도록 회화 학습 어플리케이션 화면 상에 백분율로 표시될 수 있으며, 학습자의 학습 몰입을 방해할 경우 별도로 표시하지 않을 수도 있다.
추가적으로, 실시예에 따라서는, 도4에 도시한 바와 같이, 평가 모듈(130)이 시나리오 모델에서 미리설정된 답변세트 이외에, 학습자들의 답변을 기초로 각각의 스크립트 문장에 대응하는 권장문장을 해당 답변세트에 추가 설정할 수 있다. 즉, 학습자발화분석 모듈(120)에 저장된 복수의 학습자들의 학습이력으로부터 미리 정해진 점수 이상을 획득한 우수 학습자를 선별할 수 있으며, 우수 학습자들의 이력에 저장된 발화음성정보들을 시나리오 모델의 각 스크립트 문장에 대응하는 권장문장으로 선정하여 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트에 추가로 포함시킬 수 있다. 이를 통하여 답변세트의 데이터를 확장시킬 수 있으며, 교과서적인 답변이외에 실제 그 시대에 자주 사용되는 구어체로 사용되는 답변 등도 충분히 반영하는 것이 가능하다. 즉, 학습자들에 대해 보다 정확하게 회화수준을 평가할 수 있다.
학습대화 모듈(140)은 외국어 학습 대화 흐름을 위해 미리 설정된 시나리오 모델을 저장하고, 학습자와 가상화자가 학습 대화시 시나리오 모델에 기초하여 대화흐름을 진행할 수 있다. 종래의 회화 학습 어플리케이션들에는 단문문장이나 단일방향의 짧은 대화흐름만이 가능하도록 미리설정된 다수의 시나리오들(예컨대, 도 5(a)에서 A1-B1, A2-B2. A3-B3, 또는 A1-B1-A2, A2-B2-A3 등)을 저장하고 이를 사용하여 학습하기 때문에 자연스러운 학습대화를 구현하기 어려웠다. 그러나, 학습대화 모듈(140)에 저장된 시나리오 모델은 대화유형, 대화기능, 주제, 또는 과제 등의 단위로 구성될 수 있으며, 학습자의 선택에 따라 이들이 서로 연결되어 다양한 방향으로 대화가 확장 또는 변경되어 대화 흐름이 진행될 수 있도록 구성되어 있다. 따라서 원어민 회화수업과 유사하게 학습자가 가상화자와 보다 자연스러운 대화 학습이 가능하게 된다. 도5(b)는 이와 같이 확장되는 시나리오 모델의 일실시예를 나타낸다. 본 실시예에서는 시나리오 모델을 대화유형, 주제 단위로 구성하고 있으나, 이외에도 시나리오 모델은 필요한 다른 기준 단위로도 구성될 수 있다. 또한, 시나리오 모델은 미리설정되어 저장된 것 이외에도 학습 장치(100)내에 포함된 시나리오설계 모듈(160)에 의하여 설계될 수 있다.
시나리오 모델에 기초하여 대화흐름을 진행하는 과정에서, 학습대화 모듈(140)은 학습자의 발화 문장의 의도와, 평가 모듈(130)에서 평가된 학습자의 발화 음성 정보의 회화수준 따라, 가상화자의 답변 발화 문장과 대화흐름 방향을 결정하여 대화 흐름을 진행할 수 있다. 예컨대 일실시예에서, 학습자의 회화수준이 75%인 경우 시나리오 모델 내의 다음 상황에 해당하는 가상화자의 답변 발화문장을 결정하여 대화 흐름을 이어서 진행하고, 50~75% 구간 내인 경우 학습자에게 권장문장과 학습자 발화문장 중 키워드를 추출하여 학습자에게 답변세트와 유사한 적절한 답변을 유도할 수 있도록 다른 형태로 변경된 재질문을 가상화자의 답변 발화 문장으로 결정할 수 있다. 또한, 학습자의 회화수준이 50% 미만인 경우 현재 대화 상황에 학습자가 발화하는 것이 적절한 권장 문장을 익힐 수 있도록, 힌트를 제시하기, 권장문장의 전체 문장을 제시하기, 음성으로 들려준 후 학습자가 반복하여 따라할 수 있도록 가이드를 제시하기, 또는 문장 패턴/표현 학습 제시하기 등의 형태로 가상화자의 답변 발화문장을 결정하여, 그 주제에 대하여 대화 진행이 어려운 학습자에게 먼저 실질적으로 문장을 숙지 할 수 있도록 할 수 있다.
학습기능 모듈(150)은 학습대화 흐름 중 또는 학습대화 흐름 종료 후에 평가 모듈(130)에서 평가된 학습자의 각 발화문장 또는 전체대화문의 회화수준에 따라서 외국어 학습에 필요한 단어, 문장, 표현, 발음 등을 포함하는 학습 콘텐츠를 복습 또는 추가 학습시키도록 구성될 수 있다. 일실시예에서, 학습기능 모듈(150)은 학습자의 회화수준 점수가 미리설정된 값보다 낮은 것으로 판별된 스크립트 문장과 그에 대한 답변세트에 관련된 단어, 문장, 발음 또는 표현 등을, 학습자가 숙지하도록 구현되는 것일 수 있다. 일실시예에서, 학습기능 모듈(150)은 가상화자를 통해 해당 학습콘텐츠에 대한 발음을 들려주고 학습자에게 반복해서 따라하도록 요청할 수 있다. 또한, 학습기능 모듈(150)은 학습자 본인이 한 발화음성을 들려주고 다시 발화하도록 요청할 수 있다. 학습기능 모듈(150)은 이외에도 다양한 방식으로 학습자를 위한 복습 또는 추가 학습 기능을 수행할 수 있다.
시나리오설계 모듈(160)은, 대화유형 또는 대화기능 노드들을 이용하여, 학습자와 가상화자 간의 대화 흐름에 적합한 시나리오 모델을 설계, 결합, 변경, 및 관리할 수 있다. 시나리오 모델은 학습자와 가상화자가 발화할 수 있는 대화유형, 주제, 과제 또는 기타분류의 단위로 각각의 스크립트 문장과 그 스크립트 문장에 대응할 수 있는 미리설정된 답변세트를 포함할 수 있다. 답변세트는 각 스크립트 문장에 대한 답변이 되는 대표문장과 대안적인 답변으로 적절할 수 있는 다수의 권장문장을 포함할 수 있다. 또한 시나리오 모델은 학습자의 발화문장의 의도에 따라 해당 대화유형, 대화기능, 또는 기타분류에 대응하는 노드 별로 각각 복수의 진행경로 분기되도록 구성될 수 있다.
일실시예에서, 시나리오설계 모듈(160)은 신규 시나리오 모델을 설계하기 위한 챗봇대화 설계용 UI(User Interface) 또는 UX(User Experience)를 제공할 수도 있다. 일실시예에서, 챗봇대화 설계용 UI는 노코딩(No-coding) 기반으로 웹 캔버스(Web Canvas) 상에서 드래그 앤 드롭(Drag & Drop)방식으로 필요한 복수의 기능 노드들을 적절하게 배치하여 시나리오 모델의 대화 흐름을 가시적으로 구성하여 시나리오 모델을 설계하고, 학습 서비스에 즉시 반영할 수 있다. 또한, 대화 흐름, 즉 시나리오 모델 간을 연결시켜 자연스럽고 풍부한 대화 소재를 만들어 낼 수 있다.
도 6은 9개의 대화기능 노드 타입을 가지고 시나리오 모델을 위한 챗봇대화 설계를 할 수 있도록 구성된 시나리오 설계 모듈(160)의 일실시예의 구성을 나타낸다. 일실시예에서, 9개의 대화기능 노드들은 리슨 노드(Listen node)(161), 스피크 노드(Speak node)(162), 슬롯 노드(Slot node)(163), 캐러셀 노드(Carousel node)(164), 점프 노드(Jump node)(165), 스플릿 노드(Split node)(166), 기능 노드(Function node)(167), API 노드(Application program interface node)(168) 및 템플릿 노드(Template node)(169)를 포함할 수 있다. 또한, 다른 실시예에서 시나리오 설계 모듈은(160)은 9개보다 많거나 적은 대화기능 노드 타입을 포함하도록 구성될 수도 있다. 리슨 노드(Listen node)(161)는 음성 AI 장치(10)에서 학습자의 발화문장의 의도 분석을 수행하여 얻은 학습자의 발화 음성 정보로부터 학습자의 대화 의도를 이해하도록 구성하는 기능을 가지며, 스피크 노드(Speak node)(162)는 학습자의 발화문장에 대응하여 발화하도록 결정된 원하는 답변을 하도록 구성할 수 있다. 슬롯 노드(Slot node)(163)는 학습자에게 추가적인 정보를 구하거나 정확한 답변을 유도하기 위해 재질문할 수 있도록 구성할 수 있으며, 캐러셀 노드(Carousel node)(164)는 학습자에게 선택 보기 기능을 제공하여 학습자가 복수의 선택 사항들 중 선택할 수 있도록 구성할 수 있다. 점프 노드(Jump node)(165)는 상이한 시나리오 모델들 간에 연결하여 대화흐름을 변경/이동시킬 수 있도록 구성하고, 스플릿 노드(Split node)(166)는 조건에 따라서 대화 흐름을 분기할 수 있도록 구성할 수 있다. 기능 노드(Function node)(167)는 데이터를 가공처리할 수 있도록 구성할 수 있으며 코딩(coding)으로 필요기능을 구현할 수도 있다. API 노드 (API node)(167)는 외부 API와의 연계를 지원하고 데이터 파싱(parsing)과 연계 매핑(mapping)을 수행할 수 있으며, 이러한 구성은 시나리오 모델에 외부 학습 콘텐츠와의 연계 작업을 용이하게 할 수 있다. 일실시예에서 API 노드(168)는 URL 파라미터를 설정하면 트리 형태로 정보를 보여줄 수 있도록 구성할 수 있다. API 노드(168)는 Restful API로 기간계 데이터를 송수신받을 수 있으며, 업무시 시스템과의 연계를 간단한 세팅만으로 연결가능하게 할 수 있다. 템플릿 노드(Template node)(169)는, 학습자와의 대화시 음성인식, 음성합성, 의도분석을 행하는 별도의 음성 AI 장치(10)와 연계하여 학습자와 가상화자 간에 원활한 학습 대화를 수행하기 위해서 음성 AI 장치(10)마다 상이한 템플릿을 지원해야 하는 점을 해결하기 위한 기능 노드이다. 템플릿 노드는 상이한 음성 AI 장치(10)에 따라 그에 대응하는 템플릿을 활용하여 대화학습을 할 수 있도록 구성할 수 있다, 따라서 외국어 학습장치(100)가 상이한 음성 AI 장치에 따라 영향을 받지 않고 동일 챗봇대화 흐름을 진행할 수 있도록 시나리오 모델을 설계할 수 있게 한다. 이러한 일실시예의 시나리오설계 모듈(160)에서는, 시나리오 설계시 대화 흐름에 맞게 필요한 기능을 가진 노드를 드래그 앤 드랍 방식으로 웹 캔버스에 배치시키고 해당 콘텐츠를 입력하여 각 노드를 연결시킴으로서 시나리오 모델을 설계할 수 있다.
시나리오설계 모듈(160)은 추가 학습 콘텐츠를 시나리오 모델의 각 노드에 적용하여 새로운 시나리오 모델을 설계하도록 구성될 수 있다. 시나리오설계 모듈(160)은 인터페이스 모듈(110) 및/또는 API 노드를 통해 기타 AI 서버, 콘텐츠 제공 서버, Open API 지원서버 등과의 연계가 지원될 수도 있다. 일실시예에서, 시나리오설계 모듈(160)은 외부의 콘텐츠 제공 서버 또는 콘텐츠 마켓 플랫폼에서 제공하는 다양한 콘텐츠를 연계하여 시나리오 모델을 설계하도록 할 수 있다. 예를 들어, 기상청 서버가 제공하는 날씨 정보나 도로공사 서버에서 제공하는 교통정보 등과 연계하여 대화 흐름을 수행하도록 시나리오 모델을 설계하는 것도 가능하다.
도 7(a)는 본 발명의 일 실시예에 의한 외국어 학습 장치의 시나리오설계 모듈을 이용하여, 대화 흐름 설계에 필요한 각 기능 노드를 배치하여 설계된 시나리오 모델들을 나타내는 개략도이다. 구체적으로, 도7(a)는 시나리오설계 모듈(160)의 웹 캔버스 상에서 인사(greeting)을 위한 대화 흐름 설계에 필요한 각 기능 노드를 드래그 앤 드랍 형태로 설계하고 연결하여 배치한 시나리오 모델의 일실시예를 나타낸다. 도7(a) 및 도7(b)에서 동일한 노드 타입은 9개 기능 노드 타입들 중 동일한 기능을 하는 노드임을 나타내며, T1은 리슨 노드, T2는 스플릿 노드, T3는 스피크 노드, T4는 기능 노드, T5는 점프 노드, T6는 API 노드, T7은 슬롯 노드, T8은 캐러셀 노드, T9은 템플릿 노드를 나타낸다. 도7(b)는 도 7(a)에서 설계된 시나리오 모델에 외부 콘텐츠 서버로부터의 콘텐츠를 연계하여 신규 시나리오 모델을 구성하는 일실시예를 나타내는 개략도이다. 도7(b)는 기상청 서버로부터 수신한 날씨 콘텐츠를 미리 저장된 인사 대화 흐름을 위한 시나리오 모델 중 날씨 인사에 결합하여 웹 캔버스 상에서 날씨 인사에 관한 신규 시나리오 모델을 구성하는 일실시예를 나타낸 것이다. 도7(b)에서와 같이, 일실시예에서 도7(a)의 인사(greeting) 대화 흐름을 위한 시나리오 모델에 기상청 서버로부터의 수신한 날씨 콘텐츠를 결합하여 웹 캔버스 상에서 날씨 인사 시나리오 모델을 구성하여 미션 추천까지 연계할 수 있다.
도8 및 도9는 본 발명의 일 실시예에 의한 외국어 학습장치를 이용한 외국어 학습 서비스 제공 방법을 나타내는 순서도이다.
도8를 참조하면, 외국어 학습장치는 대화유형 또는 대화기능별 노드들을 이용하여, 학습자와 가상화자 간의 대화 흐름에 적합한 시나리오 모델을 설계할 수 있다(S10). 외국어 학습장치(100)는 시나리오 모델 설계를 위한 시나리오모델 설계 툴(160)을 제공할 수 있으며, 시나리오모델 설계 툴(160)을 이용하여 시나리오 모델이 학습자와 가상화자가 발화할 수 있는 대화유형, 대화기능 또는 기타분류의 단위의 노드에서 각각의 스크립트 문장과 그 스크립트 문장에 대응할 수 있는 미리설정된 답변세트를 포함하도록 설계할 수 있다. 일실시예에서, 시나리오 모델은 스크립트 문장에 대응하여 입력되는 학습자의 발화문장의 의도에 따라 해당 대화유형, 대화기능에 따른 노드 별로 각각 복수의 진행경로 분기되도록 설계할 수 있다. 답변세트는 각 스크립트 문장에 대한 답변이 되는 대표문장과 대안적인 답변으로 적절할 수 있는 다수의 권장문장을 포함할 수 있다.
일실시예에서, 시나리오모델 설계 툴(160)은 신규 시나리오 모델을 설계하기 위한 챗봇대화 설계용 UI 또는 UX를 제공할 수 있다. 여기서, 챗봇대화 설계용 UI는 노코딩(No-coding) 기반으로 웹 캔버스(Web Canvas) 상에서 드래그 앤 드롭(Drag & Drop)방식으로 필요한 복수의 기능 노드들을 적절하게 배치하여 시나리오 모델의 대화 흐름을 가시적으로 구성하여 시나리오 모델을 설계하고, 학습 서비스에 즉시 반영할 수 있는 인터페이스를 제공할 수 있다. 또한, 이러한 챗봇대화 설계용 UI를 이용하면, 대화 흐름, 즉 시나리오 모델 사이를 연결시켜, 자연스럽고 풍부한 대화 소재를 만들어 내는 것도 가능하다. 시나리오모델 설계 툴(160)을 이용하여 시나리오 모델을 생성하는 구체적인 예는, 앞서 도6 및 도7를 참조하여 설명하였으므로, 여기서는 구체적인 설명을 생략한다.
한편, 시나리오모델 설계 툴(160)은 기타 AI 서버, 콘텐츠 제공 서버, Open API 지원서버 등과의 연계를 지원할 수 있다. 일실시예에서, 시나리오모델 설계 툴(160)은 외부의 콘텐츠 제공 서버 또는 콘텐츠 마켓 플랫폼에서 제공하는 다양한 콘텐츠를 연계하여 시나리오 모델을 설계할 수 있다. 예를 들어, 기상청 서버가 제공하는 날씨 정보나 도로공사 서버에서 제공하는 교통정보 등과 연계하여 대화 흐름을 수행하도록 시나리오 모델을 설계하는 것도 가능하다. 또한, 실시예에 따라서는 시나리오 모델을 외부의 콘텐츠 제공 서버 또는 콘텐츠 마켓 플랫폼 등으로부터 제공받는 것도 가능하며, 그러한 경우 시나리오 모델을 설계하는 단계(S10)는 생략될 수 있다.
외국어 학습장치(100)는 학습자 단말(1)을 통해 학습자로부터 미리 설정된 복수의 외국어 학습 주제 중 어느 하나에 대한 선택 입력을 수신할 수 있다(S20). 일실시예에서, 학습자는 자신이 원하는 외국어 학습 주제 이외에도 대화유형 또는 다른 기준의 복수의 메뉴 중 하나를 선택할 수 있으며, 외국어 학습장치(100)는 학습자의 선택 입력에 대응하는 외국어 학습을 제공할 수 있다.
구체적으로, 외국어 학습장치(100)는 학습자 단말(1)을 통해 선택된 주제에 대응하는 적어도 하나의 시나리오 모델에 포함된 스크립트(script)문장을 화면 상에 표시하거나 가상화자의 발화 음성으로 학습자에게 제공할 수 있다(S30). 외국어 학습장치(100)는 학습자에게 학습자가 선택한 주제에 대응하는 시나리오 모델에서의 상황을 설명하고 상황에 맞는 대화를 가상화자와 수행하도록 요청할 수 있다. 시나리오 모델은 학습자와 가상화자가 발화할 수 있는 대화유형, 주제, 과제 또는 기타분류의 단위로 각각의 스크립트 문장과 그 스크립트 문장에 대응할 수 있는 미리설정된 답변세트를 포함할 수 있다. 또한 시나리오 모델은 학습자의 발화문장의 의도에 따라 해당 대화유형, 대화기능 또는 기타분류에 대응하는 노드 별로 각각 복수의 진행경로 분기되도록 구성될 수 있다. 답변세트는 각 스크립트 문장에 대한 답변이 되는 대표문장과 대표문장 대신 대안적인 답변으로 적절할 수 있는 다수의 권장문장을 포함할 수 있다,
학습자는 선택한 주제에 대응하는 적어도 하나의 시나리오 모델에 대하여 화면상에 디스플레이되거나 가상화자를 통해 주어진 스크립트 문장에 대응하여 발화할 수 있으며, 외국어 학습장치(100)는 스크립트 문장에 대응하여 발화한 학습자의 발화 음성 정보를 수신할 수 있다(S40). 실시예에 따라서는 음성 AI 장치(10)를 통하여 학습자가 발화한 음성에 대응하는 텍스트인 발화 음성 정보를 수신할 수 있다. 즉, 음성 AI 장치(10)가 외국어 학습장치(100)와 학습자 단말(1) 사이에서 연동되도록 설정되어 있을 수 있으며, 학습자가 발화한 음성 또는 가상화자가 발화할 답변 음성은, 음성 AI 장치(10)에서 각각 음성인식 또는 음성합성되어, 외국어 학습장치(100) 또는 학습자 단말(1)로 전송될 수 있다. 일실시예에서, 학습자가 발화하면 외국어 학습장치(100)는 외국어 학습 장치(100) 내부 또는 외부의 음성 AI 장치(10)로부터, 학습자의 발화 음성을 음성인식(STT)하여 변환한 텍스트를 포함하는 발화 음성 정보를 수신할 수 있다. 또한, 외국어 학습장치(100)가 가상화자가 행할 답변 발화 문장을 선택하여 학습자에게 제공하고자 하는 경우, 텍스트 형태의 답변 발화 문장을 음성 AI 장치(10)로 전송할 수 있으며, 음성 AI 장치(10)는 답변 발화 문장을 음성합성(TTS)하여 학습자 단말(1)에게 음성으로 전송할 수 있다.
여기서, 외국어 학습장치(100)는 입력되는 학습자의 발화 음성 정보를 저장할 수 있으며, 발화 음성 정보와 관련된 발화 이력의 로그 등을 생성하여 저장하고 분석할 수 있다. 이때, 외국어 학습장치(100)는 각각의 학습자와, 각각의 학습자가 실행한 시나리오 모델 별로 구별하여 발화 음성 정보와 발화 이력을 생성할 수 있다.
이후, 외국어 학습장치(100)는 학습자의 발화 음성 정보를 시나리오 모델에 대응하여 미리 설정된 답변세트와 비교하고, 회화수준 산출 알고리즘을 통해 평가지표별 점수를 연산할 수 있다. 즉, 학습자의 발화 음성 정보에 회화수준 산출 알고리즘을 적용할 수 있으며, 회화수준 산출 알고리즘에 포함된 각각의 평가지표별로 점수를 산출할 수 있다. 나아가, 외국어 학습장치(100)는 평가지표별 점수로부터 학습자의 발화 음성 정보에 대한 회화 수준을 평가하여 회화수준 점수를 산출할 수 있으며(S50), 외국어 학습장치(100)는 학습자가 발화하는 문장 각각의 발화 음성정보를 평가하거나, 학습자의 대화문 전체에 대한 회화수준을 평가할 수 있다.
회화수준 산출 알고리즘에는 문장유사도 알고리즘, 맥락유사도 알고리즘, 발화유창성 알고리즘 등의 평가지표 알고리즘들이 포함될 수 있다. 다만, 각각의 평가지표 알고리즘에 대하여는 앞서 설명하였으므로, 여기서는 구체적인 설명을 생략한다.
한편, 회화수준 점수 산출 단계(S50)에서는, 문장유사도 알고리즘, 맥락유사도 알고리즘, 및 발화 유창성 알고리즘 등을 통해 산출된 평가지표 점수들을 입력하여, 지도학습기법을 기반으로 평가모델을 생성할 수 있으며, 이후 평가모델에 학습자의 발화 음성 정보를 입력하여 학습자의 회화수준 점수를 산출할 수 있다. 실시예에 따라서는, 문장유사도 알고리즘, 맥락유사도 알고리즘, 발화유창성 알고리즘 이외에도, 학습자의 회화수준을 평가하기 위한 다른 평가지표 알고리즘을 포함하여, 학습자의 회화수준 점수를 산출하는 것도 가능하다.
또한, 회화수준 점수 산출 단계(S50)에서는, 문장유사도 알고리즘, 맥락유사도 알고리즘, 발화 유창성 알고리즘 등을 통해 산출한 평가지표 점수들을 입력하여 지도학습기법을 기반으로 생성한 평가모델을 활용할 수 있으며, 평가모델에 학습자의 발화 음성 정보를 입력하여 학습자의 회화수준 점수를 산출할 수 있다. 즉, 머신러닝 또는 딥러닝 기법을 활용하여, 각각의 평가지표 점수를 기초로 대응하는 회화수준 점수를 산출하는 것이 가능하다. 여기서, 평가모델을 생성하기 위해 지도학습 수행시 영어 강사들의 각각의 평가지표 점수들로부터 평가한 기존 평가데이터를 활용할 수 있다. 외국어 학습장치(100)가 산출된 점수는 학습자가 바로 확인할 수 있도록 회화 학습 어플리케이션 화면 상에 백분율로 표시될 수 있으며, 학습자의 학습 몰입을 방해할 경우 별도로 표시하지 않을 수도 있다.
추가적으로, 실시예에 따라서는, 복수의 학습자들의 학습이력으로부터 미리 설정된 점수 이상을 획득한 우수 학습자를 선별하고, 우수 학습자의 이력에 저장된 발화문장들을 시나리오 모델의 각 스크립트 문장에 대응하는 권장문장으로 추가 선정하여 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트에 포함시킬 수 있다. 즉, 우수 학습자들의 답변을 바탕으로 교과서적인 답변 이외에 실제 구어체로 사용되는 답변 등도 반영할 수 있도록 답변세트의 데이터 풀(pool)을 확장시킬 수 있으며, 이러한 구성을 통해 사람들 간의 현실의 대화에 유사한 자연스러운 대화 학습이 가능하도록 할 수 있다.
이후, 시나리오 모델에 기초하여 학습자의 발화 음성 정보에 대응하는 발화 문장의 의도와, 학습자의 발화 음성 정보에 대해 평가된 회화수준 점수에 따라, 가상화자의 답변 발화문장을 결정하여 학습자에게 제공할 수 있다(S60). 여기서, 외국어 학습장치(100)는 외국어 학습 대화 흐름을 위한 미리 설정된 시나리오 모델을 저장하고, 학습자와 가상화자가 학습 대화시 시나리오 모델에 기초하여 대화흐름을 진행할 수 있다. 종래의 회화 학습 어플리케이션들에는 단문문장이나 단일방향의 짧은 대화흐름만이 가능하도록 미리설정된 다수의 시나리오들 (예컨대, 도 5(a)에서 A1-B1, A2-B2. A3-B3, 또는 A1-B1-A2, A2-B2-A3 등)을 저장하고 이를 사용하여 학습하기 때문에 자연스러운 학습대화를 구현하기 어려웠다. 그러나, 외국어 학습장치(100)에 저장된 시나리오 모델은 대화유형, 주제, 또는 과제 등의 단위로 구성될 수 있으며, 학습자의 선택에 따라 이들이 서로 연결되어 다양한 방향으로 대화가 확장 또는 변경되어 대화 흐름이 진행될 수 있도록 구성되어 있다. 따라서 원어민 회화수업과 유사하게 학습자가 가상화자와 보다 자연스러운 대화 학습이 가능하게 된다. 도5(b)는 이와 같이 확장되는 시나리오 모델의 일실시예를 나타낸다. 본 실시예에서는 시나리오 모델을 대화유형, 대화기능 단위로 구성하고 있으나, 이 외에도 시나리오 모델은 필요한 다른 기준 단위로도 구성될 수 있다.
시나리오 모델에 기초하여 대화흐름을 진행하는 과정에서, 외국어 학습장치(100)는 학습자의 발화 문장의 의도와, 학습자의 발화 음성 정보의 회화수준 따라, 가상화자의 답변 발화 문장과 대화흐름 방향을 결정하여 대화 흐름을 진행할 수 있다. 예컨대 일실시예에서, 학습자의 회화수준이 75%인 경우 시나리오 모델 내의 다음 상황에 해당하는 가상화자의 답변 발화문장을 결정하여 대화 흐름을 이어서 진행하고, 50~75% 구간 내인 경우 학습자에게 권장문장과 학습자 발화문장 중 키워드를 추출하여 학습자에게 답변세트와 유사한 적절한 답변을 유도할 수 있도록 다른 형태로 변경된 재질문을 가상화자의 답변 발화 문장으로 결정할 수 있다. 또한, 학습자의 회화수준이 50% 미만인 경우 현재 대화 상황에 학습자가 발화하는 것이 적절한 권장 문장을 익힐 수 있도록, 힌트를 제시하기, 권장문장의 전체 문장을 제시하기, 음성으로 들려준 후 학습자가 반복하여 따라할 수 있도록 가이드를 제시하기, 또는 문장 패턴/표현 학습 제시하기 등의 형태로 가상화자의 답변 발화문장을 결정하여, 그 주제에 대하여 대화 진행이 어려운 학습자에게 먼저 실질적으로 문장을 숙지 할 수 있도록 할 수 있다.
실시예에 따라서는, 외국어 학습장치(100)는 학습대화 흐름 중 또는 학습대화 흐름 종료 후에 평가된 학습자의 회화수준에 따라서 외국어 학습에 필요한 단어, 문장, 표현, 발음 등을 포함하는 학습 콘텐츠를 복습 또는 추가 학습시킬 수 있다. 일실시예에서, 외국어 학습장치(100)는 학습자의 회화수준 점수가 미리설정된 값보다 낮은 것으로 판별된 스크립트 문장과 그에 대한 답변세트에 관련된 단어, 문장, 발음 또는 표현 등을, 학습자가 숙지하도록 구현할 수 있다. 일실시예에서, 외국어 학습장치(100)는 가상화자를 통해 해당 학습콘텐츠에 대한 발음을 들려주고 학습자에게 반복해서 따라하도록 요청할 수 있다. 또한, 학습자 본인이 한 발화음성을 들려주고 다시 발화하도록 요청할 수 있으며, 이외에도 다양한 방식으로 학습자를 위한 복습 또는 추가 학습 기능을 수행할 수 있다.
구체적으로, 도9를 참조하면, 외국어 학습장치(100)는 평가 모듈(130)로부터 회화수준 점수를 입력받으면(S61), 회화수준 점수와 기준값을 비교할 수 있다(S62). 여기서, 회화수준 점수가 기준값 이상이면 시나리오 모델에 따라 다음 스크립트 문장을 추출하여 가상화자와의 대화를 계속 진행할 수 있다(S63). 이때, 학습자의 발화음성 정보에 대응하는 발화 문장의 의도에 따라 시나리오 모델의 진행경로를 결정하는 것이 가능하다. 즉, 학습자의 발화문장을 시나리오 모델 내에 미리 설정된 각각의 진행경로 별 답변세트와 비교하고, 진행경로 별 답변세트 중에서 학습자의 발화문장에 대응하는 것으로 판별된 답변세트에 따른 진행경로로 진행할 수 있다.
반면에, 점수가 기준값 미만이면 가상화자가 응답문장을 기반으로 학습자에게 핵심 단어 힌트 제시, 문장 듣고 따라하기 등을 포함하는 되묻기 대화를 통해 말하기 유도를 수행할 수 있다.
구체적으로, 회화수준 점수가 한계값 이상 기준값 미만이면(S64), 응답문장을 기반으로 음성합성을 수행하여 답변세트 내에서 학습자의 발화 문장과 가장 유사한 권장 문장을 찾아 학습자에게 의미를 되물을 수 있다(S65). 즉, 학습자의 발화 내용에 대한 음성인식이 잘못된 경우일 수 있으므로, 학습자에게 다시 정확한 의미를 확인할 수 있다.
반면에, 회화수준 점수가 한계값 미만인 경우에는, 스크립트 문장에 대한 설정답안을 학습을 수행할 수 있다(S66). 즉, 학습자의 회화수준이 낮은 상태이므로, 해당 스크립트 문장과 그에 대응하는 설정답안에 대해 학습자가 숙지하도록 학습시킬 수 있다.
실시예에 따라서는, 도8에 도시한 바와 같이, 학습자와 가상화자의 대화가 종료된 후, 학습자의 발화 음성 정보의 회화수준 점수에 따라, 학습자에게 적합한 난이도 및 주제의 학습 콘텐츠를 추천하도록 하는 것도 가능하다(S70).
전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.
본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.
1: 학습자 단말 10: 음성 AI 장치
100: 외국어 학습장치 110: 인터페이스 모듈
120: 학습자발화분석 모듈 130: 평가 모듈
140: 학습대화 모듈 150: 학습기능 모듈
160: 시나리오설계 모듈

Claims (27)

  1. 학습자에게 가상화자와의 대화를 통해 외국어 학습 서비스 제공하는 외국어 학습 장치에 있어서,
    상기 학습자로부터 수신된 발화 음성에 대해 음성인식(STT: Speech to Text)을 수행하는 음성 AI(Aritificial Intelligence) 장치로부터 상기 학습자의 발화 음성 정보를 수신하고, 그에 대응하는 상기 가상화자의 발화 음성 정보를 상기 음성 AI 장치를 통해 음성합성(TTS: Text to Speech)하여 송신하는 인터페이스 모듈;
    상기 학습자의 발화 음성 정보와 관련된 발화 이력의 로그를 저장하고 분석하는 학습자발화분석 모듈;
    상기 학습자의 발화 음성 정보를 복수의 회화수준 산출 알고리즘들에 적용하여 각각의 평가지표 점수를 연산하고, 상기 평가지표 점수를 이용하여 상기 학습자의 회화수준을 평가하는 평가 모듈; 및
    학습 대화 흐름을 위한 시나리오 모델을 저장하고, 상기 학습자와 상기 가상화자의 학습 대화시 상기 시나리오 모델에 기초하여, 상기 학습자의 발화 문장의 의도와 상기 학습자의 회화수준에 따라, 상기 가상화자의 답변 발화 문장을 결정하여 대화 흐름을 진행하는 학습 대화 모듈을 포함하는 것으로,
    상기 회화수준 산출 알고리즘은,
    상기 학습자의 발화 음성 정보와 상기 저장된 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변 세트간의 문장유사도를 평가하는 문장유사도 알고리즘;
    상기 학습자의 발화 음성 정보와, 상기 학습자와 상기 가상화자 간의 전후 질의 및 답변 사이의 대화 맥락유사도를 평가하는 맥락유사도 알고리즘; 및
    상기 학습자의 발화 음성 정보의 발화 유창성을 발음 정확성 및 발화 속도를 포함하는 지표의 점수로 산출하여 판단하는 발화유창성 알고리즘을 포함하고,
    상기 평가 모듈은,
    상기 문장유사도 알고리즘, 맥락유사도 알고리즘, 및 발화 유창성 알고리즘을 통해 산출된 각각의 평가지표 점수들을 입력하여 지도학습기법을 기반으로 평가모델을 생성하고, 상기 평가모델에 상기 학습자의 발화 음성 정보를 입력하여 상기 학습자의 회화수준 점수를 산출하며,
    상기 시나리오 모델은
    대화유형 또는 주제별 단위로 각각의 스크립트 문장과 상기 스크립트 문장에 대응하는 답변세트를 포함하고, 상기 학습자의 발화문장의 의도에 따라 해당 대화유형 또는 주제에 대응하는 각 노드 별로 복수의 진행경로로 분기되도록 구성되는, 외국어 학습 장치.
  2. 제1항에 있어서,
    학습대화 흐름 중 또는 학습대화 흐름 종료 후에 상기 평가 모듈에서 평가된 상기 학습자의 회화수준에 따라서, 상기 학습자에게 필요한 단어, 문장, 표현 및 발음 중 적어도 어느 하나를 포함하는 학습 콘텐츠를, 복습 또는 추가 학습시키도록 구성된 학습 기능 모듈을 더 포함하는, 외국어 학습 장치.
  3. 제1항에 있어서,
    대화유형 또는 대화기능 노드들을 이용하여 상기 학습자와 상기 가상화자 간의 대화 흐름에 적합한 시나리오 모델을 설계할 수 있는 시나리오 설계 모듈을 더 포함하는, 외국어 학습 장치.
  4. 제3항에 있어서, 상기 인터페이스 모듈은
    AI 서버, 콘텐츠 제공 서버, 및 Open API 지원서버 중 적어도 어느 하나와의 연계를 지원하는, 외국어 학습 장치.
  5. 제4항에 있어서,
    상기 인터페이스 모듈은 상기 콘텐츠 제공 서버로부터 외국어 학습 서비스에 결합하여 제공되는 답변세트, 상황 대화 콘텐츠를 포함하는 추가 학습 콘텐츠를 수신하도록 구성되고, 상기 시나리오 설계 모듈은 상기 추가 학습 콘텐츠를 상기 대화유형 또는 대화기능 노드들에 적용하여 새로운 시나리오 모델을 설계하도록 구성되는, 외국어 학습 장치.
  6. 삭제
  7. 제1항에 있어서, 상기 문장유사도 알고리즘은,
    상기 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트들을 단어간 의미유사성을 벡터값으로 환산하여 수치화하는 기법으로 학습하여 유사도 판별모델을 생성하고, 상기 학습자의 발화 음성 정보를 상기 유사도 판별모델에 적용하여 상기 학습자의 발화 음성 정보와 상기 답변세트들 사이의 문장 유사도 벡터 거리 값을 통해 상기 학습자의 발화 음성 정보의 문장유사도 점수를 산출하는, 외국어 학습 장치.
  8. 제1항에 있어서, 상기 맥락유사도 알고리즘은,
    상기 시나리오 모델 내에서, 상황 또는 주제를 설명하는 스크립트 또는 대화문 내의 단어, 상기 학습자에게 가이드를 제공하는 이전 스크립트 또는 대화문에 사용되는 단어, 및 이에 대응하여 이루어진 상기 학습자의 발화문장 내 단어들을 연계하여 상기 단어들 간의 의미유사성을 벡터값으로 환산하여 수치화하는 기법으로 학습하여 상기 학습자의 발화문장의 대화 맥락유사도 점수를 산출하고, 산출된 상기 맥락유사도 점수가 상기 대화 흐름의 맥락에 연관된 미리설정된 값 범위 내에 있는지 판별하는, 외국어 학습 장치.
  9. 제1항에 있어서, 상기 발화유창성 알고리즘은
    미리설정된 기준 발화 음성의 발음 정보 및 발화 속도를 학습하고, 상기 학습자의 발화 음성 정보로부터 추출된 발음 정보 및 발화 속도를 상기 학습자의 발화 문장에 대응하는 기준 발화 음성의 발음 정보 및 발화 속도와 비교하여 발음 정확성 및 발음 속도에 관한 지표 값을 산출하는, 외국어 학습 장치.
  10. 삭제
  11. 제1항에 있어서, 상기 평가 모듈은,
    상기 학습자발화분석 모듈에 저장된 복수의 학습자들의 학습이력으로부터 미리설정된 점수 이상을 획득한 우수 학습자를 선별하고, 상기 우수 학습자의 이력에 저장된 발화문장들을 상기 시나리오 모델의 각 스크립트 문장에 대응하는 추가 권장문장으로 선정하여 상기 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트에 포함시키도록 구성된, 외국어 학습 장치.
  12. 외국어 학습 장치가 학습자에게 가상화자와의 대화를 통해 외국어 학습 서비스 제공하는 방법에 있어서,
    학습자 단말을 통해 상기 학습자로부터 미리 설정된 복수의 외국어 학습 주제 중 어느 하나에 대한 선택 입력을 수신하는 단계;
    상기 학습자 단말을 통해 상기 선택된 주제에 대응하는 적어도 하나의 시나리오 모델에 포함된 스크립트(script)문장을 화면 상에 표시하거나 상기 가상화자의 발화 음성으로 상기 학습자에게 제공하는 단계;
    상기 스크립트 문장에 대응하여 발화한 상기 학습자의 발화 음성 정보를 수신하는 단계;
    상기 학습자의 발화 음성 정보를 상기 시나리오 모델에 대응하여 미리 설정된 답변세트와 비교하고, 복수의 회화수준 산출 알고리즘들을 통해 각각의 평가지표 점수를 연산하여 상기 학습자의 발화 음성 정보에 대한 회화 수준 점수를 산출하는 단계; 및
    상기 시나리오 모델에 기초하여, 상기 학습자의 발화 문장의 의도와 상기 회화수준 점수에 따라, 상기 가상화자의 답변 발화문장을 결정하여 상기 학습자에게 제공하는 단계를 포함하는 것으로,
    상기 회화수준 산출 알고리즘은,
    상기 학습자의 발화 음성 정보와 상기 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변 세트간의 문장유사도를 평가하는 문장유사도 알고리즘;
    상기 학습자 발화 음성 정보와 상기 학습자와 상기 가상화자 간의 전후 질의 및 답변 사이의 대화 맥락유사도를 평가하는 맥락유사도 알고리즘; 및
    상기 학습자의 발화 음성 정보의 발화 유창성을 발음 정확성 및 발화 속도를 포함하는 지표의 점수로 산출하여 판단하는 발화유창성 알고리즘을 포함하고,
    상기 회화수준 점수 산출 단계는,
    상기 문장유사도 알고리즘, 맥락유사도 알고리즘, 및 발화 유창성 알고리즘을 통해 산출된 평가지표 점수들을 입력하여 지도학습기법을 기반으로 평가모델을 생성하고, 상기 평가모델에 상기 학습자의 발화 음성 정보를 입력하여 상기 학습자의 회화수준 점수를 산출하며,
    상기 시나리오 모델은
    대화유형 또는 주제별 단위로 각각의 스크립트 문장과 상기 스크립트 문장에 대응하는 답변세트를 포함하고, 상기 학습자의 발화문장의 의도에 따라 해당 대화유형 또는 주제에 대응하는 각 노드 별로 복수의 진행경로로 분기되도록 구성되는, 외국어 학습 서비스 제공 방법.
  13. 제12항에 있어서,
    대화유형 또는 대화기능별 노드들을 이용하여 상기 학습자와 상기 가상화자 간의 대화 흐름에 적합한 시나리오 모델을 설계하는 단계를 더 포함하는, 외국어 학습 서비스 제공 방법.
  14. 제12항에 있어서,
    상기 학습자와 상기 가상화자의 대화가 종료된 후, 상기 학습자의 발화 음성 정보의 회화수준 점수에 따라 상기 학습자에게 적합한 난이도 및 주제의 학습 콘텐츠를 추천하는 단계를 더 포함하는, 외국어 학습 서비스 제공 방법.
  15. 삭제
  16. 제12항에 있어서, 상기 문장유사도 알고리즘은,
    상기 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트들을 단어간 의미유사성을 벡터값으로 환산하여 수치화하는 기법으로 학습하여 유사도 판별모델을 생성하고, 상기 학습자의 발화 음성 정보를 상기 유사도 판별모델에 적용하여 상기 학습자의 발화 음성 정보와 상기 답변세트 사이의 문장 유사도 벡터 거리 값을 통해 상기 학습자의 발화 음성 정보의 문장유사도 점수를 산출하는, 외국어 학습 서비스 제공방법.
  17. 제12항에 있어서, 상기 맥락유사도 알고리즘은,
    상기 시나리오 모델 내에서, 상황 또는 주제를 설명하는 스크립트 또는 대화문 내의 단어, 상기 학습자에게 가이드를 제공하는 이전 스크립트 또는 대화문에 사용되는 단어, 및 이에 대응하여 이루어진 상기 학습자의 발화문장 내 단어들을 연계하여 상기 단어들 간의 의미유사성을 벡터값으로 환산하여 수치화하는 기법으로 학습하여 상기 학습자의 발화문장의 대화 맥락유사도 점수를 산출하고 산출된 상기 맥락유사도 점수가 상기 대화 흐름의 맥락에 연관된 미리정해진 값 범위 내에 있는지 판별하는, 외국어 학습 서비스 제공 방법.
  18. 제12항에 있어서, 상기 발화유창성 알고리즘은
    기준 발화 음성의 발음 정보 및 발화 속도를 학습하고, 상기 학습자의 발화 음성 정보로부터 추출된 상기 학습자의 발음 정보 및 발화 속도를 상기 학습자의 발화 문장에 대응하는 기준 발화 음성의 발음 정보 및 발화 속도와 비교하여 발음 정확성 및 발음 속도에 관한 지표 점수를 산출하는, 외국어 학습 서비스 제공 방법.
  19. 삭제
  20. 제12항에 있어서, 상기 회화수준 점수 산출 단계는,
    복수의 학습자들의 학습이력으로부터 미리 설정된 점수 이상을 획득한 우수 학습자를 선별하고, 상기 우수 학습자의 이력에 저장된 발화문장들을 상기 시나리오 모델의 각 스크립트 문장에 대응하는 추가 권장문장으로 선정하여 상기 시나리오 모델의 각각의 스크립트 문장에 대응하는 답변세트에 포함시키는, 외국어 학습 서비스 제공 방법.
  21. 제12항에 있어서, 상기 답변 발화문장을 결정하여 상기 학습자에게 제공하는 단계는,
    상기 회화 수준 점수가 기준값 이상이면 상기 시나리오 모델에 따라 다음 스크립트 문장을 추출하여 상기 가상화자와의 대화를 지속하는 단계; 및
    상기 회화 수준 점수가 기준값 미만이면 상기 가상화자가, 상기 학습자의 발화 음성 정보를 텍스트로 변환한 응답문장을 기반으로, 상기 학습자에게 핵심 단어 힌트 제시 또는 문장 듣고 따라하기를 포함하는 되묻기 대화를 통해 말하기 유도를 행하는 단계를 더 포함하는, 외국어 학습 서비스 제공 방법.
  22. 제21항에 있어서, 상기 말하기 유도를 행하는 단계는
    상기 회화 수준 점수가 한계값 이상 기준값 미만이면, 상기 응답문장을 기반으로 음성합성을 수행하여 상기 답변세트 내에서 상기 학습자의 발화 문장과 가장 유사한 권장 문장을 찾아 상기 학습자에게 의미를 되묻는 단계; 및
    상기 회화 수준 점수가 상기 한계값 미만이면, 상기 스크립트 문장에 대한 설정답안을 학습시키는 단계를 더 포함하는, 외국어 학습 서비스 제공 방법.
  23. 제21항에 있어서, 상기 대화를 지속하는 단계는,
    상기 학습자의 발화음성 정보에 대응하는 발화 문장의 의도에 따라 상기 시나리오 모델 내의 대화유형 또는 대화기능별 노드에서 분기된 진행경로를 결정하는 것인, 외국어 학습 서비스 제공 방법.
  24. 제23항에 있어서, 상기 대화를 지속하는 단계는,
    상기 학습자의 발화문장을 상기 시나리오 모델 내의 상기 대화유형 또는 대화기능별 노드에서 분기되는 진행경로에 대하여 미리설정된 답변세트와 비교하고, 상기 진행경로 별 답변세트 중에서 상기 학습자의 발화문장에 대응하는 것으로 판별된 답변세트에 따른 진행경로로 진행하는, 외국어 학습 서비스 제공 방법.
  25. 제12항에 있어서, 상기 시나리오 모델은,
    상기 외국어 학습 장치가 제공하는 시나리오모델 설계 툴을 이용하여, 각각의 스크립트 문장과 상기 스크립트 문장에 대응하는 답변세트를 포함하도록 생성되며, 상기 스크립트 문장에 대응하여 입력되는 상기 학습자의 발화문장의 의도에 따라 복수의 진행경로로 분기되는 것인, 외국어 학습 서비스 제공 방법.
  26. 제25항에 있어서, 상기 시나리오모델 설계 툴은,
    콘텐츠 제공 서버와의 연계를 지원하며, 상기 콘텐츠 제공 서버로부터 외국어 학습 서비스에 결합하여 제공되는 답변세트, 상황 대화 콘텐츠를 포함하는 추가 학습 콘텐츠를 수신하도록 구성되고, 상기 시나리오모델 설계 툴은 상기 추가 학습 콘텐츠를 상기 시나리오 모델에 포함되는 대화유형 또는 대화기능별 노드들에 적용하여 새로운 시나리오 모델을 설계하도록 구성되는, 외국어 학습 서비스 제공 방법.
  27. 제12항 내지 제14항, 제16항 내지제18항, 제20항 내지 제26항 중 어느 한 항의 외국어 학습 서비스 제공 방법을 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램.
KR1020190137882A 2019-10-31 2019-10-31 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법 KR102302137B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020190137882A KR102302137B1 (ko) 2019-10-31 2019-10-31 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법
JP2020179148A JP7059492B2 (ja) 2019-10-31 2020-10-26 外国語学習装置、外国語学習サービス提供方法、およびコンピュータプログラム
CN202011153817.4A CN112819664A (zh) 2019-10-31 2020-10-26 用于学习外语的设备及使用其提供外语学习服务的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190137882A KR102302137B1 (ko) 2019-10-31 2019-10-31 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법

Publications (2)

Publication Number Publication Date
KR20210051948A KR20210051948A (ko) 2021-05-10
KR102302137B1 true KR102302137B1 (ko) 2021-09-15

Family

ID=75713083

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190137882A KR102302137B1 (ko) 2019-10-31 2019-10-31 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법

Country Status (3)

Country Link
JP (1) JP7059492B2 (ko)
KR (1) KR102302137B1 (ko)
CN (1) CN112819664A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102410644B1 (ko) 2022-02-16 2022-06-22 주식회사 알투스 인공지능을 활용한 음성인식 기반 외국어 교육 콘텐츠 서비스 제공 방법, 장치 및 시스템
US11875699B2 (en) 2022-04-21 2024-01-16 Columbia College Methods for online language learning using artificial intelligence and avatar technologies

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220159170A (ko) * 2021-05-25 2022-12-02 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
KR102622067B1 (ko) * 2021-08-11 2024-01-09 한국과학기술원 대화 전사 자료를 이용한 영어 회화 능력 분석 방법 및 시스템
KR102384573B1 (ko) * 2021-09-09 2022-04-11 주식회사 오리진 자율대화 기능이 구비된 인공지능 기반의 언어학습 단말기 그 동작방법
KR102551296B1 (ko) * 2021-09-24 2023-07-05 한국전자통신연구원 외국어 말하기 학습을 위한 대화 장치 및 그 방법
KR102410110B1 (ko) * 2021-11-05 2022-06-22 주식회사 살랑코리아 한국어 학습 서비스 제공 방법
KR102418558B1 (ko) * 2021-11-22 2022-07-07 주식회사 유나이티드어소시에이츠 대화형 인공지능 아바타를 이용한 영어 말하기 교육 방법, 장치 및 이에 대한 시스템
KR102491978B1 (ko) * 2021-12-21 2023-01-27 (주)웅진씽크빅 학습자 음성을 이용한 문자 언어 학습 장치 및 이를 이용한 문자 언어 학습 지원 방법
CN114743418A (zh) * 2022-04-26 2022-07-12 简伟广 一种基于ai智能的日语教学系统
KR102655327B1 (ko) * 2022-06-16 2024-04-04 장미화 유아의 영어 및 수학적 코딩을 위한 사고 능력을 향상시키는 교구 시스템
KR102569339B1 (ko) * 2023-03-09 2023-08-22 주식회사 공터영어 스피킹 테스트 시스템
KR102678364B1 (ko) * 2024-02-02 2024-06-26 주식회사 공터영어 온라인 기반 멀티 학습 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101937778B1 (ko) * 2017-02-28 2019-01-14 서울대학교산학협력단 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과 방법 및 기록매체

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101037247B1 (ko) * 2009-06-18 2011-05-26 포항공과대학교 산학협력단 외국어 회화 연습 방법 및 장치와 이것의 빠른 개발과 검증을 돕는 학습자 시뮬레이션 방법과 장치
KR101211796B1 (ko) * 2009-12-16 2012-12-13 포항공과대학교 산학협력단 외국어 학습 장치 및 그 제공 방법
KR20110120552A (ko) * 2010-04-29 2011-11-04 포항공과대학교 산학협력단 자연어 대화 기술을 이용한 외국어 학습 게임 시스템 및 방법
KR20120006154A (ko) * 2010-07-12 2012-01-18 (주)유비바다 실감형 외국어 교육 시스템 및 교육방법
JP2012215645A (ja) 2011-03-31 2012-11-08 Speakglobal Ltd コンピュータを利用した外国語会話練習システム
US9214157B2 (en) * 2011-12-06 2015-12-15 At&T Intellectual Property I, L.P. System and method for machine-mediated human-human conversation
US9535960B2 (en) * 2014-04-14 2017-01-03 Microsoft Corporation Context-sensitive search using a deep learning model
JP6556090B2 (ja) * 2016-04-08 2019-08-07 Kddi株式会社 複数の類似度算出によってテキストの点数を推定するプログラム、装置及び方法
JP2017201342A (ja) 2016-05-02 2017-11-09 良一 春日 言語学習ロボット・ソフトウェア
WO2018230345A1 (ja) 2017-06-15 2018-12-20 株式会社Caiメディア 対話ロボットおよび対話システム、並びに対話プログラム
KR101970899B1 (ko) * 2017-11-27 2019-04-24 주식회사 머니브레인 문맥 기반으로 음성 인식의 성능을 향상하기 위한 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
US11074829B2 (en) * 2018-04-12 2021-07-27 Baidu Usa Llc Systems and methods for interactive language acquisition with one-shot visual concept learning through a conversational game
CN110209793A (zh) * 2019-06-18 2019-09-06 佰聆数据股份有限公司 一种用于智能识别文本语义的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101937778B1 (ko) * 2017-02-28 2019-01-14 서울대학교산학협력단 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과 방법 및 기록매체

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102410644B1 (ko) 2022-02-16 2022-06-22 주식회사 알투스 인공지능을 활용한 음성인식 기반 외국어 교육 콘텐츠 서비스 제공 방법, 장치 및 시스템
US11875699B2 (en) 2022-04-21 2024-01-16 Columbia College Methods for online language learning using artificial intelligence and avatar technologies

Also Published As

Publication number Publication date
JP7059492B2 (ja) 2022-04-26
JP2021071723A (ja) 2021-05-06
KR20210051948A (ko) 2021-05-10
CN112819664A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
KR102302137B1 (ko) 외국어 학습장치 및 이를 이용하는 외국어 학습서비스 제공방법
CN110489756B (zh) 会话式人机交互口语测评系统
KR101037247B1 (ko) 외국어 회화 연습 방법 및 장치와 이것의 빠른 개발과 검증을 돕는 학습자 시뮬레이션 방법과 장치
Griol et al. An architecture to develop multimodal educative applications with chatbots
Komatani et al. User modeling in spoken dialogue systems to generate flexible guidance
WO2021212954A1 (zh) 极低资源下的特定发音人情感语音合成方法及装置
KR102410110B1 (ko) 한국어 학습 서비스 제공 방법
Su et al. A recursive dialogue game for personalized computer-aided pronunciation training
KR20090058320A (ko) 외국어 회화 교육을 위한 예제기반 대화 시스템 및 방법
Skidmore et al. Using Alexa for flashcard-based learning
KR101004913B1 (ko) 음성인식을 활용한 컴퓨터 주도형 상호대화의 말하기 능력평가 장치 및 그 평가방법
CN109697975B (zh) 一种语音评价方法及装置
Alharthi Siri as an interactive pronunciation coach: its impact on EFL learners
Baur et al. A textbook-based serious game for practising spoken language
KR101873379B1 (ko) 대화를 이용한 언어 학습 시스템
CN113192484B (zh) 基于文本生成音频的方法、设备和存储介质
KR102272567B1 (ko) 음성 인식 수정 시스템
KR20190113218A (ko) 사용자 모국어 패턴 분석을 활용한 외국어 학습 방법 및 시스템
CN114255759A (zh) 用机器实施的口语训练方法、设备及可读存储介质
Ross et al. Speaking with your computer: A new way to practice and analyze conversation
Boroș et al. Rss-tobi-a prosodically enhanced romanian speech corpus
Hirai et al. Using Speech-to-Text Applications for Assessing English Language Learners’ Pronunciation: A Comparison with Human Raters
Kasrani et al. A Mobile Cloud Computing Based Independent Language Learning System with Automatic Intelligibility Assessment and Instant Feedback.
McTear Rule-Based Dialogue Systems: Architecture, Methods, and Tools
KR102689260B1 (ko) 실시간 음성 인식 기반 강의 통역 플랫폼 운영 서버 및 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant