WO2018084379A1 - Appareil et procédé servant à mesurer la fiabilité d'un locuteur - Google Patents

Appareil et procédé servant à mesurer la fiabilité d'un locuteur Download PDF

Info

Publication number
WO2018084379A1
WO2018084379A1 PCT/KR2017/000601 KR2017000601W WO2018084379A1 WO 2018084379 A1 WO2018084379 A1 WO 2018084379A1 KR 2017000601 W KR2017000601 W KR 2017000601W WO 2018084379 A1 WO2018084379 A1 WO 2018084379A1
Authority
WO
WIPO (PCT)
Prior art keywords
talker
voice data
reliability
processor
keyword
Prior art date
Application number
PCT/KR2017/000601
Other languages
English (en)
Korean (ko)
Inventor
백성욱
양수연
이미영
권순일
전석봉
박성호
정재형
구본우
박준렬
Original Assignee
세종대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR10-2016-0145922 priority Critical
Priority to KR1020160145922A priority patent/KR101864824B1/ko
Application filed by 세종대학교산학협력단 filed Critical 세종대학교산학협력단
Publication of WO2018084379A1 publication Critical patent/WO2018084379A1/fr

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Abstract

La présente invention comprend : une mémoire dans laquelle un programme servant à mesurer la fiabilité de données vocales est stocké ; et un processeur qui exécute le programme stocké dans la mémoire. À cet égard, lorsque le programme est exécuté, le processeur extrait des caractéristiques et des mots-clés à partir des données vocales, extrait une pluralité d'éléments correspondant à un locuteur qui génère les données vocales sur la base des caractéristiques et des mots-clés, analyse des corrélations entre la pluralité d'éléments, et calcule la fiabilité du locuteur. Les éléments comportent au moins un mot-clé, une onomatopée émotionnelle, un son en arrière-plan, et un sexe, une tranche d'âge et un état mental d'un locuteur.
PCT/KR2017/000601 2016-11-03 2017-01-18 Appareil et procédé servant à mesurer la fiabilité d'un locuteur WO2018084379A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR10-2016-0145922 2016-11-03
KR1020160145922A KR101864824B1 (ko) 2016-11-03 2016-11-03 발화자에 대한 신뢰도 측정 장치 및 방법

Publications (1)

Publication Number Publication Date
WO2018084379A1 true WO2018084379A1 (fr) 2018-05-11

Family

ID=62076929

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/000601 WO2018084379A1 (fr) 2016-11-03 2017-01-18 Appareil et procédé servant à mesurer la fiabilité d'un locuteur

Country Status (2)

Country Link
KR (1) KR101864824B1 (fr)
WO (1) WO2018084379A1 (fr)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10992805B1 (en) 2020-01-27 2021-04-27 Motorola Solutions, Inc. Device, system and method for modifying workflows based on call profile inconsistencies

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009175336A (ja) * 2008-01-23 2009-08-06 Seiko Epson Corp コールセンターのデータベースシステム、その情報管理方法及び情報管理プログラム
KR20110043600A (ko) * 2008-06-17 2011-04-27 보이스센스 리미티드 화법분석을 통한 화자의 특성분석 방법
KR20110127029A (ko) * 2010-05-18 2011-11-24 경희대학교 산학협력단 사용자 사용 언어에 기반한 사용자의 주관적 웰빙 상태 판단 방법
KR101449856B1 (ko) * 2013-06-18 2014-10-13 경희대학교 산학협력단 전화 통화의 사용자 감정 판단 방법
KR20160040954A (ko) * 2014-10-06 2016-04-15 에스케이텔레콤 주식회사 긴급 재난신고를 판단하는 방법 및 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102311922B1 (ko) * 2014-10-28 2021-10-12 현대모비스 주식회사 사용자의 음성 특성을 이용한 대상 정보 음성 출력 제어 장치 및 방법
KR20160060243A (ko) * 2014-11-19 2016-05-30 한국전자통신연구원 고객 응대 서비스 장치 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009175336A (ja) * 2008-01-23 2009-08-06 Seiko Epson Corp コールセンターのデータベースシステム、その情報管理方法及び情報管理プログラム
KR20110043600A (ko) * 2008-06-17 2011-04-27 보이스센스 리미티드 화법분석을 통한 화자의 특성분석 방법
KR20110127029A (ko) * 2010-05-18 2011-11-24 경희대학교 산학협력단 사용자 사용 언어에 기반한 사용자의 주관적 웰빙 상태 판단 방법
KR101449856B1 (ko) * 2013-06-18 2014-10-13 경희대학교 산학협력단 전화 통화의 사용자 감정 판단 방법
KR20160040954A (ko) * 2014-10-06 2016-04-15 에스케이텔레콤 주식회사 긴급 재난신고를 판단하는 방법 및 장치

Also Published As

Publication number Publication date
KR20180049689A (ko) 2018-05-11
KR101864824B1 (ko) 2018-06-05

Similar Documents

Publication Publication Date Title
WO2015068947A1 (fr) Système d'analyse de contenu vocal reposant sur l'extraction de mots-clés à partir de données vocales enregistrées, procédé d'indexation à l'aide du système et procédé d'analyse de contenu vocal
WO2020207035A1 (fr) Procédé, appareil et dispositif d'interception de canular téléphonique, et support d'informations
WO2015005679A1 (fr) Procédé, appareil et système de reconnaissance vocale
US20140214403A1 (en) System and method for improving voice communication over a network
WO2020153572A1 (fr) Procédé et appareil d'apprentissage de modèle de détection d'événement sonore
CN102623011A (zh) 信息处理装置、信息处理方法、信息处理系统以及程序
WO2016006727A1 (fr) Dispositif et procédé d'essai de fonction cognitive
WO2018128238A1 (fr) Système et procédé de consultation virtuelle utilisant un dispositif d'affichage
WO2018070668A1 (fr) Système d'évaluation automatique des performances complexes d'une reconnaissance vocale hybride
WO2020034526A1 (fr) Procédé d'inspection de qualité, appareil, dispositif et support de stockage informatique pour l'enregistrement d'une assurance
WO2020151317A1 (fr) Procédé et appareil de vérification vocale, dispositif informatique et support d'enregistrement
WO2015023035A1 (fr) Procédé de correction d'erreurs de préposition et dispositif le réalisant
WO2018084379A1 (fr) Appareil et procédé servant à mesurer la fiabilité d'un locuteur
WO2014106979A1 (fr) Procédé permettant de reconnaître un langage vocal statistique
WO2020027372A1 (fr) Dispositif d'interprétation vocale
WO2015111772A1 (fr) Procédé de détermination d'une consommation d'alcool, support d'enregistrement et terminal associés
WO2014200187A1 (fr) Appareil pour apprendre l'apophonie et procédé associé
WO2018088664A1 (fr) Dispositif de détection automatique d'erreur de corpus d'étiquetage morphosyntaxique au moyen d'ensembles approximatifs, et procédé associé
WO2020006886A1 (fr) Procédé et dispositif d'identification pour système de contrôle d'accès, système de contrôle d'accès et support d'informations
WO2017104875A1 (fr) Procédé de reconnaissance d'émotion utilisant des informations de ton et de rythme vocal, et appareil associé
WO2019172734A2 (fr) Dispositif d'exploration de données, et procédé et système de reconnaissance vocale utilisant ce dispositif
WO2020213785A1 (fr) Système pour générer automatiquement des phrases à base de texte sur la base de l'apprentissage profond afin d'obtenir une amélioration liée à l'infinité de modèles de prononciation
WO2015147363A1 (fr) Procédé destiné à la détermination de la consommation d'alcool par comparaison de la trame de fréquence de signal de différence et support d'enregistrement et dispositif destinés à sa mise en œuvre
Lin et al. Phoneme-less hierarchical accent classification
CN111292723A (zh) 一种语音识别系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17867955

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase in:

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17867955

Country of ref document: EP

Kind code of ref document: A1