CZ2023331A3

CZ2023331A3 - Automatizovaná klasifikace emocionální kognice

Info

Publication number: CZ2023331A3
Application number: CZ2023-331A
Authority: CZ
Inventors: Joy MACKAY; Ignacio Mackay Joy; Anthony Davis; Ashland Davis Anthony
Original assignee: Elaboration, Inc.; Elaboration, Inc
Priority date: 2021-01-29
Filing date: 2022-03-18
Publication date: 2024-01-03

Abstract

Způsob detekování psychologického afektu v obsahu přirozeného jazyka za použití modulu založeného na pravidlech zahrnuje přijetí obsahu přirozeného jazyka jako textového vstupu; vyhledání shod mezi lingvistickými pravidly pro danou emocionální kognici a komponentami obsahu přirozeného jazyka a zobrazení obsahu přirozeného jazyka, který spojuje shodující se lingvistická pravidla s danou emocionální kognicí a příslušnou indikací intenzity dané emocionální kognice. Systém počítače (226) pro provedení způsobu zahrnuje centrální procesorovou jednotku CPU (200), která provádí procesy. Data a instrukce procesů mohou být uložené v paměti (202) nebo na úložném disku (204), například pevný disk HDD, nebo na přenosném paměťovém médiu, nebo mohou být uložené vzdáleně. Počítač (226) obsahuje sběrnici (222), síťový kontrolér (206) pro propojení se sítí (224) a dále grafický kontrolér (208) pro propojení s displejem (210). Univerzální I/O rozhraní (212) je propojitelné s periferiemi (218), klávesnicí a/nebo myší (214), nebo dotykovým displejem (216).

Description

Předkládaný vynález se obecně týká monitorování afektu, a zejména klasifikace a sledování intenzity emocionální kognice v obsahu přirozeného jazyka.

Dosavadní stav techniky

Afektivní komputace je studium a výzkum systémů a zařízení, jež dokážou rozpoznávat, interpretovat, zpracovávat a simulovat lidská hnutí mysli. Afektivní komputace je multidisciplinámí obor, který spojuje lingvistiku, statistiku, lidské faktory a počítačovou vědu. Jedním aspektem afektivní komputace je umožnit botům a dalším počítačovým aplikacím inteligentně reagovat na přirozenou lidskou emocionální zpětnou vazbu. V případě textu zahrnuje afektivní komputace detekci emocí z textu. Častěji se forma detekce emocí známá jako analýza sentimentu používá ke klasifikaci textu jako pozitivního, negativního nebo neutrálního. Skoro každá velká společnost, která vyvíjí počítačový software a hardware, i univerzitní výzkum a několik startupů někdy vyvinulo projekty, které zahrnují nějakou formu nástrojů pro analýzu sentimentu. Popularita analýzy sentimentu vychází z potřeby lépe chápat sentiment v reakcích na zpravodajská média a v různých komentářích zákazníků, jež jsou rozšířené na sociálních médiích, komentářích zákazníků k produktům a interakcích s chatboty.

V praxi představuje analýza sentimentu systematickou identifikaci, extrakci, kvantifikaci a studium afektivních emocionálně kognitivních stavů a subjektivních informací za použití zpracování přirozeného jazyka, analýzy textu, komputaění lingvistiky a biometrie. Analýza sentimentu se zrychlila částečně díky dostupnosti velkých datových souborů lidského dialogu, jež jsou získávány z takových zdrojů, jako jsou různé platformy sociálních médií, zaznamenané konverzace a další výstupy pro vyjádření textu. Nicméně analýza sentimentu musí zacházet s vyvíjející se povahou přirozeného jazyka. Například musí analýza sentimentu pracovat s jemnými distinkcemi a variacemi ve významu mezi slovy nebo dokonce celými frázemi. Může se jevit, že některé fráze uvádějí stejnou myšlenku, ale mohou signalizovat různý sentiment. Analýza sentimentu musí pracovat se slovy nebo frázemi, jež mohou mít rozdílný význam v závislosti na kontextu.

Navzdory významnému nedávnému pokroku v technologiích používaných ke zpracování přirozeného jazyka analýza sentimentu trpí tím, že je vázána na cvičné soubory, jež byly klasifikovány manuálně, a je tedy subjektivní. Zejména se manuálně provádí anotace velkých cvičných datových souborů textu. Cvičné sestavy z manuálních klasifikačních postupů mají tendenci být pomalé, málo výkonné a drahé. Navíc finančně konkurenceschopné způsoby získávání hodnotitelů, primárně Mechanical Turk, trpí tím, že nerodilí mluvčí jsou motivováni rychle projít klasifikačními úkoly, což vede k protichůdným výsledkům s nízkou kvalitou, přičemž pokusy o předcházení těmto důsledkům jsou omezeny na těžkopádné načítání identifikací a nespolehlivé filtrování IP adres. Jemná detekce emocí je obtížná a náchylná k chybám.

Kromě toho cvičné soubory používané pro strojové učení nezohledňují kreativitu v jazyce. Lidé mají zjevně nekonečnou schopnost vytvářet při mluvení a psaní nové věty, které ještě nebyly nikdy napsány či řečeny. Platí, že nezbytnou vlastností jazyka je přesně toto zohlednění takové kreativity, které se současné nejmodemější systémy nedokážou efektivně přizpůsobit.

Modely strojového učení pro zpracování přirozeného jazyka podle posledního stavu techniky (BERT (Bidirectional Encoder Representations from Transformers), GPT2 (Generative Pre-trained Transformer 2), GPT3), což jsou zdánlivě robustní nástroje, které dokážou pojmout mnoho do paměti a efektivně se dívají oběma směry, se nemohou vyrovnat vyvíjejícímu se přirozenému jazyku. Statistické modely se spoléhají na silné statistické, často probabilistické komponenty.

- 1 CZ 2023 - 331 A3

Modely strojového učení s učitelem predikují, že se znovu vyskytnou věci, jež již viděly, nebo vztahy, které se již vyskytly. Existuje bezpočet frází a vět, jež mohou být vytvořeny v budoucnosti, které nemohou být vystiženy větami, jež se již vyskytly, a to včetně prvků jako splynulá slova, slang, žargon, metafory nebo nově vytvořená slova.

Kromě toho nadále existuje sémantický deficit v analýze sentimentu; to částečně vyplývá z nedostatku účinných metod pro měření intenzity emocí a používání selektivních a nereprezentativních datových souborů pro cvičné účely. Navíc přílišné spoléhání se na řešení soustředěná na lexikon a založená na tokenech brání tomu, aby taková řešení nakonec dosáhla trvalé hodnoty, protože lingvisté a inženýři se potýkají s dynamickou povahou jazyka včetně sémantických posunů, zastarávání a různých jiných lingvistických změn v čase.

Analýza sentimentu jako taková trpí několika hlavními problémy; konkrétně nedostatkem datových souborů zlatého standardu s objektivně ohodnocenými a označkovánými daty pro cvičné účely, omezeními řešení založených na n-gramech, nedostatečnou schopností určit intenzitu v dobré víře, obtížemi s analyzováním hashtagů a nedostatečně důslednou validací výsledků. Navíc, zatímco jsou afektivní hodnocení na škále spokojenosti aplikována subjektivně, neexistuje v oboru či v akademické sféře žádný solidní prostředek pro validací výsledků klasifikace.

Zatímco se v sociolingvistické literatuře občas vynoří pokus o kvantifikaci pragmatických faktorů (převážně za pomoci skupinově prováděného vyčíslení a občas s využitím volby n-gramů s vysokými poměry token:typ), právě sociolingvistika se ve velké míře zaměřuje na fMRI studie, sociální experimenty nebo experimenty v reálném světě, intuitivní analýzy a podrobné zkoumání a porovnávání intuitivních, pragmatických příkladů. V oboru existují specifické, ale omezené syntakticky založené teorie, většinou u jednotlivých konstrukcí, jako je Andrewsova konstrukce (adjektivní a adverbiální fráze s konstrukcí „X ví“, např. „[jenom] bůh ví“, „kdo ví“), nebo poněkud komplexněji sémanticky bohatá, komplexní, ale na sloveso soustředěná základní analýza konstrukční gramatiky, zaměřená na specifické gramatické konstrukce pro vztahy objektů, známé jako struktura argumentů, která se ze své povahy zabývá argumenty (objekty) sloves.

Aby se jednalo o konstrukci, musí být jazykový útvar výhodně permutovatelný a modulární. Ze své povahy to vyvolává zaměření nejen na gramatická pravidla, ale i na běžné používání. Sociolingvistika se zaměřila na pragmatiku, vědu o používání v reálném světě, jež analyzuje specifické použití slov ve zvětšeném pohledu. Nicméně analýza konstrukcí se zaměřuje na strukturu argumentů a analýzu párování formy a významu se slovesem jako centrálním prvkem. Existuje potřeba efektivnější, robustní a přesné detekce kognice, emocí a emocionální kognice, která spojuje kognitivní vědu, sociolingvistiku a sémantiku.

Výše uvedený popis „dosavadního stavu techniky“ slouží účelu obecného představení kontextu tohoto vynálezu. Práce autorů tohoto vynálezu v rozsahu, v němž je popsána v tomto oddílu o dosavadním stavu techniky, ani aspekty tohoto popisu, které nemohou být považovány za předchozí stav techniky k datu podání podle jiných kritérií, nejsou výslovně ani implicitně připuštěny jako dosavadní stav techniky vzhledem k předkládanému vynálezu.

Podstata vynálezu

Podle jednoho provedení předkládaného vynálezu je jeho jedním aspektem způsob automatického rozšíření obsahu přirozeného jazyka o emocionální kognici pomocí obvodů pro zpracování, přičemž uvedený způsob může zahrnovat přijetí obsahu přirozeného jazyka jako textového vstupu pomocí vstupního zařízení; vyhledání shod mezi množstvím lingvistických pravidel pro danou emocionální kognici a komponentami textového vstupu uvedenými obvody pro zpracování, přičemž instance lingvistických pravidel mají alespoň jednu lidskou dimenzi; aktivování shodujících se lingvistických pravidel a vyhodnocení alespoň jedné lidské dimenze aktivovaných shodujících se lingvistických pravidel obvody pro zpracování; ohodnocení každé lidské dimenze k

-2CZ 2023 - 331 A3 získání prototypického profilu hodnotících skóre dimenzí pro danou emocionální kognici obvody pro zpracování; agregování dimenzí v získaném profilu skóre dimenzí obvody pro zpracování k získání údaje o intenzitě pro danou emocionální kognici; a zobrazení obsahu přirozeného jazyka na displeji, rozšířeného způsobem, který přiřazuje shodující se lingvistická pravidla k dané emocionální kognici a udává příslušnou indikaci intenzity dané emocionální kognice.

Dále je podle jednoho provedení předkládaného vynálezu dalším aspektem elektronická čtečka, která může obsahovat dotykový displej; obvody pro zpracování; a paměť, přičemž je dotykový displej nakonfigurován tak, aby zobrazoval text elektronické knihy; obvody pro zpracování jsou nakonfigurovány tak, aby nasnímaly a označkovaly text pomocí tagů za použití pravidel, jež při spuštění detekují emocionálně kognitivní stavy, a určily intenzitu, s níž s emocionálně kognitivní stavy vyskytly; obvody pro zpracování jsou nakonfigurované tak, aby vygenerovaly a zobrazily jednu nebo více postranních lišt pro vypsání informací o dynamice a intenzitě emocionální kognice na základě detekovaných komponent zobrazeného textu; dotykový displej je nakonfigurovaný tak, aby při dotyku na pozici na displeji zvolil dynamiku nebo intenzitu emocionální kognice; a obvody pro zpracování jsou dále nakonfigurovány, aby vygenerovaly a zobrazily barevně kódované zvýraznění, které označí výskyt zvolené dynamiky nebo intenzity emocionální kognice.

Dále je podle jednoho provedení předkládaného vynálezu dalším aspektem systém pro zmírňování psychologické poruchy, který může obsahovat mobilní zařízení mající obvody pro zpracování a paměť; a periferní zařízení mající komunikační zařízení a jeden nebo více akčních členů, přičemž v paměti mobilního zařízení jsou uloženy programové instrukce, jež při provedení obvody pro zpracování mobilního zařízení zajistí, že mobilní zařízení provede způsob zahrnující: přijetí obsahu přirozeného jazyka jako textového vstupu pomocí vstupního zařízení; vyhledání shod mezi množstvím lingvistických pravidel pro danou emocionální kognici a komponentami textového vstupu uvedenými obvody pro zpracování, přičemž instance lingvistických pravidel mají alespoň jednu lidskou dimenzi; detekování shodujících se lingvistických pravidel obvody pro zpracování k získání indikace intenzity pro danou emocionální kognici; a když indikace intenzity pro danou emocionální kognici dosáhne negativní emocionálně kognitivní intenzity, která překročí první prahovou hodnotu, vyslání prvního aktivačního signálu, který identifikuje emocionálně kognitivní intenzitu; a periferní zařízení je nakonfigurováno tak, aby přes komunikační zařízení přijalo vyslaný první aktivační signál; a aktivovalo uvedený jeden nebo více akčních členů k vytvoření senzorického odvrácení pozornosti ke zmírnění psychologické poruchy.

Výše uvedený obecný popis ilustrativních realizací a jejich následující podrobný popis jsou pouhé příkladné aspekty principů tohoto vynálezu a nejsou omezující.

Objasnění výkresů

Doprovodné výkresy, jež jsou začleněné do popisu vynálezu a tvoří jeho součást, ilustrují jedno nebo více provedení a společně s popisem tato provedení vysvětlují. Přiložené výkresy nejsou nutně nakresleny v měřítku. Veškeré hodnoty a rozměry vyobrazené na přiložených grafech slouží pouze ilustrativním účelům a mohou nebo nemusí představovat skutečné nebo výhodné hodnoty či rozměry. Kde to je relevantní, některé nebo všechny znaky nemusí být vyobrazeny na podporu popisu zásadních znaků.

Charakteristiky a výhody příkladných provedení jsou podrobněji rozvedeny v následujícím popisu, který odkazuje na přiložené výkresy. Na těchto výkresech:

OBR. 1 je blokový diagram systému pro automatizovanou klasifikaci přesvědčení, názoru, sentimentu a emoce podle příkladných aspektů tohoto vynálezu;

OBR. 2 je blokový diagram počítačového systému podle jednoho příkladného aspektu tohoto vynálezu;

-3 CZ 2023 - 331 A3

OBR. 3 je blokový diagram systému pro automatizovanou klasifikaci emocí podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 4 je diagram cvičné architektury podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 5 je diagram adaptivního fungování klasifikačního systému emocí podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 6 je diagram znázorňující typy lingvistických pravidel podle příkladných aspektů tohoto vynálezu;

OBR. 7 je vzestupné uspořádání vrstev modulu pravidel podle příkladných aspektů tohoto vynálezu;

OBR. 8 je vývojový diagram způsobu fungování počítačového systému podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 9 je vývojový diagram kroků hodnocení použití lingvistických pravidel podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 10 je vývojový diagram detekování pravidel podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 11 je vývojový diagram přidělování skóre podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 12 je vývojový diagram detekování pravidel podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 13 je vývojový diagram určování číselné hodnoty pro pravidlo blízkosti tokenů podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 14 je vývojový diagram klasifikace podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 15 je vývojový diagram hybridního multimodelového učení podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 16 znázorňuje elektronickou čtečku podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 17 je vývojový diagram fungování elektronické čtečky podle jednoho příkladného aspektu tohoto vynálezu.

OBR. 18 je vývojový diagram systému multimediálních audioknih a klasifikátoru sentimentu vizuálně prostorových dat podle jednoho příkladného aspektu tohoto vynálezu.

OBR. 19 je blokový diagram modulu multimediálních pravidel podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 20 je vývojový diagram modulu odhalování pravidel založeného na HUNCH podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 21 A, 21B představují vývojový diagram odhalování pravidel ve zvukových médiích podle jednoho příkladného aspektu tohoto vynálezu;

-4CZ 2023 - 331 A3

OBR. 22 je graf vzorce řečového signálu;

OBR. 23 je vývojový diagram způsobu klasifikace emocí v reálném čase ve streamu videa/audia podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 24 znázorňuje zobrazovací zařízení podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 25 je systémový diagram adaptivního fungování klasifikačního systému emocí podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 26A, 26B, 26C představují schematický diagram elektronického náramku podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 27 je schéma zapojení elektronického náramku podle jednoho příkladného aspektu tohoto vynálezu;

OBR. 28 je systémový diagram prvků uživatelského rozhraní pro sociolingvistická data podle jednoho příkladného aspektu tohoto vynálezu; a

OBR. 29 je vývojový diagram řetězce sociolingvistického modulu podle jednoho příkladného aspektu tohoto vynálezu.

Příklady uskutečnění vynálezu

Popis uvedený níže ve spojení s přiloženými výkresy je zamýšlen jako popis různých provedení představovaného předmětu a není nutně zamýšlen tak, že představuje jediné (jediná) provedení. V určitých případech popis obsahuje specifické detaily za účelem umožnění pochopení představovaného (představovaných) provedení. Nicméně odborníkům v oboru bude zřejmé, že představovaná provedení je možné realizovat bez těchto specifických detailů. V některých případech mohou být známé struktury a komponenty znázorněny ve formě blokového diagramu, aby nedošlo k zamlžení konceptů představovaného předmětu.

Jakýkoli odkaz na Jedno provedení“ nebo „některá provedení“ nebo „některé provedení“ znamená, že konkrétní prvek, znak, struktura nebo charakteristika popisované ve spojení s daným provedením, je obsažen/a v alespoň jednom provedení. Případy výskytu spojení „v jednom provedení“ na různých místech v popisu nutně všechny nedokazují k témuž provedení. Zde používané modální výrazy jako mj. „může“, „mohl by“, „možná“, „například“ apod., pokud nebude uvedeno jinak nebo to nebude chápáno jinak v kontextu, v němž jsou použity, jsou obecně zamýšleny tak, že sdělují, že určitá provedení obsahují určité znaky, prvky a/nebo kroky, zatímco jiná provedení ne. Kromě toho je třeba si výrazy v jednotném čísle v této přihlášce a přiložených nárocích vykládat tak, že znamenají Jeden nebo více“ nebo „alespoň jeden“, pokud nebude uvedeno jinak.

Teď s odkazem na výkresy, na nichž stejné referenční číslovky označují identické nebo odpovídající si součásti na několika pohledech, se následující popis týká systému a způsobu automatizované klasifikace přesvědčení názorů, sentimentu a emocí. Uvedený způsob optimálně obsahuje modul lingvistických pravidel jako vstupní vrstvu do pravděpodobnostní vrstvy a vrstvu pro určování intenzity.

Jak bylo uvedeno výše, jazyk je neustále nový, a dokonce robustní nástroje, které dokážou pojmout tolik dat do paměti a efektivně se dívají oběma směry (např. BERT) nejsou vhodné pro vyvíjející se přirozený jazyk. Existuje bezpočet vět, jež mohou být vytvořeny v budoucnosti, které nemohou být vystiženy větami, jež se již vyskytly, a to včetně prvků jako splynulá slova, slang, žargon, metafory nebo nově vytvořená slova. Zaměření se na permutovatelné konstrukce a jejich využití

-5CZ 2023 - 331 A3 pro extrahovatelné dimenze přesvědčení, názorů, sentimentu a emocí umožňuje efektivnější, robustnější a přesnější detekci.

Rovněž při zpracování přirozeného jazyka je pravděpodobnost slabým indikátorem slovní intenzity, protože frekvence se nutně nerovná intenzitě. Pravděpodobnost se v představovaných provedeních jako taková používá jako signál, že ve stanovené části zadání v podobě přirozeného jazyka je přítomna emoce. Intenzita emoce se určuje zvlášť.

K analýze textu ve snaze porozumět sentimentu, emoci, názoru nebo přesvědčení, jež mohou být výslovné nebo implikované textem, se mohou používat různé techniky. Sentiment může být definován jako postoj, myšlenka nebo soud vyprovokované pocitem. Příbuzná sentimentu je emoce, která může být definovaná jako silný pocit jako láska, hněv, radost, nenávist nebo strach. Emoce může zahrnovat vědomou mentální reakci subjektivně vnímanou jako silný pocit a doprovázenou fyziologickými změnami v těle a změnami chování. Názor může být definován jako přesvědčení, soud nebo způsob myšlení o něčem. Přesvědčení může být něco, co je akceptováno, považováno za pravdivé nebo chápáno jako názor. Pro účely tohoto popisu vynálezu se bude pojem „emocionální kognice“ používat jako pojem k označení sentimentu, názoru i přesvědčení, emoce podle jejího běžného významu, soudu, a rovněž pocitů (afektu / touhy, emocionálních nebo sexuálních vazeb), interpersonálních / sociálních sil (afinity, společenství, vazeb, vlivu), kognitivních prvků (myšlenek, názorů, přesvědčení, postojů) a mezilehlého sentimentálního prostoru (aspirací, hodnot, motivací, litování).

Popisovaná provedení používají lexikální pravidla mající sémanticko-syntaktické konstrukce, předem obodované napříč mnoha dimenzemi a obsahující stavební bloky pro sémantické sentimentální logické operace. Měřítka pro vyhledávání pravidel činí značkování (tagování) jednodušším, rychlejším a empiričtějším, a tak snižují potřebu jemného vylaďování GPU (tj. jemného vylaďování předem vycvičeného transformátoru jako BERT, GPT2, GPT3), výpočtů shod nebo operací s velkým zatížením RAM. Navrhování pravidel přes pozorování dimenzionálních vzorců, sledování sentimentálních výskytů a pozorování sekvencí může rovněž ušetřit obrovský objem značkování zdrojů, přecvičování nebo používání zdrojů k přidávání epoch pro zvyšování přesnosti nebo vícenásobných modelů k řešení problémů s nejednoznačností. Logické odvozování dalších sentimentálních jevů prostřednictvím agregace / zpracování dimenzí umožňuje jednoduché zpracování typu vyhledání a spočítání po řádcích namísto masivních výpočtů, čímž se uvolňuje prostor pro nové výpočty (detekci symptomů duševního zdraví) bez potřeby nového nebo specializovaného cvičného souboru, nového úkolu nebo přidané vrstvy.

OBR. 1 je blokový diagram systému pro automatizovanou klasifikaci emocionální kognice podle příkladných aspektů tohoto vynálezu. Systém 100 obsahuje textový vstup 102, který přijímá text z různých zdrojů zahrnujících kontinuální proud dat, dialog na sociálních médiích, dokumenty i celé knihy. Text přijatý z textového vstupu 102 podstoupí proces 104 vyčištění a normalizace dat. Pro čištění dat a normalizaci textu jsou k dispozici různé nástroje, jež obecně zahrnují zbavení textových dat nechtěných znaků a standardizaci slov. Volby, které znaky jsou nechtěné, jsou závislé na uživateli. Například v některých případech mohou být nechtěná interpunkční znaménka. V některých provedeních se specifická interpunkční znaménka neodstraňují, ale namísto toho se mohou používat při pozdějším zpracování. Specifická interpunkční znaménka mohou zahrnovat čárky, uvozovky a vykřičníky. Interpunkční znaménka, která se mohou odstranit, mohou zahrnovat symboly jako zavináč (@), hashtag (#), dolar ($), procenta (%), šipku (^Λ), ampersand (&), a hvězdičku (*). V některých provedeních mohou být odstraněny značky jako HTML tágy. V některých provedeních mohou být emotikony ponechány nezměněné. Navíc může být text převeden na malá písmena. Vyčištěná a normalizovaná data se potom podrobí předběžnému zpracování 106, jež zahrnuje tokenizaci, označkování slovních druhů tágy, stematizaci a lemmatizaci. Při tokenizaci se text rozdělí na jednotlivé prvky (např. se vyčištěný text rozdělí v místech mezer). Při označkování slovních druhů, se slovním tokenům přiřadí značky udávající jejich slovní druh. Stematizace je proces převedení slova do jeho kořenné podoby. Lemmatizace je proces získání kanonického tvaru jednotlivých slov. Dalším úkolem může být odstranění

-6CZ 2023 - 331 A3 stopslov. Předem zpracovaná slova mohou být naformátována pro proces 108 učení bez učitele, systém 110 založený na pravidlech a proces 112 učení s učitelem. Typický způsob formátování předem zpracovaných slov spočívá v použití algoritmu word2vec od Google.

Proces 108 učení bez učitele může sloužit ke klasifikaci dat včetně klasifikace emocionální kognice. Proces 108 učení bez učitele nevyžaduje označkovaná data, ale namísto toho může shlukovat předem zpracovaná data do tříd. Vstup předem zpracovaných dat a výsledná klasifikace se mohou používat pro návrh 114 vlastností/pravidel. Volba 120 navržených pravidel a vlastností může být provedena k vytvoření budoucích lingvistických pravidel.

Systém 110 založený na pravidlech obsahuje předem stanovená lingvistická pravidla. Předem stanovená lingvistická pravidla mohou být uspořádána podle kategorií emocionální kognice.

Proces 112 učení s učitelem vyžaduje označkovaná data. Značkování emocionální kognice se může provádět manuálně. Proces 112 učení s učitelem se může používat ke strojové klasifikaci emocionální kognice 118. Chyby v klasifikaci je možné upravit/zkorigovat 122, aby se zlepšily pozdější klasifikace. Proces 112 učení s učitelem generuje neuronové modely k provádění vlastní klasifikace, pomocí níž se přiřazuje pravděpodobnost. Neuronové modely se rovněž cvičí na samotných pravidlech. Lokalizují podobné vektory spoluvýskytu, podobné vzorce slovních druhů a podobné n-gramy a navrhují je jako potenciální pravidla / navrhované vlastnosti.

Na výsledky procesu 108 učení bez učitele a procesu 112 učení s učitelem se může aplikovat tabelace a obodování pomocí skóre 116. Jak proces 108 učení bez učitele, tak proces 112 učení s učitelem může poskytnout pravděpodobnost pro každou třídu (např. za použití funkce softmax).

V jedné realizaci mohou být funkce a procesy systému 100 realizovány pomocí počítače 226. Dále je s odkazem na OBR. 2 uveden popis hardwaru počítače 226 podle příkladných provedení. Na OBR. 2 počítač 226 obsahuje centrální procesorovou jednotku (CPU) 200, která provádí zde popisované procesy. Data a instrukce procesů mohou být uložena v paměti 202. Tyto procesy a instrukce mohou rovněž být uloženy na úložném disku 204, jako je pevný disk (HDD), nebo na přenosném paměťovém médiu, nebo mohou být uložena vzdáleně. Dále nejsou nárokovaná vylepšení omezena formou počítačem čitelného média, na němž jsou instrukce procesu podle předkládaného vynálezu uloženy. Například mohou být instrukce uloženy na CD, DVD, na FLASH paměti, RAM, ROM, PROM, EPROM, EEPROM, pevném disku nebo libovolném jiném zařízení pro zpracování informací, s nímž počítač 226 komunikuje, jako je server nebo počítač.

Dále mohou být nárokovaná vylepšení provedena formou pomocné aplikace, démonu na pozadí nebo komponenty operačního systému nebo jejich kombinace běžících ve spojení s CPU 200 a operačním systémem, jako je Microsoft® Windows®, UNIX®, Oracle® Solaris, LINUX®, Apple macOS® a jiné systémy známé odborníkům v oboru.

K vytvoření počítače 226 mohou být hardwarové prvky realizovány za použití různých prvků elektrických obvodů, jež jsou odborníkům v oboru známé. Například CPU 200 může být procesor Xenon® nebo Core® od společnosti Intel Corporation of America nebo procesor Opteron® od společnosti AMD of America nebo se může jednat o jiné typy procesorů známé odborníkovi s běžnými znalostmi v oboru. Alternativně může být CPU 200 realizována na bázi FPGA, ASIC, PLD nebo za použití diskrétních logických obvodů, j ak bude odborník s běžnými znalostmi v oboru znát. Dále může být CPU 200 realizována jako několik procesorů, jež paralelně spolupracují na provádění výše popsaných procesů podle předkládaného vynálezu.

Počítač 226 na OBR. 2 rovněž obsahuje síťový kontrolér 206, jako je síťová karta Intel Ethernet PRO od společnosti Intel Corporation of America, pro propojení se sítí 224. Jak je možné uznat, síť 224 může být veřejná síť, jako je internet, nebo privátní síť, jako je síť LAN nebo WAN, nebo jejich libovolná kombinace, a může rovněž zahrnovat podsítě PSTN nebo ISDN. Síť 224 může být rovněž připojena kabelem jako síť Ethernet nebo může být bezdrátová jako celulámí síť včetně

-7 CZ 2023 - 331 A3 bezdrátových celulámích systémů EDGE, 3G a 4G. Bezdrátovou sítí může být rovněž WiFi®, Bluetooth® nebo jiná známá bezdrátová forma komunikace.

Počítač 226 dále obsahuje grafický kontrolér 208, jako je grafická karta NVIDIA® GeForce® GTX nebo Quadro® od společnosti NVIDIA Corporation of America, k propojení s displejem 210, jako je LCD monitor Hewlett Packard® HPL2445w. Univerzální I/O (vstupní/výstupni) rozhraní 212 je propojeno s klávesnicí a/nebo myší 214, a rovněž s volitelným dotykovým panelem 216 nebo haptickým zařízením na displeji 210 nebo odděleným od něj. Univerzální I/O rozhraní rovněž slouží k připojení k množství periferních zařízení 218 včetně tiskáren a skenerů jako OfficeJet® nebo DeskJet® od společnosti Hewlett Packard®. I/O rozhraní 212 může rovněž sloužit k připojení mikrofonu pro hlasový vstup a reproduktorů a/nebo sluchátek pro zvukový výstup. Mikrofon a/nebo sluchátka mohou být připojeny k I/O rozhraní 212 přes vstupní port, jako je USB, HDMI nebo jiná vstupní přípojka periferních zařízení.

Univerzální paměťový kontrolér 220 spojuje úložný disk 204 s komunikační sběrnicí 222, kterou může být ISA, EISA, VESA, PCI nebo podobná sběrnice, k propojení všech komponent počítače 226. Popis obecných vlastností a funkcí displeje 210, klávesnice a/nebo myši 214 i grafického kontroléru 208, paměťového kontroléru 220, síťového kontroléru 206 a univerzálního I/O rozhraní 212 je zde pro zestručnění vypuštěn, protože tyto prvky jsou známé.

OBR. 3 je blokový diagram systému pro automatizovanou klasifikaci emocí podle jednoho příkladného aspektu tohoto vynálezu. Systém 300 obsahuje modul 312 klasifikace multimédií. Multimédia mohou zahrnovat video, audio a text. Multimédia mohou zahrnovat psaná nebo titulkovaná multimédia jako audioknihy, vizuálně prostorová multimédia jako filmy, televizní pořady, rozšířená realita nebo virtuální realita, jež se přepíší a načtou do systému 300. Textová a přepsaná média jsou přijímána jako vstupní text 302. Vstupní text 302 je zpracován v modulu 304 pro předběžné zpracování k převedení textových dat do podoby potřebné k porovnávání s pravidly 306, 308, 310 a k zadání do modelů 320 strojového učení. V některých provedeních předběžně zpracovaná textová data projdou přes pravidla přirozeného jazyka (306). Když pravidla vyhovují textovému nebo přepsanému médiu, říká se, že pravidlo je spuštěno. Vizuálně prostorová pravidla 310 mohou obsahovat pravidla pro vizuální vodítka. Pravidla 308 mluvené řeči mohou obsahovat pravidla pro řečové signály.

Emocionálně kognitivní senzor (314) zpracuje vstup na úrovni věty, odstavce, pasáže, scény nebo kapitoly a klasifikuje jej vždy pomocí tágu dané emoce, kognice, sentimentu, založeného na stavu, dynamice nebo rysu. Když je spuštěno nějaké pravidlo, je detekovaná emoce. Rovněž lingvistická pravidla mají hodnocení založená na dimenzích. V některých provedeních jsou hodnoty dimenzí pro určité pravidlo uloženy jako vektor. Emoce lze dedukovat z „tvaru“ dimenzí. Vlastnosti emocí zahrnují tvar vektoru dimenzí, hodnoty dimenzí a odlišnost od výpočtů nebo podobnost s výpočty odvozenými od jiných vektorů patřících k danému pravidlu. Výstup pravidel 306 přirozeného jazyka je zaveden do emocionálně kognitivního senzoru 314 a senzoru 316 hodnocení intenzity, jež umožňují převedení jinak kvalitativních dat na kvantitativní data pro analýzu populace jako u vědecké studie nebo politického průzkumu.

Senzor (316) hodnocení intenzity určuje hodnocení intenzity pro každou detekovanou emoci na základě dimenzí. V některých provedeních senzor (316) hodnocení intenzity přiřazuje objektivní hodnocení intenzity na základě subkomponent každého kognitivního, emocionálního, sociálního, interpersonálního nebo stavového prvku jako dimenze.

Modul (318) emocionálně kognitivního značkování přiřazuje textovým datům tag přidělené třídy emoce. K emoci a intenzitě emocionální kognice mohou být přiřazena metadata jako demografické informace, vlastnosti online profilu, časové známky, zdroje, geografické lokality. Výsledek agregovaných emocionálně kognitivních stavů pro vzorek populace a označkování emocionálně kognitivních stavů jsou vráceny do modulu 318 emocionálně kognitivního značkování.

-8CZ 2023 - 331 A3

Modul 326 odhalování pravidel může generovat nová pravidla, rovněž označovaná jako návrh pravidel. Modely 320 strojového učení se mohou cvičit na samotných pravidlech. Vycvičené modely 320 strojového učení mohou lokalizovat podobné vektory ko-výskytu, podobné vzorce POS a podobné n-gramy a navrhnout je jako potenciální nová pravidla. Navíc mohou být k vytváření nových pravidel použity vzorce emocí tak, jak jsou detekovány emocionálně kognitivním senzorem (314), i vzorce dimenzí.

Modul 320 modelů strojového učení může obsahovat libovolný model nebo modely strojového učení zvolené z transformátorových modelů, jako je BERT, RoBERTa, metoda podpůrných vektorů, word2vec, model KNN, model dlouhé krátkodobé paměti, model konvoluční neuronové sítě.

Modul 322 statistických modelů může obsahovat jeden nebo více statistických modelů. Statistické modely mohou obsahovat libovolný statistický model nebo modely z modelu k-means, Bayesova modelu, modelů prohledávání dokumentů, modelu logistické regrese, modelu lineární regrese, modelu polynomické regrese, matric doporučení, modelu náhodného lesa a ngramového jazykového modelu. Každý statistický model se používá jako klasifikátor.

Lexikální modul 324 poskytuje lexikony, jež se mohou používat v systému 300. Mezi zdroje lexikonů patří NRCLex, Harvard Inquirer, MPQA, sentiwordnet, textblob, VADER a další lexikony, jež nejsou výslovně uvedené.

V některých provedeních může agregovaný emocionálně kognitivní souhrnný klasifikátor 328 vydat konečnou odpověď, jako je emoce. Náhodný les se může používat jako souhrnný klasifikátor za použití kódování one-hot. V dalším provedení může být k vytvoření souhrnu použita logistická regrese. V jednom dalším provedení se jako výstup provedení souhrnu může používat neuronová vrstva. Výstup může obsahovat spojení sentimentu a intenzity emocionálně kognitivního sentimentu s metadaty, jako jsou demografické informace, vlastnosti online profilu, časové známky, zdroje, geografické lokality. Výstupem může být obrazové nebo grafické znázornění emocionálně kognitivního souhrnu uživatele, značky, podniku, slavné osobnosti, organizace, tématu, slova nebo fráze za časové období nebo k časovému bodu za použití geometrického vyobrazení založeného na barvách. Volitelně může výstup zahrnovat protokol k libovolnému danému času nebo za časové období popisující dimenze, emoce, dynamiku nebo společenské proudy pro demograficky nebo jinak segmentovaný nebo agregovaný vzorek. Volitelně může výstup zahrnovat vytvoření zobrazení distribuce emocionálně kognitivního stavu pro dané časové období pro emocionálně kognitivní stavy jednoho nebo agregovaných uživatelů v čase nebo k časovému bodu.

OBR. 4 je diagram cvičné architektury podle jednoho příkladného aspektu tohoto vynálezu. Aby se mohlo pracovat s vyvíjejícím se přirozeným jazykem, cvičná architektura 400 za použití modulu 320 modelů strojového učení cvičí modely strojového učení ve vytváření pravidel. Modely strojového učení se rovněž cvičí na samotných pravidlech. Lokalizují podobné vektory ko-výskytu, podobné vzorce POS a podobné n-gramy a navrhují je jako potenciální nová pravidla.

Model 310 lingvistických pravidel začíná souborem předprogramovaných lingvistických pravidel, která je možné aplikovat na fráze a věty přirozeného jazyka. Detekce může zahrnovat potenciální porovnání těchto pravidel, rozpoznání podobnosti a vytvoření pravidel, jež používají zřetězení potenciálních prvků pravidel (typy pravidel). Vytváření pravidel může probíhat prostřednictvím identifikace řetězců s dostatečnou podobností za použití prahové hodnoty, a potom vytvoření uspořádaných n-tic každého slova se slovem, slovním druhem, závislostí, kmenem a lemmatem a porovnání mezi podobnými položkami na základě indexové pozice za účelem nalezení shodující se části každé n-tice. Výsledky potom mohou být zřetězeny s volitelnými částmi nebo divokými kartami nebo výpočty blízkosti podle potřeby do zřetězeného vzorcového pravidla.

-9CZ 2023 - 331 A3

Cvičná architektura 400 obsahuje textový vstup 302 pro přístup k množství datových položek přirozeného jazyka přes obvody pro zpracování a paměť. Uvedené množství datových položek přirozeného jazyka je možné načíst z datového úložiště neboje možné zadat je přímo jako proud textu. Text může zahrnovat zaznamenaný, přepsaný nebo přeložený text, který pochází ze záznamu lidské řeči, textových databází, dokumentů nebo jiných zdrojů textových dat.

Cvičná architektura 400 obsahuje předběžný procesor 304 k provádění různých předběžných procesů, jež se typicky provádějí s textem při zpracování přirozeného jazyka. Předběžný procesor 304 může využívat kterékoli ze známých knihoven k normalizaci, tokenizaci, značkování slovních druhů, určování závislostí, stematizaci a lemmatizaci za účelem vygenerování množství předem zpracovaných datových položek přirozeného jazyka. Jedním příkladem softwarových knihoven je Natural Language Toolkit (sada nástrojů přirozeného jazyka) (NLTK). NLTK obsahuje knihovny pro zpracování textu používané pro klasifikaci, tokenizaci, stematizaci, značkování pomocí tagů a syntaktickou analýzu. NLTK obsahuje lemmatizátor WordNet mající funkci lemmatizace a množství dalších lemmatizátorů. Normalizace může být prováděna jako kanonická normalizace.

V některých provedeních může cvičná architektura 300 zahrnovat označkování množství předem zpracovaných datových položek přirozeného jazyka značkou pro emoci a intenzitu vyjádřené emoce. Značky a přiřazené datové položky přirozeného jazyka se mohou používat k procvičování modelu učení s učitelem.

Cvičná architektura 400 poskytuje množství předem zpracovaných datových položek přirozeného jazyka paralelně s modulem 320 modelů strojového učení a modelem 306 lingvistických pravidel. Cvičná architektura 400 provádí paralelní cvičení modulu 320 modelů strojového učení a modelu 306 lingvistických pravidel ve více cvičných epochách k identifikování emoce v datech přirozeného jazyka a k určení intenzity emoce. Každá cvičná epocha modulu 320 modelů strojového učení může na základě rozhodnutí 412 vygenerovat návrhy 326 vlastností nebo pravidel pro následné cvičné epochy modulu 306 lingvistických pravidel. Po každé cvičné epoše modulu 306 lingvistických pravidel se následné epochy modulu 320 modelů strojového učení shrnou do tabulek a obodují (bodovací skóre označují pravděpodobnost každé třídy). V kroku 414 se výstup představující vycvičený modul 320 modelů strojového učení a vycvičený modul 306 lingvistických pravidel uloží do trvalé paměti.

OBR. 5 je systémový diagram adaptivního fungování systému klasifikace emocí. Modul 326 odhalování pravidel může generovat nová pravidla, přičemž předkládá informace o emocích a o intenzitě jako výstup.

Pro podporu při realizaci bude fungování systému klasifikace emocí popsáno na příkladu. Tento příklad je zjednodušený, aby bylo usnadněno porozumění. Předkládaný vynález se v žádném případě na uvedený příklad neomezuje. V tomto příkladu je vstupem 302 text označený hashtagem „Why am I the one who ‘needs’ to take out the trash? #NOTANEED“ (proč jsem jediný, kdo ,potřebuje‘ vynášet odpadky?) načtením textu ze souboru nebo jako kontinuální proud, který je zadán do počítačového systému. Tento textový vstup je zpracován modulem 304 pro předběžné zpracování, který provádí funkce zahrnující označkování vstupního textu tágy indexových pozic, tokenizaci vstupního textu a vydělení zadaného hashtagu. V některých provedeních je hashtag komponentou, která má přiřazenou emoci. Indexová pozice může být celé číslo, které udává pozici vzhledem k celkovému textu, například pořadové číslo, které je vygenerováno počítadlem nebo v rámci tokenizované vstupní sestavy. Alternativně může indexovou pozicí být index jako pozice vektoru, číslo řádku nebo nějaké vstupní číslo, které označuje, kde v sekvenci textu s hashtagem se aktuální textový vstup objevuje. Funkce tokenizace může selektivně vydělit interpunkční znaménka jako „?“ jako tokeny a jiná může odstranit. Například uvozovky kolem „needs“ (potřebuje) mohou být zachovány, aby byl signalizován důraz. Hashtag může být vydělen od ostatního textu, aby bylo možné k němu přistupovat jako k identifikátoru spíše než k emocionálnímu výrazu. V některých provedeních se může hashtag používat jako pomocný signál emoce. V tomto příkladu může hashtag signalizovat, že vstupní text je sarkasmus. Hashtagy se

-10 CZ 2023 - 331 A3 mohou používat k signalizaci důrazu, komentáře / postranních poznámek, subtweetů, organizace, pokračujícího výrazu, humoru, kontextu, emocí, marketingu, protestu.

Modul přirozeného jazyka má funkci vyhledání mezi pravidly 306 přirozeného jazyka pravidla nebo pravidel, které vyhovují vstupnímu textu. Pravidlo může udávat textový vzorec s určitými vyžadovanými slovy nebo frázemi v kombinaci se syntaxí. Například vyhovujícím a spuštěným vzorcem je pravidlo jako ,,[proč]“[... ] + existenciální sloveso + „ten, který“ + sloveso.

Pravidla jsou seskupena podle emocí a kognitivních pojmů a smíšených emocionálně kognitivních pojmů. Emocionálně kognitivní senzor 314 má funkci aplikace emocionálně kognitivní značky (HNĚV) na základě spuštěného pravidla.

Senzor 316 hodnocení intenzity má funkci aktivace dimenzí pro dané spuštěné pravidlo, jež může zahrnovat 3 dimenze se skóre - pozitivní, negativní, neutrální nebo prázdná, přičemž dimenzemi je například respekt, ego, obvinění. Hodnoty skóre dimenzí nejsou jako takové omezené a mohou zahrnovat číselné hodnoty v předem stanoveném rozsahu. Senzor 316 hodnocení intenzity má funkci agregace skóre dimenzí k získání skóre intenzity. Senzor 316 hodnocení intenzity přiřadí skóre intenzity emocionálně kognitivní značce a porovná skóre intenzity s předem stanovenou prahovou hodnotou. Předem stanovenou prahovou hodnotou může být zlomková hodnota jako 0,6, celé číslo v určitém rozsahu jako 6 v rozsahu 0 až 10, procentuální hodnota jako 60 %, která je společná mezi všemi emocemi, nebo může být nastavena pro každou emocionálně kognitivní značku. V tomto příkladu je podle prahové hodnoty úroveň emocionální intenzity označena (HNĚV — STŘEDNÍ). V některých provedeních se skóre intenzity může rovněž vztahovat k mluvčímu, když je známá základní úroveň mluvčího.

Meta emocionálně kognitivní agregátor 328 má fúnkci zhodnocení emocionálně kognitivní značky a zkombinováním značky s ostatním okolními značkami vytvoření vzorce emocionálně kognitivních značek, např. HNĚV^_VYROVNANOST.

Na další úrovni má dynamika 610 funkci porovnání vzorce emocionálně kognitivních značek s dynamickým vzorcem. Dynamika 610 přiřadí značku na základě odpovídajícího dynamického vzorce, např. SHOVÍVAVOST.

OBR. 6 je diagram znázorňující typy lingvistických pravidel podle příkladných aspektů tohoto vynálezu. Typy lingvistických pravidel pro sentiment, emoci, názor a přesvědčení, jež se aplikují na stanovenou část vstupu přirozeného jazyka, mohou zahrnovat pravidlo, j ež využívá značkování slovních druhů pomocí tagů, syntax nebo závislostní syntaktickou analýzu (502) včetně: např. modálních a optativních sloves, notace časů, deklinace, konjugace, přízvuků i přímých objektů a vlastních jmen, pravidlo, jež využívá porovnávání řetězců včetně přesného, nepřesného, maskovaného nebo s divokou kartou (504), pravidlo, jež využívá vzdálenost mezi tokeny (506), pravidlo, jež využívá interpunkci (508), pravidlo, jež využívá lemmatizaci (510), pravidlo, jež využívá stematizaci (512), pravidlo, jež využívá lexikon (514), a pravidlo, jež využívá vyhledávání slov nebo slovník (516).

-11 CZ 2023 - 331 A3

V některých provedeních mohou komponenty pravidel obsahovat grafický obsah včetně emodži, glyfů, emotikonů, znaků, skriptů a libovolných jiných grafémů. Aplikováním lingvistických pravidel na stanovenou část vstupu přirozeného jazyka se získá číselná nebo Booleovská hodnota pro každé z jednoho nebo více lingvistických pravidel.

V některých provedeních přídavné typy lingvistických pravidel zohledňují další světové jazyky včetně japonštiny, korejštiny, čínštiny, vietnamštiny a dalších asijských jazyků. Uvedené přídavné typy lingvistických pravidel mohou zahrnovat pravidlo, které značkuje závislosti pomocí tagů, pravidlo nebo pravidla, jež detekují částice, pravidlo nebo pravidla, jež detekují markéry, pravidlo nebo pravidla, jež detekují strukturálně narativní síly včetně tématu, subjektu a predikátu, pravidlo nebo pravidla, jež označí třídy substantiv seskupených podle shodných vlastností, pravidlo nebo pravidla, jež detekují pády včetně nominativu, ablativu a dalších, pravidlo nebo pravidla, jež detekují gramatické kategorie sloves, pravidlo, které detekuje přepisy kliknutí, pro zaznamenání sémantických informací z kliknutí pomocí myši, touchpadu, dotykového displeje.

V některých provedeních mohou lingvistická pravidla zahrnovat operátor NEBO pro volitelné podmínky a operátor zřetězení pro kombinované podmínky. V některých provedeních mohou lingvistická pravidla obsahovat vnitro-pravidlové odkazy, které odkazují k jiným částem pravidla. Vnitro-pravidlový odkaz může zahrnovat zdvojení nebo replikaci: ADJ + SUBST + SUBST s podmínkou, že SUBSTANTIVUM je bezprostředně předcházející SUBSTANTIVUM. Vnitropravidlový odkaz může obsahovat index pro pozice v pravidlu: zástupný znak nebo poziční prvck|01 v pravidlu.

V některých provedeních mohou být vnitro-pravidlové odkazy pro lingvistická pravidla ve formě vzorců. Vzorec může obsahovat: SUBST -> SUBST pro zdvojení, SUBST l+SUBST pro nezdvojení.

Lingvistická pravidla jsou seskupena podle typů emoce nebo kognice. V některých provedeních mají pravidla pořadí důležitosti a pořadí se může měnit k signalizaci přednosti před pravidly pod ním a následnosti za pravidly nad ním. Každé lingvistické pravidlo má jednu nebo více dimenzí a hodnotu pro každou dimenzi. V jednom provedení mohou dimenze zahrnovat sentiment, emoci, emocionálně kognitivní postoje, hodnoty, sociální zvyky, nastavení mysli, rozhledy, pohledy, odezvy, rysy, přesvědčení, názory, perspektivy, motivace, předpojatost, stavy, způsoby, přístupy, dynamiku, osobnostní rysy, emocionální přístup, emocionální volbu, reakci, dispozici, dočasný stav, změnu stavu, kognitivní aspekt, behaviorální aspekt, vnitřní stav, vnější stav, pocit, emoci, propozici, postoj, propoziční postoj, směrovaný postoj, nesměřovaný postoj, postoj směrovaný k sobě, vědomou emocionální kognici, nevědomou emocionální kognici. V jednom provedení mohou dimenze zahrnovat emocionální afekty: strachu, anticipace, znechucení, strachu, radosti, smutku, překvapení a důvěry (z NRCLex). V dalším provedení mohou dimenze zahrnovat, ale neomezují se na stránky, komponenty a aspekty emocionální kognice, jako je: ego, obviňování, konformita, posvátnost, laskavost, respekt, čas (budoucí), (sebe) obliba, schvalování, upřímnost, zranitelnost, soud, odstup, účel, formálnost, minimalizace, specifičnost, síla, akce (aktivita), aktivní působení, zvědavost, zřejmost, záměr, důraz, energie, jistota, zájem, zapojení, šok /

-12 CZ 2023 - 331 A3 překvapení, napětí, rychlost, nuance, logika, paranoia, víra, distance, identifikace s, (sebe) uznání, uznání (jiných), objektifikace, přilnutí, empatie a trpělivost.

V některých provedeních mohou být dimenze seskupeny do kategorií, jako je osobnostní rys, přesvědčení, názor, perspektiva, přístup, motivace, předpojatost, stav, emocionální přístup / volba, způsob, reakce, interpersonální dynamika.

Autoři vynálezu zjistili, že i zcela přesná klasifikace dokáže i tak poskytovat velmi omezené sémantické informace. Například „hodnocení přesnosti“ vždy neodráží užitečné sémantické informace, když přijde na detekci afektu. Značky pro afekty mohou být příliš vágní (ve snaze nacpat více než 25 emocí do šesti značek). Klasifikace může nadále postrádat užitečné subtextové informace a může postrádat orientaci na kognitivní stav mluvčího. Klasifikace neposkytuje signály, proč je určitý pocit přítomen. Věty, fráze nebo konstrukce zůstávají špatně klasifikované s ohledem na konkrétní afekt a hlubokou sémantickou hodnotu, analyzované na úrovni věty, když jsou často natlačeny do jediné třídy tam, kde by se mělo aplikovat více značek, nebojím strojové algoritmy nedokážou přesně porozumět v důsledku složitosti a hloubky lidské emoce. Navíc, i když lze z konverzace vytěžit další informace, hodnota diskurzního textu je doposud omezena na přístupy založené na kontextových vodítkách, jako je rozpoznání jmenované entity a specifické informace mluvčího, jež toho poskytují málo o afektivních stavech.

Navzdory existenci nejmodemější technologie, jako jsou transformátory, ty historicky vynikly pouze v predikčních a překladových úkolech spíše než v sémantické interpretaci (částečně kvůli slabšímu celkovému výkonu u sémantických úkolů). Transformátory mají konečné omezení ve své sémantické schopnosti kvůli mezeře mezi lidskou a strojovou interpretační schopností. Mezi sémantická omezení, obzvláště při interpretaci improvizované řeči a textu, patří schopnost identifikovat smíšené emoce, komplexní emoce, figurativní výrazy a neupřímné emoční výrazy (jako je sarkasmus, ironie, zdvořilost a pasivní agrese). Popisovaná provedení představují přístup k zvládání rozsahu a hloubky lidských emocí a kognice.

OBR. 7 je vzestupné uspořádání vrstev modulu pravidel. „Dimenze“ (702) j sou prvky emocionálně kogitivního výrazu a pocitů a myšlenek za ním. V některých provedeních je systém realizován za použití objektově orientovaného programování a emoce jsou třída mající soubor dimenzí jakožto atributů třídy. Intenzita je metoda třídy emocí a používá se k určování hodnoty intenzity na základě přítomnosti dimenzí. Hodnoty intenzity mohou být ukládány do strukturované nebo nestrukturované databáze. Třída emocí má prototypické hodnoty pro každý z atributů/dimenzí. Hodnoty dimenzí jsou drobné valence s trinámími hodnotami (+1 pozitivní platnost, -1 negativní platnost, 0 neutrální platnost a 0 není přítomna / není relevantní; přičemž poslední 2 nejsou ekvivalentní). V některých provedeních hodnoty pro dimenze obsahují vrstvy Booleovských hodnot, jako je (1) PRAVDA-NEPRAVDA (neutrální versus ne), (2) PRAVDA-NEPRAVDA (pravdivá versus nepravdivá), (3) potenciálně podobně s prázdnou hodnotou. Hodnoty mohou mít podobu čísel s plovoucí desetinnou čárkou nebo celých čísel.

Pro každý datový řádek tyto dimenze dostávají hodnocení vždy při spuštění pravidla. Takže pro ilustraci například („[proč / jak to, že] + EXISTENCIÁLNÍ SLOVESO + ZÁJMENO + [ČASHYPERBOLA] + ten/ti, který/kteří + SLOVESO“), což označuje konstrukci s:

volitelnou položkou ze seznamu slov (ze 2 položek: „proč“ nebo , jak to, že“) + existenciálním slovesem plus zájmenem (v češtině nevyjádřeným) (,jsi“ / Jsem“ / Jsou“ / Jsme“ / Je“ atd.) + volitelnou položkou ze seznamu slov pro časovou hyperbolu („vždycky“, „nikdy“, „neustále“ atd.) +

- 13 CZ 2023 - 331 A3 fuzzy (nepřesným řetězcem) („ti, kdo“, „ten, kdo“) + v podstatě jakýmkoli slovesem („sedí vepředu“, „všechno zaplatí“, „vyvolává problémy“, „dostane snadnou práci“ atd.) Toto pravidlo používá části, které jsou modulární, a pokrývá určitý stupeň permutace.

Systém detekuje jádrový dimenzionální profil dané emoce. Různá pravidla vyhledávají výrazné a částečné, ale silně se shodující konfigurace, jež představují různá vyjádření emocionálních stavů. Jinými slovy emoce jsou mentální stavy. Prvotní emoce jsou čisté a neodůvodněné (např. strach, hněv, štěstí, smutek). Komplexní emoce jsou sociálnější a kognitivnější (např. zármutek, deprese, hanba, nejistota, obdiv). Komplexní emoce nastávají při společném výskytu kognitivních stavů a emocionálních stavů, nebo když se více emocí vyskytuje zároveň. Když jsou pravidla aktivována, dávají signál, kdy se takové emocionální stavy vyskytují.

Čím více dimenzí odpovídá konkrétní emoci, tím vyšší je intenzita dané emoce. Následkem toho je měřítko intenzity objektivním měřítkem a představuje stupeň intenzity. V některých provedeních, když se stejná konstrukce vyskytne dvakrát ve vstupním textu, odpovídající konstrukce se počítá při obou výskytech. Při měření intenzity se skóre dimenzí normalizují na počet slov. To znamená, že hodnoty jsou založené na hustotě.

V příkladném provedení existuje 50 dimenzí. V některých provedeních je počet dimenzí větší. Každé pravidlo má hodnocení přes celý soubor dimenzí.

Každé pravidlo 704 obsahuje jednu nebo více dimenzí. Pro výše uvedené pravidlo je jednou příkladnou dimenzí ego. Ego může být nepřítomno v dané konstrukci (nemá s ní nic společného — prázdná hodnota), být neutrální (komponenta ega se vyskytuje, ale je velmi vyvážená a objektivní), být pozitivní (egoistická, povýšená) nebo negativní (obdivná, prosebná, nenávistná k sobě atd.). Ego je dimenze, která se hodnotí u tohoto pravidla. Další dimenzí je zvědavost. Tato konstrukce detekovaná tímto pravidlem je proaktivně zvědavá, atak dostává hodnocení +1.

Pravidla 704, jakmile jsou aktivovaná, signalizují detekované emoce. Jakmile jsou emoce detekovány (v části věty, kde se vyskytují; provede se označkování pomocí tagů za použití indexové pozice namísto jednoduše na úrovni věty nebo pasáže, což umožňuje lepší rozlišení a přehlednost), je možné identifikovat komplexní emoce 706, a ty jsou obvykle složeny ze simultánních emocí. Například pohrdání je kombinací pýchy / povýšenosti a hněvu. Kromě toho se mohou emocionálně kognitivní stavy překrývat.

Jakmile jsou na místě aktivovány komplexní a prvotní emoce, je možné ohodnotit vzorce 708 emocí, protože emoce v určitých situacích přirozeně přecházejí do jiných emocí. Navíc mohou emoce postupovat, eskalovat nebo se vyřešit. Vzorce 708 emocí se vytvářejí zřetězením emocí do uspořádané sestavy nebo řetězce emocí (např. NADĚJE + OČEKÁVÁNÍ + PŘEKVAPENÍ + SMUTEK). Tyto vzorce lze do určité míry hodnotit jako skip-gramový model s omezenými možnostmi. Vzorce pro přechod emocí, postup emocí, eskalaci emocí a řešení emocí jsou uloženy jako rozpoznatelné emocionální vzorce.

Vzorce emocí se mohou používat k predikování toků emocí: nadšení přecházející do přijetí a do uklidnění; hněv přecházející do zmatení, uvědomění a zpět do lásky s tím, jak porozumění narůstá a vyvíjí se empatie nebo shovívavost atd.

Z emocionálních vzorců se vybuduje dynamika 710. Dynamika 710 představuje popisné značky pro hlavní emocionální události, jež shrnují vzorce emocí. Například dynamika „ZKLAMANÍ“ je značka pro emocionální vzorec NADĚJE + OČEKÁVÁNÍ + PŘEKVAPENÍ + SMUTKU. Dynamika může nastávat vzhledem k sobě samému - to je obvykle komplexní emoce. Dále může

-14 CZ 2023 - 331 A3 dynamika nastávat s někým jiným / interpersonálně - to může být jev jako shovívavost. V takovém případě je SHOVÍVAVOST značka pro emocionální vzorec HNĚV + UVĚDOMĚNÍ + UÁSKA.

Vrstva nad dynamikou 710 může zahrnovat společenské proudy 712, což jsou meta-výsledky silné emocionální dynamiky en masse, často vrcholící v důsledku tlaku velkých událostí nebo masových hnutí - jako jsou nepokoje nebo inovace. Velké události mohou zahrnovat nadcházející události ve skutečném světě (výbuch hněvu, převrat, povstání, pop-kultumí nebo společenský trend, událost na akciovém trhu jako vykoupení akcií GameStop, „zrušení“ veřejné osobnosti, bod zlomu k vypuknutí násilí atd.) Tyto společenské proudy mohou rovněž být přítomny v menších společenských skupinách, jak tomu je u bodů zlomu domácího násilí, zamilování se, výbuchu hněvu atd. Detekování společenských proudů umožňuje reakci / prevenci nebo využití či alespoň pasivní sledování / identifikaci. Takové události mohou být korelovány se specifickými minulými takovými událostmi v reálném světě s těmito společenskými proudy, což umožňuje rychlou reakci, prevenci nebo využití, pokud je možné podobné události rychle detekovat nebo predikovat v budoucnosti. Výpočet emocionálně kognitivních stavů, dimenzí, dynamiky nebo společenských proudů z přirozeného jazyka od jednoho nebo více uživatelů přes pravidla 306 přirozeného jazyka.

V některých provedeních je možné každou úroveň emocionálního / kognitivního toku predikovat pro tyto vrstvy na základě historických dat ukládaných v průběhu používání klasifikačního systému.

OBR. 8 je vývojový diagram způsobu fungování počítačového systému podle jednoho příkladného aspektu tohoto vynálezu. Jedno provedení se týká procesu sledování psychologického afektu s jemnými nuancemi v obsahu přirozeného jazyka. V rámci tohoto způsobu se nejprve aplikují lingvistická pravidla pro emoce na konstrukce, fráze nebo věty přirozeného jazyka, přičemž každé pravidlo má jednu nebo více dimenzí. Výsledky aplikace lingvistických pravidel se použijí k detekování emoce a určení intenzity emoce. Pomocí modelu strojového učení se navrhnou nová lingvistická pravidla, takže tento model slouží k rozšíření aplikace lingvistických pravidel. Tento proces může být prováděn v zařízení majícím textový a/nebo hlasový vstup a textový, řečový a/nebo grafický výstup. Počítačový program obsahuje instrukce uložené na počítačem čitelném paměťovém médiu, které, když jsou prováděny počítačovým systémem, jako je systém na OBR. 2, provádějí kroky, jak jsou znázorněny ve vývojovém diagramu.

V kroku S802 je počítač 226 nakonfigurován k přijímání obsahu přirozeného jazyka jako textu, který může být odvozen od textového a/nebo hlasového vstupu. Obsah přirozeného jazyka může být načten ze souboru uloženého na diskovém úložišti 204 nebo může být načten z proudu dat přijímaného na síťovém kontroléru 206 nebo z textového zadání na klávesnici 214 nebo z textu z hlasového vstupu přes mikrofon. Navíc může vstup zahrnovat agregaci dat z online nebo offline databáze, dotazu, získaných z historického archivu nebo korpusu nebo extrahovaných z internetových stránek, jako jsou sociální média nebo internetové stránky recenzí uživatelů. Vstup může být nevyžádaný nebo vyžádaný a může se týkat tématu, osoby, značky, organizace, konceptu, slova nebo skupiny slov. Vstup může obsahovat data z rozhovorů, přepsaná nebo jinak získaná od účastníků průzkumů, výzkumu trhu nebo akademických studií. V některých provedeních může vstup obsahovat časové známky, které je možné číst ve spojení s obsahem přirozeného jazyka.

U velkých úseků textu, které mohou překračovat velikost vstupního textu, který zpracovává modul 306 pravidel přirozeného jazyka nebo modul 320 modelů strojového učení, jeden přístup spočívá v načítání vstupu za použití posuvného okna o pevné velikosti. Ve volitelném kroku S804 je počítač 226 nakonfigurován tak, aby aplikoval čtecí okno o pevné délce na obsah přirozeného jazyka. Délkou může být počet znaků. Čtecí okno se může o určitý počet znaků překrývat mezi po sobě následujícími pohyby čtecího okna. V kroku S806 je počítač 226 nakonfigurován tak, aby vyhodnotil obsah přirozeného jazyka za použití lingvistických pravidel pro každou emoci, aby se získaly lingvistické rysy pro lidské dimenze emoce. Jak bylo popsáno výše, lingvistická pravidla jsou za použití vzorců přiřazena k obsahu přirozeného jazyka.

-15 CZ 2023 - 331 A3

V kroku S808 je počítač 226 nakonfigurován, aby přidělil každé lidské dimenzi skóre pro přítomnost, neutralitu, úroveň nebo nepřítomnost jako skóre dimenzí pro každé aplikované pravidlo.

V kroku S810 je počítač 226 nakonfigurován, aby agregoval skóre dimenzí pro každou emoci, aby se získalo skóre intenzity pro příslušnou emoci. Agregovaná skóre představují intenzitu emoce. V některých provedeních se pro každou konkrétní dimenzi určí index začátku a index konce pro emoci v obsahu přirozeného jazyka. V některých provedeních mohou být indexovaný obsah přirozeného jazyka a odpovídající dimenze předány do modulu 320 modelů strojového učení. V některých provedeních může být do modulu 320 modelů strojového učení předána nejvyšší dimenze pro emoci společně s příslušným číselným (skóre dimenze) nebo mapovaným deskriptorem. Vzorce emocí včetně indexu začátku a indexu konce mohou být uloženy pro celou pasáž mající několik konstrukcí, frází a vět.

V kroku S812 je počítač 226 nakonfigurován, aby klasifikoval obsah přirozeného jazyka do třídy emocí na základě skóre dimenzí. V některých provedeních může klasifikace vygenerovat pravděpodobnost pro každou třídu emocí.

V kroku S814 je počítač 226 nakonfigurován, aby označkoval agregovanou hodnotu jako emoci a určil kontext uvedené značky jako vzorec značek emocí pro obsah přirozeného jazyka.

V kroku S816 je počítač 226 nakonfigurován, aby vydal klasifikaci a vzorec značek emocí v podobě textového, řečového a/nebo grafického výstupu.

V kroku S818 je počítač 226 nakonfigurován tak, aby sledoval vzorec značek emocí a souvisejících komponent v časové posloupnosti v celém obsahu přirozeného jazyka k vysledování značek emocí v čase. Každé značce emoce může být přiřazeno pořadové číslo indexu k označení jejich pořadí v posloupnosti. V případě obsahu přirozeného jazyka, který obsahuje časové známky, může být každé značce emoce přiřazena časová známka souvisejících komponent.

OBR. 9 je vývojový diagram kroků hodnocení použití lingvistických pravidel podle jednoho příkladného aspektu tohoto vynálezu. Hodnocení pomocí množství lingvistických pravidel v kroku S806 zahrnuje následující kroky.

V kroku S902 je počítač 226 nakonfigurován, aby detekoval pravidla za pomoci porovnávání vzorců pravidel; a

V kroku S904 je počítač 226 nakonfigurován, aby vyhodnotil lidské dimenze každého detekovaného pravidla.

OBR. 10 je vývojový diagram detekování pravidel podle jednoho příkladného aspektu tohoto vynálezu. Detekování pravidel v kroku S902 zahrnuje krok S1002 detekování přítomnosti nebo nepřítomnosti konstrukcí v obsahu přirozeného jazyka majících komponenty související s emocí.

OBR. 11 je vývojový diagram přidělování skóre podle jednoho příkladného aspektu tohoto vynálezu. Přidělování skóre v kroku S808 zahrnuje krok SI 102 vyhodnocení každé dimenze k určení skóre dimenzí.

OBR. 12 je vývojový diagram detekování pravidel podle jednoho příkladného aspektu tohoto vynálezu. Detekování pravidel mezi množstvím lingvistických pravidel v kroku S702 zahrnuje krok S1202 určení číselných hodnot pro

-16 CZ 2023 - 331 A3 pravidlo značkování slovních druhů tágy nebo syntaktické pravidlo, pravidlo přiřazování řetězců, přesné, nepřesné, maskované nebo s divokou kartou, pravidlo blízkosti tokenů, interpunkční pravidlo, lemmatizační pravidlo, stematizační pravidlo, pravidlo lexikonu a pravidlo vyhledávání slov nebo pravidlo založené na slovníku.

OBR. 13 je vývojový diagram určování číselné hodnoty pro pravidlo blízkosti tokenů podle jednoho příkladného aspektu tohoto vynálezu. Určení číselné hodnoty pro pravidlo blízkosti tokenů zahrnuje přistoupení ke všem tokenům majícím vzdálenost méně než n tokenů od daného bodu v obsahu přirozeného jazyka, kde n je celé číslo.

OBR. 14 je vývojový diagram klasifikace podle jednoho příkladného aspektu tohoto vynálezu. Počítač 225 je nakonfigurován, aby provedl klasifikaci v kroku S812 za použití způsobu strojového učení včetně kteréhokoli z učení s učitelem, učení bez učitele a systému založeného na pravidlech.

OBR. 15 je vývojový diagram strojového učení podle jednoho příkladného aspektu tohoto vynálezu. Strojové učení v kroku S1402 zahrnuje krok S1502 přijetí množství datových položek přirozeného jazyka z datového úložiště;

krok S1504 normalizace a tokenizace množství datových položek přirozeného jazyka za použití modulu pro předběžné zpracování k vygenerování předem zpracovaných datových položek přirozeného jazyka, což může zahrnovat předběžné roztřídění datových řádků na pozitivní, negativní a neutrální, aby se šetřil výpočetní výkon a čas při klasifikaci;

krok S1506 označkování množství předem zpracovaných datových položek značkou pro vyjádřený sentiment, emoci, názor nebo přesvědčení a intenzitu vyjádřeného sentimentu emoce, názoru nebo přesvědčení;

krok S1508 paralelního poskytnutí množství předem zpracovaných datových položek přirozeného jazyka modulu učení bez učitele, modulu založenému na pravidlech a modulu učení s učitelem;

krok S1510 paralelního vycvičení modulu učení bez učitele, modulu založeného na pravidlech a modulu učení s učitelem v několika cvičných epochách k identifikaci vyjádřené emoce v datech přirozeného jazyka a k určení skalárního měřítka intenzity emoce.

Každá cvičná epocha modulu učení bez učitele poskytuje návrhy vlastností nebo pravidel pro následné cvičné epochy modulu založeného na pravidlech a každá cvičná epocha modulu založeného na pravidlech poskytuje tabelaci a data skóre pro následné epochy modulu učení bez učitele a modulu učení s učitelem.

V kroku S1512 je vygenerován výstup představující vycvičený modul učení bez učitele, vycvičený modul založený na pravidlech a vycvičený modul učení s učitelem.

- 17 CZ 2023 - 331 A3

V kroku S1514 jsou lidské dimenze v datech přirozeného jazyka přiřazeny porovnáním lidských dimenzí se stávajícími řadami dimenzí s divokými kartami či bez nich nebo přeskakováním vzorců za účelem navržení nových pravidel pro modul založený na pravidlech.

Systém umožňuje dedukci nebo rozpoznání bodů a úrovní (intenzit), v nichž se pocit přemění na akci (jak je popsáno v textu nebo se detekuje podle textu). Systém umožňuje rozpoznání dynamiky v rámci sebe sama, na bipersonální (jeden k jednomu), interpersonální / multipersonální nebo rodinné úrovni nebo na úrovni společnosti (společenství, země, regionu nebo světa). Systém umožňuje sledování intenzity emoce tak, jak kolísá v průběhu věty, položky / odstavce a pasáže. Systém umožňuje identifikaci velkých, důležitých posunů ve vnímání, jako je ostrý obrat v celkovém sebehodnocení (přes dimenzi ega), jež mohou signalizovat, že nastal problém nebo významná změna. Systém může odhalit vztah mezi důležitými faktory prostřednictvím korelace, jako je vztah mezi sebeúctou / sebehodnocením a celkovým optimismem.

Na základě výše uvedených poznatků jsou možné četné modifikace a variace. Proto se rozumí, že v rozsahu připojených patentových nároků může být tento vynález realizován jinak, než zde bylo specificky popsáno.

Výše uvedený popis tedy představuje a popisuje pouhé příklady provedení předkládaného vynálezu. Jak bude odborník v oboru chápat, předkládaný vynález může být realizován v jiných specifických podobách bez odchýlení se od jeho ducha či podstatných charakteristik. V souladu s tím je popis předkládaného vynálezu zamýšlen jako ilustrativní, ale nikoliv vymezující rozsah vynálezu a další nároky.

Příkladné realizace

ELEKTRONICKÉ ČTECÍ ZAŘÍZENÍ

Provedení předkládaného vynálezu zahrnují elektronickou ěteěku. Elektronická ěteěka může být speciální zařízení, jež obsahuje specializovaný firmware a displej, který je nakonfigurovaný tak, aby optimálně zobrazoval text s vysokou zřetelností (běžně označované jako ěteěka elektronických knih), nebo se může jednat o univerzální výpočetní zařízení, jako je tablet nebo smartphone, které je pomocí softwaru nakonfigurované na čtení textů, typicky v podobě mobilní aplikace (app). Elektronická ěteěka má displej, který má úhlopříčku zhruba 10 palců nebo méně a má omezenou schopnost počítačového zpracování a paměť. Ve většině případů může elektronická ěteěka komunikovat s webovou službou přes internetové připojení, typicky v podobě WiFi připojení. Některé elektronické ěteěky obsahují komunikační modul pro komunikaci pomocí celulámího přenosu.

Systém 300 mající modul 312 klasifikace multimédií může být realizován v zařízení s omezeným procesním výkonem a pamětí, protože většina zpracování je založena na provádění modulu 306 pravidel přirozeného jazyka. Modul 320 modelů strojového učení může být prováděn off-line na samostatném počítači nebo v cloudové službě.

OBR. 16 znázorňuje elektronickou ěteěku podle jednoho příkladného aspektu tohoto vynálezu. Elektronická ěteěka 1600 obsahuje displej nebo dotykový displej 1602. Když displej 1602 zobrazuje text knihy 1604, může mít displej funkce přetáčení zobrazované jako rolovací pruhy (neznázoměné) a funkce obracení stránek zobrazované jako tlačítka 1606.

OBR. 17 je vývojový diagram fungování elektronické ěteěky podle jednoho příkladného aspektu tohoto vynálezu. V kroku S1702 může systém 300 vyhodnotit psané literární nebo dokumentární dílo se zaměřením na emocionální, kognitivní, interpersonálně nebo sociálně dynamické, motivační, názorové nebo psychologické prvky nebo prvky související s přesvědčením pomocí modulu 312 klasifikace multimédií. V kroku S1704 j e text elektronické knihy načten a oznaěkován

-18 CZ 2023 - 331 A3 tágy pravidel, jež spouští emocionální, kognitivní nebo jiné stavy, jež jsou identifikovány, a intenzity, s níž se vyskytly.

V jednom provedení může v kroku S1706 systém 300 vygenerovat a zobrazit barevně kódované zvýraznění, které označuje výskyt určité emocionální nebo kognitivní nebo sociologické či interpersonální dynamiky a/nebo stavů. V jednom provedení může v kroku S1708 systém 300 vygenerovat a zobrazit jeden nebo více postranních pruhů pro dynamiku 1610 a intenzitu 1620 emocí. Postranní pruhy mohou sumarizovat emocionální, kognitivní, sociologickou nebo interpersonální dynamiku či stavy, jež se vyskytují v textu 1604, s přidaným kontextem, kde je k dispozici. V kroku S1710 je možné vstoupit do interakce s každou dynamikou 1612 nebo stavem 1622 vybráním 1630 (dotykem, myší, pomocí klávesnice atd), což umožňuje předkládat elektronické čtečce 1600 příklady 1632 dané dynamiky nebo stavu v textu.

MULTIMEDIÁLNÍ AUDIOKNIHA nebo KLASIFIKÁTOR SENTIMENTU VIZUÁLNĚ PROSTOROVÝCH DAT

Systém 300 mající modul 312 klasifikace multimédií může být realizován v zařízení s omezeným procesním výkonem a pamětí, protože většina zpracování je založena na provádění modulu 306 pravidel přirozeného jazyka. Systém 300 provádí klasifikaci emocí pro věty, fráze a konstrukce a může provádět klasifikaci emocí v reálném čase tak, jak se text přijímá. Modul 320 modelů strojového učení může být prováděn off-line na samostatném počítači nebo v cloudové službě.

OBR. 18 je vývojový diagram multimediální audioknihy a klasifikátoru sentimentu vizuálně prostorových dat podle jednoho příkladného aspektu tohoto vynálezu.

Psaná nebo titulkovaná multimédia jako audioknihy nebo vizuálně prostorová multimédia jako filmy nebo televizní pořady je možné načíst do systému a přepsat do textové podoby.

V kroku 1802 jsou textová a přepsaná média podrobena zpracování v modulu (306) pravidel přirozeného jazyka, který provádí přiřazení k pravidlům.

Emocionálně kognitivní senzor (314) zpracuje vstup na úrovni věty, odstavce, pasáže, scény nebo kapitoly a klasifikuje jej vždy pomocí tágu dané emoce, kognice, sentimentu, založeného na stavu, dynamice nebo společenském jevu. V textu jsou detekovány a přiřazeny sporadické, krátké nebo částečné řetězce a zvolená jednotlivá slova, známé jako nekonstrukční háčky s častým používáním (High Use Non-Construction Hooks - HUNCH) s částečnými dimenzemi.

Senzor (316) hodnocení intenzity analyzuje text a přiřazuje objektivní hodnocení intenzity na základě subkomponent každého kognitivního, emocionálního, sociálního, interpersonálního nebo stavového prvku známých jako dimenze.

Modul (318) emocionálně kognitivního značkování přiřazuje textovým datům přidělenou třídu.

Časově poziční koordinace provádí asociace založené na načasování mezi třídami otagovaných informací a koordinovanými úseky zvukových nebo vizuálně prostorových dat a signálů, jež se potom klasifikují a odešlou do modulu (318) emocionálně kognitivního značkování k označení pomocí tagů.

Systém 300 vyhledá další případy odpovídajících zvukových nebo vizuálních vzorců jak absolutních, tak relativních vzhledem ke zvukové nebo vizuální základní úrovni a zkorigovaných pro pohlaví, věk, třídu, rasu, akcent, lokalitu a další demografické informace a situační informace, přičemž je automaticky označí tágy emocionálně kognitivních tříd patřících k danému vzorci.

-19 CZ 2023 - 331 A3

Text koordinovaný s automaticky otagovanými emocionálními třídami v předchozím kroku je automaticky označen příznakem jako shodující se nebo s vysokou pravděpodobností se shodující s emocionálně kognitivními třídami, teď nesenými zvukovými nebo vizuálními daty.

OBR. 19 je blokový diagram modulu multimediálních pravidel. Textová, vizuálně prostorová a zvuková datajsou porovnána a přepracována jako návrhy multimediálních pravidel a odeslána zpět do modulu (310) pravidel přirozeného jazyka, modulu (306) vizuálně prostorových pravidel a modulu (308) zvukově řečových pravidel.

Následný zvukový nebo vizuální vstup vykazující podobnou, opačnou, částečnou shodu nebo vykazující jinak matematicky významný poměr nebo vztah ve zvukových nebo vizuálních signálech a vzorcích obdrží tágy udávající pravděpodobnost emocionálně kognitivní třídy.

Porovnání podobnosti, rozdílů, protikladů a jiných měření každého pravidla modulu 312 mutimediálních pravidel a navrhovaných pravidel zlepší schopnost navrhování pravidel a zvýrazní modulární složky každého pravidla.

V jednom provedení se HUNCH používají jako háčky umožňující systému analyzovat okolní text, přičemž se navrhují potenciální nová pravidla zpět modulu (312) multimediálních pravidel. Dimenzionální vzorce musí být v souladu s pozitivními a negativními dimenzemi nebo nesmí být v rozporu se vzorcem pravidla.

HUNCH jsou konkrétně částečné úseky, které nejsou založené na pravidlech (jako 1-2 slova nebo částečné fráze), jež nesou svoji vlastní dimenzi. Zavedení těchto úseků do systému 300 umožňuje, aby neuronové modely 320 „přiřazovaly“ tyto částečně dimenzionální modely a používaly je jako háčky pro nacházení indikátorů emocí. V jednom příkladu zůstává pravidlo HNĚVU neodhalené, ale má ego +1, netrpělivost +1, sílu +1 atd. Háček (jako „I won‘t“ (nebudu)) může mít pouze ego +1 a sílu +1, ale pokud vypadá dostatečně, že by mohl být v souladu s hněvem, bude okolní text prozkoumán. K tomu musí mít 0 protichůdných dimenzí a musí mít stávající dimenze v souladu. To umožňuje detekovat permutace pravidel (kde obě jsou pravdivá) nebo připouští potenciálně nová pravidla (kde nejsou v rozporu, ale kde profil dimenzí vypadá jako hněv). Pomocí této techniky je nalezena nová konstrukce HNĚVU jako „I [won't / am not going to / am not gonna] take it [“one more time“, „again“, „anymore“, at all] (už to [nebudu] [ani jednou / znovu / nikdy / vůbec] brát)“, z níž je možné vydestilovat pravidlo jako „[ZÁJMENO 1OS] + ([POMOCNÉ SEOVESO] + [ZÁPOR] + ((„GOING“) + [SLOVESO V INFINITIVU] nebo [SLOVESO V BUDOUCÍM ČASE]) + ((PŘÍMÝ OBJEKT -ZÁJMENO))* + [Seznam slov: časová fráze] + „!““, přičemž části s hvězdičkou jsou volitelné, což dává například:

I'm not going to take it anymore! (Už to nebudu brát!)

I'm not going to serve you again! (Už ti nebudu sloužit!)

We will not bow anymore! (Iž se nebudeme klanět!)

Pro některé emoce a některé dimenze vzhledem k dané emoci mohou být přijatelné dvě nebo více hodnot. Například hněv může být přímý nebo s nuancemi, takže může dostat jedno nebo druhé skóre.

V některých provedeních v závislosti na emoci a dimenzi může být přijatelná více než jedna hodnota. Například hněv může (a musí být buď) ego-neutrální nebo ego-pozitivní.

V jiných případech musí být jedna valence pro dimenzi. Například hněv musí být energický; hněv musí být specifický. Několik HUNCH následujících po sobě může odpovídat dimenzionální sestavě emoce. Nebo také nemusí, když dojde k posunu emoce.

-20 CZ 2023 - 331 A3

OBR. 20 je vývojový diagram modulu odhalování pravidel založeného na HUNCH podle jednoho příkladného aspektu tohoto vynálezu. Tento proces se provádí v modulu 326 odhalování pravidel.

V kroku S2002 mohou být přiřazena skóre dimenzím spojeným s HUNCH.

V kroku S2004 se HUNCH porovnají s profily pro emocionálně kognitivní stavy. Aby mohly být přiřazeny k možnému emocionálně kognitivnímu stavu, nemohou mít prvky či dimenze, které jsou v rozporu s daným stavem. Prázdné dimenze, které nejsou v rozporu, je možné potenciálně přiřadit.

V kroku S2006 se musí negativní nebo pozitivní dimenze pravděpodobně shodovat, pokud nemají opačný příznak.

V kroku S2008 jsou navrženy emocionálně kognitivní stavy.

V kroku S2010 jsou nové přiřazené řetězce a okolní text navrženy zpět do modulu 306 pravidel přirozeného j azyka.

V kroku S2012 jsou zvuková nebo vizuálně prostorová data odpovídající novým řetězcům zavedena do odpovídajícího modulu 312 multimediálních pravidel.

OBR. 21 A, 21B představují vývojový diagram odhalování pravidel ve zvukových médiích podle jednoho příkladného aspektu tohoto vynálezu.

V kroku S2102 se zvukové médium (nebo zvuk z vizuálního média) přepíše na text a zadá. Volitelně se mohou zadat přepisy skrytých titulků nebo scénář. V některých provedeních mohou být přepsány vzdechy, šumy, gesta a jiné netextové zvuky jako anotace, aby se zachytilo více vlastností zvukového média.

V kroku S2104 se na vstupní text aplikují pravidla za účelem detekování emocí (i kognice a dalších prvků).

V kroku S2106 jsou zaznamenány indexové pozice ve vstupním textu, kde pravidla byla úspěšně aplikována

V kroku S2108 jsou vypočítány dimenze pravidel k určení intenzity na úrovně fráze, věty, pasáže a kapitoly.

V kroku S2110 jsou pasáže anotovány odpovídající emocí (a/nebo jinými prvky) a příslušnými intenzitami a atributy.

V kroku S2112 jsou odpovídající zvukové vlny nebo vizuálně prostorová data časově koordinována s indexovou pozicí slov v pasáži.

V kroku S2114 se vypočítají a uloží skutečné charakteristiky zvuku a relativní vztahy mezi základním zvukovým nebo vizuálně prostorovým profilem mluvčího a jeho daným specifickým emocionálně kognitivním profilem.

V kroku S2116, když se objeví podobné, odvozené, opačné nebo jinak související zvukové fragmenty, jsou přiřazeny k příslušné emocionálně kognitivní značce. Dílčí pasáže nebo řetězce, které spouštějí stejné pravidlo, jsou zavedeny do učících algoritmů. Podobné zvukové nebo vizuálně prostorové fragmenty detekované v datech jsou předběžně označkovány tágy navrhovaných emocionálně kognitivních stavů na základě stávajících tagů podobných zvukových nebo vizuálně prostorových dat. Podobné fragmenty detekované ve zvukových nebo vizuálně prostorových datech jsou zavedeny zpět do modulu 306 pravidel přirozeného jazyka.

-21 CZ 2023 - 331 A3

OBR. 22 je graf vzorce řečového signálu. V jednom provedení je vzorec 2210 řečového signálu pro textový vstup 2202 indexován 2204 textovým vstupem 2202 a je použit k označení času začátku a času konce (2208) emoce 2206.

DYNAMICKÉ ZOBRAZENÍ EMOCIONÁLNÍ KOGNICE

Historicky určité části populace zaznamenaly různé bariéry porozumění emocionálním, kognitivním, sociálním, názorovým, interpersonálním nebo metakognitivním, metaemocionálním nebo rozhodovacím vodítkům nebo dynamice v mluveném nebo psaném textu. Zejména lidé, kteří nejsou neurotypičtí (např. neurodivergentní) se stavy, jako je autismus, zažívají problematicky vysokou míru neporozumění sociálním vodítkům, emocím a jiným dynamickým prvkům přítomným v jazyce nebo jejich nezaznamenáním. Tyto potíže mohou rovněž zažívat lidé, kteří nejsou rodilými mluvčími daného jazyka. Média konzumovaná těmito skupinami lidí mohou být špatně chápaná, matoucí, zavádějící a někdy mohou vést k odpojení, interpersonálním konfliktům nebo odcizení, stranění se a izolaci, když sociální normy nejsou chápány a/nebo jsou překračovány. Potěšení z médií může být rovněž sníženo nebo se o něm obtížněji hovoří z důvodů sociálních vazeb. Zábavní společnosti mohou také ztrácet publikum nebo zaznamenávat jeho úbytek, protože některé skupiny nechápou příslušnou emocionální, interpersonální, na přesvědčení založenou nebo kognitivní dynamiku.

Analyzované a anotované titulky mohou být zaváděny do algoritmů strojového učení pro větší efektivitu s tím, jak se vyvíjejí nebo zavádějí nové situace, dynamika, emoce, kognitivní stavy a sociální aspekty či proudy. Moduly teorie mysli je možné aktualizovat o přídavné iterace za účelem přizpůsobení se dané společnosti, pohlaví, náboženství, přesvědčení, věku, tématu nebo kultuře či subkultuře k zajištění přesnosti.

Cvičná data je možné částečně automatizovat díky vyhledaným robustním informacím, přiřazeným ke vstupnímu médiu.

Za použití cvičných dat je možné vytvářet média, jež je možné psát, shromažďovat, různě sestavovat, zjednodušovat nebo napodobovat za použití anotací k předchozím datům.

Cvičná data mohou být zvuková, vizuální, textová, multisenzorická nebo kombinacemi všech typů.

Jeden typ cvičných dat zahrnuje korpus GoEmotions s následujícími úpravami: Eliminace třídy touhy; eliminace neutrální značky a místo toho použití neutrální značky při odvozování skóre jistoty: 1 - skóre neutrální pravděpodobnosti = skóre jistoty.

Cvičná data se získávají z míst, kde je logicky nutně nebo s nadprahovou nutností vyžadována přítomnost sentimentu, jako jsou bez omezení emoce, kognice a další dimenze, a/nebo kde autor sám proklamuje svoji vlastní emoci, jež efektivně poskytují tag a umožňují empirické značkování.

Jedním provedením systému 300 pro automatizovanou klasifikaci emocí je dynamické zobrazení emocionální kognice. Dynamické zobrazení může vkládat subtextová data emocí v reálném čase, což umožňuje, aby se neurodivergentní uživatelé učili a zlepšovali si sociální, emocionální a interpersonální dovednosti a dovednosti teorie mysli za pochodu.

Modul 306 pravidel přirozeného jazyka je nakonfigurován za použití pravidel sestávajících z frekventovaných a/nebo permutovatelných frází založených na konstrukcích umožňujících rychlé určování lingvistických vzorců v textových informacích poskytovaných titulky. Hashtagy jsou rozčleněny podle kontextuálních a korpusových unigramů a dalších přítomných n-gramů odvozených ze vstupního textu namísto jejich pouhého zpřístupnění přes lexikon(y), což poskytuje přesnější, relevantnější zpracování přirozeného jazyka a analýzu sentimentu. K detekci sentimentu se používají podobné, částečné nebo opačné dimenzionální vzorce. Jsou vytvářena pravidla ke

-22 CZ 2023 - 331 A3 kódování dimenzí, jež je možné používat k detekci symptomů duševního zdraví v každé konstrukci spouštějící pravidlo.

Emocionálně kognitivní modul 314 je nakonfigurovaný k přidělování skóre subkomponentám („dimenzím“) pro každé pravidlo, což umožňuje rychlé a stále přesnější rozpoznávání motivace, vlivu, emocí a kognice a podobných subkomponent, které se agregují v charakteristických vzorcích a kombinacích, k identifikaci přechodných a trvalých emotivních, kognitivních, na přesvědčení založených, názorově centrovaných sociálních a osobnostních stavů. Emoce jsou dedukovány z „tvaru“ dimenzí. Vlastnosti emocí mohou zahrnovat vektor dimenzí, hodnoty dimenzí a odlišnost od výpočtů nebo podobnost s výpočty odvozenými od těchto částí.

Modul 318 emocionálně kognitivního značkování (tagování) je nakonfigurován ktagování a sledování vývoje subtextových informací v průběhu titulků a řeči za pomoci subkomponent emocionálních, kognitivních, motivačních a názorových stavů a stavů založených na přesvědčení. Jakmile jsou emoce označkované tágy, agregovaný emocionálně kognitivní souhrnný klasifikátor 328 označí tágy metaemocionální stavy, posuny a kombinace na základě emocionálních vzorců.

Modul 326 odhalování pravidel je nakonfigurován k identifikaci, využívání, vyvozování a dedukování z přerušovaných emocionálních stavů, trendů, přechodů mezi dimenzemi a dalších sentimentálních stavů a posunů za účelem navrhování potenciálních nových pravidel a jejich opětovného zavádění do systému 300. Emocionální vzorce a meta-emocionální posuny stavy a kombinace jsou dedukovány z mezer ve vzorcích emocí, kognice a dalších komponent sentimentu. Modul 326 odhalování pravidel je nakonfigurován za použití afektivní logiky, která se používá k dedukování chybějících sentimentálních stavů a posunů v datech nebo k řešení sémantických, kognitivních, emocionálně kognitivních nebo jinak sentimentálních nejednoznačností. Modul 326 odhalování pravidel je nakonfigurován tak, aby reguloval cvičení modulu 320 modelů strojového učení na „hraně“ tříd, jako mezi téměř emocionálními stavy, jako je zármutek a smutek nebo smutek a hněv pro vhodnější, jemnější a rychlejší rozlišení.

Displej 210 je nakonfigurován tak, aby zobrazoval subtextová vodítka vedle vizuálních a zvukových (slyšitelného tónu a řeči) dat k umožnění bohatších informací a povědomí o situaci. Subtextová data se zobrazují k informování uživatelů a diváků a k rozšiřování a/nebo objasňování sociálních situací a komplexních emocionálních a kognitivních stavů znázorněných nebo popisovaných v médiu.

Modul 326 odhalování pravidel je nakonfigurovaný tak, aby pracoval s modulem 320 modelů strojového učení. Analyzované a anotované titulky mohou být zaváděny do modulu 320 modelů strojového učení s tím, jak se vyvíjejí nebo zavádějí nové situace, dynamika, emoce, kognitivní stavy a sociální aspekty či proudy. Cvičná data je možné získávat z vyhledaných informací, přiřazených ke vstupnímu médiu. Cvičná data mohou být zvuková, vizuální, textová, multisenzorická nebo kombinacemi všech typů.

V jednom provedení cvičná data zahrnují korpus GoEmotions. V tomto provedení je korpus GoEmotions upraven odstraněním třídy touhy. Neutrální značka je nahrazena skórem jistoty, které je odvozeno od neutrální značky jako: 1 - skóre neutrální pravděpodobnosti = skóre jistoty.

V některých provedeních se cvičná data získávají ze zdrojů, kde je logicky nutně nebo s nadprahovou nutností vyžadována přítomnost sentimentu, jako jsou bez omezení emoce, kognice a další dimenze, a/nebo kde autor sám proklamuje svoji vlastní emoci, jež efektivně poskytují tag a umožňují empirické značkování.

OBR. 23 je vývojový diagram způsobu klasifikace emocí v reálném čase ve streamu videa/audia podle jednoho příkladného aspektu tohoto vynálezu. Tento způsob se provádí pomocí

-23 CZ 2023 - 331 A3 zobrazovacího zařízení zahrnujícího tablet, smartphone, inteligentní televizi, které přijímá streamované audio a/nebo video a které obsahuje svůj zabudovaný počítač s pamětí.

V kroku S2302 se přijímá scéna z filmu nebo televizního pořadu nebo streamovaného pořadu nebo zaznamenané divadelní hry nebo zdroje animovaného videa společně s koordinovaným textovým přepisem.

V kroku S2304 je provedeno porovnání pravidel s textovými daty modulem 306 založeným na pravidlech, emocionálně kognitivním modulem 314, senzorem 316 hodnocení intenzity a modulem 318 emocionálně kognitivního značkování, který opatřuje emocionální, kognitivní a další takové stavy tágy s hodnocením intenzity, v textovém přepisu.

V kroku S2306 agregovaný emocionálně kognitivní souhrnný klasifikátor 328 určí kontextová vodítka na základě ko-výskytu slov, diskurzních prvků a tematických prvků.

V kroku S2308 emocionálně kognitivní senzor 316 volitelně označí jednotlivé řetězce nebo ngramy trinámími skóre dimenzí.

V kroku S2310 modul 310 vizuálně prostorových pravidel a modul 308 pravidel zvukové řeči detekují a zadají rozšířené informace (Augl) a situační prvky (SE) zjevné ve vizuálních datech nebo tónové prvky zřejmé ve zvukových datech do samostatného, ale časově koordinovaného zdroje pro médium.

V kroku S2312 emocionálně kognitivní senzor 314 postaví vedle sebe (provede koordinaci a divergenci a určitý stupeň od každého) kontextově orientované sémantické informace (kontextová vodítka) a data Augl a SE, čímž vytvoří kontextová skóre pro každou scénu.

V kroku S2314 j sou simultánně vrácena emocionální data v závorce a vložena do textového přepisu k zobrazení na zobrazovacím zařízení 210 tak, aby divák mohl snáze správně identifikovat emocionální, kognitivní nebo sociální prvky média.

OBR. 24 znázorňuje zobrazovací zařízení podle jednoho příkladného aspektu tohoto vynálezu. Příkladné zobrazovací zařízení 2400 obsahuje obrazovku 2402 k zobrazení scény z filmu nebo televizního pořadu nebo streamovaného pořadu nebo zaznamenané divadelní hry nebo zdroje animovaného videa společně s koordinovaným textovým přepisem 2412. Na této příkladné obrazovce jsou simultánně vrácena emocionální data 2414 (např. pár emoce-intenzita „ANGERMEDIUM“ (HNEV-STREDNÍ) a vložena do textového přepisu 2410 a zobrazena na zobrazovacím zařízení 2400. Je třeba poznamenat, že ačkoliv pár emoce-intenzita je znázorněn jako dvojice pojmů, může být pár 2414 emoce-intenzita zobrazen v jiných formátech zahrnujících intenzitu jako číselnou hodnotu nebo grafický symbol, který znázorňuje relativní velikost (nízkou, střední, vysokou), jako je pruh určité relativní velikosti a/nebo barvy nebo sestava barevných teček s variabilní délkou. Také může být pár 2414 emoce-intenzita znázorněn v grafickém útvaru jako například uvnitř kruhu nebo obdélníkového tvaru nebo ve formě bubliny s komentářem. Navíc ačkoliv je vyobrazen jeden pár 2414 emoce-intenzita, počet a/nebo sekvence párů emoce-intenzita závisí na obsahu textového přepisu 2412. Například mohou být páry 2414 emoce-intenzita zobrazeny jako vzorec.

UKLIDŇUJÍCÍ ZAŘÍZENÍ PRO HRANIČNÍ PORUCHU OSOBNOSTI

OBR. 25 je diagram klasifikačního systému emocí se smyslovým rozptýlením podle jednoho příkladného aspektu tohoto vynálezu.

Hraniční porucha osobnosti (BPD) je duševní zdravotní porucha, která ovlivňuje způsob, jímž člověk myslí a cítí se vzhledem k sobě a ostatním, což způsobuje problémy s fungováním v každodenním životě. Zahrnuje problémy se sebehodnocením, potíže se zvládáním emocí

-24 CZ 2023 - 331 A3 a chování a vzorec nestabilních vztahů. Terapie BPD zahrnuje učení se zvládání emocí, které se jeví jako intenzivně nepřekonatelné a mohou vést k sebepoškozování. Představovaná provedení obsahují periferní zařízení pro poskytování zpětné vazby na základě určitých emocí a vzorců emocí, zejména intenzity emoce.

Pacient s diagnostikovanou hraniční poruchou osobnosti (BPD) může být vybaven zařízením opatřeným mikrofonem nebo vstupním zařízením, které dokáže přijímat zadání z klávesnice, jiným zařízením pro zadávání textu, jako je záznamník hlasu s přepisem, nebo zařízením s funkcí zadávání textu, jako je zařízení opatřené dotykovým displejem majícím obrazovku pro zadávání textu. Řečové signály mohou být převáděny/přepisovány na text. Text může být zadáván (302) do zařízení přímo. Zařízením může být výhodně přenosné/mobilní výpočetní zařízení, které může pacient nosit. V některých provedeních může být přenosným/mobilním výpočetním zařízením zařízení, které umožňuje digitální komunikaci s cloudovou službou.

Textové zadání je zpracováno modulem (306) pravidel přirozeného jazyka, který je potom opatří značkami emocí a předá zadání do emocionálně kognitivního senzoru (314).

Senzor (316) hodnocení intenzity vypočítá dimenze pro každé zadání a přidělí objektivní hodnocení intenzity.

Modul (2504) agregované intenzity počítá klouzavé průměry a agregovaná skóre.

Okamžitá skóre intenzity počítá modul (2502) okamžité intenzity.

Když průběžná negativní emocionální intenzita v modulu (2504) agregované intenzity dosáhne dostatečně vysoké prahové hodnoty, systém může proaktivně poskytnout senzorickou uklidňující pomůcku (2506) prostřednictvím periferního zařízení nakonfigurovaného na dialektickou behaviorální terapii (DBT) k zajištění senzorického rozptýlení pacienta, které zahrnuje, ale neomezuje se na: podání pikantních bonbónů, vibrace Bluetooth náramku, ohřátí Bluetooth náramku.

Když kterýkoli daný datový bod v modulu (2502) okamžité intenzity dosáhne negativní emocionální intenzity překračující práh nebezpečí, systém proaktivně aktivuje periferní zařízení 2506 k vyvolání senzorického rozptýlení.

Monitorování intenzity jazyka nebo řeči pokračuje jak přes senzor (316) hodnocení intenzity, tak přes emocionálně kognitivní senzor 314. Když agregovaná intenzita nebo intenzita datových bodů dosáhne první prahové hodnoty, je aktivováno různé náhodné senzorické uklidňující rozptýlení.

Jakmile klouzavý průměr modulu (510) agregované intenzity a hodnocení modulu (2504) okamžité intenzity nevystoupají nad prahovou hodnotu po dobu 30 nebo více minut, je centrální jednotkou vydán (2508) pacientovi deníkový lístek, který jej vyplní a zaznamená pocity pro osobní nebo terapeutické použití.

V dalších provedeních má klasifikační systém emocí se senzorickým rozptýlením využití přesahující BPD. Volitelně se u uživatele překonávajícího závislost na alkoholu, drogách nebo kompulzivní chování v následném rehabilitačním programu po léčbě nebo v domě střízlivého života monitorují emocionálně kognitivní známky předcházející nebo signalizují relaps, přičemž se provádí zadání (302) v podobě textu nebo přepsaného textu do zařízení. Volitelně se u profesionální komunikace pracovníka nebo manažera sledují známky konkrétních emocionálně kognitivních stavů, jako je stres nebo úzkost, a zadávají se (302) do zařízení. Volitelně, když průběžná negativní emocionální intenzita v modulu (2504) agregované intenzity dosáhne dostatečně vysoké prahové hodnoty, systém upozorní zdravotnické zařízení, rehabilitační program

-25 CZ 2023 - 331 A3 nebo dům střízlivého života nebo zaměstnavatele, že u pacienta hrozí nebezpečí relapsu nebo extrémní stres či úzkost.

OBR. 26A, 26B, 26C představují schematický diagram elektronického náramku podle jednoho příkladného aspektu tohoto vynálezu. Elektronický náramek 2600 může mít podobu kruhu 2612 majícího zabudované elektronické komponenty.

Vodiče:

Vodiče 2610 mají podobu svazku několika izolovaných vodičů. Jednotlivé vodiče jsou buď pozitivní „+“ nebo negativní Vodiče 2610 jsou výhodně nichromové (ze slitiny niklu a chrómu), ale mohou být i z jiného materiálu pro výrobu drátů.

Náramek 2612 může obsahovat zabudovaný komunikační čip (připojený k mikroprocesorovému čipu 2620) nakonfigurovaný pro bezdrátovou komunikaci. Bezdrátová komunikace je výhodně komunikace v krátkém dosahu pro přenos a přijímání signálů z přenosného/mobilního zařízení. V jednom provedení komunikační čip provádí bezdrátovou komunikaci za použití standardu Bluetooth nebo Bluetooth Low Energy (BLE).

Prvek v podobě posuvného okénka 2614 je vyroben ze skla nebo plastu. Posunutím posuvného okénka 2614 se odhalí dávkovač 2616, což je jednotlivý otvor. Posuvné okénko 2614 je motorizováno pomocí solenoidového krokového mikromotoru 2602 (< 5 mm).

Zařízení 2600 je poháněno zabudovaným mikroprocesorem 2620. Mikroprocesor obsahuje uložení pro vodiče a komponenty za použití technologie typu montážní desky.

Elektromagnetický excentrický mikromotor 2622 je akční člen, který vytváří vibrace pomocí nevyváženého zatížení.

Měděná destička 2608 uložená v silikonu vytváří teplo.

Zařízení je napájeno dobíječi lithium-iontovou baterií 2604. Dobíječi baterie 2604 má příslušné dobíječi rozhraní 2606.

Na náramku 2612 jsou kontrolky 2630 pro spárování s přenosným/mobilním zařízením.

Náramek 2612 je průsvitný a může měnit barvu za pomoci LED světel v závislosti na detekované emoci. To může být užitečné pro lidi z BPD zažívající averzivní tenzi v silně aktivovaném stavu, aby mohli sdělovat svoje emoce pečovatelům nebo svým blízkým.

Zařízení 2600 může být po úpravě rovněž použitelné k uklidňování lidí s posttraumatickou stresovou poruchou (PTSD) při panických záchvatech a předávání emocionálních informací blízkým a pečovatelům, když dojde ke spuštění.

Ve výše uvedeném popisuje veškeré procesy, popisy nebo bloky ve vývojových diagramech třeba chápat jako představující moduly, segmenty nebo části kódu, jež obsahují jednu nebo více proveditelných instrukcí pro realizaci specifických logických fúnkcí nebo kroků v rámci procesu, a do rozsahu příkladných provedení představovaného rozvinutí jsou zahrnuty alternativní realizace, v nichž mohou být funkce prováděny odchylně od znázorněného nebo popisovaného pořadí včetně

-26 CZ 2023 - 331 A3 toho, že jsou prováděny v podstatě současně nebo v obráceném pořadí, v závislosti na příslušné funkci, jak budou odborníci v oboru chápat.

EMOCIONÁLNĚ KOGNITIVNÍ PROFILOVAČ

V jednom příkladném provedení může být emocionálně kognitivní klasifikace realizována jako profilovač.

Textový vstup se namluví nebo jinak zadá do modulu 306 pravidel přirozeného jazyka k provedení analýzy. Vstup může být o uživateli, jiném člověku nebo nějakém tématu. Volitelně může uživatel natočit video o sobě, jak odpovídá na náhodné nabídky práce. Volitelně OCR nebo transkripce zvuku přepíše psaný text nebo textové informace obsažené ve videu, respektive audiu na prostý text.

Text je analyzován emocionálně kognitivním senzorem 314 se zaměřením na sentimentální obsah.

Emocionálně kognitivní sentiment je po klasifikaci označkován modulem 318 emocionálně kognitivního značkování.

Intenzita sentimentu je vypočítána přes dimenze v rámci senzoru 316 hodnocení intenzity.

V emocionálně kognitivním profilovači se vytvoří profil s osobnostními rysy, výrazovými rysy, kognitivními rysy a emocionálním rysy i s hodnotami a předpojatostmi.

V emocionálně kognitivním profilovači se k informacím o profilu přiřadí demografické informace.

Agregovaný emocionálně kognitivní souhrnný klasifikátor 328 provede predikce o typu kandidáta, který bude dobře odpovídat požadavkům pro danou schůzku, zaměstnání nebo komisi. Volitelně uživatel zadá, např. formou průzkumu nebo dotazníku, informace o typu osobnostních rysů, hodnot, kognitivních rysů, emocionálních rysů, hodnot a rozhodovacích bodů, které by jeho ideální kandidát měl mít.

Vydají se doporučení pro uživatele seznamovacích stránek, konzultanty komise nebo manažery nabírající pracovníky s ohledem na způsobilost daného člověka s hodnocením vhodnosti a shody.

Profily sestavené emocionálně kognitivním profilovačem jsou zachovány a uloženy pro budoucí použití modulem 320 modelů strojového učení.

EMOCIONÁLNĚ KOGNITIVNĚ INFORMOVANÁ TVORBA TEXTŮ/KOMUNIKACE

V jednom příkladném provedení může být emocionálně kognitivní klasifikace realizována jako předtextová aplikace zahrnující mimo jiné telefonní banky nebo textové banky.

Uživatel zadá textový nebo přepsaný vstup do systému za účelem získání emocionálně kognitivních doporučení, jež informují uživatele o zdravých, empatických, pozitivních a sociálně / (sub)kultumě vyvážených komunikačních technikách a psychologii.

Volitelně může být příslušným vztahem: prodejní vztah; vztah zákaznického servisu; vztah na pracovišti; akademický vztah; poradní / koučovací vztah; romantický vztah; přátelství; rodinný vztah; bývalý nebo potenciální vztah; odcizený vztah; vztah v krizi; vztah mezi známými; nebo jiný lidský vztah.

Když jsou u uživatele nebo v uživatelově textu detekovány nezdravé, nevhodné, necitlivé, matoucí odpovědi nebo odpovědi s omezenou perspektivou, uživatel je vyzván, aby rozvíjel svoje komunikační dovednosti, aby se naučil robustnější komunikační přístupy, formou her, modulů,

-27 CZ 2023 - 331 A3 výukových programů nebo dalších výukových nástrojů. Ať se uživatel rozhodne pro výukovou hru či modul nebo ne, uživatel je dotázán, zda chce zadat více kontextu k dané situaci.

Uživatel je dotázán, zda bych chtěl zkusit komunikaci znovu.

Když uživatel zvolí, že chce doplnit kontext, může odpovědět na sérii otázek, jež pomáhají hodnotit emocionálně kognitivní stavy a emocionální nebo sociální situaci. Když uživatel odmítne doplnit další kontext, může si uživatel zvolit, že odpoví na další otázky k vyhodnocení jeho vlastního emocionálně kognitivního stavu.

Volitelně mohou uživatelé volit ze seznamu obav, potíží, problémů a nadějí pro komunikaci nebo vztah.

Uživatel dostane příležitost změnit svou komunikační techniku a zadat novou komunikaci, která bude zahrnovat uživatelovy nové znalosti a povědomí nebo bude odrážet jeho změněný emocionálně kognitivní stav.

Uživatelé jsou vyzváni, aby začali znovu.

DYNAMICKÉ/ADAPTIVNÍ PROVEDENÍ

Spontánní uživatelský textový nebo přepsaný vstup se zadá do výpočetního zařízení, aplikace, herní konzole telefonu nebo tabletu.

Text jde do modulu 304 předběžného zpracování a je analyzován modulem 306 pravidel přirozeného jazyka, a potom je analyzován modulem 312 klasifikace médií.

Otevřeně deklarované (explicitní) a subtextově detekované (implicitní) emocionálně kognitivní stavy jsou vyhodnoceny v emocionálně kognitivním senzoru 314 a stupeň duševních stavů je obodován v senzoru 316 hodnocení intenzity.

Uživatelské zadání obdrží značky v modulu 318 emocionálně kognitivního značkování.

Systém poskytne propracovanou, vybranou, vygenerovanou, editovanou nebo jinak upravenou odpověď nebo odpověď přizpůsobenou emocionálně kognitivnímu stavu uživatele, čímž poskytne uživateli personalizovanou, interaktivní, diskurzivní zkušenost. Volitelně může dialog zahrnovat více než jednoho počítačem vygenerovaného a/nebo vedeného bota či postavu. Volitelně může dialog probíhat v rámci tradiční videohry nebo videohry ve virtuální nebo rozšířené realitě. Dialog může volitelně zahrnovat jednoho nebo více přídavných lidských činitelů. Volitelně může dialog zahrnovat terapeutického bota poskytujícího psychoterapeutickou, poradní, krizovou nebo abstinenční pomoc uživateli nebo skupinám.

Volitelně může dialog zahrnovat virtuálního přítele nebo asistenta poskytujícího doprovod nebo pomoc uživateli. Dialog může volitelně zahrnovat jednoho nebo více botů z oblasti prodeje nebo podpory zákazníků.

Volitelně se měřítka související s prostředím jako komplexnost, složitost, hlasitost, rychlost, barevné schéma, intervence, scénáře, minihry a/nebo dílčí úkoly, možnosti, otázky, postavy, upozornění, komentáře, dialogy nebo nabízené volby a jiné takové personalizační

-28 CZ 2023 - 331 A3 a individualizační aktivity aktualizují podle odpovědí uživatele, aby byly zajištěny nej aktuálnější a agregované jazykové reakce prostřednictvím bota.

Minulé odpovědi od uživatele/uživatelů se ukládají do databáze, spárují se s příslušnými opakovanými výzvami pro budoucí použití během aktuálních a budoucích uživatelových sezení.

SOCIOLINGVISTIKA

PROBLÉM:

Historicky sociolingvistika studuje podrobné postoje, přesvědčení, názory a sentiment jednotlivců, tříd jednotlivců, skupin lidí, ras, pohlaví socioekonomických skupin a dalších skupin lidí pozorováním a/nebo analýzou jejich mluvených, psaných nebo gestikulovaných slov.

Sociolingvistika je subdisciplína sémantiky, která hodnotí text ve vztahu ke společenským faktorům včetně subkultur, rozdílů mezi rasami, pohlavími, podtřídami lidí, regiony atd. Sociolingvistika již dlouho studuje kontext jazyka včetně kulturních norem, spolupráce, očekávání, problémů identity, interpersonálních vztahů a sociálního kontextu.

Výzkumníci v oblasti humanitních a sociálních věd i technici zabývající se zpracováním přirozeného jazyka (NLP) v oboru počítačových věd provádějí analýzu spontánního a propracovaného textu a řeči. Historicky tito výzkumníci a profesionálové museli rozvinout počítačový kód, aby bylo možné rozebírat, čistit, tagovat, anotovat a analyzovat slova k získávání vhledů.

Tyto nedostatky vedly k odcizení výzkumníků z oblasti humanitních a sociálních věd (jako je psychologie, sociologie, aplikovaná behaviorální věda, antropologie, komunikace, rétorika, ženské studie, etnologie a politologie), čímž připravily společnost o bohaté komentáře ke každodennímu používání jazyka a jeho významu. Navíc všeobecný nedostatek integrovaných výpočetních řešení pro sociolingvistické a kognitivní hodnocení jazyka bránil zrychlení společenského pokroku v éře, v níž textová a řečová komunikace je stále rychlejší a je nepostradatelná a má centrální význam pro společenský rozvoj, spravedlnost a porozumění.

Navíc samotné řetězce přirozeného jazyka, kognitivní lingvistiky a sociolingvistiky obecně vyžadovaly komplikovanou instalaci, závislost na předem připravených datových tocích a jejich omezení nebo nekompatibilních řešeních, jež vyvolávají potíže a zdržují koordinaci.

PŘEDCHOZÍ PŘÍSTUPY:

Předchozí pokusy o automatizaci sociolingvistického výzkumu a analýzu digitálního, skenovaného, přepsaného nebo přeloženého textu vyžadovaly sled množství nástrojů, z nichž každý vyžaduje technické know-how k provedení klasifikace a integrace. Dostupné korpusy často trpí omezeným rozsahem, přístupností a velikostí a příprava dalších korpusů je obtížná a drahá. Existuje málo uživatelsky příjemných extrakčních programů, jež nabízejí jen základní rozbory a neumožňují integraci s jemně granulovanými lingvistickými nástroji a nástroji přirozeného jazyka, umožňují pozorovatelské nebo tagovací vhledy do přirozeného prostředí a klasifikace lidského sentimentu, přesvědčení, názorů či emocí se soustředila na učení s učitelem (často s Bayesovskou pravděpodobností), učení bez učitele (jako neuronové sítě).

Žádné stávající řešení neintegruje nej modernější nástroje sociálního výzkumu, jež pokrývají celý studijní řetězec od celkového návrhu studie; přes návrh vzorce přeskakování v průzkumu; nábor dobrovolníků; integraci formulářů pro souhlas; dotazování, průzkum, pohovory nebo datové příspěvky; příjem a zpracování dat, až po dohled nad prováděním studie a tvorbu dotazů. Podobně žádné stávající řešení neposkytuje sadu moderních, speciálně navržených nástrojů pro statistickou

-29 CZ 2023 - 331 A3 analýzu, jež by pokrývaly lingvistické, komputační, agregační nástroje, integraci cloudu a cvičení, testování a používání strojového učení.

Stávající řešení neposkytují bezešvý způsob stahování, šíření, sběru a komentování výzkumných a akademických datových souborů, statistických souborů, příslušného kódu a protokolů s výsledky. A konečně stávající řešení neumožňují uživatelům dávat datové soubory zpět k dispozici široké veřejnosti nebo akademickým kolegům pro použití při dalším výzkumu.

ZPŮSOB

Tento sociolingvistický řetězec je potřeba a žádoucí s tím, jak se technologie rozvíjí a rozšiřuje se dosah sociolingvistických studií a rozvíjí se výzkum humanitních a technických věd mimo oblast lingvistiky, který zahrnuje textová, zvuková a vizuální historická, subkultumí, populační, geografická data a metadata, k dosažení pokroku ve výzkumu i ve společnosti.

V současnosti se sociolinvistika provádí na vybraných, užších datových souborech. Scházejí komputační nástroje pro profesionální nástroje praktických nebo akademických sociolingvistů, kdy stávající řešení jsou příliš fundamentální, méně jemně granulovaná a mají vysokou vstupní technickou bariéru. Těch málo uživatelsky příznivých řešení pro sociolingvisty má tendenci představovat neúplné řetězce, jež umožňují základní výběr, jednoduché vyhledávání a výpočty pro nej frekventovanější fráze, export a málo dalšího.

Tento řetězec je nový a cenný pro kontinuální, širokou komputační lingvistickou analýzu u celé řady témat, pro komerční použití při správě dobrého jména, hodnocení reklamy a marketingu, sledování virálních témat i detekci propagandy a dezinformací a související hodnocení.

Obecně se vlastnosti datových souborů často mění podle typu a úkolu. Stávající řešení vykazují tagování slovních druhů, n-gramy, kolokace a frekvenci a relativní frekvenci a umožňují extrakci dat a základní jazykovou, pojmovou nebo lingvistickou analýzu. Nicméně stávající řešení neposkytují robustní a specializované sociolingvistické nástroje založené na disciplíně, centralizované akademické, výzkumné a neziskově založené nástroje pro sociolingvistický výzkum v humanitních a technických vědách ani nástroje pro návrh a rozvoj studie v průběhu životního cyklu výzkumných studií.

Tento způsob rovněž zahrnuje volitelné geolokační nástroje, nástroje pro porovnávání slov a pojmů, nástroje pro analýzu diskurzu a sociální interakce i nástroje pro sociolingvistickou analýzu sentimentu. Jazykové změny postavené vedle sebe v čase, udávající detekci populační hodnoty a změnu postoje, jsou rovněž nové a je využívat ke sledování sociálních problémů a společenské hodnoty.

Zájmové skupiny, neziskové organizace a akademičtí výzkumníci v současnosti nemají žádný sociolingvistický řetězec k plnému zvládání těchto potřeb ani digitální prostředky k navrhování a vytváření robustních sociolingvistických krátkodobých, výhledových a dlouhodobých studií od začátku do konce. Veřejná správa by mohla těžit z digitální aplikace sociolingvistického řetězce na jiné disciplíny a komerční značky by rovněž mohly těžit ze sledování a analýzy textových zpráv, výzkumu trhu, vývoje produktů, testování cílových skupin a automatické sociolingvistické analýzy sentimentu v čase.

Na tento řetězec by rovněž bylo možné aplikovat hodnotící použití včetně analýzy národní bezpečnosti, vynucování práva nebo monitorování policejní brutality, psychologických a sociálně behaviorálních studií, hodnocení sociálních programů, právní analýzy, objektivních a efektivních postupů najímání pracovníků a řešení rizik.

A konečně, péče o duševní a tělesné zdraví i očkovací, farmaceutická a terapeutická a všeobecná lékařská péče silně potřebují komplexní integrovaný výzkumně analytický sociolingvistický

-30 CZ 2023 - 331 A3 řetězec pro vyhodnocení problémů zdravotní péče, nepříznivých reakcí na léky a monitorování nemocí, vše ve velkém měřítku. Finanční trhy jsou rovněž v současnosti citlivé na pohyb v důsledku vyjádření v masových sociálních médiích a mohly by těžit z prostředku hodnocení, sledování a monitorování vyjádření v sociálních médiích přes technickou optiku.

CHARAKTERISTIKY ZPŮSOBU

Sociolingvistický modul nabízí následující vlastnosti:

• Integraci automatizovaných sémantických nástrojů pro analýzu sentimentu včetně měření na základě pozitivní-negativní-neutrální (PNN) polarity, detekce specifických afektů s více emocionálními značkami.

• Bezešvé toky zpracování dat, jež mohou být hierarchicky nastaveny uživatelem ke kompletní automatizaci speciálního řetězce pro zpracování textových dat.

• Integraci konotačních nástrojů, jež zavádějí a umožňují notaci a predikci latentních a subtextových inferenčních informací, slovních vnoření, větných vnoření, kognitivních lingvistických znaků, strukturně-sémantického mapování a markérů pro deduktivní a induktivní uvažování.

• Uživatelem měřitelné dimenze zahrnující, ale neomezující se na lingvistické znaky a morfémy, fonémy, lexikální strukturní komponenty a strukturní komponenty na úrovni věty a odstavce s uživatelem distribuovanou vahou pro tvorbu algoritmů.

• Volitelné integrované určování prahové hodnoty a vážení pro kategorizaci specifických, předdefinovaných nebo vrstvených sémantických informací.

• Volitelnou a vyladitelnou integraci strojového učení včetně bezešvého nasazení 0 až n modelů učení s učitelem, smíšeného učení a učení bez učitele na datový soubor.

• Průvodce vedené GUI (grafickým uživatelským rozhraním), jež umožňují netechnickým uživatelům provádět volbu návrhu studie za účelem nastavování parametrů pro pozorovatele, anotátory, subjekty a hodnotitele výzkumných projektů pro subjektivní značkování textových nebo přepsaných dat.

• Výpočet statistických průměrů, klouzavých průměrů datových souborů a další způsoby určování skóre centrálních tendencí, historických emocí a sentimentu vázaných na uživatelem definovaná témata, korpusy nebo vyhledávací dotazy, skóre konotací pro každou uživatelem definovanou dimenzi pro uživatelem definovaná témata, korpusy nebo vyhledávací dotaz a statistiky o dalších uživatelem definovaných syntaktických, fonologických, morfologických, kognitivně lingvistických, sociolingvistických a sémanticko lingvistických dimenzích textu.

• Intenzita: Náš klasifikační model je jediný, o němž víme, který klasifikuje intenzitu emocí, konotací nebo lexikálních rámců namísto pravděpodobnosti (klasifikace) nabízené jako náhrada za intenzitu.

MODEL

Tento vynález popisuje sociolingvistický řetězec, který umožňuje výzkumníkům z oblasti sociálních věd, počítačových vět a humanitních disciplín a podoborů analyzovat mluvený a psaný jazyk, nasbíraný online a offline, a vytvářet analýzovatelné datové soubory analyzované strojovým

-31 CZ 2023 - 331 A3 učením a procedurálním programováním k poskytování vhledů uživateli, aniž by byla vyžadovaná znalost počítačového programování.

Výzkumníci, neziskové organizace a další uživatelé mohou používat sociolingvistický modul k provádění hloubkové analýzy řečových a textových korpusů. Text může být časově rozdělený, aby mohl být sledován v čase, nebo omezený pro časově ohraničenou analýzu.

Předběžné zpracování zahrnuje značkování slovních druhů pomocí tagů (i možnost vytváření gramů slovních druhů), vytváření n-gramů, výpočty frekvence a relativní frekvence, rozpoznávání jmenovaných subjektů, kolokace, skip-gramy, aproximované n-gramy, aproximované a další lexikony a jiné funkce přípravy dat zpracování přirozeného jazyka (NLP).

TECHNICKÉ DETAILY

Tok jádrového systému sociolingvistického modulu zahrnuje následující zásadní a volitelné individuálně upravené kroky:

I. Systém začíná ukládáním, přijímáním, extrahováním a jiným katalogizováním textu umístěného na internet, vygenerovaného internetem a na internetu, textu v odpovědích na internetu, digitalizovaného, přepsaného nebo trvale přítomného textu na internetu (zahrnujícího ale neomezujícího se na mluvená slova v audio nebo video materiálech [„řeč“], prostý text, označkovaný text a emotikony, anotovaný text, text s hypertextovými odkazy, rozšířený text, přepsaný text nebo přeložený text. Volby se extrahují, vyčistí a umístí do strukturovaných a nestrukturovaných (příslušně) databází k uložení.

II. Mezitím sociolingvistický modul provádí průběžný sběr a agregaci korpusu zahrnujícího, ale neomezujícího se na příspěvky na sociálních médiích, příspěvky na fórech, odpovědi na stránkách dotazů a odpovědí, internetové komentáře, texty reklam, texty instrukcí, psaná či mluvená umělecká díla a právní text. Pokud to je relevantní, začne automatické značkování pomocí tagů s průběžným formátováním, indexováním a zpracováním / obohacováním dat, jež zahrnuje, ale neomezuje se na ukládání a sledování přesvědčení, názorů, emocí a postojů k celé řadě témat pro daného jednotlivce nebo skupinu a je jimi spouštěno v průběžné realizaci analýzy sentimentu. Data potom podstoupí indexování pro budoucí vyhledávání.

III. Dále administrátor přijme možnosti aplikace analýzy sentimentu na text, jež umožňuje zpracovat data se zaměřením na emoce, sentiment, přesvědčení a názory s využitím sémantických analytických nástrojů a metod, které zahrnují, ale neomezují se na: neuronovou síť, algoritmus náhodného lesa, shlukovací algoritmus, algoritmus základních složek, algoritmus maticové faktorizace, algoritmus Bayesovy klasifikace, modul založený na pravidlech, vyhledávací modul.

IV. Jakmile je automatické tagování dokončeno, uživatelé mohou pomocí grafického uživatelského rozhraní na osobních počítačích, smartphonu, tabletu nebo mobilním přenosném zařízení vytvářet a spravovat průzkumy, vytvářet nová data nebo značkovat uložená data tágy na základě průzkumů.

V. Uživatelé mohou pomocí grafického uživatelského rozhraní vytvářet nová pravidla tagování kognitivně lingvistických komponent, jež je možné aplikovat na stávající data a budoucí data.

VI. Uživatelé mohou pomocí grafického uživatelského rozhraní vytvářet na základě dotazů uzpůsobené náhledy na data k zodpovězení výzkumných otázek, zahrnující ale neomezující se na: akademické a vědecké výzkumné otázky, obchodní inteligenci, marketingovou inteligenci, analýzu akciových trhů, vhledy pro politickou kampaň.

-32 CZ 2023 - 331 A3

VII. Konečně mohou být průzkumy, otagovaná data a nové korpusy a subkorpusy vytvořené uživatelem zahrnuty do datového úložiště, aby se na nich mohly provádět nové dotazy.

VIII. Podobně je možné nová, uživatelem vytvářené automatizovaná tagovací pravidla, uzpůsobené náhledy založené na dotazech, vizuální znázornění dat a modely strojového učení a jejich vyladíteIné prahové hodnoty, parametry a hyperparametry zapojit do modulu automatizovaného tagování za účelem tagování a indexování nově příchozích dat pro budoucí přístup a dotazování.

IX. Dva předchozí kroky představují zapojení datových zpětnovazebních smyček pro vylepšování výkonnosti analýzy dat, statistiky a strojového učení.

X. Grafické uživatelské rozhraní umožňuje export zvolených datových souborů se zvolenými vlastnostmi, komponentami a parametry k provádění analýzy.

Přidání dat jako příspěvek do veřejného datového úložiště při uveřejnění nebo dokončení projektu.

Příkladná provedení

Profesorka sociologie chce provést studii slov pro chorobu používaných v čase v online diskurzu od roku 2002.

Předchozí způsoby by primárně umožňovaly výpočet nej významnějších slov, frází nebo témat, jejich vyznačení v datech a vydání zprávy. OBR. 28 je systémový diagram fúnkcí uživatelského rozhraní pro sociolingvistická data. OBR. 29 je vývojový diagram řetězce sociolingvistického modulu. Sociolingvistický řetězec je nový a nesamozřejmý díky své schopnosti vzít spontánní vyjádření ve volné podobě a převést je na kvantifikovatelná, vypočítatelná data.

Dříve se kvalitativní výzkumníci primárně mohli zaměřovat na výrazy, jež byly jak subjektivní, tak agregované. Datové soubory bylo možné analyzovat jedině podle metadat, jako je věk, stádium rakoviny, lokalita nebo rodinný stav.

Sociolingvistický řetězec je rovněž nový svou schopností umožňovat korelace, operace, statistické klasifikace za pomoci strojového učení, datově analytické, na třídách založené nebo prediktivní klasifikace na základě částečně nebo čistě kvalitativních dat.

Profesorka zadá URL do generátoru korpusu uvedeného modulu, který agreguje, normalizuje a sloučí extrahovaná data do jediného textového datového souboru.

Dále užíváte lká importuje zvukové soubory nashromážděné katedrou sociologie za posledních 5 let studenty s magnetofonem.

Zvukové soubory se přepíšou na text a přidají do metakorpusu. Každý subkorpus obsahuje pole, který odlišuje jeho zdroj.

Profesorka zadá dotazy za účelem analyzování historických trendů u slov pro chorobu.

Zvukové soubory se automaticky otagují o odpovědi na otevřené otázky, které předtím nebylo možné kvantifikovat, jako:

„Můžete mi říct trochu víc o tom, co se stalo potom?“ „Jak se s tím vyrovnáváte?“

-33 CZ 2023 - 331 A3 „Dostalo se vám podpory od někoho v té době?“ „Co myslíte, že jste získal/a z této zkušenosti?“ „Jak jste aplikoval/a zkušenost, kterou jste získal/a v jiné životní situaci?“

Pro každou z těchto otázek teď může sociolingvistický řetězec kvantifikovat dimenze (i jejich příslušné subkomponenty), jako jsou bez omezení:

Emoce

Postoje k problémům

Osobnost

Přesvědčení

Perspektivy

Sentiment

Vjemy

Názory

Profesorka a její tým provede 8 90minutových nahrávaných rozhovorů v průběhu 2 let s pacienty a jejich primárními poskytovateli péče včetně 4 rozhovorů v průběhu procesu chemoterapie s následným rozhovorem po dokončení chemoterapie.

Zvukové záznamy zbývajících rozhovorů se přepíšou a přijmou do sociolingvistického řetězce, kde PI může jednoduše načíst zvukové rozhovory pomocí nástrojů pro předběžné zpracování dat.

Profesorka dostane upozornění e-mailem, jakmile jsou soubory zpracovány a přepsány do textové podoby.

Průvodce importem dat řetězce umožňuje výzkumníkům zadávat názvy příslušných polí, zadávat metadata nebo slučovat datové soubory.

Profesorka může potom podrobit data zpracování přirozeného jazyka se zaměřením na lingvistický sentiment a zpracování pomocí statistických nebo sémantických nástrojů, jako jsou bez omezení: tokenizace (přijímající hlavní pojmy a fráze používané pacienty s rakovinou v rozhovorech), kolokace k odhalení důležitých pojmů obklopujících pojmy, na něž se v rozhovorech dotazuje, korelace, emocionální skóre ke sledování pocitu, názoru nebo přesvědčení či postoje v každém kontrolním bodě rozhovoru a/nebo při následném rozhovoru.

Profesorka se může rozhodnout pro spuštění porovnávací metriky k porovnání jazyka a/nebo sentimentu používaného pacienty s ohledem na čas, geografické umístění nebo další metadata a/nebo přijmout měřítka centrality pro datový soubor a další statistické zásahy, měřítka a korelační body (jež by jinak byly nedostupné pro kvalitativní rozhovory).

Navíc může profesorka provést závěrová srovnání s podobnými studiemi u pacientů s rakovinou podstupujících odlišnou nebo podobnou léčbu, sjednotit datové soubory kvalitativních rozhovorů s následnými průzkumy po skončení rozhovorů v písemné podobě, exportovat datové soubory pro

-34 CZ 2023 - 331 A3 další analýzu ve statistických programech, provádět strojové učení (seskupování, shlukování učitelů, predikování pocitu zdraví, hodnocení, na kterých znacích závisí pocit zdraví).

Když studie vygeneruje nová data, může profesorka procvičit algoritmy strojového učení v jejich volbě na nových datech a/nebo přispět daty do datového úložiště pro použití ostatními.

Když bude profesorka chtít, mohou prostudovat nebo odhalit vzorce v datech pro další závěry.

Navíc mohou být pacienti shlukováni, případy mohou podstoupit T-test nebo další měření pro detekci anomálií.

Profesorka se může rozhodnout pro použití dalších nástrojů ke zvýraznění výrazných znaků, jako je bez omezení náhodný les.

Za použití strojového učení může profesorka detekovat pacienty s rakovinou na nejnižší úrovni pocitu zdraví, jejich příslušné vlastnosti a/nebo pacienty s nejvyšším rizikem sebevraždy.

Jakmile je výzkumný článek uveřejněný, profesorka může přispět svými datovými soubory do zásoby všeobecných znalostí přes datové úložiště, schválit jejich použití za vybraných nebo veškerých podmínek a poukázat na své výzkumné články pro kategorizaci a využití jinými výzkumníky.

I když byla popsána určitá provedení, tato provedení byla prezentována pouze pro příklad a jejich účelem není omezovat rozsah předkládaného vynálezu. Ve skutečnosti platí, že zde popisované nové způsoby, zařízení a systémy je možné realizovat mnoha různými formami, navíc je možné u formy zde popisovaných způsobů, zařízení a systémů provádět různá vynechání, nahrazení a změny, aniž by došlo k odchýlení se od ducha předkládaného vynálezu. Přiložené nároky a jejich ekvivalenty jsou zamýšleny tak, že pokrývají takové formy nebo modifikace, jak by spadaly do rozsahu a ducha předkládaného vynálezu. Například může být tato technologie strukturovaná pro cloudové výpočetní systémy, kde je jedna funkce sdílena a zpracovávána ve spolupráci mezi množstvím zařízení přes síť.

SÉMIOTICKÁ LINGVISTICKO POLITICKÁ ANALÝZA

PROBLÉM

Neexistuje žádný systém analýzy sentimentu, který by dokázal vyčíslit politický postoj se spolehlivou přesností včetně vztahu k politické straně a jeho psycholingvistických subkomponent. Navíc neexistuje sémantický systém, který by dokázal zachytit subtextové jemně granulované signály politického přesvědčení v přepsaném, přeloženém nebo autorském textu nebo 5 (zvukové řeči) s inkluzivním sémantickým rámcováním.

Žádné řešení strojového učení nezachytilo tyto implikační a konotační nuance politické řeči v granulámím, kvantifikovaném formátu založeném na valenci. To jsou stále důležitější funkce, protože obtížně opakovatelná řečová a textová komunikace má výrazný vliv na veřejnost a je zájem ίο na prevenci souvisejícího násilí (jako byl útok na Capitol v USA z 6. ledna 2021).

Strojové učení nebylo aplikováno na tyto kognitivně lingvistické prvky s přesnými měřením subkomponent systému politického přesvědčení, hodnocení sebe a ostatních nebo diskurzivní obraty v rámci zpráv, způsoby, které vytvářejí robustní osobní profily, shluky a vztahy politického 15 postoje a jeho dílčích součástí v rámci komunit, politických stran a lidských skupin.

Detekce afektu (emocí) jak při pronášení politických sdělení — tak i v indukovaných a ve vyvolávaných emocionálních reakcích u kolektivního a individuálního publika —je důležitá

-35 CZ 2023 - 331 A3 pro ochranu společnosti, pochopení a zachování politického diskurzu a svobody projevu i k zažehnání budoucího potenciálního politického násilí.

Dále je potřeba normalizovaná hodnotící a klasifikační sada systémů k další klasifikaci a detekci dalších aspektů sentimentu implikovaných a konotovaných v psané a mluvené politické řeči, jako jsou bez omezení názory, přesvědčení a postoje.

Pokusy měřit a zlepšovat posuny v systémech společenského přesvědčení, snižovat počty zločinů z nenávisti, omezovat politické násilí mezi stranami a další prosociální, zklidňující opatření vyžadují sadu systémů pro měření online, celulámí, digitální a analogové komunikace, jejích implikací, nuancí a účinků.

A konečně měření pozic na politickém spektru je potřeba k detekování politického extrémismu nebo domácího či zahraničního terorismu.

PŘEDCHOZÍ PŘÍSTUPY

Automatizovaná klasifikace politických postojů dosud postrádá jemně granulované, obohacené mikroinformace o přesvědčení, názorech a cítění (sentimentu). Žádný jediný systém nebyl schopen spolehlivě predikovat posuny v politických postojích, typ a inklinace nerozhodnutých voličů a pravděpodobnost změny názoru a politických stran, a to vše najednou.

Dále teoretické kognitivně lingvistické prvky, které dokáží zachycovat nuance politického přesvědčení, nebyly spolehlivě kvantifikovány normalizovaným způsobem, který umožňuje srovnávací body napříč sektory společností.

Takový systém je potřeba v těsném sledu za politickým zasahováním cizích subjektů. Navíc používání politického jazyka, videa a řeči způsoby, které mají významné emocionální a kognitivní účinky na občany, v posledních měsících a letech vzbudilo veřejnou pozornost. Velice potřeba je systém pro detekci nuancovaných zpráv a účinků na publikum během a po provádění politické komunikace.

Také vzestup subkultur, jako jsou zastánci bílé nadřazenosti, a další extremistické skupiny na příslušných stranách politického spektra, i jejich společenského vlivu a rostoucí násilí signalizuje potřebu souboru systémů pro kvantifikaci, identifikaci a predikci emocionální eskalace a vzedmutí k politickému násilí.

Předchozí řešení tohoto problému dokázala predikovat samotné násilí, ale nedokázala je navázat na implikatury a konotace ve specifických komunikačních prvcích.

Předchozí řešení tohoto problému se nezabývala dílčími prvky kognice, lingvistiky, emocí, intelektuálních procesů a předpokladů a jejich mikroumístěním napříč politickým spektrem přesahujícím hlavní strany.

Klasifikace názorů, přesvědčení, sentimentu a emocí v této oblasti je zásadní pro nenásilnou společnost, detekci hrozeb, veřejný diskurz, prevenci podněcování a vhled do politického publika při aplikaci jak na lidská, tak na komputační kolbiště.

ZPŮSOBY

Příjem internetových stránek nebo jinak digitalizovaného textu, přepsaného zvuku a jejich předběžné lingvistické zpracování a následná lingvistická analytická měření za účelem agregace multidimenzionálních skóre, valence, polarity a deixe.

-36 CZ 2023 - 331 A3

Převod multidimenzionálního skóre autora, mluvčího, strany a zpravodajského média nebo zdroje obsahu najedno skóre politického sklonu (PLS) se subdimenzemi pro postojové čtení s ohledem na sledování vládních, konstitučních, ideologických a společenských záležitostí.

Průběžné aktualizování skóre obsahu a médií s přijímáním nových datových řádků.

Detekce a klasifikace datových řádků s ohledem na skóre pravděpodobnosti nerozhodnutých voličů (SVLS), měření prahových hodnot loajality k politické straně, míry kolísání v postupných postojích v čase nebo komunikaci o politických událostech i stupně, v němž se mění vzhledem k času nebo události a závažnosti a intenzity události.

Třídy nerozhodnutých voličů, jež je možné detekovat podle centrální příčiny a hlavních faktorů, pro jejich politickou ambivalenci, otevřenost, flexibilitu, ovlivnitelnost, tvárnost a pohyb podél politického spektra a souvisejících vedlejších os.

Schopnost využití v aktivitách národní bezpečnosti, interakcích člověka a robota, vzdělávacích aplikacích a experimentech, emočním modelování pro sociální roboty a dalších bezpečnostních interakcích detekce afektu.

Skóre APS3 měří místa jako moc, kontrola, reforma, směrovost, přirozenost, akce a statusové vztahy, jak jsou zastoupena v lingvisticky vypočítaných konstrukcích a řetězcích.

Schopnost integrovat a provádět převod na robotem čitelná měření sociální psychologie včetně skupinové dynamiky, meziskupinových vztahů, předsudků nebo stereotypů a organizační psychologie.

[0376] Vypočítané a přenášené integrace kognitivně emocionálních lingvistických prvků, jako jsou bez omezení valence moci, skóre uzákoněných ctností (EVS), komparativní hodnotové skóre (CVS), skóre sociálních subkomponent s automatickým umístěním (APS3) a jejich příslušné subkomponenty.

Měření význačných komponent v multidimenzionálním prostoru, odporu, náboženství, skóre lokality, ironických konstrukcí, typu rétorického prostředku, řečových aktů, dynamické změny psycholingvistického stavu.

Skóre atributů uživatelů a valenční derivace u subkomponent, jako je statečnost, zvědavost, autentičnost, zranitelnost, skóre emocionálního kvocientu (EQS), soucit, soud a učenlivost tak, jak se vztahují k politickým lokalizacím a pozicím.

CHARAKTERISTIKY MODELU

Profily prototypických uživatelů daného shluku kolektivně a individuálně k určení mikro rozdělení politického postoje a pozice na příslušných vedlejších osách.

Zahrnutí mikro značek a vedlejších os pro politický postoj, rozložení politické a stranické příslušnosti nájemně granulámí podčásti založené na sentimentu s možností analyzování, sběru a uspořádání názorů týkajících se bez omezení pozice s ohledem na finance, morálku, sociální podporu, ekonomiku, dosah působnosti vlády, občanské svobody, ústavu a dalších politických sektorů sentimentu pro matematickou, statistickou a na vektorech založenou klasifikaci.

Teoretické komponenty kognitivní lingvistiky zahrnující, ale neomezující se na rámcování, konceptuální metaforu, literární prostředky, metaforu, směšování konceptů, mentální prostory, lexikální sémantiku, rámcovou sémantiku, silovou dynamiku a další subkomponenty kognitivní lingvistiky byly změřeny a zahrnuty, kde ještě předtím nebyly, do sjednoceného souboru systémů, který měří subkomponenty pro kvantifikaci a výpočet těchto emotivních účinků skrze jazyk.

-37 CZ 2023 - 331 A3

Zahrnutí teoretických kognitivně lingvistických prvků soustředěných na význam, aplikovaných na vstupní data v kvantifikované podobě, prostřednictvím konverze na statistické prvky a prvky strojového učení, značky, matice a vstupy k zachycení bohatých sémanticko politických informací o postoji, politickém sklonu a přesvědčení.

Heuristika pro přiřazování příznaků komentářům na sociálních médiích v reakci na zvukový (jako podcasty), vizuální (jako videa nebo obrázky) a textový nebo řečový obsah (zahrnující, ale neomezující se na projevy, komentáře, rozhovory, zprávy, poznámky, příspěvky, e-maily a další vstupy), jež nesouhlasí s pozorovaným nebo zaznamenaným uveřejněným obsahem.

Náš model má jedinečnou schopnost kombinovat strojové učení (učení s učitelem a bez učitele) se souborem systémů založených na pravidlech, který poskytuje empiričtější klasifikaci sentimentu, emocí, přesvědčení a názorů, silnější profilování stran za použití jazyka, efektivnější klasifikaci a větší flexibilitu při práci s datovými soubory.

Používání meta informací, synchronizovaných streamů, aplikace modelů, členění dat, porovnávání základních úrovní oproti percepčním výsledkům a výpočtů valencí k detekování politického sektoru a emotivního uvažování.

TECHNICKÉ DETAILY

Schopnost shromažďování označkovaných dat je zajištěna za použití heuristiky, filtrování, zástupců založených na lokalitě a pravidlech pro politickou příslušnost a postoj k předem definovanému seznamu vedlejších os, předmětů, témat a lexikálních rámců.

Integrace shromažďování význačných n-gramů spojených s osobou, internetovými stránkami, lokalitou nebo časovým obdobím za pomoci statistických přístupů a přístupů strojového učení zahrnujících, ale neomezujících se na: počítání n-gramů a měření specifičnosti pro uvedenou osobu, internetovou stránku, lokalitu nebo časové období ve srovnání s jinými takovými subjekty.

Systémy začínají identifikací charakteristických vedlejších os, předmětů, témat a lexikálních polí a rámců specifických pro konkrétní politiky, veřejné figury vytěžením textů nej častějších n-gramů a modelováním témat uživatelem generovaných dat v různých formách včetně (bez omezení): tweetů, přepsané řeči.

Tyto systémy mohou rovněž identifikovat charakteristické vedlejší osy, předměty, témata a lexikální pole a rámce specifické pro konkrétního uživatele sociálních médií vytěžením textů nej častějších n-gramů a modelováním témat uživatelem generovaných dat v různých formách zahrnujících bez omezení: tweety, příspěvky na síti Reddit, přepsanou řeč z interakcí na sociálních médiích, fotografie, oblíbený obsah a zvukové záznamy, pokud jsou k dispozici.

Tyto systémy mohou rovněž identifikovat charakteristické vedlejší osy, předměty, témata a lexikální pole a rámce specifické pro konkrétní sociální síť prostřednictvím vytěžení textů nej častějších n-gramů a modelováním témat uživateli generovaných dat v různých formách zahrnujících bez omezení: články, příspěvky, přepsanou řeč z interakcí na sociálních médiích pro oficiální účet sítě, oblíbený obsah a zvukové záznamy, pokud jsou k dispozici.

Tyto systémy mohou definovat konečný seznam záležitostí, na nichž se bude měřit postoj uživatelů, na základě vedlejších os předem definovaných a odhalených pomocí statistiky a strojového učení.

[0394] Tyto systémy mohou potom identifikovat postoj uživatelů ke každé záležitosti a vedlejší ose se skóre jistoty za použití strojového učení zahrnujícího, ale neomezujícího se na následující přístupy: indikátory založené na n-gramech jako virální přijetí význačných n-gramů, identifikaci

-38 CZ 2023 - 331 A3 dominantních témat prostřednictvím ko-výskytu slov, n-gramů, skipgramů a gramů slovních druhů (POS) a specializovaných kolokací, Bayesovské klasifíkátory, kolaborativní filtrování, maticovou faktorizaci, shlukovací algoritmus, LSTM neuronovou síť, jemně vyladěnou transformátorovou neuronovou síť, identifikované na základě vytěžení textu a modelování témat. Tyto systémy potom spojí tato data s vytěženými metadaty uživatelů, jež mohou udávat věk, etnickou skupinu, socioekonomický status.

Tyto systémy mohou potom predikovat podobnost uživatelů na základě podobnosti postoje u elicitovaného seznamu vedlejších os za použití přístupů strojového učení zahrnujících, ale neomezujících se na: neuronovou síť, Bayesovský klasifikátor, algoritmus k nejbližších sousedů, shlukovací algoritmus, logistickou regresi, SVM, náhodný les.

Tyto systémy mohou potom predikovat politickou příslušnost za použití postojů uživatelů jako vstupních vlastností pomocí přístupů strojového učení zahrnujících ale neomezujících se na indikátory založené na pravidlech, Bayesovské klasifíkátory, LSTM neuronové sítě, jemně vyladěné transformátorové neuronové sítě vycvičené na politických datech a veřejné reakci.

Může být integrováno shromažďování informací o uživatelích s ohledem na odhalované a předem definované dimenze zahrnující, ale neomezující se na: soucit, tvrdohlavost, pravděpodobnost proměnlivosti politického postoje, tendenci k násilí atd.

Tyto kroky se mohou opakovat pro libovolný specifický časový bod a analýza změn v datech umožňuje sledovat politické pohyby a identifikovat trend v politických postojích v čase, a to u jednoho uživatele, specifické skupiny uživatelů nebo u datového souboru všech uživatelů jako celku.

Pomocí křížových referencí na data generovaná uživateli vystavenými propagandě, reklamě a jiným identifikovaným zdrojům vlivu dokáží tyto systémy kvantifikovat stupeň změny postoje na libovolné identifikované vedlejší ose.

Výsledky analýz pro specifického uživatele a časové období je možné vizualizovat na grafickém uživatelském rozhraní (GUI), jež zahrnuje, ale neomezuje se na: internetové stránky, plugin modul prohlížeče, aplikaci pro smartphone.

Tyto systémy je možné rovněž aplikovat na hodnocení postoje uživatele na jediném nebo omezeném datovém bodu, jako je jediný příspěvek, video nebo libovolná forma příchozího textu, audia, videa.

DETEKCE PŘEDSUDKŮ, DISKRIMINACE A PŘEDPOJATOSTI

Tyto způsoby jsou jedinečné pro jejich rozpoznávání skryté a otevřené předpojatosti, přičemž granulámí lingvistické rysy jsou speciálně extrahované z výrazů založených na předsudcích a diskriminaci a aplikované na takové výrazy v přirozeném jazyce, přičemž je možné je aplikovat a jemně vyladit na případy rasismu, sexismu, ageismu, homofobie, transfobie, xenofobie, sexuálního obtěžování, třídní diskriminace a diskriminace postižených ve spontánní nebo připravené řeči nebo textu od soukromých nebo veřejných postav a subjektů, neziskových organizací, z publikací, internetových stránek a jiných zdrojů médií a jejich komunikačních prostředků.

PROBLÉM

Detekci diskriminace, předsudků a jinak negativních nebo předpojatých postojů vůči dané skupině lidí, chráněné třídě, menšině, bezmocné nebo znevýhodněné skupině obyvatel nebylo možné snadno jednotně kvantifikovat v komputaění lingvistice. Nebyl vyvinut žádný formalizovaný systém, který by bylo možné aplikovat napříč časem, texty a předsudky, protože detekce takového psaní zůstává příliš specifická pro konkrétní datové soubory.

-39 CZ 2023 - 331 A3

Navíc když sociolingvisté, sociologové, psychologové a etické a ženské studie a studie sexuálních odlišností (a jejich ekvivalentní humanitní a technické studie) prozkoumaly jazyk zblízka, bylo vyvinuto málo spolehlivých souborů pravidel a vodítek jako standard pro detekci rasové předpojatosti.

V důsledku toho nebylo k dispozici žádné jednotné měřítko, podle nějž by bylo možné hodnotit přirozený jazyk nebo spontánní řeč. Kvůli tomu nebyl zaveden konzistentní relativní stupeň předpojatosti a předsudků, takže je obtížné prosazovat zodpovědnost a podporovat rychlejší společenskou změnu.

Tím došlo k vytvoření společnosti, kde trpící menšina je „neviditelná“, přičemž zvláštní skupiny obyvatel jsou vlastně podrobeny gaslightingu následkem nedostatku definitivního, sjednoceného důkazu v jazyce. Tento efekt rovněž ztížil organizacím a korporacím měření jejich výkonnosti a schopnosti reakce jakožto kolektivních subjektů, když přijde na implicitní předpojatost.

A konečně výsledky v reálném světě vyžadují korelaci se soubory systémů měření z hlediska implicitní předpojatosti a diskriminace, aby veřejní a soukromí jednotlivci, subjekty a systémy mohli být vedeni k zodpovědnosti, hodnoceni a mohli se zlepšovat (i zásahy navržené ke zlepšení takových systémů, individuální komunikace a výsledky subjektů v rovném zacházení). Společnost vyžaduje řešení pro předcházení předpojatosti a měřítko, jak je používají tyto systémy, k identifikaci, prevenci a detekci pravděpodobnosti individuálního nebo hromadného násilí ze strany skupiny lidí nebo vůči skupině lidí, a to obecně i v libovolné dané době a na libovolném místě.

Nenápadné formy předpojatosti jako „označování za jiné“ (přistupování k menšinám a utlačovaným skupinám, jako kdyby byly mimo normu bělosti, heteronormativity, cisgenderu ajiného většinového statusu), „bílé rytířství“ (přistupování k menšinám nebo utlačovaným skupinám, jako by bylo potřeba je zachraňovat, přičemž se členové většiny prezentují jako zachránci) nebo „mikroagrese“ (malé, skryté a snadno přehlédnutelné často nevědomé, ale kolektivní psychologické ubližování) se obtížně vypočítávají, předvídají a kvantifikují.

Jako takové nebyly doteď k dispozici žádné standardizované způsoby kvantifikace předpojatosti a diskriminace.

CHARAKTERISTIKY

Komputační efektivita detekce diskriminace díky zavedení indexů do všech zapojených algoritmů.

Vysoká přehlednost a přesnost díky technikám časového rozdělení a rozdělení textu k vypíchnutí emocionálních a předpojatých reakcí během rozhovorů, pozorování a komunikací zadaných do systémů.

Další komputační efektivita přístupu k výsledkům (rychlost dotazování) díky zavedení indexů do zapojených algoritmů.

Integrace multisenzorických vstupů do jediného systému detekce předpojatosti, který na výstupu poskytuje sadu normalizovaných skóre a celkové skóre předpojatosti, které udává přítomnost a stupeň předsudků, předpojatosti, diskriminace nebo nerovné přízně ve vnímání a působení daného vstupu.

Schopnost navázat hodnocení a vstupy diskriminace a předpojatosti na důsledky v reálném světě zahrnující, ale neomezující na soudní rozhodnutí, spravedlivé ocenění bydlení, obvinění z policejní brutality, diskriminaci v zaměstnání, předpojatost médií, výsledky přesvědčování a marketingu, komerční návratnost investic (výsledky imprese, jak doslova u entit na webu, v tabletech a

-40 CZ 2023 - 331 A3 smartphonech, tak i jiné přeměny z potenciálních prodejů na prodeje u jiných médií) a hodnocení sociálních norem.

Obratnost při hodnocení implicitní předpojatosti pozorovatelů při pozorování a vnitřním zpracování multisenzorických dat i implicitní předpojatosti přítomné v samotných konzumovaných médiích au jejich činitelů, umožňující provádění korelací a statistických spojení mezi uvedenými dvěma.

Jemně vyladěné aplikace, které je možné přizpůsobit parametrům pro diskriminační projevy a lingvistické výrazy a používat nad rámec tradičních klasifikací předpojatosti, po jemně vyladěné funkce pro předpojatost vůči intersexualitě, diskriminaci kvůli národnostnímu původu, diskriminaci kvůli těhotenství, rodičovskému nebo partnerskému stavu a socioekonomické třídě.

Používání metadat a hodnocení komputační lingvistiky společně s dalšími senzorickými vstupy k vytváření profilů geografického, socioekonomického, politického a sociálního postavení v souvislosti s věkem, a další funkce pro predikci subjektů nebo jednotlivců, jež by pravděpodobně mohli nést předpojatost, pro efektivní intervence.

Schopnost monitorovat intervence oproti časové ose a sledování lokalit pro účely úpravy, zlepšování a grantů.

Markéry detekce základního stavu (BSD) umožňující zkopírování automatických identifikátorů datových řádků do datového úložiště a třídění podle markérů konkretizovaných pro pohlaví, rasu, socioekonomickou třídu, sexuální orientaci, stupeň fýzické způsobilosti a inkorporační dimenze pro konverzi indexu chudoby nebo socioekonomického indexu.

Výpočet komparativních signálů mezi daty s připojenými markéry BSD a tokem vstupních dat umožňující AI zlepšovat efektivitu v době zpracování v subtextových kanálech, čímž se dosáhne jak zkrácení cvičných kol, tak snížení využití systémových zdrojů.

ZPŮSOB

Tyto systémy detekce předpojatosti a předsudků kvantifikují diskriminační postoje a negativní přístupy k chráněným, menšinovým, znevýhodněným či konkrétním třídám lidí. Tyto systémy osvětlují detekci diskriminačního jazyka přes detekci a měření subtextových lingvistických vodítek podle přítomnosti a umístění rysů ve větě a měřením případů (v rozsahu [0, n]); relativní pozice v rámci věty (IRP); množství přiřazení syntaktických sekvencí, nepřesného nebo přesného řetězce nebo jejich kombinace; mikrodimenzionálního porovnání (MDC) libovolného typu následujících kategorií lingvistických konstrukcí a význačných sociolingvistických rysů a jejich příslušných měřicích bodů:

1. Minimalizace

2. Obětní beránek

3. Změna rámce problému na nepředsudečný

4. Zavržení

5. Označování za jiné

6. Deskriptory založené na strachu

7. Výrazy založené na hrozbách

8. Obvinění z nezákonnosti

9. Diskriminační odmítnutí

10. Zvířecí výrazy

11. Vychyluj ící výrazy

12. Záměna argumentů a hyperbolický výsměch

13. Ospravedlňování předpoj atosti

14. Zpochybňování utrpení

-41 CZ 2023 - 331 A3

15. Extremistické rámování

16. Vzpurné výrazy

17. Obviňování oběti

18. Umlčování

19. Otevřené výhrůžky

20. Dominanční techniky

21. Zdvořilé naléhání

22. Rady, co by se mělo

23. Obranné techniky

24. Formáty blahosklonného vysvětlování (mužů vůči ženám, bílých vůči jiným atd.)

25. Diskvalifikace obětí

26. Stereotypy

27. Vylučující výrazy

28. Třídní výrazy

29. Zpochybňování cti

30. Charakterové soudy založené na třídě

31. Diskreditační kampaně

32. Dvojí standardy

3. Lingvistické napodobování

34. Vymazání a pózy

35. Exotizace

36. Nostalgie po době před rovností

37. Mikro urážky

8. Chvála vnímání většinového rysu

39. Kapciózní otázky

40. Chvála vzorové menšiny

41. Patemalizace

42. Adekvátní j azyk

43. Kriminalizační výrazy

44. Moralizování

45. Dehumanizující výrazy

46. Řeč o čistotě

47. Výrazy o narušení/invazi/převzetí

48. Obvinění z podvodu/zneužívání sociálních dávek

49. Obvinění z kažení společnosti

50. Stížnosti na asimilaci

51. Jazyk zpravodajských služeb

52. Prohlašování předsudku za upřímnost / realismus

53. Ukončení ochrany

54. Obezřetnost jako klam zvláštního zacházení

55. Předsudečné úvody / ospravedlnění popírající předsudky před rasistickými poznámkami

56. Předsudek převlečený za humor

57. Používání terčů pro společenské uznání

58. Znevažování způsobeného traumatu

59. (Falešná / zplošťující) generalizace (Jeden z těch“, „někdo takový“)

60. Neurčité zájmeno ukazovacích zájmen

61. Gaslighting (manipulace)

62. Dehumanizace

63. Normalizace předpoj atosti

64. Klam stádového efektu

65. Instrukce k ignorování fanatismu

66. Obvinění z využívání statutu minority jako výhody / privilegia

67. Mytologie o svépomoci

68. Ospravedlnění freudovským přeřeknutím

69. Trivializace

-42 CZ 2023 - 331 A3

70. Rasizace

71. Re storativní j ústíce j ako uplatňování dvoj ích standardů

72. Dvojsmyslné komplimenty

73. Ohrožení minoritního j azyka

74. Klam j ediného datového bodu

75. Dominující jazyk / Prosazování moci

76. Připomínky nižšího společenského statutu

77. Oběti jako podněcovači (tvrzení o zasloužené újmě/síle)

78. Tvrzení o necivilizovanosti

79. Infantilizuj ící j azyk

80. Deminutiva

81. Objektifikace

82. Sexualizace

83. Fetišizace

84. Jazyk orientovaný na většinu

85. Obvinění z nečestnosti

86. Obvinění z nedostatku ctnosti

87. Ospravedlnění symbolickou přítomností nebo úspěchem

88. Předpoklad většinové rasy, většinové etnicity, vládnoucího pohlaví, většinové sociální orientace, schopných / neznevýhodněných nebo jinak společensky privilegovaných výhod

89. Pohrdání nebo obvinění implikovaná sémantickými rámci

90. Implicitní nároky na vzdělání utlačovatelů

PROVEDENÍ

Tyto prvky jsou rozlišeny v jazyce shromážděním jednoho nebo více následujících lingvistických rysů:

1. Odhalení diskriminačních a předsudečných lingvistických markérů 0 až n ze seznamu rysů, kde každý lingvistický marker představuje druhé lingvistické vnoření měření kognitivních komponent (CCM), jež přispívají k celkovému skóre předpojatosti a diskriminační označkování.

2. Dostupný výčet skip-gramů frází v korpusu, jež mohou zvýraznit rozdíly mezi přístupem ke skupinám lidí, i vypočítaných kognitivně lingvistických rysů souvisejících s předsudky, předpojatostí nebo diskriminačními postoji nebo praktikami vůči dané skupině lidí, menšině nebo chráněné třídě podle jejich přítomnosti či nepřítomnosti, intenzity a stupně.

3. Volitelně sestavení korpusu zvuku, obrazů a videí i dat ze sociálních médií a metadat k pozorování lidskými bytostmi i k analyzování a hodnocení pomocí algoritmů strojového učení k vyhodnocení implicitní předpojatosti, diskriminace a předsudků prostřednictvím analýzy mikrovýrazů, analýzy zvukových vln a komputace ve všech jejích aspektech, a rovněž přepisu mluveného slova z oprávněného přístupu, vložených nahrávek, živého videa, audia nebo záznamu z kamery.

4. Přídavné volitelné zaznamenání vstupu od samotných pozorovatelů ve formě obrazů, videa, audia, psaného nebo přepsaného či přeloženého textu, dat průzkumu, rozhovorů nebo komentářů z živých či internetových interakcí nebo interakcí na sociálních médiích i odpovídajících metadat.

5. Aplikace balíčku přirozeného jazyka na textový korpus, kde to je indikováno, přičemž se vygenerují tágy slovních druhů (POS) pro každé slovo v kontextu v korpusu a vytvoří se mapování každého slova na jeho odpovídající slovní druh.

-43 CZ 2023 - 331 A3

6. Pokud to je relevantní, aplikace dalšího lingvistického vyčíslení, notace a tagování včetně strukturních závislostí a kolokací bez omezení.

7. Identifikace a předběžné zpracování případných obrazů obličeje zahrnující ale neomezující se na: sémantickou segmentaci, reinterpretaci a normalizaci.

8. Identifikace a předběžné zpracování relevantních, časovaných, uživatelem vyprodukovaných zvukových úryvků, jež mohou naznačovat emoci, úmysl, názor uživatele.

9. Pokud to je relevantní pro vstupní materiál, vycvičení zvolených modelů na připravených korpusech nebo prototypických textech, jež vykazují předpojatost, diskriminaci, předsudky, protekcionářství proti dané skupině lidí, chráněné třídě nebo menšině, i na přepsaných, přeložených, vložených nebo extrahovaných textech přirozeného jazyka, vložených gestech, výrazech obličeje nebo spontánní řeči.

10. Pokud to je relevantní pro typ vstupního materiálu, vycvičení počítačových modelů detekce vizuálních emocí na shromážděných, předem zpracovaných obličejových datech.

11. Pokud to je relevantní pro vstupní materiál, vycvičení rozpoznávacích modelů zvukových emocí na shromážděném, identifikovaném a předem zpracovaném zvuku, řeči produkované uživatelem.

12. Volitelně pomocí predikce obličejových emocí predikování značky emoce pro obraz(y) a přiřazení dané značky ke stávajícímu textu pro uživatele. To umožňuje na základě přídavných elicitovaných dat označit obrazy a textová data tágy pro úroveň uvěřitelnosti, důvěry, předpokladu viny, předpokladu pravdy a příznivosti jejich reakcí.

13. Volitelně pomocí predikce zvukových emocí predikování značky emoce pro obraz(y) a přiřazení dané značky ke stávajícímu textu pro uživatele. To umožňuje na základě přídavných elicitovaných dat označit zvuk a textová data tágy pro úroveň uvěřitelnosti, důvěry, předpokladu viny, předpokladu pravdy a příznivosti jejich reakcí.

14. Vyčíslení gramů slovních druhů (POS-gramů), jež potenciálně zvýrazňují rozdíly přístupem ke skupinám lidí.

15. Vypsání a prozkoumání frekvence POS-gramů a skip-gramů nacházejících se v datech.

16. Za pomoci jednoho nebo více statistických přístupů odhalení skip-gramů a gramů slovních druhů, jež potenciálně zvýrazňují a zdůrazňují rozdíly mezi přístupem ke skupinám lidí.

17. Podle potřeby rozšíření dat za pomoci člověkem nebo strojem generovaných seznamů slov obsahujících sestavu sociolingvistických indikátorů předpojatosti v množství kontextů vůči dané skupině lidí, kontrolní skupině nebo celkové populaci.

18. Aplikování způsobů rozšíření dat podle potřeby k vygenerování podobných synogramů (sémanticky podobných n-gramů) k použití jako n-gramů.

19. Rozšíření frekventovaných n-gramů podle potřeby nahrazením každého slova sestavou, která se skládá z příslušných slov nebo sekvence slov, jež mají podobný sémantický význam, valenci, značku sentimentu, shluk sentimentu, sémantickou asociaci nebo polaritu jako stanovené slovo.

20. Doplnění jakéhokoli rozšíření seznamu frekventovaných n-gramů k nejbližšími sousedy ve vnořovacím prostoru Word2Vec s přídavným utříděním antonym, respektive synonym ze seznamu.

-44 CZ 2023 - 331 A3

21. Pro indikované případy porovnání skip-gramů lišících se dvěma nebo více pojmy nebo slovy, jež příslušně mají výrazný rozdíl, vzdálenost a směr polarity, sentiment, valenci, shluk nebo sémantickou asociaci či význam.

22. Detekování přítomnosti vyčíslených a rozšířených rysů ve vloženém extrahovaném, přeloženém nebo přepsaném textu nebo řeči na bázi korpusu, s rozlišením rysů, jež jsou indikátory předpojatosti.

23. Výpočet skóre pro datový řádek pro každou relevantní značku na základě detekovaných rysů zahrnujících, ale neomezující se na rysy obrazů obličeje textu.

24. Vycvičení způsobů strojového učení na libovolných rozšířených datech a zvolených rysech ze vstupů zahrnujících, ale neomezujících se na LSTM, transformátory, CNN, KNN, shlukování, náhodný les, lineární regresi a Bayesovskou pravděpodobnost ke kvantifikaci předpojatosti.

25. Pomocí obrazových a textových dat vydání a klasifikování implicitní předpojatosti, skóre diskriminace, skóre předsudků, skóre uvěřitelnosti, skóre pravdy, skóre předpokladu viny a skóre protekcionářství.

26. Použití vzniklého vycvičeného modelu k predikci předpojatosti, diskriminace nebo předsudku v libovolném video souboru, obrazovém souboru nebo souboru zvukových vln patřícím k danému řečovému nebo textovému vstupu.

27. Vyhodnocení zvukových či textových reakcí nebo reakcí počítačového vidění na podobnou nebo stejnou komunikaci různými a odlišnými skupinami lidí analyzováním poměrů, bodů v čase nebo vymezení průchodů nebo počtu slov příznivých, nepříznivých a neutrálních obličejových, textových nebo zvukových výrazů a reakcí (i jejich subdimenzí a specifických emocí) vzhledem ke komunikaci, gestikulaci, obrazům, hlasům nebo datům profilu jiné skupiny lidí.

Výše uvedený vynález rovněž zahrnuje níže uvedená provedení.

(1) Způsob automatického rozšiřování obsahu přirozeného jazyka o emocionální kognici obvody pro zpracování. Přičemž uvedený způsob zahrnuje přijetí obsahu přirozeného jazyka jako textového vstupu pomocí vstupního zařízení; vyhledání shod mezi množstvím lingvistických pravidel pro danou emocionální kognici a komponentami textového vstupu uvedenými obvody pro zpracování, přičemž instance lingvistických pravidel mají alespoň jednu lidskou dimenzi; aktivování shodujících se lingvistických pravidel a vyhodnocení alespoň jedné lidské dimenze aktivovaných shodujících se lingvistických pravidel obvody pro zpracování; ohodnocení každé lidské dimenze k získání prototypického profilu hodnotících skóre dimenzí pro danou emocionální kognici obvody pro zpracování; agregování dimenzí v získaném profilu skóre dimenzí obvody pro zpracování k získání údaje o intenzitě pro danou emocionální kognici; a zobrazení na displeji obsahu přirozeného jazyka, rozšířeného způsobem, který přiřazuje shodující se lingvistická pravidla k dané emocionální kognici a udává příslušnou indikaci intenzity dané emocionální kognice.

(2) Způsob podle charakteristiky způsobu (1), v němž lidské dimenze zahrnují jedno nebo více emocionálních hnutí jako sentiment, emoci, emocionálně kognitivní postoje, hodnoty, sociální zvyky, nastavení mysli, rozhledy, pohledy, odezvy, rysy, přesvědčení, názory, perspektivy, motivace, předpojatost, stavy, způsoby, přístupy, dynamiku, osobnostní rysy, emocionální přístup, emocionální volbu, reakci, dispozici, dočasný stav, změnu stavu, kognitivní aspekt, behaviorální aspekt, vnitřní stav, vnější stav, pocit, emoci, propozici, postoj, propoziční postoj, směrovaný postoj, nesměřovaný postoj, postoj směrovaný k sobě, vědomou emocionální kognici, nevědomou emocionální kognici, hněv, anticipaci, znechucení, strach, radost, smutek, překvapení, důvěru, ego,

-45 CZ 2023 - 331 A3 obvinění, souhlas, posvátnost, laskavost, respekt, čas, přízeň, schválení, upřímnost, zranitelnost, soud, odloučení, účelnost, formálnost, minimalizaci, specifičnost, sílu, akci, aktivní působení, zvědavost, zřejmost, záměmost, důraz, energii, jistotu, zájem, zapojení, šok nebo překvapení, napětí, rychlost, nuanci, logiku, paranoiu, odstup, identifikaci, úctu, objektifikaci, vazbu, empatii a trpělivost, v němž každá dimenze má hodnotu, kterou je jedna z +1 pro pozitivní sílu, -1 pro negativní sílu, 0 pro neutrální sílu a 0 pro není přítomna nebo není relevantní, a v němž ohodnocení každé lidské dimenze obvody pro zpracování pomocí skóre zahrnuje přidělení skóre lidským dimenzím pro všechny shodná pravidla.

(3) Způsob podle charakteristiky způsobu (1) nebo (2), v němž krok vyhledání pomocí množství lingvistických pravidel dále zahrnuje detekci konstrukcí na základě lingvistických pravidel; a vyhodnocení lidských dimenzí každé detekované konstrukce.

(4) Způsob podle kterékoli z charakteristik způsobů (1) až (3), v němž krok ohodnocení pomocí skóre zahrnuje porovnání signálu intenzity s prahovými hodnotami pro danou emocionální kognici k získání úrovně emocionální intenzity.

(5) Způsob podle charakteristiky způsobu (3), v němž krok detekování konstrukcí dále zahrnuje detekování přítomnosti nebo nepřítomnosti konstrukcí v obsahu přirozeného jazyka majících komponenty související s danou emocionální kognici.

(6) Způsob podle kterékoli z charakteristik způsobů (1) až (5), dále zahrnující detekování, za pomoci obvodů pro zpracování, vzorce emocionálních kognic, který obsahuje danou emocionální kognici, zřetězením s dalšími emocionálními kognicemi detekovanými jinými lingvistickými pravidly, a identifikování vzorce emocionálních kognic jako dynamické kognice; a sledování dané emocionální kognice a ostatních emocionálních kognic společně se souvisejícími komponentami v časovém sledu v obsahu přirozeného jazyka.

(7) Způsob podle charakteristiky způsobu (3), v němž krok detekování konstrukcí dále nahrnuje určení číselné hodnoty pro jedno nebo více pravidel z pravidla pro značkování řeči tágy nebo syntaktického pravidla, pravidla přiřazování řetězců, které je přesné, nepřesné, maskované nebo s divokou kartou, pravidla blízkosti tokenů, interpunkčního pravidla, lemmatizačního pravidla, stematizačního pravidla, pravidla lexikonu a pravidla vyhledávání slov nebo pravidla založeného na slovníku.

(8) Způsob podle charakteristiky způsobu (7), v němž určení číselné hodnoty pro pravidlo blízkosti tokenů zahrnuje přistoupení ke všem tokenům majícím vzdálenost méně než n tokenů od daného bodu v obsahu přirozeného jazyka, přičemž n je kladné celé číslo.

(9) Způsob podle kterékoli z charakteristik způsobů (1) až (8), dále zahrnující vygenerování nových lingvistických pravidel modulem strojového učení, který provádí alespoň jedno z učení s učitelem a učení bez učitele.

(10) Způsob podle charakteristiky způsobu (9), dále zahrnující přijetí množství datových položek přirozeného jazyka z úložiště; normalizaci a tokenizaci přijatého množství datových položek přirozeného jazyka za pomoci předběžného zpracování k vygenerování předem zpracovaných datových položek přirozeného jazyka; označkování množství předem zpracovaných datových položek přirozeného jazyka značkou pro vyjádřenou emocionální kognici a intenzitu vyjádřené emocionální kognice; paralelní poskytnutí množství předem zpracovaných datových položek přirozeného jazyka modulu učení bez učitele, a modulu učení s učitelem; paralelní vycvičení modulu učení bez učitele a modulu učení s učitelem v několika cvičných epochách k identifikaci konkrétní emocionální kognice v datech přirozeného jazyka a k určení intenzity dané emocionální kognice, přičemž každá cvičná epocha modulu učení bez učitele poskytuje návrhy pravidel pro následné cvičné epochy modulu založeného na pravidlech a každá cvičná epocha modulu založeného na pravidlech poskytuje tabelaci a data skóre pro následné epochy modulu učení bez

-46 CZ 2023 - 331 A3 učitele a modulu učení s učitelem; a poskytnutí výstupu představujícího alespoň jeden z vycvičeného modulu učení bez učitele a vycvičeného modulu učení s učitelem.

(11) Způsob podle kterékoli z charakteristik způsobů (1) až (10), dále zahrnující vygenerování nových lingvistických pravidel obvody pro zpracování, při němž se provádí přiřazení lidských dimenzí přítomných v obsahu přirozeného jazyka porovnáním lidských dimenzí se stávajícími řadami dimenzí majícími divoké karty nebo přeskakování vzorců k určení nových pravidel pro modul založený na pravidlech.

(12) Způsob podle kterékoli z charakteristik způsobů (1) až (11), v němž krok přijetí dále zahrnuje průběžné načítání streamovaného živého videa nebo zdroje animovaného videa s koordinovaným textovým přepisem, a uvedený způsob dále zahrnuje určení kontextových vodítek na základě kovýskytu slov, diskurzních prvků a tematických prvků; označení individuálních řetězců nebo ngramů trinámími skóre dimenzí; detekování a zadání dalších informací zjevných ve vizuálních datech nebo tónových prvků zřetelných ve zvukových datech do samostatného, ale časově koordinovaného zdroje videa; a postavení kontextových vodítek a dalších informací vedle sebe k vytvoření kontextových skóre pro každou scénu videa.

(13) Způsob podle charakteristiky způsobu (12), v němž krok zobrazení zahrnuje zobrazení textového přepisu způsobem, že se daná emocionální kognice a příslušný údaj o intenzitě dá do závorky a simultánně se vloží vedle komponent.

(14) Způsob podle kterékoli z charakteristik způsobů (1) až (13), dále zahrnující vygenerování nových pravidel modulem odhalování pravidel, a v němž uvedený způsob dále zahrnuje detekování háčkových slov nebo dvojic slov v obsahu přirozeného jazyka obvody pro zpracování; vyhodnocení jedné nebo více lidských dimenzí spojených s detekovaným háčkovým slovem nebo dvojicemi slov za účelem stanovení, jestli háčková slova nebo dvojice slov signalizují možnou emocionální kognici; když je možná emocionální kognice přítomna, extrahování předem stanoveného okna slov obklopujících háčková slova nebo dvojice slov; přidělení skóre uvedené jedné nebo více lidským dimenzím obvody pro zpracování k získání profilu skóre dimenzí pro háčkové slovo nebo dvojice slov; a když profil skóre dimenzí vyčnívá nad většinu, sestavení nového pravidla pro možnou emocionální kognici na základě háčkového slova nebo dvojic slov a extrahovaných okolních slov.

(15) Způsob podle kterékoli z charakteristik způsobů (1) až (14), dále zahrnující identifikaci indexových pozic v textovém vstupu na pozicích, kde jsou přiřazena lingvistická pravidla.

(16) Způsob podle charakteristiky způsobu (15), dále zahrnující anotování textového vstupu emocionální kognici a příslušným údajem o intenzitě na indexových pozicích.

(17) Způsob podle kterékoli z charakteristik způsobů (1) až (16), v němž krok přijetí dále zahrnuje přijetí obsahu přirozeného jazyka jako zvukového vstupu pomocí vstupního zařízení a přepis zvukového vstupu na textový vstup, přičemž uvedený způsob dále zahrnuje porovnání fragmentu zvukového vstupu s uloženým pravidlem pro podobný zvukový fragment a přiřazení emocionálně kognitivní značky uloženého pravidla uvedenému zvukovému fragmentu.

(18) Elektronická čtečka, zahrnující dotykový displej; obvody pro zpracování; a paměť, u níž je dotykový displej nakonfigurován tak, aby zobrazoval text elektronické knihy; obvody pro zpracování jsou nakonfigurovány tak, aby nasnímaly a označkovaly text tágy za použití pravidel, jež při spuštění detekují emocionálně kognitivní stavy, a určily intenzitu, s níž se emocionálně kognitivní stavy vyskytly; obvody pro zpracování jsou nakonfigurované tak, aby vygenerovaly a zobrazily jednu nebo více postranních lišt pro vypsání informací o dynamice a intenzitě emocionální kognice na základě detekovaných komponent zobrazeného textu; dotykový displej je nakonfigurovaný tak, aby při dotyku na pozici na displeji zvolil dynamiku nebo intenzitu emocionální kognice; a obvody pro zpracování jsou dále nakonfigurovány, aby vygenerovaly a

-47 CZ 2023 - 331 A3 zobrazily barevně kódované zvýraznění, které označí výskyt zvolené dynamiky nebo intenzity emocionální kognice.

(19) Systém pro zmírňování psychologické poruchy, zahrnující mobilní zařízení mající obvody pro zpracování a paměť; a periferní zařízení mající komunikační zařízení a jeden nebo více akčních členů, přičemž v paměti mobilního zařízení jsou uloženy programové instrukce, jež při provedení obvody pro zpracování mobilního zařízení zajistí, že mobilní zařízení provede způsob zahrnující: přijetí obsahu přirozeného jazyka jako textového vstupu pomocí vstupního zařízení; vyhledání shod mezi množstvím lingvistických pravidel pro danou emocionální kognici a komponentami textového vstupu uvedenými obvody pro zpracování, přičemž instance lingvistických pravidel mají alespoň jednu lidskou dimenzi; detekování shodujících se lingvistických pravidel obvody pro zpracování k získání indikace intenzity pro danou emocionální kognici; a když indikace intenzity pro danou emocionální kognici dosáhne emocionálně kognitivní intenzity, která překročí první prahovou hodnotu, vyslání prvního aktivačního signálu, který identifikuje emocionálně kognitivní intenzitu; a periferní zařízení je nakonfigurováno tak, aby přes komunikační zařízení přijalo vyslaný první aktivační signál; a aktivovalo uvedený jeden nebo více akčních členů k vytvoření senzorického odvrácení pozornosti ke zmírnění psychologické poruchy.

(20) Systém podle charakteristiky způsobu (19), v němž programové instrukce, které, když jsou prováděny obvody pro zpracování mobilního zařízení, dále zajišťují, že mobilní zařízení provádí uvedený způsob, zahrnující pokračování v přijímání obsahu přirozeného jazyka jako dalšího textového vstupu pomocí vstupního zařízení; a když údaj o intenzitě pro danou emocionální kognici dosáhne emocionální intenzity pro negativní emoci, která překročí druhou prahovou hodnotu, vyslání druhého aktivačního signálu, který identifikuje emocionální intenzitu pro negativní emoci; a periferní zařízení je dále nakonfigurováno k přijetí vyslaného druhého aktivačního signálu a aktivování uvedeného jednoho nebo více akčních členů k vyvolání odlišného náhodného senzorického rozptýlení ke zmírnění poruchy osobnosti.

(21) Způsob podle charakteristiky způsobu (1), dále zahrnující zvýraznění slov v obsahu přirozeného jazyka na základě údaje o intenzitě; odeslání obsahu přirozeného jazyka se zvýrazněnými slovy na displej; a zobrazení obsahu přirozeného jazyka se zvýrazněnými slovy formou zobrazení v rozšířené realitě na displeji v průběhu relace streamování videa.

(22) Elektronická čtečka podle charakteristiky způsobu (18), dále zahrnující detekování přítomnosti nebo nepřítomnosti konstrukcí v textu majících komponenty spojené s emocionálně kognitivními stavy; a když se uživatel dotkne textu zobrazeného na dotykovém displeji, zobrazení znázornění emocí a kognice v textu, přičemž těmito znázorněními jsou barevné tepelné mapy.

(23) Elektronická čtečka podle charakteristiky způsobu (18) dále zahrnující anotování textu emocionálně kognitivními stavy a příslušnou intenzitou na indexových pozicích, jež se zobrazí, když se uživatel dotkne elektronické čtečky během čtení.

(24) Systém podle charakteristiky způsobu (19), dále zahrnující v reakci na detekování shodných lingvistických pravidel, že mobilní zařízení je nakonfigurováno k vysílání elektrických signálů nebo krátkých rádiových vln ke spuštění barevně kódovaného osvětlení periferního zařízení na základě lingvistických pravidel.

(25) Systém podle charakteristiky způsobu (19), v němž periferní zařízení dále obsahuje barevný geometrický displej nakonfigurovaný k aktivaci LED podle údaje o intenzitě pro danou emocionální kognici.

(26) Systém podle charakteristiky způsobu (19), v němž způsob prováděný mobilním zařízením dále zahrnuje porovnání údaje o intenzitě s prahovými hodnotami pro danou emocionální kognici k získání úrovně emocionální intenzity pro kognitivně emocionální stav; přičemž periferní zařízení obsahuje diody vyzařující barvu a vibrátor a je nakonfigurováno tak, aby signalizovalo kognitivně

-48 CZ 2023 - 331 A3 emocionální stav pomocí diod vyzařující barvu a vibrovalo za pomoci vibrátoru, když údaj o intenzitě překročí prahovou hodnotu.

(27) Systém podle charakteristiky způsobu (19), v němž způsob prováděný mobilním zařízením dále zahrnuje určení vzorce emocionálních kognici, který obsahuje danou emocionální kognici, zřetězením s dalšími emocionálními kognicemi identifikováním vzorce emocionálních kognici jako dynamické emocionální kognice; a periferní zařízení obsahuje LED diody a vibrační zařízení, které vibruje v koordinaci s pulzováním LED diod a signalizuje posun s tím, jak se posouvají emocionální kognice.

(28) Systém podle charakteristiky způsobu (19), v němž způsob prováděný mobilním zařízením dále zahrnuje identifikaci indexových pozic v textovém vstupu na pozicích, kde jsou přiřazena lingvistická pravidla, během zvukových konverzací přijímaných a přepisovaných, když jsou pronášeny nositelem periferního zařízení.

Claims

1. Způsob automatického rozšiřování obsahu přirozeného jazyka o emocionální kognici obvody pro zpracování, přičemž uvedený způsob zahrnuje:

přijetí obsahu přirozeného jazyka jako textového vstupu pomocí vstupního zařízení;

vyhledání shod mezi množstvím lingvistických pravidel pro danou emocionální kognici a komponentami textového vstupu obvody pro zpracování, přičemž instance lingvistických pravidel mají alespoň jednu lidskou dimenzi;

aktivování shodujících se lingvistických pravidel a vyhodnocení alespoň jedné lidské dimenze aktivovaných shodujících se lingvistických pravidel obvody pro zpracování;

ohodnocení každé lidské dimenze k získání prototypického profilu hodnotících skóre dimenzí pro danou emocionální kognici obvody pro zpracování;

agregování dimenzí v získaném profilu skóre dimenzí obvody pro zpracování k získání údaje o intenzitě pro danou emocionální kognici; a zobrazení na displeji obsahu přirozeného jazyka, rozšířeného způsobem, který přiřazuje shodující se lingvistická pravidla k dané emocionální kognici a udává příslušnou indikaci intenzity dané emocionální kognice.

2. Způsob podle nároku 1, přičemž lidské dimenze zahrnují jedno nebo více emocionálních hnutí jako sentiment, emoci, emocionálně kognitivní postoje, hodnoty, sociální zvyky, nastavení mysli, rozhledy, pohledy, odezvy, rysy, přesvědčení, názory, perspektivy, motivace, předpojatost, stavy, způsoby, přístupy, dynamiku, osobnostní rysy, emocionální přístup, emocionální volbu, reakci, dispozici, dočasný stav, změnu stavu, kognitivní aspekt, behaviorální aspekt, vnitřní stav, vnější stav, pocit, emoci, propozici, postoj, propoziční postoj, směrovaný postoj, nesměřovaný postoj, postoj směrovaný k sobě, vědomou emocionální kognici, nevědomou emocionální kognici, hněv, anticipaci, znechucení, strach, radost, smutek, překvapení, důvěru, ego, obvinění, souhlas, posvátnost, laskavost, respekt, čas, přízeň, schválení, upřímnost, zranitelnost, soud, odloučení, účelnost, formálnost, minimalizaci, specifičnost, sílu, akci, aktivní působení, zvědavost, zřejmost, záměmost, důraz, energii, jistotu, zájem, zapojení, šok nebo překvapení, napětí, rychlost, nuanci, logiku, paranoiu, odstup, identifikaci, úctu, objektifikaci, vazbu, empatii a trpělivost, přičemž každá dimenze má hodnotu, kterou je jedna z +1 pro pozitivní sílu, -1 pro negativní sílu, 0 pro neutrální sílu a 0 pro není přítomna nebo není relevantní, a přičemž ohodnocení každé lidské dimenze obvody pro zpracování pomocí skóre zahrnuje přidělení skóre lidským dimenzím pro všechny shodná pravidla.

3. Způsob podle nároku 1, přičemž krok vyhledání pomocí množství lingvistických pravidel dále zahrnuje:

detekci konstrukcí na základě lingvistických pravidel; a vyhodnocení lidských dimenzí každé detekované konstrukce.

4. Způsob podle nároku 1, přičemž krok ohodnocení pomocí skóre zahrnuje:

porovnání signálu intenzity s prahovými hodnotami pro danou emocionální kognici k získání úrovně emocionální intenzity.

-50CZ 2023 - 331 A3

5. Způsob podle nároku 3, přičemž krok detekování konstrukcí dále zahrnuje:

detekování přítomnosti nebo nepřítomnosti konstrukcí v obsahu přirozeného jazyka majících komponenty související s danou emocionální kognicí.

6. Způsob podle nároku 1, dále zahrnující detekování, za pomoci obvodů pro zpracování, vzorce emocionálních kognic, který obsahuje danou emocionální kognicí, zřetězením s dalšími emocionálními kognicemi detekovanými jinými lingvistickými pravidly, a identifikování vzorce emocionálních kognic jako dynamické emocionální kognice; a sledování dané emocionální kognice a ostatních emocionálních kognic společně se souvisejícími komponentami v časovém sledu v obsahu přirozeného jazyka.

7. Způsob podle nároku 3, přičemž krok detekování konstrukcí dále nahrnuje určení číselné hodnoty pro jedno nebo více pravidel z pravidla značkování slovních druhů tágy nebo syntaktického pravidla, pravidla přiřazování řetězců, které je přesné, nepřesné, maskované nebo s divokou kartou, pravidla blízkosti tokenů, interpunkčního pravidla, lemmatizační pravidlo, stematizačního pravidla, pravidlo lexikonu a pravidla vyhledávání slov nebo pravidla založeného na slovníku.

8. Způsob podle nároku 7, přičemž krok určení číselné hodnoty pro pravidlo blízkosti tokenů zahrnuje přistoupení ke všem tokenům majícím vzdálenost méně než n tokenů od daného bodu v obsahu přirozeného jazyka, přičemž n je kladné celé číslo.

9. Způsob podle nároku 1, dále zahrnující vygenerování nových lingvistických pravidel modulem strojového učení, který provádí alespoň jedno z učení s učitelem a učení bez učitele.

10. Způsob podle nároku 9, dále zahrnující:

přijetí množství datových položek přirozeného jazyka z úložiště;

normalizaci a tokenizaci přijatého množství datových položek přirozeného jazyka za použití předběžného zpracování k vygenerování množství předem zpracovaných datových položek přirozeného jazyka;

označkování množství předem zpracovaných datových položek přirozeného jazyka značkou pro vyjádřenou emocionální kognicí a intenzitu vyjádřené emocionální kognice;

paralelní poskytnutí množství předem zpracovaných datových položek přirozeného jazyka modulu učení bez učitele, a modulu učení s učitelem;

paralelní vycvičení modulu učení bez učitele a modulu učení s učitelem v několika cvičných epochách k identifikaci konkrétní emocionální kognice v datech přirozeného jazyka a k určení intenzity dané emocionální kognice, přičemž každá cvičná epocha modulu učení bez učitele

-51 CZ 2023 - 331 A3 poskytuje návrhy pravidel pro následné cvičné epochy modulu založeného na pravidlech a každá cvičná epocha modulu založeného na pravidlech poskytuje tabelaci a data skóre pro následné epochy modulu učení bez učitele a modulu učení s učitelem; a poskytnutí výstupu představujícího alespoň jeden z vycvičeného modulu učení bez učitele a vycvičeného modulu učení s učitelem.

11. Způsob podle nároku 1, dále zahrnující vygenerování nových lingvistických pravidel obvody pro zpracování, při němž se provádí přiřazení lidských dimenzí přítomných v obsahu přirozeného jazyka porovnáním lidských dimenzí se stávajícími řadami dimenzí majícími divoké karty nebo přeskakování vzorců k určení nových pravidel pro modul založený na pravidlech.

12. Způsob podle nároku 1, přičemž krok přijetí dále zahrnuje průběžné načítání streamovaného živého videa nebo zdroje animovaného videa společně s koordinovaným textovým přepisem, a uvedený způsob dále zahrnuje určení kontextových vodítek na základě ko-výskytu slov, diskurzních prvků a tematických prvků;

označení individuálních řetězců nebo n-gramů trinámími skóre dimenzí;

detekování a zadání dalších informací zjevných ve vizuálních datech nebo tónových prvků zřetelných ve zvukových datech do samostatného, ale časově koordinovaného zdroje videa; a postavení kontextových vodítek a dalších informací vedle sebe k vytvoření kontextových skóre pro každou scénu videa.

13. Způsob podle nároku 12, přičemž krok zobrazení zahrnuje zobrazení textového přepisu způsobem, že se daná emocionální kognice a příslušný údaj o intenzitě dá do závorky a simultánně se vloží vedle komponent.

14. Způsob podle nároku 1, dále zahrnující vygenerování nových lingvistických pravidel modulem pro odhalování pravidel, a přičemž uvedený způsob dále zahrnuje:

detekování háčkových slov nebo dvojic slov v obsahu přirozeného jazyka obvody pro zpracování;

vyhodnocení jedné nebo více lidských dimenzí spojených s detekovaným háčkovým slovem nebo dvojicemi slov za účelem stanovení, jestli háčková slova nebo dvojice slov signalizují možnou emocionální kognici;

když je možná emocionální kognice přítomna, extrahování předem stanoveného okna slov obklopujících háčková slova nebo dvojice slov;

přidělení skóre uvedené jedné nebo více lidským dimenzím obvody pro zpracování k získání profilu skóre dimenzí pro háčkové slovo nebo dvojice slov; a když profil skóre dimenzí vyčnívá nad většinu, sestavení nového pravidla pro možnou emocionální kognici na základě háčkového slova nebo dvojic slov a extrahovaných okolních slov.

15. Způsob podle nároku 1, dále zahrnující identifikaci indexových pozic v textovém vstupu na pozicích, kde jsou přiřazena lingvistická pravidla.

16. Způsob podle nároku 15, dále zahrnující anotování textového vstupu emocionální kognici a příslušným údajem o intenzitě na indexových pozicích.

-52CZ 2023 - 331 A3

17. Způsob podle nároku 1, přičemž krok přijetí dále zahrnuje přijetí obsahu přirozeného jazyka jako zvukového vstupu pomocí vstupního zařízení a přepis zvukového vstupu na textový vstup, přičemž uvedený způsob dále zahrnuje:

porovnání fragmentu zvukového vstupu s uloženým pravidlem pro podobný zvukový fragment a přiřazení emocionálně kognitivní značky uloženého pravidla uvedenému zvukovému fragmentu.

18. Elektronická čtečka, zahrnující:

dotykový displej;

obvody pro zpracování; a paměť, přičemž dotykový displej je nakonfigurován tak, aby zobrazoval text elektronické knihy;

obvody pro zpracování jsou nakonfigurovány tak, aby nasnímaly a označkovaly text tágy za použití pravidel, jež při spuštění detekují emocionálně kognitivní stavy, a určily intenzitu, s níž se emocionálně kognitivní stavy vyskytly;

obvody pro zpracování jsou nakonfigurované tak, aby vygenerovaly a zobrazily jednu nebo více postranních lišt pro vypsání informací o dynamice a intenzitě emocionální kognice na základě detekovaných komponent zobrazeného textu;

dotykový displej je nakonfigurovaný tak, aby při dotyku na pozici na displeji zvolil dynamiku nebo intenzitu emocionální kognice; a obvody pro zpracování jsou dále nakonfigurovány, aby vygenerovaly a zobrazily barevně kódované zvýraznění, které označí výskyt zvolené dynamiky nebo intenzity emocionální kognice.

19. Systém pro zmírňování psychologické poruchy, zahrnující:

mobilní zařízení mající obvody pro zpracování a paměť; a periferní zařízení mající komunikační zařízení a jeden nebo více akčních členů, přičemž v paměti mobilního zařízení jsou uloženy programové instrukce, jež při provedení obvody pro zpracování mobilního zařízení zajistí, že mobilní zařízení provede způsob zahrnující:

detekování shodujících se lingvistických pravidel obvody pro zpracování k získám indikace intenzity pro danou emocionální kognici; a když indikace intenzity pro danou emocionální kognici dosáhne emocionálně kognitivní intenzity, která překročí první prahovou hodnotu, vyslání prvního aktivačního signálu, který identifikuje emocionálně kognitivní intenzitu; a periferní zařízení je nakonfigurováno tak, aby přes komunikační zařízení přijalo vyslaný první aktivační signál; a aktivovalo uvedený jeden nebo více akčních členů k vytvoření senzorického odvrácení pozornosti ke zmírnění psychologické poruchy.

-53 CZ 2023 - 331 A3

20. Systém podle nároku 19, přičemž programové instrukce, které, když jsou prováděny obvody pro zpracování mobilního zařízení, dále zajišťují, že mobilní zařízení provádí uvedený způsob, zahrnující pokračování v přijímání obsahu přirozeného jazyka jako dalšího textového vstupu pomocí vstupního zařízení; a když údaj o intenzitě pro danou emocionální kognici dosáhne emocionální intenzity pro negativní emoci, která překročí druhou prahovou hodnotu, vyslání druhého aktivačního signálu, který identifikuje emocionální intenzitu pro negativní emoci; a periferní zařízení je dále nakonfigurováno k přijetí vyslaného druhého aktivačního signálu a aktivování uvedeného jednoho nebo více akčních členů k vyvolání odlišného náhodného senzorického rozptýlení ke zmírnění poruchy osobnosti.

21. Způsob podle nároku 1, dále zahrnující:

zvýraznění slov v obsahu přirozeného jazyka na základě údaje o intenzitě;

odeslání obsahu přirozeného jazyka se zvýrazněnými slovy na displej; a zobrazení obsahu přirozeného jazyka se zvýrazněnými slovy formou zobrazení v rozšířené realitě na displeji v průběhu relace streamování videa.

22. Elektronická čtečka podle nároku 18, dále zahrnující:

detekování přítomnosti nebo nepřítomnosti konstrukcí v textu majících komponenty spojené s emocionálně kognitivními stavy; a když se uživatel dotkne textu zobrazeného na dotykovém displeji, zobrazení znázornění emocí a kognice v textu, přičemž těmito znázorněními jsou barevné tepelné mapy.

23. Elektronická čtečka podle nároku 18, dále zahrnující anotování textu emocionálně kognitivními stavy a příslušnou intenzitou na indexových pozicích, jež se zobrazí, když se uživatel dotkne elektronické čtečky během čtení.

24. Systém podle nároku 19, dále zahrnující:

v reakci na detekování shodných lingvistických pravidel, že mobilní zařízení je nakonfigurováno k vysílání elektrických signálů nebo krátkých rádiových vln ke spuštění barevně kódovaného osvětlení periferního zařízení na základě lingvistických pravidel.

25. Systém podle nároku 19, přičemž periferní zařízení dále obsahuje barevný geometrický displej nakonfigurovaný k aktivaci LED podle údaje o intenzitě pro danou emocionální kognici.

26. Systém podle nároku 19, přičemž způsob prováděný mobilním zařízením dále zahrnuje porovnání údaje o intenzitě s prahovými hodnotami pro danou emocionální kognici k získání úrovně emocionální intenzity pro kognitivně emocionální stav; a přičemž periferní zařízení obsahuje diody vyzařující barvu a vibrátor a je nakonfigurováno tak, aby signalizovalo kognitivně emocionální stav pomocí diod vyzařující barvu a vibrovalo za pomoci vibrátoru, když údaj o intenzitě překročí prahovou hodnotu.

-54CZ 2023 - 331 A3

27. Systém podle nároku 19, přičemž způsob prováděný mobilním zařízením dále zahrnuje určení, za pomoci obvodů pro zpracování, vzorce emocionálních kognic, který obsahuje danou emocionální kognici, zřetězením s dalšími emocionálními kognicemi detekovanými jinými lingvistickými pravidly, a identifikování vzorce emocionálních kognic jako dynamické kognice; a

5 a periferní zařízení obsahuje LED diody a vibrační zařízení, které vibruje v koordinaci s pulzováním LED diod a signalizuje posun s tím, jak se posouvají emocionální kognice.

28. Systém podle nároku 19, přičemž způsob prováděný mobilním zařízením dále zahrnuje identifikaci indexových pozic v textovém vstupu na pozicích, kde jsou přiřazena lingvistická pravidla, během zvukových konverzací přijímaných a přepisovaných, když jsou pronášeny ίο nositelem periferního zařízení.