WO2022223431A1

WO2022223431A1 - Verfahren und vorrichtung zur erzeugung von optimierten fonts

Info

Publication number: WO2022223431A1
Application number: PCT/EP2022/060016
Authority: WO
Inventors: Constantin Rothkopf; Florian Kadner; Yannik Keller
Original assignee: Technische Universität Darmstadt
Priority date: 2021-04-19
Filing date: 2022-04-14
Publication date: 2022-10-27
Also published as: DE102021109845A1

Abstract

Es ist ein computerimplementiertes Verfahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm (50) offenbart. Das Verfahren umfasst: Bilden (S110) eines Font-Raumes (110), in dem verschiedene Fonts durch Dimensionen des Font-Raumes (110) charakterisiert werden; Auswählen (S120) eines Startpunktes in dem Font-Raum (100), wobei zu dem Startpunkt ein zugehöriger Startfont gehört; fortlaufendes Ändern (S130) der Position im Font-Raum (110) und dadurch eine zur Darstellung genutzten Font zu ändern, um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und Bereitstellen (S140) der optimierten Fonts zur Darstellung auf dem Bildschirm (50).

Description

VERFAHREN UND VORRICHTUNG ZUR ERZEUGUNG VON

OPTIMIERTEN FONTS

Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Erzeugung von optimierten Fonts und insbesondere auf ein computerimple mentiertes Verfahren und ein System zur Erzeugung von adaptierten Fonts.

HINTERGRUND

Digitaler Text ist zu einer der primären Möglichkeiten des Wissensaustauschs geworden, wobei der Text zum Lesen in der Regel auf einem Bildschirm über eine Druckschrift (Fonts) dargesteht wird. Traditionell folgt die Umwandlung von Text in die tatsächlich sichtbaren Buchstaben einem komplexen Prozess, der künstlerische und gestalterische Überlegungen bei der Erstehung von Schriftbil dern, die Auswahl bestimmter Schriftarten und viele typografische Entscheidun gen bezüglich der räumlichen Platzierung und Anordnung von Buchstaben und Wörtern umfasst.

Eine grundlegende Frage bei der Darstellung von Text ist, ob die Art und Weise, wie der Text dargestellt wird, einen Einfluss darauf hat, wie er gelesen, verarbei tet und verstanden wird. Zahlreiche empirische Untersuchungen haben gemes sen, wie Eigenschaften von geschriebenem Text dessen Wahrnehmung beim Le- sen sowohl auf Papier als auch auf elektronischen Geräten beeinflussen. Insge samt sind die Ergebnisse dieser empirischen Untersuchungen zum Zusammen hang zwischen Lesegeschwindigkeit bzw. Leseverständnis und Schriftparame tern jedoch gemischt und zum Teil widersprüchlich.

Einige dieser Fonts (konkrete Schriftarten) wurden entwickelt, um die Lesbar keit für Menschen mit Sehschwäche zu verbessern. Wieder Andere wurden ent wickelt, um die Lesbarkeit auf kleinen elektronischen Geräten zu erhöhen. Eine individuelle Optimierung ist damit jedoch nicht möglich. Es besteht daher ein Bedarf nach einer Möglichkeit optimierte Fonts für Bild schirme bereitzustellen, die sich beliebig individuell anpassen lassen.

KURZBESCHREIBUNG DER ERFINDUNG

Zumindest ein Teil der obengenannten Probleme wird durch ein computerim- plementiertes Verfahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm nach Anspruch l und ein System nach Anspruch 9 gelöst. Die abhängigen Ansprüche beziehen sich auf vorteilhafte Weiterbildungen der Gegenstände der unabhängigen Ansprüche.

Die vorliegende Erfindung bezieht sich auf ein computerimplementiertes Ver- fahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bild schirm. Das Verfahren umfasst die Schritte:

- Bilden eines Font-Raumes, in dem verschiedene Fonts durch Dimensio nen des Font-Raumes charakterisiert werden oder Bereitst eilen eines pa- rametrischen Font-Raumes; - Auswählen eines Startpunktes in dem Font-Raum, wobei zu dem Start punkt ein zugehöriger Startfont gehört;

- fortlaufendes Ändern der Position im Font-Raum, um dadurch eine zur Darstellung genutzten Font zu ändern und um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und - Bereitstellen der optimierten Fonts zur Darstellung auf dem Bildschirm.

Der Font-Raum muss somit nicht neu geschaffen werden. Gemäß Ausführungs beispielen können auch parametrische Font-Räume wie z.B. parametrische Ty pographien in dem Verfahren genutzt werden.

Optional wird für den zumindest einen Parameterwert eines oder mehr aus dem Folgenden verwendet: eine Speicherbelegung, - eine Menge an Druckerschwärze bei einem Drucken von Texten,

- eine Scangeschwindigkeit,

- eine Geschwindigkeit bei automatischer Texterkennung,

- eine Lesegeschwindigkeit eines Nutzers, - ein Erinnerungsvermögen eines Nutzers,

- ein Textverständnis eines Nutzers,

- eine Präferenz für den gelesen Text eines Nutzers.

Optional umfasst das Verfahren außerdem ein Erfassen einer Größe, die den zu mindest einen Parameterwert bestimmt. Diese Größe kann beispielsweise von einem Sensor kommen, der den Parameterwert erfasst. Zum Beispiel kann die Speicherbelegung an einem Computer direkt erfasst werden. Gleiches trifft zu für einen verbrauchten Toner (Druckerschwärze) oder die Geschwindigkeit beim Scannen bzw. der Texterkennung. Die Lesegeschwindigkeit kann mit einem Au genscanner (der die Augenbewegung erfasst) oder über ein Benutzereingabe (z.B. beim Umblättern bei einem elektronischen Lesegerät) ermittelt werden.

Gemäß weiterer Ausführungsbeispiele kann ein Erinnerungsvermögen oder Textverständnis mittels kognitiver Tests erfasst werden, z.B. mit üblichen Frage- Verfahren, die den Grad des Verständnisses testen. Optional kann die Präferenz auch mit kognitiven Testverfahren erfasst werden oder mittels Pupillometrie (Augenscanner) ermittelt werden.

Optional wird eine der zahlreichen bereits von Typographen entwickelte para metrisch gestaltete Schriftart benutzt. Dies sind Fonts, die durch die numerische Veränderung weniger Parameter unterschiedliche Schriftbilder ergeben. Der Pa rameter ändert dabei insbesondere das Erscheinungsbild des Fonts und nicht (nur) die Schriftgröße und/ oder die Schriftneigung und/ oder die Schriftdicke.

Optional wird der Font-Raum als kontinuierlicher Raum mit einer Dimension N gebildet, der zwischen M bekannten Fonts interpoliert. Auf diese Weise werden die Fonts kontinuierlich geändert (d.h. nicht sprunghaft), wenn die Position im Font-Raum kontinuierlich geändert wird. Die Dimension N des Font-Raumes kann durch eine Kreuzvalidierung basierend auf den M bekannten Fonts be- stimmt wird. Mögliche Werte sind z.B. N=2, 3, 4, 5, ... und M hat zumindest ei nen Wert von 10, 15, 20, 30. Im Prinzip können diese Werte aber beliebig sein.

Optional wird der Font-Raum wie durch folgende Schritte gebildet:

Aufstellen einer Daten-Matrix X, die in jeder Zeile oder jeder Spalte Ein- träge für jeweils einen bekannten Font umfasst;

Bilden einer Basis-Matrix W und einer Koeffizienten-Matrix H durch ein Minimieren einer Frobenius-Norm für eine Differenz aus der Daten-Mat rix X und einem Produkt der Basis-Matrix W und der Koeffizienten-Mat rix H: Min |X - Wx H| , (l) wobei die Basis-Matrix W eine M x N - Matrix ist. Das Produkt WxH ist das üb liche Matrizenprodukt, bei dem die Werte der Zeilen und Spalten miteinander skalar multipliziert werden.

Optional umfasst das fortlaufende Ändern zum Finden des Optimums eine An- wendung zumindest eines der folgenden Verfahren: eine Bayes’schen Optimierung, bei der sukzessiv Punkte im Font-Raum getestet werden, um Regionen im Font-Raum zu finden, in welchen der Parameterwert sich verbessert (z.B. Lesegeschwindigkeit steigt); eine dichtebasierte Cluster-Analyse (z.B. das OPTICS-Verfahren), wobei der zu optimierende Parameterwert als vierte Dimension hinzugenom men wird und die Punkte eines Datensatzes linear geordnet werden, so dass räumlich nächste Nachbarn zusammen als Cluster angeordnet wer den; eine Varianzanalyse (z.B. ANOVA, MANOVA), um statistisch signifikante Unterschiede zwischen den Clustern zu ermitteln. Es versteht sich, dass diese Schritte optional sind. Das System funktioniert prin zipiell auch ohne a) die dichtebasierte Cluster- Analyse und auch ohne b) eine Varianzanalyse. Diese beiden Methoden können verwendet werden, um a) die Schriftarten besser in ihrer Ähnlichkeit zu bewerten und b) zu untersuchen, ob die menschlichen Lesegeschwindigkeiten auch tatsächlich statistisch signifikant besser sind.

Dieses Verfahren oder zumindest Teile davon kann/können ebenfalls in Form von Anweisungen in Software oder auf einem Computerprogrammprodukt im plementiert oder gespeichert sein, wobei gespeicherte Anweisungen in der Lage sind, die Schritte nach dem Verfahren auszuführen, wenn das Verfahren auf ei nem Prozessor läuft. Daher bezieht sich die vorliegende Erfindung ebenfalls auf Computerprogrammprodukt mit darauf gespeichertem Software-Code (Soft wareanweisungen), der ausgebildet ist, um eines der zuvor beschriebenen Ver fahren auszuführen, wenn der Software-Code durch eine Verarbeitungseinheit ausgeführt wird. Die Verarbeitungseinheit kann jede Form von Computer oder

Steuereinheit sein, die einen entsprechenden Mikroprozessor aufweist, der einen Software-Code ausführen kann. Weitere Ausführungsbeispiele beziehen sich auch auf ein computerlesbares Speichermedium mit darauf gespeicherten An weisungen, die bei Ausführung durch einen Computer diesen veranlassen, das Verfahren, wie es zuvor beschrieben wurde, auszuführen.

Weitere Ausführungsbeispiele beziehen sich auf ein System (Vorrichtung) zur Erzeugung von optimierten oder adaptierten Fonts zur Darstellung auf einem Bildschirm. Das System umfasst: ein Erzeugungsmodul, ein Optimierungsmodul und eine Ausgabeschnittstelle. Das Erzeugungsmodul ist ausgebildet, um einen Font-Raum zu bilden, in dem verschiedene Fonts durch Dimensionen des Font- Raumes charakterisiert werden. Das Optimierungsmodul ist ausgebildet, um ei nen Startpunktes in dem Font-Raum zu wählen, wobei zu dem Startpunkt ein zugehöriger Startfont gehört. Außerdem ist das Optimierungsmodul ausgebildet, um durch fortlaufendes Ändern der Position im Font-Raum einen zur Darstel- lung genutzten Font zu ändern, um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden. Die Ausgabeschnittstelle ist ausgebildet, für einen Bildschirm (Display) den optimierten Font zur Darstellung auf dem Bildschirm auszugeben. Die bayessche Optimierung ist einem Fachmann als eine globale Optimierungs methode für Black-Box-Funktionen bekannt, wobei iterativ Hyperparameter konfigurationen ausprobiert werden, die nach einem aktuellen Modell vielver sprechend erscheinen. Anschließend wird das Modell durch die neuen Erkennt - nisse angepasst. Die bayessche Optimierung versucht so möglichst viele Be obachtungen über die Funktion zu sammeln, insbesondere über die Lage des Optimums. Sie berücksichtigt gleichzeitig die Erkundung von Bereichen, in de nen wenig Wissen über die zu erwartende Performance vorliegt (Exploration) und die Ausnutzung von Wissen über Bereiche, in denen das Optimum erwartet wird (Exploitation).

Vorteile von Ausführungsbeispielen ergeben sich insbesondere daraus, dass adaptiv Schriften generiert und schrittweise optimiert werden können, um bei spielsweise die individuelle Lesegeschwindigkeit zu erhöhen oder andere Para meter verbessern zu können. Das System basiert auf einem generativen Schrift- raum, der datengesteuert durch nicht-negative Matrixfaktorisierung (NMF) von einem Satz von klassischen Schriften (z.B. 25) erlernt wird. Ausführungsbei spiele verwenden diesen Schriftraum, um neue Schriften zu generieren und mes sen, wie eine generierte Schrift die beispielhafte Lesegeschwindigkeit auf indivi dueller Benutzerebene beeinflusst. Mittels Bayes'scher Optimierung wählen Aus- führungsbeispiele aus dem generativen Fontmodell neue Fonts aus, um diejeni gen Fonts zu finden, die zu einem optimalen Resultat führen (z.B. dem Leser er möglichen, Texte schneller zu lesen).

Durchgeführte Probandenstudie haben ergeben, dass die Wahrnehmung der ge zeigten Informationen durch den Menschen verbessern wird. Dieses Ziel wurde erfindungsgemäß durch eine Präsentation von Bildinhalten in einer Weise er reicht, die auf die physischen Gegebenheiten der menschlichen Wahrnehmung und Aufnahme von Informationen Rücksicht nimmt. Die Darstellung der Bildin halte folgt somit nicht ästhetischen Gesichtspunkten, sondern dient der Effi zienzsteigerung der Mensch-Maschine-Schnittstelle.

Um dieses technische Ziel zu erreichen, werden beispielsweise Parameter der Schriften automatisch durch die Interaktion des Nutzers, also des Lesenden, ge setzt, um so beispielsweise die Wahrnehmung zu verbessern. Ästhetische Krite rien gehen dabei nicht in das Verfahren ein, sondern kognitive Kriterien (Text verarbeitungsgeschwindigkeit) oder Wahrnehmungskriterien (Lesbarkeit). Es kann natürlich nicht ausgeschlossen werden, dass die Fonts mit der besten Text verarbeitungsgeschwindigkeit und einer hervorragender Lesbarkeit durch den Nutzer auch es ästhetisch angesehen werden. Es kann aber auch genau umge kehrt sein, d.h. der aus der Optimierung resultierende Fonts als besonders unäs thetisch angesehen wird. In jedem Fall, ist die Ästhetik kein primäres Ziel der Optimierung.

KURZBESCHREIBUNG DER FIGUREN

Die Ausführungsbeispiele der vorliegenden Erfindung werden besser verstanden anhand der folgenden detaillierten Beschreibung und den beiliegenden Zeich- nungen der unterschiedlichen Ausführungsbeispiele, die jedoch nicht so verstan den werden sollten, dass sie die Offenbarung auf die spezifischen Ausführungs formen einschränken, sondern lediglich der Erklärung und dem Verständnis die nen.

Fig. l zeigt ein schematisches Flussdiagramm für ein Verfahren gemäß ei nem Ausführungsbeispiel der vorliegenden Erfindung.

Fig. 2 zeigt einen Verfahrensablauf der interaktiven Verbesserung der Les barkeit von Texten, die gemäß weiteren Ausführungsbeispielen auf ei nem Monitor dargestellt werden.

Fig. 3 zeigt ein Beispiel für Namen von 25 Schriften (Baseline-Schriften), die in ihrer jeweiligen Schriftart dargestellt sind.

Fig. 4 zeigt die Darstellung der 25 Schriften im Font-Raum.

Fig. 5A veranschaulicht den Einfluss der beispielhaften drei Dimensionen des Font-Raums für den Großbuchstaben K Fig. 5B zeigt eine Interpolation gemäß Ausführungsbeispielen zwischen den Fonts Frutiger und Sabon.

Fig. 6A veranschaulicht die Cluster, die der höchsten Lesegeschwindigkeit entsprechen.

Fig. 6B zeigt die mittleren Lesegeschwindigkeiten für jedes der gefundenen Schriftcluster zusammen mit dem entsprechenden 95%-Konfidenz- intervall (Glaubwürdigkeitsintervall) für jeden Probanden.

Fig. 7 zeigt Schriften, die aus den Zentroiden der besten Cluster für Proban den erzeugt wurden.

DETAILLIERTE BESCHREIBUNG

Fig. 1 zeigt ein schematisches Flussdiagramm für ein Verfahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm.

Das Verfahren umfasst: Bilden S110 eines Font-Raumes, in dem verschiedene Fonts durch Dimen sionen des Font-Raumes charakterisiert werden;

Auswahlen S120 eines Startpunktes in dem Font-Raum, wobei zu dem Startpunkt ein zugehöriger Startfont gehört;

Optimieren S130 zumindest eines Parameterwertes durch ein fortlaufen- des Ändern der Position im Font-Raum, um dadurch eine zur Darstellung genutzten Font zu ändern; und

Bereitstellen S140 der optimierten Fonts zur Darstellung auf dem Bild schirm. Es versteht sich, dass beim Bilden des Font-Raumes kein neuer Font-Raum ge schaffen werden muss. Es kann auch ein bereits bekannter Font-Raum für Aus führungsbeispiele genutzt werden. Er wird dazu in einer Datenverarbeitungsein heit dementsprechend eingelesen und somit dort geschaffen. Beispielsweise kön- nen dazu parametrische Font-Räume verwendet werden (z.B. parametrische Ty pographien). Die Typografie bezieht sich beispielsweise auf einen medienunab hängigen Gestaltungsprozess, der mittels Schrift, Bildern, Linien, Flächen, Leer räumen, Laufweiten, Ligaturen usw. erreicht wird.

Es versteht sich, dass Ausführungsbeispiele verschiedenste Optimierungen durchführen können. Außerdem kann das Verfahren Computer-implementiert sein, d.h. es kann durch Anweisungen umgesetzt sein, die auf einem Speicher medium gespeichert sind und in der Lage sind, die Schritte des Verfahrens aus zuführen, wenn die Anweisungen durch einen Prozessor ausgeführt werden. Die Anweisungen umfassen typischerweise eine oder mehrere Anweisungen, die auf unterschiedliche Art auf unterschiedlichen Medien in oder peripher zu einer

Steuereinheit (mit einem Prozessor) gespeichert sein können, die, wenn sie gele sen und durch die Steuereinheit ausgeführt werden, die Steuereinheit dazu ver anlassen, Funktionen, Funktionalitäten und Operationen auszuführen, die zum Ausführen eines Verfahrens gemäß der vorliegenden Erfindung notwendig sind. Im Folgenden werden Ausführungsbeispiele vor allem in Bezug auf die Verbes serung der Lesegeschwindigkeit beschrieben. Es versteht sich aber, dass die in folgenden beschriebenen Ausführungsbeispiele in analoger oder gleicher Weise anwendbar sind auf andere Parameterwerte, die optimiert werden sollen (z.B. auf eine Speicherbelegung, eine Menge an Druckerschwärze bei einem Drucken von Texten, eine Scangeschwindigkeit, eine Geschwindigkeit bei automatischer Texterkennung etc.).

Fig. 2 zeigt eine Möglichkeit der interaktiven Verbesserung der beispielhaften Lesbarkeit von Texten, die auf einem Monitor (Bildschirm 50) dargestellt wer den. Im unteren Teil (2) ist der Gesamtprozess veranschaulicht. Im oberen Teil (1) ist die iterative Optimierung genauer dargestellt. Bezugnehmend auf den unteren Teil (2), werden nach einem Start (Schritt S10) eine Menge an klassischen Schriften bereitgestellt (Baseline 55). Dann wird zu nächst ein generativer Schriftraum mit nicht-negativer Matrixfaktorisierung (NMF) aus einer Menge klassischer Schriftarten gebildet oder gelernt (Schritt S110). In diesem Raum generieren Ausführungsbeispiele durch aktives Lernen neue True-Type-Schriften (Schritt S120), rendern Texte (Schritt S130) mit der neuen Schrift und messen die beispielhafte Lesegeschwindigkeit (Schritt S135) der einzelnen Benutzer. Ob ein Optimum erreicht ist, wird im Schritt S137 fest gestellt. Falls das der Fall ist, endet das Verfahren mit Schritt S140, wo die opti- mierte Schrift zur Darstellung bereitgestellt wird.

Der iterative Prozess der Schritte S120, S130, S135 und S137 ist im oberen Teil (1) genauer dargestellt. Dort ist zunächst der Schriftenraum 110 dargestellt, wo bei der Prozess unter a) mit einem Startfont 105 beginnt. Als nächstes kann un ter b) eine Frage gestellt werden, bei der Benutzer eine Wörter zu erkennen hat. Dann folgt unter ci) zunächst das Lesen eines Textes und unter C2) das Prüfen, ob der Benutzer aufmerksam gelesen hat (z.B. durch das Beantworten einer Frage). Mit den Schritten b), ci) und C2) kann somit die Lesegeschwindigkeit ge messen werden. Im Schritt d) erfolgt die Optimieren durch das Ändern der Posi tion, d.h. es wird eine neue Position 106 im Font-Raum 110 gewählt (z.B. unter Nutzung einer Bayes‘schen Optimierung). Der Vorgang wiederholt sich, bis bei dem Schritt S137, siehe unteren Teil (2), festgestellt wird, dass keine weiteren Fortschritte erreicht werden.

Die neuen Fonts (Schriften) werden im Schritt S130 (bzw. b), z.B. über die Bayes'sche Optimierung, sequentiell „on the fly“ generiert, um die beispielhafte Lesegeschwindigkeit der Benutzer progressiv zu erhöhen.

Durchgeführte Vergleichsexperimente zeigten, dass:

- dieses adaptive Schriftgenerierungssystem Regionen im Schriftraum 110 findet, die hohen Lesegeschwindigkeiten entsprechen,

- diese Schriften die beispielhafte Lesegeschwindigkeit der Teilnehmer signifikant erhöhen, und

- sich die gefundenen Schriften zwischen den einzelnen Lesern signifi kant unterscheiden.

Es versteht sich, dass die Vorgehensweise auch auf andere Gebiete übertragen lässt. Die Optimierung kann hinsichtlich vieler Parameter durchgeführt werden, wozu u.a. Folgendes gehört: eine Speicherbelegung, eine Menge an Drucker schwärze bei einem Drucken von Texten, eine Scangeschwindigkeit, eine Ge schwindigkeit bei automatischer Texterkennung.

Die einzelnen Schritte werden im Folgenden genauer beschrieben: A. Lernen oder Erzeugen eines Schriftraums (Schritt

Um neue Fonts auf Basis einer gegebenen Baseline 55 zu synthetisieren, nutzen Ausführungsbeispiele zunächst ein parametrisches generatives Fontmodell. Hier verwenden Ausführungsbeispiele ein sogenanntes „nicht-überwachtes Lernen“, um den kontinuierlichen Font-Raum 110 zu erhalten. Konkret nutzen Ausfüh- rungsbeispiele die nicht-negative Matrixfaktorisierung, NMF, als Methode zur Reduktion der Dimensionalität von Fonts. Um eine Grundmenge an Schriften, einschließlich Schriften mit Serifen und serifenlosen Schriften, abzudecken, kann eine Liste klassischer und populärer Schriften ausgewählt werden, die z.B. insgesamt 25 klassische Schriften enthält. Fig. 3 zeigt ein Beispiel für Namen von 25 Schriften (Baseline-Schriften 55), die in ihrer jeweiligen Schriftart dargestellt sind. Zur Durchführung der NMF kann ein Graustufenbild erzeugt werden, das alle 26 Buchstaben in Groß- und Klein schreibung, die Zahlen von null bis neun, die deutschen Umlaute, Klammern, Frage- und Ausrufezeichen, Punkt, Komma, Bindestrich, Doppelpunkt, Semiko- Ion, Schrägstrich und Anführungszeichen aufweist. Die Buchstaben wurden ne beneinander angeordnet. Die Bilddaten wurden dann zusammen mit Informati onen über die Ausrichtung jeder Glyphe im Font verkettet, die aus den entspre chenden Informationen in der TrueType-Datei gewonnen wurden. Das NMF-Verfahren basiert auf der Idee, eine Matrix X mit dem Produkt zweier Matrizen W, H so zu approximieren, dass folgende Beziehung gilt:

X - W · H . (l)

Diese Faktorisierung erfolgt unter der Randbedingung, dass die Approximation die Frobenius-Norm

X - W · H (2) minimiert und dass alle Einträge von W, H nicht-negativ sind. Die Spalten von W repräsentieren dann die dimensionalen Merkmale und H enthält die Ge wichte zur Kombination dieser Merkmale, um die Zeilen in X zu rekonstruieren. Konkret können die Matrizen wie folgt gebildet werden. Die Matrix X ist die Da tenmatrix. Diese umfasst alle Informationen der Baseline-Schriftarten 55 und soll jetzt in N Basisvektoren zerlegt werden, um den Schriftenraum aufzuspan nen. Prinzipiell ist das ähnlich einer klassischen Hauptachsentransformation. Um die Datenmatrix X zu erhalten, können schwarz-weiß Bilder einer bestimm- ten Pixel-Größe (z.B. 2375 x 51) pro Schriftart erstellt werden, in der alle 26

Buchstaben des Alphabets in Klein- und Großbuchstaben, alle Ziffern von o bis 9, alle deutschen Umlaute, Klammern, Frage- und Ausrufezeichen, Komma, An führungszeichen, Doppelpunkt, Semikolon, Slash und Satzpunkt zu sehen sind (insgesamt sind das 81 Zeichen). Alle diese Komponenten können nebeneinan- der ausgerichtet und dargestellt werden. Jeder dieser Pixel weist jetzt einen Grauwert auf, der z.B. eine Wert zwischen o und 255 darstellt (dabei ist o schwarz und 255 weiß und dazwischen interpolieren sich Graustufen).

Diese Bilder können “flach gemacht” werden. Hierzu wird jede Reihe des Bildes einfach hintereinander angeordnet, wodurch eine eindimensionale Darstellung des Bildes erhalten wird. In unserem Fall ergibt sich dann also eine Liste von z.B. 2375 x 51=121125 Werten. Zusätzlich wird für jede Baseline-Schriftart die Information über das Kerning, also den Abstand zwischen den Zeichen im Fließtext extrahiert. Die Information ist in *.ttf Schriftart-Dateien für jedes Zeichen gespeichert und umfasst ein Pad- ding links, rechts und nach unten. Zusätzlich können Ausführungsbeispiele noch einen Wert, der die Zeilenhöhe angibt, und einen Wert für die Länge des Leer zeichens speichern. Bei 8i Zeichen ergibt sich auf diese Weise eine Liste für die Abstands-Informationen mit 81x 3 + 2 = 245 Einträgen. Dieser wird an die Liste für das “flach gemachte” Bild gehängt, sodass die Liste nun in dem Beispiel 121125 + ²43 = 121370 Einträge umfasst. Die Matrix X hat in jeder Reihe eine solche Liste, sodass ihre Dimension in dem gewählten Beispiel 25 x 121370 ist, da wir 25 Schriftarten in dieser eindimensio nalen Darstellungsweise ausdrücken.

Als nächstes wird eine Repräsentation gesucht, um diese Matrix X zu rekonstru ieren. Dazu werden zwei Matrizen W, H gesucht, die multipliziert wieder die Matrix X ergeben bzw. zumindest in guter Näherung. Die Gleichung (1) soll gel ten, wobei W die Matrix der Basisvektoren und H die Matrix der Koeffizienten ist, die mit den Basisvektoren multipliziert die Schriftarten ergeben.

Das wird über die Minimierung der Frobenius-Norm umgesetzt, sodass der Re konstruktionsfehler möglichst gering wird. Für die Umsetzung dieser Minimie- rang gibt es bereits bestehende Algorithmen (siehe https://en.wikipe- dia.org/wiki/Non-negative_matrix_factorization#Algorithms), die gemäß Ausfüh rungsbeispielen hierzu genutzt werden können.

Für die 25 beispielhaften Baseline-Schriftarten 55 besitzt die Matrix W die Di mensionen 25 x N und die Matrix H die Dimension N x 121370, sodass bei einer Multiplikation beider Matrizen wieder die Dimension von Matrix X rekonstru iert wird. Der Größe N ist in diesem Fall ein freier Parameter und gibt in dem ge wählten Fall die Dimensionen des aufzuspannenden Schriftraums 110 an. Bei spielsweise kann N=3 gewählt werden, wobei die Erfindung nicht auf ein be stimmtes N eingeschränkt sein soll. Um die Dimension sinnvoll zu wählen, kann ein Kompromiss zwischen mög lichst guten Rekonstruktion und einer möglichst guter Generalisierung getroffen werden. Konkret heißt dies: Ist N sehr groß, können die originalen Schriftarten sehr gut approximiert werden, da sehr viele Merkmale genutzt werden, um die Schriften darzustellen. Gleichzeitig liegt hier aber das Problem, dass dann even tuell nur Merkmale gelernt werden, die bei den verwendeten Schriftarten vorlie gen. Es entsteht dann die Schwierigkeit andere, neue Fonts zu rekonstruieren, die nicht in der Baseline 55 vorhanden sind und womöglich ganz andere Merk male besitzen. Außerdem gibt es noch das Problem, dass die Optimierung der Lesegeschwindigkeit mittels Bayesian-Optimierung immer schwieriger wird, je mehr Dimensionen zusätzlich zu betrachten sind. Für eine kompakte Darstel lung der Schriften ist es daher vorteilhaft ein N zu wählen, dass nicht zu groß und nicht zu klein ist. Zur technischen Umsetzung kann ein Verfahren aus dem maschinellen Lernen genutzt werden, welches dem Fachmann als Kreuzvalidie- rung (cross-validation) bekannt ist. Bei diesem Verfahren wird beurteilt, wie Er gebnisse einer statistischen Analyse auf einen unabhängigen Datensatz verallge meinert werden können, wobei abgeschätzt wird, wie genau ein Vorhersagemo dell in der Praxis funktionieren wird.

In den Spalten der Basis-Matrix W stehen jetzt die dimensionalen Merkmale, also die Basisvektoren. Die Koeffizienten-Matrix H gibt jetzt die Gewichte an, mit denen die Originalschriften rekonstruiert werden kann. Das konkrete Aus führungsbeispiel verwendet drei Komponenten (N=3), um eine ausreichend um fangreiche Schriftdarstellung zu gewährleisten und gleichzeitig eine Überanpas sung an die Daten zu vermeiden. Im Folgenden soll der Einfluss dieser drei Spalten beschrieben werden.

Fig. 4 zeigt die Darstellung der 25 Fonts im dreidimensionalen Font-Raum 110. Durch diese Darstellung ist es nun möglich, neue Fonts als Linearkombinatio nen der drei gelernten Font-Basisvektoren zu synthetisieren. Entsprechend kann eine Schrift durch einen Punkt in diesem dreidimensionalen Raum repräsentiert werden. Wenn beispielsweise zum Vergleich die zwei Schriftarten Clarendon und Dax genommen werden, dann hat Clarendon ausgeprägte Serifen, bei Dax je doch nicht. Dies bedeutet, dass die Gewichte in der Koeffizienten-Matrix H für das Merkmal “Serife”, welches in den Spalten der Basis-Matrix W kodiert ist, deutlich größer für Clarendon ausfallen, um die Serifen wiederherzustellen. Das kann man sich wie “Tinte auf Papier drucken” vorstellen. Dem Drucker wird die Anweisung gegeben, wie viel Tinte er bei den Serifen verwenden soll.

Fig. 5A zeigt beispielhaft den Einfluss der drei Dimensionen für den Großbuch staben K. Die Betrachtung der Buchstabenwiedergabe zeigt, dass die erste und dritte Dimension mit der Skalierung der Buchstaben in vertikaler bzw. horizon- taler Richtung Zusammenhängen, während die zweite Dimension mit dem Vor handensein und der Stärke der Serifen zusammenhängt. Dieses generative Mo dell ermöglicht eine Reduzierung des Speicherbedarfs für die Speicherung aller Schriften, die Erstellung neuer Schriften und auch die Interpolation zwischen den aktuellen Schriften. Fig. 5B zeigt die Änderungen in drei Zeichen (Großbuchstabe K, Kleinbuchstabe y und Zahl 3), die sich aus der linearen Bewegung im euklidischen Raum 110 zwischen den Punkten ergeben, die den Schriftarten Frutiger und Sabon ent sprechen, d.h. die Punkte (3.59 , 0.7 , 10.13) und (0.86 , 11.77 , 2.10) im Font- Raum 110. An den Rändern sind die Originalschriften, rechts daneben die NMF- Annäherungen und dazwischen die lineare Interpolation durch den Schriftraum. Die Koordinaten für beide Fonts in dem dreidimensionalen Raum sind angege ben. Es ist zu beachten, dass die Änderungen allmählich und gleichmäßig sind.

Ein Vorteil der streng positiven Komponenten des NMF-Verfahrens gemäß Aus führungsbeispielen gegenüber anderen Methoden wie der Hauptkomponen- tenanalyse oder Transformatorennetzen ist, dass die Basisfunktionen der Dru ckerschwärze auf Papier darstellen und damit als Elemente angesehen werden können, die tatsächlichen Glyphen ähneln. Im Gegensatz zu Ausführungsbei spielen leiden konventionelle Implementierungen unter Problemen bei der Aus richtung und dem Kerning in Fließtexten. Qualitativ zufriedenstellende Texte können damit kaum generiert werden. Wie bereits erwähnt, generieren Ausführungsbeispiele TrueType-Font (TTF)- Dateien on „the fly“, um Texte mit einer synthetisierten Schriftart erzeugen zu können. Eine lineare Kombination der durch NMF erhaltenen Basisvektoren ergibt einen Vektor, der ein neues Graustufen-Bitmap-Bild aller Glyphen im neuen synthetisierten Font sowie Ausrichtungsinformationen für jede einzelne

Glyphe umfasst. Die Bitmap-Bilder der Glyphen können einzeln in Scalable Vec- tor Graphics (SVG) umgewandelt und dann zu einem SVG-Font zusammenge fügt werden. Der SVG-Font kann dann in das TTF-Format konvertiert werden. An dieser Stelle können auch die Ausrichtungsinformationen direkt in eine TTF- Datei eingefügt werden. Der gesamte Prozess der Schrifterzeugung funktioniert automatisch und in Echtzeit.

B. Optimierung (z.B. Baves'sche Optimierungsverfahren: Schritt

Gemäß Ausführungsbeispielen ist es möglich grundsätzlich neue Schriftarten zu generieren, die z.B. weder zu Baseline-Schriften 55 gehören noch anderweitig bekannt sind und die beispielweise die Lesegeschwindigkeit der Teilnehmer er höhen oder einen anderen Parameter verbessern. Dazu wird ein Optimierungs verfahren gewählt, das entsprechende Regionen im dreidimensionalen Schrift raum 110 findet.

Als zugrundeliegende Annahme kann angenommen werden, dass sich die Schriftarten innerhalb des generativen Schriftraums (Font-Raum 110) gleichmä ßig verändern und dass sich die beispielhafte Lesegeschwindigkeit der Teilneh mer entlang ähnlicher Schriftarten ebenfalls gleichmäßig verändert. Die zu opti mierende Zielfunktion kann z.B. die Lesegeschwindigkeit eines Individuums in Abhängigkeit von einer bestimmten Schrift sein, die in diesem Fall durch einen Punkt in dem beispielhaften dreidimensionalen Schriftraum 110 (N=3) reprä sentiert wird.

Da der Schriftraum 110 prinzipiell unendlich groß ist und nur eine begrenzte An zahl von Texten dargestellt werden kann, nutzen Ausführungsbeispiele die Bayes'sche Optimierung, da es sich hierbei um ein bekanntes Optimierungsver fahren handelt, um Extrema komplexer Kostenfunktionen zu finden, wenn die Anzahl der Stichproben, die gezogen werden können, begrenzt ist.

Die Bayes'sche Optimierung beginnt mit einer apriori Unsicherheit über das dreidimensionale Schriftvolumen und wählt sukzessive Punkte innerhalb dieses Volumens aus, für die die beispielhafte Lesegeschwindigkeit durch ein Leseexpe riment bewertet wird. Die Idee ist nun, mit einem dieser Punkte zu starten und anzunehmen, dass er einen Wert der zugrunde liegenden unbekannten Funktion darstellt. Indem die beispielhafte Lesegeschwindigkeit für diese Schriftart durch ein Experiment ermittelt wird, reduziert der Algorithmus die Unsicherheit an dieser Stelle im Schriftraum (siehe Schritte ci und C2 aus der Fig. 2).

Um die nächste Schrift zum Testen auszuwählen, wird ein Kompromiss gesucht (siehe Schritt d) in Fig. 2), und zwar zwischen

(i) der Auswahl eines Bereichs im Schriftraum, für den die Unsicherheit über die beispielhafte Lesegeschwindigkeit groß ist, und

(ii) der Auswahl eines Bereichs im Schriftraum, in dem aufgrund früherer Le seexperimente eine hohe Lesegeschwindigkeit zu erwarten ist.

Dieser Selektionsprozess wird durch die sogenannte Akquisitionsfunktion und ihrer entsprechenden Parameter durchgeführt. In der beispielhaften Bayes'sche Optimierung werden also Regionen, in denen die beispielhafte Lesegeschwindigkeit hoch ist, dichter und Regionen, in denen die Unsicherheit hoch ist, gleichmäßiger gesampelt (getestet).

C. Beispielhafter Versuchsaufbau und Daten

Zur Demonstration der Leistungsfähigkeit von Ausführungsbeispielen wird im Folgenden ein beispielhaftes Experiment beschrieben. Der gesamte geschlossene Regelkreis des Experiments (siehe Fig. 2) bestand darin, durch den Bayes'schen Optimierungsalgorithmus eine Schrift im generati ven Schriftraum 110 zu generieren und die beispielhafte Lesegeschwindigkeit einzelnen Teilnehmer zu nutzen, um neue Schriften zu generieren, für die die beispielhafte Lesegeschwindigkeit höher ist.

Hierzu nahmen 11 Probanden (5 Frauen, 6 Männer; Erwartungswert für Alter = 24 mit Standardabweichung = 2,64) an dem Experiment teil. Alle Teilnehmer waren deutsche Muttersprachler und hatten normales oder korrigiertes bis nor males Sehvermögen. Die Teilnehmer wurden akquiriert von Diplomanden und Studenten der Forschungsgruppe und erhielten die erforderlichen Materialien zur Teilnahme. Alle Probanden erhielten eine detaillierte, mehrseitige Anleitung, um Einflüsse wie Sitzposition, Betrachtungsabstände, Raumbeleuchtung etc. möglichst ähnlich zu halten. Neben einer ausführlichen Anleitung und Informa tionen zum Experiment erhielten die Probanden auch eine ausführbare Datei mit dem Experiment. Die Probanden waren Laien in Bezug auf Verfahren der Schrifterzeugung und -auswahl.

Die Probanden lasen insgesamt 95 Texte, die einem deutschen Wiki für Kinder- Lexikontexte entnommen wurden. Diese Texte wurden ausgewählt, weil sie für erwachsene Muttersprachler leicht verständlich sind, so dass der Inhalt der Texte nur einen geringen Einfluss auf die beispielhafte Lesegeschwindigkeit hatte. Außerdem wurden die Texte so ausgewählt, dass sie in ihrer Länge ver gleichbar waren, d.h. die Wortanzahl der ersten 94 Texte lag im Durchschnitt bei 99,7 mit einem Minimum von 91 und einem Maximum von 109 Wörtern. Zu sätzlich wurde ein einzelner Text mit nur 51 Wörtern ausgewählt, um zu über- prüfen, ob die beispielhafte Lesegeschwindigkeit in Abhängigkeit von der Text länge signifikant abweicht. Die Texte wurden für jeden Teilnehmer in einer zu fälligen Reihenfolge präsentiert.

Um die beispielhafte Lesegeschwindigkeit eines Benutzers gemäß Ausführungs beispiele zu messen, drückten die Probanden eine Taste, wenn sie mit dem Le- sen eines Textes begannen und drückten die Taste erneut, wenn sie den Text zu Ende gelesen hatten. In einem Anwendungsszenario könnte die beispielhafte Le segeschwindigkeit über die Seitenvorschubtaste auf einem E-Reader wie z. B. ei nem Kindle gemessen werden. Weitere Ausführungsbeispiele nutzen zur Mes sung der beispielhafte Lesegeschwindigkeit einen Eye-Tracker oder eine Stan- dard-Webcam eines Computers.

Die Texte sollten aufmerksam und so schnell wie möglich, aber insgesamt nur einmal gelesen werden. Um zu überprüfen, ob die Texte gelesen und inhaltlich verarbeitet wurden, hatten die Probanden die Aufgabe, während des Lesens Wörter aus vorher festgelegten Kategorien zu erkennen. Jeder einzelne Versuch begann, gemäß Ausführungsbeispielen, mit der Vorstellung der Kategorie für den nächsten Text, z.B. wurde vor dem Lesen des Textes angegeben, dass an schließend Wörter aus der Kategorie Tiere erkannt werden sollten. Die Kategorie bezog sich nur auf den nächsten Text, und für jeden Versuch wurde eine neue Kategorie gewählt. Die Kategorie jedes Textes wurde zuvor unabhängig vonei- nander von zwei der Autoren dieser Studie benannt und jeder Proband erhielt die gleiche Kategorie für einen Text.

Für jeden Text gab es zwischen einem und zehn Wörtern, die zu den angewiese nen Kategorien gehörten (Mittelwert: 3,07, Standardabweichung: 2,05). Sobald eine Versuchsperson die Kategorie für den nächsten Versuch gelesen hatte, konnte sie die Leertaste benutzen, um den Text anzuzeigen und mit dem Lesen zu beginnen. Sobald der Text angezeigt wurde, begann auch die Zeitmessung für die beispielhafte Lesegeschwindigkeit. Um einen versehentlichen Start zu ver meiden, konnte die Aufgabe gemäß Ausführungsbeispiele erst einige Sekunden nach der Anzeige der Kategorie gestartet werden (dies wurde den Teilnehmern beispielhaft durch ein rot/grünes Signal angezeigt). Jedes Mal, wenn ein Begriff erkannt wurde, der zu der vorher festgelegten Kategorie passte, konnten die Teilnehmer die Leertaste drücken, um dies anzuzeigen. Z.B. sollte bei dem kur zen Satz: "Der schnelle braune Fuchs springt über den faulen Hund" beim Lesen der Wörter Fuchs und Hund die Leertaste gedrückt werden, um anzuzeigen, dass die Objekte für die Kategorie Tiere erkannt wurden (siehe Schritt ci) aus Fig. 2). Sobald den Text zu Ende gelesen war, konnte die Enter-Taste gedrückt werden, um das Lesen und damit auch die Zeitmessung zu stoppen.

Zusätzlich wurde nach dem Lesen von elf Texten in zufälligen Versuchen wäh rend des Experiments eine Multiple-Choice-Frage gestellt (siehe Schritt C2) in Fig. 2), um zusätzlich das Textverständnis der Probanden zu testen. Die Frage bezog sich immer auf den zuletzt gelesenen Text und es wurden sechs mögliche Antworten vorgegeben, von denen genau eine richtig war. Nach dem Lösen einer der Multiple-Choice-Fragen erhielten die Teilnehmer ein Feedback zu ihrer Ant wort. Dieses Feedback setzte sich aus der durchschnittlichen Lesegeschwindig- keit, der Anzahl der richtigen Erkennungen und der Korrektheit der Multiple- Choice-Frage zusammen. Diese drei Komponenten wurden zu einer Punktzahl zusammengefasst, um die Teilnehmer weiter zu motivieren, schnell, aber auch richtig und aufmerksam zu lesen.

Um zu untersuchen, ob es Regionen des generativen Schriftraums 110 gibt, die höhere Lesegeschwindigkeiten erlauben, lasen die Probanden die 95 Texte in verschiedenen synthetisierten Schriften. Da der dreidimensionale Raum unend lich groß ist und nur eine begrenzte Anzahl von Texten präsentiert werden kann, wurde die Bayessche globale Optimierung mit dem Gauß-Verfahren verwendet, um mit nur 95 Proben verschiedener Fonts auszukommen, wobei die zu optimie- rende Zielfunktion die beispielhafte Lesegeschwindigkeit ist, die durch die drei Dimensionen parametriert ist. Um Regionen im Schriftraum mit höheren Lese geschwindigkeiten zu erkennen, verwenden Ausführungsbeispiele ein Clus- tering- Verfahren, das neben den drei Schriftdimensionen für jeden einzelnen Teilnehmer die Lesegeschwindigkeit als vierte Dimension einbezieht. Zum Clustern der Datenpunkte kann der OPTICS-Algorithmus verwendet wer den. Hierbei handelt es sich um ein dichtebasiertes Clusteringverfahren, das die Punkte eines Datensatzes linear ordnet, sodass räumlich nächste Nachbarn zu sammen als Cluster angeordnet werden können. Dies hat gegenüber anderen Verfahren, wie z.B. k-Means, den Vorteil, dass die Anzahl der Cluster nicht im Voraus festgelegt werden muss und Ausreißer, die keinem Cluster zugeordnet werden, erkannt werden können. Letzteres ist bei der Analyse der Daten nütz lich, da so Phasen mit Abweichungen in der Lesegeschwindigkeit aufgrund von Aufmerksamkeitsfehlern ausgeschlossen werden konnten.

Als freier Parameter des Algorithmus wird die Mindestanzahl der Datenpunkte definiert, die in einem Cluster vorhanden sein sollen. Dieser Parameter wurde auf n = 5 gesetzt (er sollte das Doppelte der Dimension minus l sein). Fig. 6A veranschaulicht die besten Cluster 6oi, 602, 603, ... , die der höchsten Lesege schwindigkeit entsprechen. Ein erste Cluster 601 entspricht einem ersten Pro banden, ein zweites Cluster 601 entspricht einem zweiten Probanden, ein drittes Cluster 601 entspricht einem dritten Probanden usw. Die Cluster 601, 602, ... werden durch ein Ellipsoid dargestellt, mit dem Zentrum aller zugehörigen Da tenpunkte und dem Standardfehler in allen drei Dimensionen als Hauptachsen.

Fig. 6B zeigt gefundene Cluster 601, 602, 603, ... für jeden der 11 Probanden ba sierend auf den dichtebasierten Algorithmus zur Clusteranalyse (OPTICS) und die zugehörigen mittleren Lesegeschwindigkeiten zusammen mit ihren Stan dardfehlern. Die mittleren Lesegeschwindigkeiten aller Cluster 601, 602, 603, ... wurden für jeden Probanden in eine Rangfolge gebracht. Es hat sich gezeigt, dass die Standardfehler der beispielhafte Lesegeschwindigkeit im Vergleich zu den mittleren Lesegeschwindigkeiten für jedes Cluster 601, 602, 603, ... und je- den Probanden sehr klein waren

D. Verbesserung der beispielhaften Lesegeschwindigkeit

Um zu überprüfen, ob Schriftcluster signifikant unterschiedlichen Lesege schwindigkeiten entsprechen, wird gemäß Ausführungsbeispielen eine Bayes‘sche Varianzanalyse (ANOVA) berechnet. Als Nullhypothese kann die An- nähme genommen werden, dass es keinen signifikanten Unterschied zwischen den Texten gab. Sogenannte Bayes-Faktoren geben dann entscheidende Hin weise gegen die Nullhypothese, sodass sich die Cluster signifikant in ihrer mitt leren Lesegeschwindigkeit unterscheiden. Gemäß Ausführungsbeispielen ermit- telte eine multivariate Varianzanalyse (MANOVA) statistisch signifikante Unter schiede in der Lesegeschwindigkeit zwischen den Clustern der höchsten Lesege schwindigkeit der Probanden, F (10, 75) = 3,24, p < .001; Pillai Trace = 0,91. Die entsprechende ANOVA für jede einzelne Dimension wurde durchgeführt und ergab drei signifikante Unterschiede Di : F (10, 75) = 2,01, p < .05; D2 : F(io, 75) = 3,63, p < .05; D3 : F(IO,75) =4,02, p < .05 (F ist das Resultat des F-Testes bzw. das Verhältnis der Varianzen zwischen und innerhalb der Cluster und p gibt die Wahrscheinlichkeit der Glaubwürdigkeit der Nullhypothese). Diese Werte sind die genauen Angaben bzgl. des Ergebnisses des statistischen Tests A- NOVA. Prinzipiell reichen die p-Werte, um die Signifikanz zu belegen. Sie sind darüber hinaus gehende, detaillierte Angaben über die Signifikanz der verbes serten Lesegeschwindigkeit aufgrund des Experiments mit den Probanden.

Daher sind die Unterschiede zwischen den Clustern aus der Fig. 6A der höchsten Lesegeschwindigkeit der Individuen statistisch signifikant. Die gemäß Ausfüh- rungsbeispielen erzeugte Verteilung ist aber nicht nur statistisch signifikant un terschiedlich, sondern gleichzeitig ist auch die Lesegeschwindigkeit im Durch schnitt statistisch signifikant schneller. Alle Probanden zeigten eine verbesserte Lesegeschwindigkeit.

Fig. 7 zeigt schließlich ein Pangramm für drei Beispiele (Probanden), geschrie- ben in der jeweiligen Schriftart des Zentrums des Clusters mit der höchsten Le segeschwindigkeit. Die Fonts sind TrueType-Schriften und können als solche ge nutzt werden.

Wesentliche Aspekte von Ausführungsbeispiele können wir folgt zusammenge fasst werden: Ausführungsbeispiele beziehen sich auf ein System (Human-in-the-Loop) zur

Verbesserung eines Parameters wie der Lesbarkeit von digital gerendertem Text. Das System verwendet einen gelernten generativen Schriftraum 110 und eine Bayes'sche Optimierung, um Schriften zu generieren, die im Hinblick auf die beispielhafte individuelle Lesegeschwindigkeit des Benutzers bewertet werden. Ausführungsbeispiele stellen Variation der Schriftmerkmale in einem spezifi schen, durch NMF gelernten Schriftraum dar. Mit Hilfe dieser Darstellung un tersuchen Ausführungsbeispiele die beispielhafte Lesegeschwindigkeit von ein zelnen Benutzern mit Hilfe der Bayes'schen Optimierung. Ergebnisse von Benutzerstudien haben die Machbarkeit des Ansatzes gezeigt, sowohl in Bezug auf die benötigten Daten, um Schriften zu finden, die die indivi duelle Lesegeschwindigkeit erhöhen, als auch in Bezug auf die statistisch signifi kante Größenordnung der Verbesserung der individuellen Lesegeschwindigkeit. Schließlich bestehen signifikante Unterschiede zwischen den Probanden in den Schriftregionen, die Schriften enthalten, die mit hoher Lesbarkeit assoziiert sind. Die generierten Schriften können tatsächliche TrueType-Schriftdateien sein, die installiert und verwendet werden können.

Obwohl sich die in dem Experiment gefundenen, die beispielhafte Lesege schwindigkeit maximierenden Schriften zwischen den einzelnen Probanden sig- nifikant unterschieden, kann daraus nicht geschlossen werden, dass das System eine einzige Schrift findet, die die beispielhafte Lesegeschwindigkeit für einen einzelnen Probanden oder über alle Probanden hinweg unveränderlich maxi miert. Vielmehr kann das System gemäß Ausführungsbeispiele dynamisch und kontinuierlich die Schriftarten für ein Individuum erstellen, die die beispielhafte Lesegeschwindigkeit zum Zeitpunkt der Nutzung maximiert. Dies kann vom In halt des Textes abhängen, davon, ob man erschöpft ist oder vielleicht unter schiedliche Anzeigegeräte verwendet. Die empirischen Daten, die Ausführungs beispiele in den Experimenten erhalten haben, belegen eindeutig, dass das Sys tem gemäß Ausführungsbeispielen die beispielhafte Lesegeschwindigkeit aller Teilnehmer erhöht.

Während in der Vergangenheit konstante, variable und parametrische Schriften entworfen und entwickelt wurden, handelt es sich bei Ausführungsbeispiele um ein interaktives System, das neue Schriften (d.h. unbekannte Schriften) auf Basis der Interaktion des Benutzers mit dem Text generiert. Das System erstellt gemäß Ausführungsbeispiele dynamisch und kontinuierlich Fonts für eine Person, was in der Studie die beispielhafte Lesegeschwindigkeit zum Zeitpunkt der Nutzung maximierte. Die Bewertung des Systems in einer Nutzerstudie zeigte die Mach barkeit des Ansatzes. Das System kann zusammen mit einem Eye-Tracker oder mit einer Webcam eingesetzt werden, um die beispielhafte Lesegeschwindigkeit automatisch zu messen.

Die in der Beschreibung, den Ansprüchen und den Figuren offenbarten Merk male der Erfindung können sowohl einzeln als auch in beliebiger Kombination für die Verwirklichung der Erfindung wesentlich sein.

BEZUGSZEICHENLISTE

50 Bildschirm

55 Baseline-Fonts

110 Font-Raum (Schriftenraum) 105 Startpunkt

106 geänderte Position

Claims

ANSPRÜCHE

1. Computerimplementiertes Verfahren zur Erzeugung von optimierten

Fonts zur Darstellung auf einem Bildschirm (50), das Verfahren umfasst:

Bilden (S110) eines Font-Raumes (110), in dem verschiedene Fonts durch Dimensionen des Font-Raumes charakterisiert werden oder Bereitst eilen von parametrischen Font-Räumen;

Auswahlen (S120) eines Startpunktes (105) in dem Font-Raum (110), wo bei zu dem Startpunkt ein zugehöriger Startfont gehört; fortlaufendes Ändern (S130) einer Position (106) im Font-Raum (110), um dadurch eine zur Darstellung genutzten Font zu ändern und um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und

Bereitstellen (S140) der optimierten Fonts zur Darstellung auf dem Bild schirm (50).

2. Verfahren nach Anspruch 1, wobei für den zumindest einen Parameter wert eines oder mehr aus dem Folgenden verwendet wird: eine Speicherbelegung, eine Menge an Druckerschwärze bei einem Drucken von Texten, eine Scangeschwindigkeit, eine Geschwindigkeit bei automatischer Texterkennung, eine Lesegeschwindigkeit eines Nutzers, ein Erinnerungsvermögen eines Nutzers, ein Textverständnis eines Nutzers, eine Präferenz für den gelesen Text eines Nutzers.

3. Verfahren nach Anspruch 1 oder Anspruch 2, das weiter ein Erfassen (S135) einer Größe umfasst, die den zumindest einen Parameterwert be stimmt.

4. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Font- Raum (110) als kontinuierlicher Raum mit einer Dimension N gebildet wird, der zwischen M bekannten Fonts interpoliert.

5. Verfahren nach Anspruch 4, wobei die Dimension N des Font-Raumes (110) durch eine Kreuzvalidierung basierend auf den M bekannten Fonts bestimmt wird.

6. Verfahren nach Anspruch 4 oder Anspruch 5, wobei der Font-Raum (110) wie folgt gebildet wird:

Auf st eilen einer Daten-Matrix (X), die in jeder Zeile oder Spalte Einträge für jeweils einen bekannten Font umfasst;

Bilden einer Basis-Matrix (W) und einer Koeffizienten-Matrix (H) durch ein Minimieren einer Frobenius-Norm für eine Differenz aus der Daten-Matrix (X) und einem Produkt der Basis-Matrix (W) und der Koeffizienten-Matrix (H):

Min |X - Wx H| , wobei die Basis-Matrix (W) eine Dimension von M x N hat.

7. Verfahren nach einem der Ansprüche 1 bis 6, wobei das fortlaufendes Än dern (S130) zum Finden des Optimums eine Anwendung zumindest eines der folgenden Verfahren umfasst: eine Bayes’schen Optimierung (S132), bei der sukzessiv Punkte im Font-Raum (110) getestet werden, um Regionen im Font-Raum (110) zu finden, in welchen der Parameterwert sich verbessert; eine dichtebasierte Cluster-Analyse (S134), wobei der zu optimie rende Parameterwert als vierte Dimension hinzugenommen wird und die Punkte eines Datensatzes linear ordnet werden, um räum lich nächste Nachbarn zusammen als Cluster anzuordnen; eine Varianzanalyse (S136) zum Ermitteln von statistisch signifi kante Unterschiede zwischen den Clustern.

8. Computerlesbares Speichermedium mit darauf gespeicherten Anweisun gen, die bei Ausführung durch einen Computer diesen veranlassen, das Verfahren nach einem der Ansprüche l bis 7 auszuführen.

9 System zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm (50), das System umfasst: ein Erzeugungsmodul, das ausgebildet ist, um einen Font-Raum (110) zu bilden, in dem verschiedene Fonts durch Dimensionen des Font-Raumes (110) charakterisiert werden; ein Optimierungsmodul, das ausgebildet ist, um einen Startpunktes (105) in dem Font-Raum (110) zu wählen, zu dem Startpunkt ein zugehöriger Startfont gehört, und durch fortlaufendes Ändern der Position (106) im Font-Raum (110) einen zur Darstellung genutzten Font zu ändern, um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und eine Ausgabeschnittstelle für einen Bildschirm (50), die ausgebildet ist, um den optimierten Font zur Darstellung auf dem Bildschirm (50) auszu geben.