WO2022223431A1 - Verfahren und vorrichtung zur erzeugung von optimierten fonts - Google Patents

Verfahren und vorrichtung zur erzeugung von optimierten fonts Download PDF

Info

Publication number
WO2022223431A1
WO2022223431A1 PCT/EP2022/060016 EP2022060016W WO2022223431A1 WO 2022223431 A1 WO2022223431 A1 WO 2022223431A1 EP 2022060016 W EP2022060016 W EP 2022060016W WO 2022223431 A1 WO2022223431 A1 WO 2022223431A1
Authority
WO
WIPO (PCT)
Prior art keywords
font
fonts
space
display
font space
Prior art date
Application number
PCT/EP2022/060016
Other languages
English (en)
French (fr)
Inventor
Constantin Rothkopf
Florian Kadner
Yannik Keller
Original Assignee
Technische Universität Darmstadt
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technische Universität Darmstadt filed Critical Technische Universität Darmstadt
Publication of WO2022223431A1 publication Critical patent/WO2022223431A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography

Definitions

  • the present invention relates to a method and apparatus for generating optimized fonts, and more particularly to a computer-implemented method and system for generating adapted fonts.
  • the present invention relates to a computer-implemented method for generating optimized fonts for display on a screen.
  • the procedure includes the steps:
  • the font space therefore does not have to be recreated.
  • parametric font spaces such as parametric typographies can also be used in the method.
  • one or more of the following is used for the at least one parameter value: a memory allocation, - a lot of printer ink when printing texts,
  • the method also includes detecting a variable that determines the at least one parameter value.
  • This variable can come, for example, from a sensor that records the parameter value.
  • memory usage on a computer can be captured directly.
  • used toner printing ink
  • Reading speed can be determined using an eye scanner (which records eye movement) or via user input (e.g. when turning the page on an electronic reader).
  • memory or text comprehension can be measured using cognitive tests, e.g., using standard questioning methods that test the level of comprehension.
  • the preference can also be recorded using cognitive test methods or determined using pupillometry (eye scanner).
  • One of the numerous parametric fonts already developed by typographers is optionally used. These are fonts that result in different typefaces by numerically changing a few parameters. In particular, the parameter changes the appearance of the font and not (only) the font size and/or font inclination and/or font thickness.
  • the font space is formed as a continuous space of dimension N that interpolates between M known fonts.
  • N the dimension of the font space
  • M the dimension of the font space
  • the font space is formed as follows:
  • the continuous changing to find the optimum includes an application of at least one of the following methods: a Bayesian optimization, in which successive points in the font space are tested in order to find regions in the font space in which the parameter value is improved (e.g. reading speed increases); a density-based cluster analysis (eg the OPTICS method), where the parameter value to be optimized is added as a fourth dimension and the points of a data set are ordered linearly, so that spatially nearest neighbors are arranged together as a cluster; an analysis of variance (e.g. ANOVA, MANOVA) to determine statistically significant differences between the clusters. It is understood that these steps are optional.
  • the system also works without a) the density-based cluster analysis and also without b) a variance analysis. These two methods can be used to a) better assess the similarity of the fonts and b) to investigate whether human reading speeds are actually statistically significantly better.
  • This method, or at least parts thereof, may also be implemented or stored in the form of instructions in software or on a computer program product, where stored instructions are capable of performing the steps of the method when the method is run on a processor. Therefore, the present invention also relates to a computer program product with software code (software instructions) stored thereon, which is designed to execute one of the methods described above when the software code is executed by a processing unit.
  • the processing unit can be any form of computer or
  • Be control unit that has a corresponding microprocessor that can execute a software code. Further exemplary embodiments also relate to a computer-readable storage medium having instructions stored thereon which, when executed by a computer, cause it to carry out the method as described above.
  • FIG. 1 For exemplary embodiments, relate to a system (device) for generating optimized or adapted fonts for display on a screen.
  • the system includes: a generation module, an optimization module, and an output interface.
  • the generation module is designed to form a font space in which different fonts are characterized by dimensions of the font space.
  • the optimization module is designed to select a starting point in the font space, with the starting point having an associated starting font.
  • the optimization module is designed to change a font used for display by continuously changing the position in the font space, in order to find an optimum with regard to at least one parameter value.
  • the output interface is designed to output the optimized font for display on the screen for a screen (display).
  • Bayesian optimization is known to those skilled in the art as a global optimization method for black-box functions, iteratively trying out hyperparameter configurations that appear promising according to a current model. The model is then adjusted based on the new findings. Bayesian optimization tries to collect as many observations as possible about the function, especially about the position of the optimum. At the same time, it takes into account the exploration of areas in which there is little knowledge about the expected performance (exploration) and the utilization of knowledge about areas in which the optimum is expected (exploitation).
  • fonts can be generated adaptively and optimized step by step in order, for example, to be able to increase the individual reading speed or to be able to improve other parameters.
  • the system is based on a generative font space that is data-driven learned by non-negative matrix factorization (NMF) from a set of classic fonts (e.g. 25).
  • NMF non-negative matrix factorization
  • Exemplary embodiments use this font space to generate new fonts and measure how a generated font affects exemplary reading speed at the individual user level.
  • exemplary embodiments select new fonts from the generative font model in order to find those fonts that lead to an optimal result (e.g. enable the reader to read texts faster).
  • this goal was achieved by presenting image content in a way that takes into account the physical conditions of human perception and the absorption of information.
  • the display of the image content is therefore not based on aesthetic aspects, but serves to increase the efficiency of the human-machine interface.
  • Fonts are set automatically through the interaction of the user, i.e. the reader, in order to improve perception, for example.
  • Aesthetic criteria are not included in the process, but rather cognitive criteria (text processing speed) or perception criteria (legibility).
  • text processing speed text processing speed
  • perception criteria legibility
  • aesthetics is not a primary goal of optimization.
  • FIG. 1 shows a schematic flow chart for a method according to an exemplary embodiment of the present invention.
  • FIG. 2 shows a process flow for the interactive improvement of the legibility of texts that are displayed on a monitor according to further exemplary embodiments.
  • Fig. 3 shows an example of names of 25 fonts (baseline fonts) represented in their respective font.
  • Fig. 4 shows the representation of the 25 fonts in the font space.
  • Figure 5A illustrates the impact of the exemplary three dimensions of font space for the capital K 5B shows an interpolation according to exemplary embodiments between the fonts Frutiger and Sabon.
  • Figure 6A illustrates the clusters corresponding to the highest read speed.
  • 6B shows the mean reading speeds for each of the found writing clusters along with the corresponding 95% confidence interval (plausibility interval) for each subject.
  • Figure 7 shows fonts generated from the centroids of the best clusters for subjects.
  • FIG. 1 shows a schematic flowchart for a method for generating optimized fonts for display on a screen.
  • the method includes: forming S110 a font space in which different fonts are characterized by dimensions of the font space;
  • Optimizing S130 at least one parameter value by continuously changing the position in the font space in order to thereby change a font used for the display;
  • Provision S140 of the optimized fonts for display on the screen It is understood that no new font space needs to be created when forming the font space.
  • An already known font space can also be used for exemplary embodiments. For this purpose, it is correspondingly read into a data processing unit and thus created there.
  • parametric font spaces can be used for this (eg parametric typographies).
  • Typography for example, refers to a media-independent design process that is achieved using writing, images, lines, surfaces, spaces, spacing, ligatures, etc.
  • the method may be computer-implemented, i.e. implemented by instructions stored on a storage medium and operable to perform the steps of the method when the instructions are executed by a processor.
  • the instructions typically include one or more instructions that are embodied in different ways on different media in or peripheral to a
  • Control unit (with a processor) can be stored which, when read and executed by the control unit, cause the control unit to perform functions, functionalities and operations necessary to perform a method according to the present invention.
  • exemplary embodiments are described primarily with regard to improving the reading speed. It goes without saying, however, that the exemplary embodiments described below can be applied in an analogous or identical manner to other parameter values that are to be optimized (e.g. to memory occupancy, an amount of printer ink when text is printed, a scanning speed, a speed with automatic text recognition Etc.).
  • Fig. 2 shows a possibility of interactive improvement of the exemplary readability of texts displayed on a monitor (screen 50) who the.
  • the entire process is illustrated in the lower part (2).
  • the iterative optimization is shown in more detail in the upper part (1).
  • a start step S10
  • a set of classic fonts are provided (baseline 55).
  • NMF non-negative matrix factorization
  • exemplary embodiments generate new true-type fonts (step S120), render texts (step S130) with the new font, and measure the example reading speed (step S135) of each user. Whether an optimum has been reached is determined in step S137. If that is the case, the method ends with step S140, where the optimized font is provided for display.
  • steps S120, S130, S135 and S137 is shown in more detail in the upper part (1).
  • the font space 110 is shown there first, where the process under a) begins with a start font 105 .
  • a question can be asked in which the user has to recognize a word.
  • the reading of a text follows and under C2) checking whether the user has read carefully (e.g. by answering a question). The reading speed can thus be measured with steps b), ci) and C2).
  • step d) the optimization is done by changing the position, i.e. a new position 106 in the font space 110 is chosen (e.g. using a Bayesian optimization). The process is repeated until it is determined at step S137, see below (2), that no further progress is made.
  • the new fonts are generated sequentially "on the fly” in step S130 (or b), e.g. via Bayesian optimization, in order to progressively increase the exemplary reading speed of the user.
  • this adaptive font generation system finds regions in the font space 110 that correspond to high reading speeds
  • optimization can be performed in terms of many parameters, including but not limited to: memory usage, amount of printer ink when printing texts, scanning speed, automatic text recognition speed.
  • example embodiments To synthesize new fonts based on a given baseline 55, example embodiments first use a parametric generative font model. Here, embodiments use so-called "unsupervised learning" to obtain the continuous font space 110 . Specifically, exemplary embodiments use non-negative matrix factorization, NMF, as a method for reducing the dimensionality of fonts. In order to cover a basic set of fonts, including serif and sans serif fonts, a list of classic and popular fonts can be selected, eg containing a total of 25 classic fonts. Figure 3 shows an example of names of 25 fonts (baseline fonts 55) represented in their respective font.
  • NMF non-negative matrix factorization
  • a grayscale image can be generated that contains all 26 letters in upper and lower case, the numbers from zero to nine, the German umlauts, brackets, question and exclamation marks, periods, commas, hyphens, colons, semicolons , slash and quotation marks. The letters were arranged side by side.
  • the image data was then concatenated along with information about the alignment of each glyph in the font, derived from the corresponding information in the TrueType file.
  • the NMF method is based on the idea of approximating a matrix X with the product of two matrices W, H such that the following relationship applies:
  • the matrices can be formed as follows.
  • the matrix X is the data matrix. This includes all information of the baseline fonts 55 and should now be broken down into N base vectors in order to span the font space. In principle, this is similar to a classic main axis transformation.
  • black and white images of a specific pixel size e.g. 2375 x 51
  • the information about the kerning i.e. the distance between the characters in the body text, is extracted for each baseline font.
  • the information is stored in *.ttf font files for each character and includes left, right and down padding.
  • the matrix W has the dimensions 25 x N and the matrix H has the dimension N x 121370, so that the dimension of matrix X is reconstructed when the two matrices are multiplied.
  • the variable N is a free parameter and, in the selected case, indicates the dimensions of the writing space 110 to be spanned.
  • a compromise can be made between the best possible reconstruction and the best possible generalization. In concrete terms, this means: If N is very large, the original fonts can be approximated very well, since a large number of features are used to represent the fonts.
  • the columns of the basis matrix W now contain the dimensional features, i.e. the basis vectors.
  • the coefficient matrix H now gives the weights with which the original fonts can be reconstructed.
  • FIG. 4 shows the representation of the 25 fonts in the three-dimensional font space 110.
  • this representation it is now possible to synthesize new fonts as linear combinations of the three learned font basis vectors.
  • a script can be represented by a point in this three-dimensional space. For example, if the two fonts Clarendon and Dax, then Clarendon has pronounced serifs, but Dax doesn't. This means that the weights in the coefficient matrix H for the serif feature encoded in the columns of the base matrix W are significantly larger for Clarendon to restore the serifs. Think of it like “printing ink on paper”. The printer is instructed on how much ink to use in the serifs.
  • FIG. 5A shows an example of the influence of the three dimensions for the capital letter K.
  • a look at the letter rendering shows that the first and third dimensions are related to the scaling of the letters in the vertical and horizontal directions, while the second dimension is related to the pre presence and the strength of the serifs.
  • This generative model allows for a reduction in memory requirements for storing all fonts, creating new fonts, and also interpolating between the current fonts.
  • Fig. 5B shows the changes in three characters (uppercase K, lowercase y and number 3) resulting from linear motion in Euclidean space 110 between the points corresponding to the Frutiger and Sabon fonts, i.e. the points (3.59 , 0.7 , 10.13) and (0.86 , 11.77 , 2.10) in font space 110.
  • the original fonts are at the edges, the NMF approximations are to the right and in between are the linear interpolation through the font space.
  • the coordinates for both fonts in three-dimensional space are given. It should be noted that
  • An advantage of the strictly positive components of the NMF method according to exemplary embodiments over other methods such as principal component analysis or transformer networks is that the basis functions represent the printer's ink on paper and can therefore be viewed as elements that resemble actual glyphs.
  • conventional implementations suffer from alignment and kerning problems in body text. Qualitatively satisfactory texts can hardly be generated with it.
  • exemplary embodiments generate TrueType Font (TTF) files on the fly in order to be able to generate text with a synthesized font.
  • TTF TrueType Font
  • a linear combination of the base vectors obtained by NMF yields a vector containing a new grayscale bitmap image of all the glyphs in the new synthesized font and alignment information for each one
  • the bitmap images of the glyphs can be individually converted to Scalable Vector Graphics (SVG) and then assembled into an SVG font.
  • SVG font can then be converted to TTF format.
  • orientation information can also be inserted directly into a TTF file. The entire font generation process works automatically and in real time.
  • exemplary embodiments use the Bayesian optimization, as it is a well-known optimization technique to find extrema of complex cost functions when the number of samples that can be drawn is limited.
  • Bayesian optimization starts with an a priori uncertainty about the three-dimensional volume of writing and successively selects points within this volume for which the exemplary reading speed is evaluated by a reading experiment. The idea now is to start with one of these points and assume that it represents a value of the underlying unknown function. By experimentally finding the exemplary reading speed for this font, the algorithm reduces the uncertainty at this point in the font space (see steps c1 and C2 of Figure 2).
  • This selection process is carried out by the so-called acquisition function and its corresponding parameters.
  • regions where the example reading speed is high are sampled more densely and regions where the uncertainty is high are sampled (tested) more evenly.
  • the subjects read a total of 95 texts taken from a German wiki for children's encyclopedia texts. These texts were chosen because they are easily understandable for adult native speakers, so the content of the texts had little impact on the exemplary reading speed. In addition, the texts were selected so that they were comparable in length, i.e. the average word count of the first 94 texts was 99.7 with a minimum of 91 and a maximum of 109 words. In addition, a single text with only 51 words was selected to check whether the example reading speed deviates significantly depending on the text length. The texts were presented in a random order for each participant.
  • the subjects pressed a button when they started reading a text and pressed the button again when they closed the text had read the end.
  • the exemplary reading speed could be reached via the page feed button on an e-reader such as B. ei nem Kindle are measured.
  • Further exemplary embodiments use an eye tracker or a standard webcam of a computer to measure the exemplary reading speed.
  • each individual test began with the presentation of the category for the next text, e.g. before reading the text it was stated that words from the animal category should then be recognized.
  • the category referred to the closest text only, and a new category was chosen for each trial.
  • the category of each text was previously named independently by two of the authors of this study, and each subject received the same category for a text.
  • the spacebar should be pressed to indicate that the objects for the animal category have been recognized (see step ci) off 2).
  • the Enter key could be pressed to stop the reading and thus also the time measurement.
  • a multiple-choice question was asked (see step C2) in FIG. 2) to additionally test the text comprehension of the subjects.
  • the question always referred to the last text read and six possible answers were given, of which exactly one was correct.
  • the participants received feedback on their answer. This feedback consisted of the average reading speed, the number of correct recognitions and the correctness of the multiple choice question.
  • exemplary reading speed is parameterized by the three dimensions.
  • exemplary embodiments use a clustering method which, in addition to the three writing dimensions, includes the reading speed as the fourth dimension for each individual participant.
  • the OPTICS algorithm can be used to cluster the data points.
  • This is a density-based clustering method that arranges the points of a data set in a linear manner so that spatially nearest neighbors can be clustered together.
  • this has the advantage that the number of clusters does not have to be determined in advance and outliers that are not assigned to any cluster become, can be recognized. The latter is useful when analyzing the data, as it allows phases with deviations in reading speed due to attention errors to be ruled out.
  • FIG. 6A illustrates the best clusters 60i, 602, 603, ... corresponding to the highest read speed.
  • a first cluster 601 corresponds to a first subject
  • a second cluster 601 corresponds to a second subject
  • a third cluster 601 corresponds to a third subject
  • the clusters 601, 602, ... are represented by an ellipsoid with the center of all associated Da ten points and the standard error in all three dimensions as principal axes.
  • Figure 6B shows found clusters 601, 602, 603, ... for each of the 11 subjects based on the density-based cluster analysis algorithm (OPTICS) and the associated mean reading speeds together with their standard errors.
  • the mean reading speeds of all clusters 601, 602, 603, ... were ranked for each subject. It has been shown that the standard errors of the example reading speeds compared to the mean reading speeds for each cluster 601, 602, 603, ... and each subject were very small
  • a Bayesian analysis of variance is calculated according to exemplary embodiments.
  • the assumption that there was no significant difference between the texts can be taken as the null hypothesis. So-called Bayes factors then provide decisive information against the null hypothesis, so that the clusters differ significantly in their average reading speed.
  • the differences between the clusters of Figure 6A of the highest reading speed of the individuals are statistically significant.
  • the distribution generated according to exemplary embodiments is not only statistically significantly different, but at the same time the reading speed is also statistically significantly faster on average. All subjects showed an improved reading speed.
  • FIG. 7 shows a pangram for three examples (subjects), written in the respective font of the center of the cluster with the highest reading speed.
  • the fonts are TrueType fonts and can be used as such.
  • exemplary embodiments relate to a system (human-in-the-loop) for
  • the system uses a learned generative font space 110 and Bayesian optimization to generate fonts that are evaluated against the user's exemplary individual reading speed.
  • Example embodiments depict variation in writing characteristics in a specific writing space learned through NMF. Using this depiction, example embodiments examine individual users' exemplary reading speed using Bayesian optimization. Results from user studies have demonstrated the feasibility of the approach, both in terms of the data needed to find fonts that increase individual reading speed and in terms of the statistically significant magnitude of improvement in individual reading speed. Finally, there are significant inter-subject differences in the writing regions that contain writings associated with high legibility.
  • the generated fonts can be actual TrueType font files that can be installed and used.
  • the system can dynamically and continuously create the fonts for an individual that maximize the exemplary reading speed at the time of use. This can depend on the content of the text, whether you are exhausted or perhaps using different display devices.
  • the empirical data obtained by embodiments in the experiments clearly demonstrates that the system according to embodiments increases the exemplary reading speed of all participants.
  • exemplary embodiments involve an interactive system that generates new fonts (ie, unknown fonts) based on the user's interaction with the text.
  • the system dynamically and continuously creates fonts for a person, what in the study maximized the exemplary reading speed at the time of use.
  • the evaluation of the system in a user study showed the feasibility of the approach.
  • the system can be used in conjunction with an eye tracker or webcam to automatically measure example reading speeds.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

Es ist ein computerimplementiertes Verfahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm (50) offenbart. Das Verfahren umfasst: Bilden (S110) eines Font-Raumes (110), in dem verschiedene Fonts durch Dimensionen des Font-Raumes (110) charakterisiert werden; Auswählen (S120) eines Startpunktes in dem Font-Raum (100), wobei zu dem Startpunkt ein zugehöriger Startfont gehört; fortlaufendes Ändern (S130) der Position im Font-Raum (110) und dadurch eine zur Darstellung genutzten Font zu ändern, um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und Bereitstellen (S140) der optimierten Fonts zur Darstellung auf dem Bildschirm (50).

Description

VERFAHREN UND VORRICHTUNG ZUR ERZEUGUNG VON
OPTIMIERTEN FONTS
Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Erzeugung von optimierten Fonts und insbesondere auf ein computerimple mentiertes Verfahren und ein System zur Erzeugung von adaptierten Fonts.
HINTERGRUND
Digitaler Text ist zu einer der primären Möglichkeiten des Wissensaustauschs geworden, wobei der Text zum Lesen in der Regel auf einem Bildschirm über eine Druckschrift (Fonts) dargesteht wird. Traditionell folgt die Umwandlung von Text in die tatsächlich sichtbaren Buchstaben einem komplexen Prozess, der künstlerische und gestalterische Überlegungen bei der Erstehung von Schriftbil dern, die Auswahl bestimmter Schriftarten und viele typografische Entscheidun gen bezüglich der räumlichen Platzierung und Anordnung von Buchstaben und Wörtern umfasst.
Eine grundlegende Frage bei der Darstellung von Text ist, ob die Art und Weise, wie der Text dargestellt wird, einen Einfluss darauf hat, wie er gelesen, verarbei tet und verstanden wird. Zahlreiche empirische Untersuchungen haben gemes sen, wie Eigenschaften von geschriebenem Text dessen Wahrnehmung beim Le- sen sowohl auf Papier als auch auf elektronischen Geräten beeinflussen. Insge samt sind die Ergebnisse dieser empirischen Untersuchungen zum Zusammen hang zwischen Lesegeschwindigkeit bzw. Leseverständnis und Schriftparame tern jedoch gemischt und zum Teil widersprüchlich.
Einige dieser Fonts (konkrete Schriftarten) wurden entwickelt, um die Lesbar keit für Menschen mit Sehschwäche zu verbessern. Wieder Andere wurden ent wickelt, um die Lesbarkeit auf kleinen elektronischen Geräten zu erhöhen. Eine individuelle Optimierung ist damit jedoch nicht möglich. Es besteht daher ein Bedarf nach einer Möglichkeit optimierte Fonts für Bild schirme bereitzustellen, die sich beliebig individuell anpassen lassen.
KURZBESCHREIBUNG DER ERFINDUNG
Zumindest ein Teil der obengenannten Probleme wird durch ein computerim- plementiertes Verfahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm nach Anspruch l und ein System nach Anspruch 9 gelöst. Die abhängigen Ansprüche beziehen sich auf vorteilhafte Weiterbildungen der Gegenstände der unabhängigen Ansprüche.
Die vorliegende Erfindung bezieht sich auf ein computerimplementiertes Ver- fahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bild schirm. Das Verfahren umfasst die Schritte:
- Bilden eines Font-Raumes, in dem verschiedene Fonts durch Dimensio nen des Font-Raumes charakterisiert werden oder Bereitst eilen eines pa- rametrischen Font-Raumes; - Auswählen eines Startpunktes in dem Font-Raum, wobei zu dem Start punkt ein zugehöriger Startfont gehört;
- fortlaufendes Ändern der Position im Font-Raum, um dadurch eine zur Darstellung genutzten Font zu ändern und um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und - Bereitstellen der optimierten Fonts zur Darstellung auf dem Bildschirm.
Der Font-Raum muss somit nicht neu geschaffen werden. Gemäß Ausführungs beispielen können auch parametrische Font-Räume wie z.B. parametrische Ty pographien in dem Verfahren genutzt werden.
Optional wird für den zumindest einen Parameterwert eines oder mehr aus dem Folgenden verwendet: eine Speicherbelegung, - eine Menge an Druckerschwärze bei einem Drucken von Texten,
- eine Scangeschwindigkeit,
- eine Geschwindigkeit bei automatischer Texterkennung,
- eine Lesegeschwindigkeit eines Nutzers, - ein Erinnerungsvermögen eines Nutzers,
- ein Textverständnis eines Nutzers,
- eine Präferenz für den gelesen Text eines Nutzers.
Optional umfasst das Verfahren außerdem ein Erfassen einer Größe, die den zu mindest einen Parameterwert bestimmt. Diese Größe kann beispielsweise von einem Sensor kommen, der den Parameterwert erfasst. Zum Beispiel kann die Speicherbelegung an einem Computer direkt erfasst werden. Gleiches trifft zu für einen verbrauchten Toner (Druckerschwärze) oder die Geschwindigkeit beim Scannen bzw. der Texterkennung. Die Lesegeschwindigkeit kann mit einem Au genscanner (der die Augenbewegung erfasst) oder über ein Benutzereingabe (z.B. beim Umblättern bei einem elektronischen Lesegerät) ermittelt werden.
Gemäß weiterer Ausführungsbeispiele kann ein Erinnerungsvermögen oder Textverständnis mittels kognitiver Tests erfasst werden, z.B. mit üblichen Frage- Verfahren, die den Grad des Verständnisses testen. Optional kann die Präferenz auch mit kognitiven Testverfahren erfasst werden oder mittels Pupillometrie (Augenscanner) ermittelt werden.
Optional wird eine der zahlreichen bereits von Typographen entwickelte para metrisch gestaltete Schriftart benutzt. Dies sind Fonts, die durch die numerische Veränderung weniger Parameter unterschiedliche Schriftbilder ergeben. Der Pa rameter ändert dabei insbesondere das Erscheinungsbild des Fonts und nicht (nur) die Schriftgröße und/ oder die Schriftneigung und/ oder die Schriftdicke.
Optional wird der Font-Raum als kontinuierlicher Raum mit einer Dimension N gebildet, der zwischen M bekannten Fonts interpoliert. Auf diese Weise werden die Fonts kontinuierlich geändert (d.h. nicht sprunghaft), wenn die Position im Font-Raum kontinuierlich geändert wird. Die Dimension N des Font-Raumes kann durch eine Kreuzvalidierung basierend auf den M bekannten Fonts be- stimmt wird. Mögliche Werte sind z.B. N=2, 3, 4, 5, ... und M hat zumindest ei nen Wert von 10, 15, 20, 30. Im Prinzip können diese Werte aber beliebig sein.
Optional wird der Font-Raum wie durch folgende Schritte gebildet:
Aufstellen einer Daten-Matrix X, die in jeder Zeile oder jeder Spalte Ein- träge für jeweils einen bekannten Font umfasst;
Bilden einer Basis-Matrix W und einer Koeffizienten-Matrix H durch ein Minimieren einer Frobenius-Norm für eine Differenz aus der Daten-Mat rix X und einem Produkt der Basis-Matrix W und der Koeffizienten-Mat rix H: Min |X - Wx H| , (l) wobei die Basis-Matrix W eine M x N - Matrix ist. Das Produkt WxH ist das üb liche Matrizenprodukt, bei dem die Werte der Zeilen und Spalten miteinander skalar multipliziert werden.
Optional umfasst das fortlaufende Ändern zum Finden des Optimums eine An- wendung zumindest eines der folgenden Verfahren: eine Bayes’schen Optimierung, bei der sukzessiv Punkte im Font-Raum getestet werden, um Regionen im Font-Raum zu finden, in welchen der Parameterwert sich verbessert (z.B. Lesegeschwindigkeit steigt); eine dichtebasierte Cluster-Analyse (z.B. das OPTICS-Verfahren), wobei der zu optimierende Parameterwert als vierte Dimension hinzugenom men wird und die Punkte eines Datensatzes linear geordnet werden, so dass räumlich nächste Nachbarn zusammen als Cluster angeordnet wer den; eine Varianzanalyse (z.B. ANOVA, MANOVA), um statistisch signifikante Unterschiede zwischen den Clustern zu ermitteln. Es versteht sich, dass diese Schritte optional sind. Das System funktioniert prin zipiell auch ohne a) die dichtebasierte Cluster- Analyse und auch ohne b) eine Varianzanalyse. Diese beiden Methoden können verwendet werden, um a) die Schriftarten besser in ihrer Ähnlichkeit zu bewerten und b) zu untersuchen, ob die menschlichen Lesegeschwindigkeiten auch tatsächlich statistisch signifikant besser sind.
Dieses Verfahren oder zumindest Teile davon kann/können ebenfalls in Form von Anweisungen in Software oder auf einem Computerprogrammprodukt im plementiert oder gespeichert sein, wobei gespeicherte Anweisungen in der Lage sind, die Schritte nach dem Verfahren auszuführen, wenn das Verfahren auf ei nem Prozessor läuft. Daher bezieht sich die vorliegende Erfindung ebenfalls auf Computerprogrammprodukt mit darauf gespeichertem Software-Code (Soft wareanweisungen), der ausgebildet ist, um eines der zuvor beschriebenen Ver fahren auszuführen, wenn der Software-Code durch eine Verarbeitungseinheit ausgeführt wird. Die Verarbeitungseinheit kann jede Form von Computer oder
Steuereinheit sein, die einen entsprechenden Mikroprozessor aufweist, der einen Software-Code ausführen kann. Weitere Ausführungsbeispiele beziehen sich auch auf ein computerlesbares Speichermedium mit darauf gespeicherten An weisungen, die bei Ausführung durch einen Computer diesen veranlassen, das Verfahren, wie es zuvor beschrieben wurde, auszuführen.
Weitere Ausführungsbeispiele beziehen sich auf ein System (Vorrichtung) zur Erzeugung von optimierten oder adaptierten Fonts zur Darstellung auf einem Bildschirm. Das System umfasst: ein Erzeugungsmodul, ein Optimierungsmodul und eine Ausgabeschnittstelle. Das Erzeugungsmodul ist ausgebildet, um einen Font-Raum zu bilden, in dem verschiedene Fonts durch Dimensionen des Font- Raumes charakterisiert werden. Das Optimierungsmodul ist ausgebildet, um ei nen Startpunktes in dem Font-Raum zu wählen, wobei zu dem Startpunkt ein zugehöriger Startfont gehört. Außerdem ist das Optimierungsmodul ausgebildet, um durch fortlaufendes Ändern der Position im Font-Raum einen zur Darstel- lung genutzten Font zu ändern, um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden. Die Ausgabeschnittstelle ist ausgebildet, für einen Bildschirm (Display) den optimierten Font zur Darstellung auf dem Bildschirm auszugeben. Die bayessche Optimierung ist einem Fachmann als eine globale Optimierungs methode für Black-Box-Funktionen bekannt, wobei iterativ Hyperparameter konfigurationen ausprobiert werden, die nach einem aktuellen Modell vielver sprechend erscheinen. Anschließend wird das Modell durch die neuen Erkennt - nisse angepasst. Die bayessche Optimierung versucht so möglichst viele Be obachtungen über die Funktion zu sammeln, insbesondere über die Lage des Optimums. Sie berücksichtigt gleichzeitig die Erkundung von Bereichen, in de nen wenig Wissen über die zu erwartende Performance vorliegt (Exploration) und die Ausnutzung von Wissen über Bereiche, in denen das Optimum erwartet wird (Exploitation).
Vorteile von Ausführungsbeispielen ergeben sich insbesondere daraus, dass adaptiv Schriften generiert und schrittweise optimiert werden können, um bei spielsweise die individuelle Lesegeschwindigkeit zu erhöhen oder andere Para meter verbessern zu können. Das System basiert auf einem generativen Schrift- raum, der datengesteuert durch nicht-negative Matrixfaktorisierung (NMF) von einem Satz von klassischen Schriften (z.B. 25) erlernt wird. Ausführungsbei spiele verwenden diesen Schriftraum, um neue Schriften zu generieren und mes sen, wie eine generierte Schrift die beispielhafte Lesegeschwindigkeit auf indivi dueller Benutzerebene beeinflusst. Mittels Bayes'scher Optimierung wählen Aus- führungsbeispiele aus dem generativen Fontmodell neue Fonts aus, um diejeni gen Fonts zu finden, die zu einem optimalen Resultat führen (z.B. dem Leser er möglichen, Texte schneller zu lesen).
Durchgeführte Probandenstudie haben ergeben, dass die Wahrnehmung der ge zeigten Informationen durch den Menschen verbessern wird. Dieses Ziel wurde erfindungsgemäß durch eine Präsentation von Bildinhalten in einer Weise er reicht, die auf die physischen Gegebenheiten der menschlichen Wahrnehmung und Aufnahme von Informationen Rücksicht nimmt. Die Darstellung der Bildin halte folgt somit nicht ästhetischen Gesichtspunkten, sondern dient der Effi zienzsteigerung der Mensch-Maschine-Schnittstelle.
Um dieses technische Ziel zu erreichen, werden beispielsweise Parameter der Schriften automatisch durch die Interaktion des Nutzers, also des Lesenden, ge setzt, um so beispielsweise die Wahrnehmung zu verbessern. Ästhetische Krite rien gehen dabei nicht in das Verfahren ein, sondern kognitive Kriterien (Text verarbeitungsgeschwindigkeit) oder Wahrnehmungskriterien (Lesbarkeit). Es kann natürlich nicht ausgeschlossen werden, dass die Fonts mit der besten Text verarbeitungsgeschwindigkeit und einer hervorragender Lesbarkeit durch den Nutzer auch es ästhetisch angesehen werden. Es kann aber auch genau umge kehrt sein, d.h. der aus der Optimierung resultierende Fonts als besonders unäs thetisch angesehen wird. In jedem Fall, ist die Ästhetik kein primäres Ziel der Optimierung.
KURZBESCHREIBUNG DER FIGUREN
Die Ausführungsbeispiele der vorliegenden Erfindung werden besser verstanden anhand der folgenden detaillierten Beschreibung und den beiliegenden Zeich- nungen der unterschiedlichen Ausführungsbeispiele, die jedoch nicht so verstan den werden sollten, dass sie die Offenbarung auf die spezifischen Ausführungs formen einschränken, sondern lediglich der Erklärung und dem Verständnis die nen.
Fig. l zeigt ein schematisches Flussdiagramm für ein Verfahren gemäß ei nem Ausführungsbeispiel der vorliegenden Erfindung.
Fig. 2 zeigt einen Verfahrensablauf der interaktiven Verbesserung der Les barkeit von Texten, die gemäß weiteren Ausführungsbeispielen auf ei nem Monitor dargestellt werden.
Fig. 3 zeigt ein Beispiel für Namen von 25 Schriften (Baseline-Schriften), die in ihrer jeweiligen Schriftart dargestellt sind.
Fig. 4 zeigt die Darstellung der 25 Schriften im Font-Raum.
Fig. 5A veranschaulicht den Einfluss der beispielhaften drei Dimensionen des Font-Raums für den Großbuchstaben K Fig. 5B zeigt eine Interpolation gemäß Ausführungsbeispielen zwischen den Fonts Frutiger und Sabon.
Fig. 6A veranschaulicht die Cluster, die der höchsten Lesegeschwindigkeit entsprechen.
Fig. 6B zeigt die mittleren Lesegeschwindigkeiten für jedes der gefundenen Schriftcluster zusammen mit dem entsprechenden 95%-Konfidenz- intervall (Glaubwürdigkeitsintervall) für jeden Probanden.
Fig. 7 zeigt Schriften, die aus den Zentroiden der besten Cluster für Proban den erzeugt wurden.
DETAILLIERTE BESCHREIBUNG
Fig. 1 zeigt ein schematisches Flussdiagramm für ein Verfahren zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm.
Das Verfahren umfasst: Bilden S110 eines Font-Raumes, in dem verschiedene Fonts durch Dimen sionen des Font-Raumes charakterisiert werden;
Auswahlen S120 eines Startpunktes in dem Font-Raum, wobei zu dem Startpunkt ein zugehöriger Startfont gehört;
Optimieren S130 zumindest eines Parameterwertes durch ein fortlaufen- des Ändern der Position im Font-Raum, um dadurch eine zur Darstellung genutzten Font zu ändern; und
Bereitstellen S140 der optimierten Fonts zur Darstellung auf dem Bild schirm. Es versteht sich, dass beim Bilden des Font-Raumes kein neuer Font-Raum ge schaffen werden muss. Es kann auch ein bereits bekannter Font-Raum für Aus führungsbeispiele genutzt werden. Er wird dazu in einer Datenverarbeitungsein heit dementsprechend eingelesen und somit dort geschaffen. Beispielsweise kön- nen dazu parametrische Font-Räume verwendet werden (z.B. parametrische Ty pographien). Die Typografie bezieht sich beispielsweise auf einen medienunab hängigen Gestaltungsprozess, der mittels Schrift, Bildern, Linien, Flächen, Leer räumen, Laufweiten, Ligaturen usw. erreicht wird.
Es versteht sich, dass Ausführungsbeispiele verschiedenste Optimierungen durchführen können. Außerdem kann das Verfahren Computer-implementiert sein, d.h. es kann durch Anweisungen umgesetzt sein, die auf einem Speicher medium gespeichert sind und in der Lage sind, die Schritte des Verfahrens aus zuführen, wenn die Anweisungen durch einen Prozessor ausgeführt werden. Die Anweisungen umfassen typischerweise eine oder mehrere Anweisungen, die auf unterschiedliche Art auf unterschiedlichen Medien in oder peripher zu einer
Steuereinheit (mit einem Prozessor) gespeichert sein können, die, wenn sie gele sen und durch die Steuereinheit ausgeführt werden, die Steuereinheit dazu ver anlassen, Funktionen, Funktionalitäten und Operationen auszuführen, die zum Ausführen eines Verfahrens gemäß der vorliegenden Erfindung notwendig sind. Im Folgenden werden Ausführungsbeispiele vor allem in Bezug auf die Verbes serung der Lesegeschwindigkeit beschrieben. Es versteht sich aber, dass die in folgenden beschriebenen Ausführungsbeispiele in analoger oder gleicher Weise anwendbar sind auf andere Parameterwerte, die optimiert werden sollen (z.B. auf eine Speicherbelegung, eine Menge an Druckerschwärze bei einem Drucken von Texten, eine Scangeschwindigkeit, eine Geschwindigkeit bei automatischer Texterkennung etc.).
Fig. 2 zeigt eine Möglichkeit der interaktiven Verbesserung der beispielhaften Lesbarkeit von Texten, die auf einem Monitor (Bildschirm 50) dargestellt wer den. Im unteren Teil (2) ist der Gesamtprozess veranschaulicht. Im oberen Teil (1) ist die iterative Optimierung genauer dargestellt. Bezugnehmend auf den unteren Teil (2), werden nach einem Start (Schritt S10) eine Menge an klassischen Schriften bereitgestellt (Baseline 55). Dann wird zu nächst ein generativer Schriftraum mit nicht-negativer Matrixfaktorisierung (NMF) aus einer Menge klassischer Schriftarten gebildet oder gelernt (Schritt S110). In diesem Raum generieren Ausführungsbeispiele durch aktives Lernen neue True-Type-Schriften (Schritt S120), rendern Texte (Schritt S130) mit der neuen Schrift und messen die beispielhafte Lesegeschwindigkeit (Schritt S135) der einzelnen Benutzer. Ob ein Optimum erreicht ist, wird im Schritt S137 fest gestellt. Falls das der Fall ist, endet das Verfahren mit Schritt S140, wo die opti- mierte Schrift zur Darstellung bereitgestellt wird.
Der iterative Prozess der Schritte S120, S130, S135 und S137 ist im oberen Teil (1) genauer dargestellt. Dort ist zunächst der Schriftenraum 110 dargestellt, wo bei der Prozess unter a) mit einem Startfont 105 beginnt. Als nächstes kann un ter b) eine Frage gestellt werden, bei der Benutzer eine Wörter zu erkennen hat. Dann folgt unter ci) zunächst das Lesen eines Textes und unter C2) das Prüfen, ob der Benutzer aufmerksam gelesen hat (z.B. durch das Beantworten einer Frage). Mit den Schritten b), ci) und C2) kann somit die Lesegeschwindigkeit ge messen werden. Im Schritt d) erfolgt die Optimieren durch das Ändern der Posi tion, d.h. es wird eine neue Position 106 im Font-Raum 110 gewählt (z.B. unter Nutzung einer Bayes‘schen Optimierung). Der Vorgang wiederholt sich, bis bei dem Schritt S137, siehe unteren Teil (2), festgestellt wird, dass keine weiteren Fortschritte erreicht werden.
Die neuen Fonts (Schriften) werden im Schritt S130 (bzw. b), z.B. über die Bayes'sche Optimierung, sequentiell „on the fly“ generiert, um die beispielhafte Lesegeschwindigkeit der Benutzer progressiv zu erhöhen.
Durchgeführte Vergleichsexperimente zeigten, dass:
- dieses adaptive Schriftgenerierungssystem Regionen im Schriftraum 110 findet, die hohen Lesegeschwindigkeiten entsprechen,
- diese Schriften die beispielhafte Lesegeschwindigkeit der Teilnehmer signifikant erhöhen, und
- sich die gefundenen Schriften zwischen den einzelnen Lesern signifi kant unterscheiden.
Es versteht sich, dass die Vorgehensweise auch auf andere Gebiete übertragen lässt. Die Optimierung kann hinsichtlich vieler Parameter durchgeführt werden, wozu u.a. Folgendes gehört: eine Speicherbelegung, eine Menge an Drucker schwärze bei einem Drucken von Texten, eine Scangeschwindigkeit, eine Ge schwindigkeit bei automatischer Texterkennung.
Die einzelnen Schritte werden im Folgenden genauer beschrieben: A. Lernen oder Erzeugen eines Schriftraums (Schritt
Figure imgf000012_0001
Um neue Fonts auf Basis einer gegebenen Baseline 55 zu synthetisieren, nutzen Ausführungsbeispiele zunächst ein parametrisches generatives Fontmodell. Hier verwenden Ausführungsbeispiele ein sogenanntes „nicht-überwachtes Lernen“, um den kontinuierlichen Font-Raum 110 zu erhalten. Konkret nutzen Ausfüh- rungsbeispiele die nicht-negative Matrixfaktorisierung, NMF, als Methode zur Reduktion der Dimensionalität von Fonts. Um eine Grundmenge an Schriften, einschließlich Schriften mit Serifen und serifenlosen Schriften, abzudecken, kann eine Liste klassischer und populärer Schriften ausgewählt werden, die z.B. insgesamt 25 klassische Schriften enthält. Fig. 3 zeigt ein Beispiel für Namen von 25 Schriften (Baseline-Schriften 55), die in ihrer jeweiligen Schriftart dargestellt sind. Zur Durchführung der NMF kann ein Graustufenbild erzeugt werden, das alle 26 Buchstaben in Groß- und Klein schreibung, die Zahlen von null bis neun, die deutschen Umlaute, Klammern, Frage- und Ausrufezeichen, Punkt, Komma, Bindestrich, Doppelpunkt, Semiko- Ion, Schrägstrich und Anführungszeichen aufweist. Die Buchstaben wurden ne beneinander angeordnet. Die Bilddaten wurden dann zusammen mit Informati onen über die Ausrichtung jeder Glyphe im Font verkettet, die aus den entspre chenden Informationen in der TrueType-Datei gewonnen wurden. Das NMF-Verfahren basiert auf der Idee, eine Matrix X mit dem Produkt zweier Matrizen W, H so zu approximieren, dass folgende Beziehung gilt:
X - W · H . (l)
Diese Faktorisierung erfolgt unter der Randbedingung, dass die Approximation die Frobenius-Norm
X - W · H (2) minimiert und dass alle Einträge von W, H nicht-negativ sind. Die Spalten von W repräsentieren dann die dimensionalen Merkmale und H enthält die Ge wichte zur Kombination dieser Merkmale, um die Zeilen in X zu rekonstruieren. Konkret können die Matrizen wie folgt gebildet werden. Die Matrix X ist die Da tenmatrix. Diese umfasst alle Informationen der Baseline-Schriftarten 55 und soll jetzt in N Basisvektoren zerlegt werden, um den Schriftenraum aufzuspan nen. Prinzipiell ist das ähnlich einer klassischen Hauptachsentransformation. Um die Datenmatrix X zu erhalten, können schwarz-weiß Bilder einer bestimm- ten Pixel-Größe (z.B. 2375 x 51) pro Schriftart erstellt werden, in der alle 26
Buchstaben des Alphabets in Klein- und Großbuchstaben, alle Ziffern von o bis 9, alle deutschen Umlaute, Klammern, Frage- und Ausrufezeichen, Komma, An führungszeichen, Doppelpunkt, Semikolon, Slash und Satzpunkt zu sehen sind (insgesamt sind das 81 Zeichen). Alle diese Komponenten können nebeneinan- der ausgerichtet und dargestellt werden. Jeder dieser Pixel weist jetzt einen Grauwert auf, der z.B. eine Wert zwischen o und 255 darstellt (dabei ist o schwarz und 255 weiß und dazwischen interpolieren sich Graustufen).
Diese Bilder können “flach gemacht” werden. Hierzu wird jede Reihe des Bildes einfach hintereinander angeordnet, wodurch eine eindimensionale Darstellung des Bildes erhalten wird. In unserem Fall ergibt sich dann also eine Liste von z.B. 2375 x 51=121125 Werten. Zusätzlich wird für jede Baseline-Schriftart die Information über das Kerning, also den Abstand zwischen den Zeichen im Fließtext extrahiert. Die Information ist in *.ttf Schriftart-Dateien für jedes Zeichen gespeichert und umfasst ein Pad- ding links, rechts und nach unten. Zusätzlich können Ausführungsbeispiele noch einen Wert, der die Zeilenhöhe angibt, und einen Wert für die Länge des Leer zeichens speichern. Bei 8i Zeichen ergibt sich auf diese Weise eine Liste für die Abstands-Informationen mit 81x 3 + 2 = 245 Einträgen. Dieser wird an die Liste für das “flach gemachte” Bild gehängt, sodass die Liste nun in dem Beispiel 121125 + 243 = 121370 Einträge umfasst. Die Matrix X hat in jeder Reihe eine solche Liste, sodass ihre Dimension in dem gewählten Beispiel 25 x 121370 ist, da wir 25 Schriftarten in dieser eindimensio nalen Darstellungsweise ausdrücken.
Als nächstes wird eine Repräsentation gesucht, um diese Matrix X zu rekonstru ieren. Dazu werden zwei Matrizen W, H gesucht, die multipliziert wieder die Matrix X ergeben bzw. zumindest in guter Näherung. Die Gleichung (1) soll gel ten, wobei W die Matrix der Basisvektoren und H die Matrix der Koeffizienten ist, die mit den Basisvektoren multipliziert die Schriftarten ergeben.
Das wird über die Minimierung der Frobenius-Norm umgesetzt, sodass der Re konstruktionsfehler möglichst gering wird. Für die Umsetzung dieser Minimie- rang gibt es bereits bestehende Algorithmen (siehe https://en.wikipe- dia.org/wiki/Non-negative_matrix_factorization#Algorithms), die gemäß Ausfüh rungsbeispielen hierzu genutzt werden können.
Für die 25 beispielhaften Baseline-Schriftarten 55 besitzt die Matrix W die Di mensionen 25 x N und die Matrix H die Dimension N x 121370, sodass bei einer Multiplikation beider Matrizen wieder die Dimension von Matrix X rekonstru iert wird. Der Größe N ist in diesem Fall ein freier Parameter und gibt in dem ge wählten Fall die Dimensionen des aufzuspannenden Schriftraums 110 an. Bei spielsweise kann N=3 gewählt werden, wobei die Erfindung nicht auf ein be stimmtes N eingeschränkt sein soll. Um die Dimension sinnvoll zu wählen, kann ein Kompromiss zwischen mög lichst guten Rekonstruktion und einer möglichst guter Generalisierung getroffen werden. Konkret heißt dies: Ist N sehr groß, können die originalen Schriftarten sehr gut approximiert werden, da sehr viele Merkmale genutzt werden, um die Schriften darzustellen. Gleichzeitig liegt hier aber das Problem, dass dann even tuell nur Merkmale gelernt werden, die bei den verwendeten Schriftarten vorlie gen. Es entsteht dann die Schwierigkeit andere, neue Fonts zu rekonstruieren, die nicht in der Baseline 55 vorhanden sind und womöglich ganz andere Merk male besitzen. Außerdem gibt es noch das Problem, dass die Optimierung der Lesegeschwindigkeit mittels Bayesian-Optimierung immer schwieriger wird, je mehr Dimensionen zusätzlich zu betrachten sind. Für eine kompakte Darstel lung der Schriften ist es daher vorteilhaft ein N zu wählen, dass nicht zu groß und nicht zu klein ist. Zur technischen Umsetzung kann ein Verfahren aus dem maschinellen Lernen genutzt werden, welches dem Fachmann als Kreuzvalidie- rung (cross-validation) bekannt ist. Bei diesem Verfahren wird beurteilt, wie Er gebnisse einer statistischen Analyse auf einen unabhängigen Datensatz verallge meinert werden können, wobei abgeschätzt wird, wie genau ein Vorhersagemo dell in der Praxis funktionieren wird.
In den Spalten der Basis-Matrix W stehen jetzt die dimensionalen Merkmale, also die Basisvektoren. Die Koeffizienten-Matrix H gibt jetzt die Gewichte an, mit denen die Originalschriften rekonstruiert werden kann. Das konkrete Aus führungsbeispiel verwendet drei Komponenten (N=3), um eine ausreichend um fangreiche Schriftdarstellung zu gewährleisten und gleichzeitig eine Überanpas sung an die Daten zu vermeiden. Im Folgenden soll der Einfluss dieser drei Spalten beschrieben werden.
Fig. 4 zeigt die Darstellung der 25 Fonts im dreidimensionalen Font-Raum 110. Durch diese Darstellung ist es nun möglich, neue Fonts als Linearkombinatio nen der drei gelernten Font-Basisvektoren zu synthetisieren. Entsprechend kann eine Schrift durch einen Punkt in diesem dreidimensionalen Raum repräsentiert werden. Wenn beispielsweise zum Vergleich die zwei Schriftarten Clarendon und Dax genommen werden, dann hat Clarendon ausgeprägte Serifen, bei Dax je doch nicht. Dies bedeutet, dass die Gewichte in der Koeffizienten-Matrix H für das Merkmal “Serife”, welches in den Spalten der Basis-Matrix W kodiert ist, deutlich größer für Clarendon ausfallen, um die Serifen wiederherzustellen. Das kann man sich wie “Tinte auf Papier drucken” vorstellen. Dem Drucker wird die Anweisung gegeben, wie viel Tinte er bei den Serifen verwenden soll.
Fig. 5A zeigt beispielhaft den Einfluss der drei Dimensionen für den Großbuch staben K. Die Betrachtung der Buchstabenwiedergabe zeigt, dass die erste und dritte Dimension mit der Skalierung der Buchstaben in vertikaler bzw. horizon- taler Richtung Zusammenhängen, während die zweite Dimension mit dem Vor handensein und der Stärke der Serifen zusammenhängt. Dieses generative Mo dell ermöglicht eine Reduzierung des Speicherbedarfs für die Speicherung aller Schriften, die Erstellung neuer Schriften und auch die Interpolation zwischen den aktuellen Schriften. Fig. 5B zeigt die Änderungen in drei Zeichen (Großbuchstabe K, Kleinbuchstabe y und Zahl 3), die sich aus der linearen Bewegung im euklidischen Raum 110 zwischen den Punkten ergeben, die den Schriftarten Frutiger und Sabon ent sprechen, d.h. die Punkte (3.59 , 0.7 , 10.13) und (0.86 , 11.77 , 2.10) im Font- Raum 110. An den Rändern sind die Originalschriften, rechts daneben die NMF- Annäherungen und dazwischen die lineare Interpolation durch den Schriftraum. Die Koordinaten für beide Fonts in dem dreidimensionalen Raum sind angege ben. Es ist zu beachten, dass die Änderungen allmählich und gleichmäßig sind.
Ein Vorteil der streng positiven Komponenten des NMF-Verfahrens gemäß Aus führungsbeispielen gegenüber anderen Methoden wie der Hauptkomponen- tenanalyse oder Transformatorennetzen ist, dass die Basisfunktionen der Dru ckerschwärze auf Papier darstellen und damit als Elemente angesehen werden können, die tatsächlichen Glyphen ähneln. Im Gegensatz zu Ausführungsbei spielen leiden konventionelle Implementierungen unter Problemen bei der Aus richtung und dem Kerning in Fließtexten. Qualitativ zufriedenstellende Texte können damit kaum generiert werden. Wie bereits erwähnt, generieren Ausführungsbeispiele TrueType-Font (TTF)- Dateien on „the fly“, um Texte mit einer synthetisierten Schriftart erzeugen zu können. Eine lineare Kombination der durch NMF erhaltenen Basisvektoren ergibt einen Vektor, der ein neues Graustufen-Bitmap-Bild aller Glyphen im neuen synthetisierten Font sowie Ausrichtungsinformationen für jede einzelne
Glyphe umfasst. Die Bitmap-Bilder der Glyphen können einzeln in Scalable Vec- tor Graphics (SVG) umgewandelt und dann zu einem SVG-Font zusammenge fügt werden. Der SVG-Font kann dann in das TTF-Format konvertiert werden. An dieser Stelle können auch die Ausrichtungsinformationen direkt in eine TTF- Datei eingefügt werden. Der gesamte Prozess der Schrifterzeugung funktioniert automatisch und in Echtzeit.
B. Optimierung (z.B. Baves'sche Optimierungsverfahren: Schritt
Figure imgf000017_0001
Gemäß Ausführungsbeispielen ist es möglich grundsätzlich neue Schriftarten zu generieren, die z.B. weder zu Baseline-Schriften 55 gehören noch anderweitig bekannt sind und die beispielweise die Lesegeschwindigkeit der Teilnehmer er höhen oder einen anderen Parameter verbessern. Dazu wird ein Optimierungs verfahren gewählt, das entsprechende Regionen im dreidimensionalen Schrift raum 110 findet.
Als zugrundeliegende Annahme kann angenommen werden, dass sich die Schriftarten innerhalb des generativen Schriftraums (Font-Raum 110) gleichmä ßig verändern und dass sich die beispielhafte Lesegeschwindigkeit der Teilneh mer entlang ähnlicher Schriftarten ebenfalls gleichmäßig verändert. Die zu opti mierende Zielfunktion kann z.B. die Lesegeschwindigkeit eines Individuums in Abhängigkeit von einer bestimmten Schrift sein, die in diesem Fall durch einen Punkt in dem beispielhaften dreidimensionalen Schriftraum 110 (N=3) reprä sentiert wird.
Da der Schriftraum 110 prinzipiell unendlich groß ist und nur eine begrenzte An zahl von Texten dargestellt werden kann, nutzen Ausführungsbeispiele die Bayes'sche Optimierung, da es sich hierbei um ein bekanntes Optimierungsver fahren handelt, um Extrema komplexer Kostenfunktionen zu finden, wenn die Anzahl der Stichproben, die gezogen werden können, begrenzt ist.
Die Bayes'sche Optimierung beginnt mit einer apriori Unsicherheit über das dreidimensionale Schriftvolumen und wählt sukzessive Punkte innerhalb dieses Volumens aus, für die die beispielhafte Lesegeschwindigkeit durch ein Leseexpe riment bewertet wird. Die Idee ist nun, mit einem dieser Punkte zu starten und anzunehmen, dass er einen Wert der zugrunde liegenden unbekannten Funktion darstellt. Indem die beispielhafte Lesegeschwindigkeit für diese Schriftart durch ein Experiment ermittelt wird, reduziert der Algorithmus die Unsicherheit an dieser Stelle im Schriftraum (siehe Schritte ci und C2 aus der Fig. 2).
Um die nächste Schrift zum Testen auszuwählen, wird ein Kompromiss gesucht (siehe Schritt d) in Fig. 2), und zwar zwischen
(i) der Auswahl eines Bereichs im Schriftraum, für den die Unsicherheit über die beispielhafte Lesegeschwindigkeit groß ist, und
(ii) der Auswahl eines Bereichs im Schriftraum, in dem aufgrund früherer Le seexperimente eine hohe Lesegeschwindigkeit zu erwarten ist.
Dieser Selektionsprozess wird durch die sogenannte Akquisitionsfunktion und ihrer entsprechenden Parameter durchgeführt. In der beispielhaften Bayes'sche Optimierung werden also Regionen, in denen die beispielhafte Lesegeschwindigkeit hoch ist, dichter und Regionen, in denen die Unsicherheit hoch ist, gleichmäßiger gesampelt (getestet).
C. Beispielhafter Versuchsaufbau und Daten
Zur Demonstration der Leistungsfähigkeit von Ausführungsbeispielen wird im Folgenden ein beispielhaftes Experiment beschrieben. Der gesamte geschlossene Regelkreis des Experiments (siehe Fig. 2) bestand darin, durch den Bayes'schen Optimierungsalgorithmus eine Schrift im generati ven Schriftraum 110 zu generieren und die beispielhafte Lesegeschwindigkeit einzelnen Teilnehmer zu nutzen, um neue Schriften zu generieren, für die die beispielhafte Lesegeschwindigkeit höher ist.
Hierzu nahmen 11 Probanden (5 Frauen, 6 Männer; Erwartungswert für Alter = 24 mit Standardabweichung = 2,64) an dem Experiment teil. Alle Teilnehmer waren deutsche Muttersprachler und hatten normales oder korrigiertes bis nor males Sehvermögen. Die Teilnehmer wurden akquiriert von Diplomanden und Studenten der Forschungsgruppe und erhielten die erforderlichen Materialien zur Teilnahme. Alle Probanden erhielten eine detaillierte, mehrseitige Anleitung, um Einflüsse wie Sitzposition, Betrachtungsabstände, Raumbeleuchtung etc. möglichst ähnlich zu halten. Neben einer ausführlichen Anleitung und Informa tionen zum Experiment erhielten die Probanden auch eine ausführbare Datei mit dem Experiment. Die Probanden waren Laien in Bezug auf Verfahren der Schrifterzeugung und -auswahl.
Die Probanden lasen insgesamt 95 Texte, die einem deutschen Wiki für Kinder- Lexikontexte entnommen wurden. Diese Texte wurden ausgewählt, weil sie für erwachsene Muttersprachler leicht verständlich sind, so dass der Inhalt der Texte nur einen geringen Einfluss auf die beispielhafte Lesegeschwindigkeit hatte. Außerdem wurden die Texte so ausgewählt, dass sie in ihrer Länge ver gleichbar waren, d.h. die Wortanzahl der ersten 94 Texte lag im Durchschnitt bei 99,7 mit einem Minimum von 91 und einem Maximum von 109 Wörtern. Zu sätzlich wurde ein einzelner Text mit nur 51 Wörtern ausgewählt, um zu über- prüfen, ob die beispielhafte Lesegeschwindigkeit in Abhängigkeit von der Text länge signifikant abweicht. Die Texte wurden für jeden Teilnehmer in einer zu fälligen Reihenfolge präsentiert.
Um die beispielhafte Lesegeschwindigkeit eines Benutzers gemäß Ausführungs beispiele zu messen, drückten die Probanden eine Taste, wenn sie mit dem Le- sen eines Textes begannen und drückten die Taste erneut, wenn sie den Text zu Ende gelesen hatten. In einem Anwendungsszenario könnte die beispielhafte Le segeschwindigkeit über die Seitenvorschubtaste auf einem E-Reader wie z. B. ei nem Kindle gemessen werden. Weitere Ausführungsbeispiele nutzen zur Mes sung der beispielhafte Lesegeschwindigkeit einen Eye-Tracker oder eine Stan- dard-Webcam eines Computers.
Die Texte sollten aufmerksam und so schnell wie möglich, aber insgesamt nur einmal gelesen werden. Um zu überprüfen, ob die Texte gelesen und inhaltlich verarbeitet wurden, hatten die Probanden die Aufgabe, während des Lesens Wörter aus vorher festgelegten Kategorien zu erkennen. Jeder einzelne Versuch begann, gemäß Ausführungsbeispielen, mit der Vorstellung der Kategorie für den nächsten Text, z.B. wurde vor dem Lesen des Textes angegeben, dass an schließend Wörter aus der Kategorie Tiere erkannt werden sollten. Die Kategorie bezog sich nur auf den nächsten Text, und für jeden Versuch wurde eine neue Kategorie gewählt. Die Kategorie jedes Textes wurde zuvor unabhängig vonei- nander von zwei der Autoren dieser Studie benannt und jeder Proband erhielt die gleiche Kategorie für einen Text.
Für jeden Text gab es zwischen einem und zehn Wörtern, die zu den angewiese nen Kategorien gehörten (Mittelwert: 3,07, Standardabweichung: 2,05). Sobald eine Versuchsperson die Kategorie für den nächsten Versuch gelesen hatte, konnte sie die Leertaste benutzen, um den Text anzuzeigen und mit dem Lesen zu beginnen. Sobald der Text angezeigt wurde, begann auch die Zeitmessung für die beispielhafte Lesegeschwindigkeit. Um einen versehentlichen Start zu ver meiden, konnte die Aufgabe gemäß Ausführungsbeispiele erst einige Sekunden nach der Anzeige der Kategorie gestartet werden (dies wurde den Teilnehmern beispielhaft durch ein rot/grünes Signal angezeigt). Jedes Mal, wenn ein Begriff erkannt wurde, der zu der vorher festgelegten Kategorie passte, konnten die Teilnehmer die Leertaste drücken, um dies anzuzeigen. Z.B. sollte bei dem kur zen Satz: "Der schnelle braune Fuchs springt über den faulen Hund" beim Lesen der Wörter Fuchs und Hund die Leertaste gedrückt werden, um anzuzeigen, dass die Objekte für die Kategorie Tiere erkannt wurden (siehe Schritt ci) aus Fig. 2). Sobald den Text zu Ende gelesen war, konnte die Enter-Taste gedrückt werden, um das Lesen und damit auch die Zeitmessung zu stoppen.
Zusätzlich wurde nach dem Lesen von elf Texten in zufälligen Versuchen wäh rend des Experiments eine Multiple-Choice-Frage gestellt (siehe Schritt C2) in Fig. 2), um zusätzlich das Textverständnis der Probanden zu testen. Die Frage bezog sich immer auf den zuletzt gelesenen Text und es wurden sechs mögliche Antworten vorgegeben, von denen genau eine richtig war. Nach dem Lösen einer der Multiple-Choice-Fragen erhielten die Teilnehmer ein Feedback zu ihrer Ant wort. Dieses Feedback setzte sich aus der durchschnittlichen Lesegeschwindig- keit, der Anzahl der richtigen Erkennungen und der Korrektheit der Multiple- Choice-Frage zusammen. Diese drei Komponenten wurden zu einer Punktzahl zusammengefasst, um die Teilnehmer weiter zu motivieren, schnell, aber auch richtig und aufmerksam zu lesen.
Um zu untersuchen, ob es Regionen des generativen Schriftraums 110 gibt, die höhere Lesegeschwindigkeiten erlauben, lasen die Probanden die 95 Texte in verschiedenen synthetisierten Schriften. Da der dreidimensionale Raum unend lich groß ist und nur eine begrenzte Anzahl von Texten präsentiert werden kann, wurde die Bayessche globale Optimierung mit dem Gauß-Verfahren verwendet, um mit nur 95 Proben verschiedener Fonts auszukommen, wobei die zu optimie- rende Zielfunktion die beispielhafte Lesegeschwindigkeit ist, die durch die drei Dimensionen parametriert ist. Um Regionen im Schriftraum mit höheren Lese geschwindigkeiten zu erkennen, verwenden Ausführungsbeispiele ein Clus- tering- Verfahren, das neben den drei Schriftdimensionen für jeden einzelnen Teilnehmer die Lesegeschwindigkeit als vierte Dimension einbezieht. Zum Clustern der Datenpunkte kann der OPTICS-Algorithmus verwendet wer den. Hierbei handelt es sich um ein dichtebasiertes Clusteringverfahren, das die Punkte eines Datensatzes linear ordnet, sodass räumlich nächste Nachbarn zu sammen als Cluster angeordnet werden können. Dies hat gegenüber anderen Verfahren, wie z.B. k-Means, den Vorteil, dass die Anzahl der Cluster nicht im Voraus festgelegt werden muss und Ausreißer, die keinem Cluster zugeordnet werden, erkannt werden können. Letzteres ist bei der Analyse der Daten nütz lich, da so Phasen mit Abweichungen in der Lesegeschwindigkeit aufgrund von Aufmerksamkeitsfehlern ausgeschlossen werden konnten.
Als freier Parameter des Algorithmus wird die Mindestanzahl der Datenpunkte definiert, die in einem Cluster vorhanden sein sollen. Dieser Parameter wurde auf n = 5 gesetzt (er sollte das Doppelte der Dimension minus l sein). Fig. 6A veranschaulicht die besten Cluster 6oi, 602, 603, ... , die der höchsten Lesege schwindigkeit entsprechen. Ein erste Cluster 601 entspricht einem ersten Pro banden, ein zweites Cluster 601 entspricht einem zweiten Probanden, ein drittes Cluster 601 entspricht einem dritten Probanden usw. Die Cluster 601, 602, ... werden durch ein Ellipsoid dargestellt, mit dem Zentrum aller zugehörigen Da tenpunkte und dem Standardfehler in allen drei Dimensionen als Hauptachsen.
Fig. 6B zeigt gefundene Cluster 601, 602, 603, ... für jeden der 11 Probanden ba sierend auf den dichtebasierten Algorithmus zur Clusteranalyse (OPTICS) und die zugehörigen mittleren Lesegeschwindigkeiten zusammen mit ihren Stan dardfehlern. Die mittleren Lesegeschwindigkeiten aller Cluster 601, 602, 603, ... wurden für jeden Probanden in eine Rangfolge gebracht. Es hat sich gezeigt, dass die Standardfehler der beispielhafte Lesegeschwindigkeit im Vergleich zu den mittleren Lesegeschwindigkeiten für jedes Cluster 601, 602, 603, ... und je- den Probanden sehr klein waren
D. Verbesserung der beispielhaften Lesegeschwindigkeit
Um zu überprüfen, ob Schriftcluster signifikant unterschiedlichen Lesege schwindigkeiten entsprechen, wird gemäß Ausführungsbeispielen eine Bayes‘sche Varianzanalyse (ANOVA) berechnet. Als Nullhypothese kann die An- nähme genommen werden, dass es keinen signifikanten Unterschied zwischen den Texten gab. Sogenannte Bayes-Faktoren geben dann entscheidende Hin weise gegen die Nullhypothese, sodass sich die Cluster signifikant in ihrer mitt leren Lesegeschwindigkeit unterscheiden. Gemäß Ausführungsbeispielen ermit- telte eine multivariate Varianzanalyse (MANOVA) statistisch signifikante Unter schiede in der Lesegeschwindigkeit zwischen den Clustern der höchsten Lesege schwindigkeit der Probanden, F (10, 75) = 3,24, p < .001; Pillai Trace = 0,91. Die entsprechende ANOVA für jede einzelne Dimension wurde durchgeführt und ergab drei signifikante Unterschiede Di : F (10, 75) = 2,01, p < .05; D2 : F(io, 75) = 3,63, p < .05; D3 : F(IO,75) =4,02, p < .05 (F ist das Resultat des F-Testes bzw. das Verhältnis der Varianzen zwischen und innerhalb der Cluster und p gibt die Wahrscheinlichkeit der Glaubwürdigkeit der Nullhypothese). Diese Werte sind die genauen Angaben bzgl. des Ergebnisses des statistischen Tests A- NOVA. Prinzipiell reichen die p-Werte, um die Signifikanz zu belegen. Sie sind darüber hinaus gehende, detaillierte Angaben über die Signifikanz der verbes serten Lesegeschwindigkeit aufgrund des Experiments mit den Probanden.
Daher sind die Unterschiede zwischen den Clustern aus der Fig. 6A der höchsten Lesegeschwindigkeit der Individuen statistisch signifikant. Die gemäß Ausfüh- rungsbeispielen erzeugte Verteilung ist aber nicht nur statistisch signifikant un terschiedlich, sondern gleichzeitig ist auch die Lesegeschwindigkeit im Durch schnitt statistisch signifikant schneller. Alle Probanden zeigten eine verbesserte Lesegeschwindigkeit.
Fig. 7 zeigt schließlich ein Pangramm für drei Beispiele (Probanden), geschrie- ben in der jeweiligen Schriftart des Zentrums des Clusters mit der höchsten Le segeschwindigkeit. Die Fonts sind TrueType-Schriften und können als solche ge nutzt werden.
Wesentliche Aspekte von Ausführungsbeispiele können wir folgt zusammenge fasst werden: Ausführungsbeispiele beziehen sich auf ein System (Human-in-the-Loop) zur
Verbesserung eines Parameters wie der Lesbarkeit von digital gerendertem Text. Das System verwendet einen gelernten generativen Schriftraum 110 und eine Bayes'sche Optimierung, um Schriften zu generieren, die im Hinblick auf die beispielhafte individuelle Lesegeschwindigkeit des Benutzers bewertet werden. Ausführungsbeispiele stellen Variation der Schriftmerkmale in einem spezifi schen, durch NMF gelernten Schriftraum dar. Mit Hilfe dieser Darstellung un tersuchen Ausführungsbeispiele die beispielhafte Lesegeschwindigkeit von ein zelnen Benutzern mit Hilfe der Bayes'schen Optimierung. Ergebnisse von Benutzerstudien haben die Machbarkeit des Ansatzes gezeigt, sowohl in Bezug auf die benötigten Daten, um Schriften zu finden, die die indivi duelle Lesegeschwindigkeit erhöhen, als auch in Bezug auf die statistisch signifi kante Größenordnung der Verbesserung der individuellen Lesegeschwindigkeit. Schließlich bestehen signifikante Unterschiede zwischen den Probanden in den Schriftregionen, die Schriften enthalten, die mit hoher Lesbarkeit assoziiert sind. Die generierten Schriften können tatsächliche TrueType-Schriftdateien sein, die installiert und verwendet werden können.
Obwohl sich die in dem Experiment gefundenen, die beispielhafte Lesege schwindigkeit maximierenden Schriften zwischen den einzelnen Probanden sig- nifikant unterschieden, kann daraus nicht geschlossen werden, dass das System eine einzige Schrift findet, die die beispielhafte Lesegeschwindigkeit für einen einzelnen Probanden oder über alle Probanden hinweg unveränderlich maxi miert. Vielmehr kann das System gemäß Ausführungsbeispiele dynamisch und kontinuierlich die Schriftarten für ein Individuum erstellen, die die beispielhafte Lesegeschwindigkeit zum Zeitpunkt der Nutzung maximiert. Dies kann vom In halt des Textes abhängen, davon, ob man erschöpft ist oder vielleicht unter schiedliche Anzeigegeräte verwendet. Die empirischen Daten, die Ausführungs beispiele in den Experimenten erhalten haben, belegen eindeutig, dass das Sys tem gemäß Ausführungsbeispielen die beispielhafte Lesegeschwindigkeit aller Teilnehmer erhöht.
Während in der Vergangenheit konstante, variable und parametrische Schriften entworfen und entwickelt wurden, handelt es sich bei Ausführungsbeispiele um ein interaktives System, das neue Schriften (d.h. unbekannte Schriften) auf Basis der Interaktion des Benutzers mit dem Text generiert. Das System erstellt gemäß Ausführungsbeispiele dynamisch und kontinuierlich Fonts für eine Person, was in der Studie die beispielhafte Lesegeschwindigkeit zum Zeitpunkt der Nutzung maximierte. Die Bewertung des Systems in einer Nutzerstudie zeigte die Mach barkeit des Ansatzes. Das System kann zusammen mit einem Eye-Tracker oder mit einer Webcam eingesetzt werden, um die beispielhafte Lesegeschwindigkeit automatisch zu messen.
Die in der Beschreibung, den Ansprüchen und den Figuren offenbarten Merk male der Erfindung können sowohl einzeln als auch in beliebiger Kombination für die Verwirklichung der Erfindung wesentlich sein.
BEZUGSZEICHENLISTE
50 Bildschirm
55 Baseline-Fonts
110 Font-Raum (Schriftenraum) 105 Startpunkt
106 geänderte Position

Claims

ANSPRÜCHE
1. Computerimplementiertes Verfahren zur Erzeugung von optimierten
Fonts zur Darstellung auf einem Bildschirm (50), das Verfahren umfasst:
Bilden (S110) eines Font-Raumes (110), in dem verschiedene Fonts durch Dimensionen des Font-Raumes charakterisiert werden oder Bereitst eilen von parametrischen Font-Räumen;
Auswahlen (S120) eines Startpunktes (105) in dem Font-Raum (110), wo bei zu dem Startpunkt ein zugehöriger Startfont gehört; fortlaufendes Ändern (S130) einer Position (106) im Font-Raum (110), um dadurch eine zur Darstellung genutzten Font zu ändern und um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und
Bereitstellen (S140) der optimierten Fonts zur Darstellung auf dem Bild schirm (50).
2. Verfahren nach Anspruch 1, wobei für den zumindest einen Parameter wert eines oder mehr aus dem Folgenden verwendet wird: eine Speicherbelegung, eine Menge an Druckerschwärze bei einem Drucken von Texten, eine Scangeschwindigkeit, eine Geschwindigkeit bei automatischer Texterkennung, eine Lesegeschwindigkeit eines Nutzers, ein Erinnerungsvermögen eines Nutzers, ein Textverständnis eines Nutzers, eine Präferenz für den gelesen Text eines Nutzers.
3. Verfahren nach Anspruch 1 oder Anspruch 2, das weiter ein Erfassen (S135) einer Größe umfasst, die den zumindest einen Parameterwert be stimmt.
4. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Font- Raum (110) als kontinuierlicher Raum mit einer Dimension N gebildet wird, der zwischen M bekannten Fonts interpoliert.
5. Verfahren nach Anspruch 4, wobei die Dimension N des Font-Raumes (110) durch eine Kreuzvalidierung basierend auf den M bekannten Fonts bestimmt wird.
6. Verfahren nach Anspruch 4 oder Anspruch 5, wobei der Font-Raum (110) wie folgt gebildet wird:
Auf st eilen einer Daten-Matrix (X), die in jeder Zeile oder Spalte Einträge für jeweils einen bekannten Font umfasst;
Bilden einer Basis-Matrix (W) und einer Koeffizienten-Matrix (H) durch ein Minimieren einer Frobenius-Norm für eine Differenz aus der Daten-Matrix (X) und einem Produkt der Basis-Matrix (W) und der Koeffizienten-Matrix (H):
Min |X - Wx H| , wobei die Basis-Matrix (W) eine Dimension von M x N hat.
7. Verfahren nach einem der Ansprüche 1 bis 6, wobei das fortlaufendes Än dern (S130) zum Finden des Optimums eine Anwendung zumindest eines der folgenden Verfahren umfasst: eine Bayes’schen Optimierung (S132), bei der sukzessiv Punkte im Font-Raum (110) getestet werden, um Regionen im Font-Raum (110) zu finden, in welchen der Parameterwert sich verbessert; eine dichtebasierte Cluster-Analyse (S134), wobei der zu optimie rende Parameterwert als vierte Dimension hinzugenommen wird und die Punkte eines Datensatzes linear ordnet werden, um räum lich nächste Nachbarn zusammen als Cluster anzuordnen; eine Varianzanalyse (S136) zum Ermitteln von statistisch signifi kante Unterschiede zwischen den Clustern.
8. Computerlesbares Speichermedium mit darauf gespeicherten Anweisun gen, die bei Ausführung durch einen Computer diesen veranlassen, das Verfahren nach einem der Ansprüche l bis 7 auszuführen.
9 System zur Erzeugung von optimierten Fonts zur Darstellung auf einem Bildschirm (50), das System umfasst: ein Erzeugungsmodul, das ausgebildet ist, um einen Font-Raum (110) zu bilden, in dem verschiedene Fonts durch Dimensionen des Font-Raumes (110) charakterisiert werden; ein Optimierungsmodul, das ausgebildet ist, um einen Startpunktes (105) in dem Font-Raum (110) zu wählen, zu dem Startpunkt ein zugehöriger Startfont gehört, und durch fortlaufendes Ändern der Position (106) im Font-Raum (110) einen zur Darstellung genutzten Font zu ändern, um ein Optimum hinsichtlich zumindest eines Parameterwertes zu finden; und eine Ausgabeschnittstelle für einen Bildschirm (50), die ausgebildet ist, um den optimierten Font zur Darstellung auf dem Bildschirm (50) auszu geben.
PCT/EP2022/060016 2021-04-19 2022-04-14 Verfahren und vorrichtung zur erzeugung von optimierten fonts WO2022223431A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102021109845.9A DE102021109845A1 (de) 2021-04-19 2021-04-19 Verfahren und Vorrichtung zur Erzeugung von optimierten Fonts
DE102021109845.9 2021-04-19

Publications (1)

Publication Number Publication Date
WO2022223431A1 true WO2022223431A1 (de) 2022-10-27

Family

ID=81346174

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2022/060016 WO2022223431A1 (de) 2021-04-19 2022-04-14 Verfahren und vorrichtung zur erzeugung von optimierten fonts

Country Status (2)

Country Link
DE (1) DE102021109845A1 (de)
WO (1) WO2022223431A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004101937A (ja) * 2002-09-10 2004-04-02 Seiko Epson Corp フォント最適化方法およびフォント最適化装置ならびにフォント最適化処理プログラム
JP2012230652A (ja) * 2011-04-27 2012-11-22 Isuzu Motors Ltd 可読性評価方法、可読性評価装置及び可読性評価プログラム
WO2020124455A1 (zh) * 2018-12-19 2020-06-25 深圳市欢太科技有限公司 一种优化字体的方法及相关设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9940868B2 (en) 2014-10-24 2018-04-10 Indian Institute Of Technology Kanpur Convergent monotonic matrix factorization based entire frame image processing
US11003831B2 (en) 2017-10-11 2021-05-11 Adobe Inc. Automatically pairing fonts using asymmetric metric learning
CN108804397B (zh) 2018-06-12 2021-07-20 华南理工大学 一种基于少量目标字体的汉字字体转换生成的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004101937A (ja) * 2002-09-10 2004-04-02 Seiko Epson Corp フォント最適化方法およびフォント最適化装置ならびにフォント最適化処理プログラム
JP2012230652A (ja) * 2011-04-27 2012-11-22 Isuzu Motors Ltd 可読性評価方法、可読性評価装置及び可読性評価プログラム
WO2020124455A1 (zh) * 2018-12-19 2020-06-25 深圳市欢太科技有限公司 一种优化字体的方法及相关设备

Also Published As

Publication number Publication date
DE102021109845A1 (de) 2022-10-20

Similar Documents

Publication Publication Date Title
DE60204005T2 (de) Verfahren und einrichtung zur erkennung eines handschriftlichen musters
Pelli et al. Feature detection and letter identification
DE102021211682A1 (de) Verfahren und system zur multidirektionalen erkennung von szenentexten basierend auf einem multielement-aufmerksamkeitsmechanismus
DE69333431T2 (de) Verfahren zum Erkennen von handgeschriebenen Symbolen
DE3716787C2 (de)
DE69932167T2 (de) Zeichenerkennung
DE69434405T2 (de) Verfahren zur Erzeugung eines visuellen Entwurfs
DE60316503T2 (de) Klassifikationsanalyse von Freiformeingaben mit digitaler Tinte
DE112017002799T5 (de) Verfahren und system zum generieren multimodaler digitaler bilder
DE3806223C2 (de) Verfahren zur Erzeugung von Zeichenmustern
DE69533479T2 (de) Zeichensatz mit zeichen aus mehreren strichen und handschrifterkennungssystem
DE69133362T2 (de) Dokumentenverarbeitungs-verfahren und -gerät, entsprechende Program und Speichereinheit
DE102019001911A1 (de) Aufbauen von neuen Zeichensatz-Bildzeichen aus Teilbetrachtungen
DE102018007936A1 (de) Beantworten von Fragen für Datenvisualisierungen
DE102021209201A1 (de) Szenentext-Erkennungsverfahren und -System auf Basis sequenzieller Verformung
DE19610759C2 (de) Verfahren zum Codieren eines Dokumentes und Verfahren zum Senden eines Dokumentes von einem Sendecomputersystem zu einem Empfangscomputersystem
DE102011079443A1 (de) Lerngewichtungen von Schriftarten für getippte Proben bei der Handschriftenschlüsselwortauffindung
Kadner et al. Adaptifont: Increasing individuals’ reading speed with a generative font model and bayesian optimization
Pelli et al. Identifying letters
DE19512185B4 (de) Verfahren und Vorrichtung zum Erzeugen von Fontdaten
WO2005119580A1 (de) Verfahren und einrichtung zur strukturanalyse eines dokuments
DE102018108856A1 (de) Tiefes verstärktes Modell für abstrahierungsfähige Verdichtung
DE60217748T2 (de) Verfahren und Gerät zur Anzeige eines Bildraumes
EP2679147B1 (de) Verfahren und Vorrichtung zur Kodierung von Augen- und Blickverlaufsdaten
DE102012025349B4 (de) Bestimmung eines Ähnlichkeitsmaßes und Verarbeitung von Dokumenten

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22717846

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18287215

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22717846

Country of ref document: EP

Kind code of ref document: A1