WO2009100913A1 - Verfahren und vorrichtung zur textattribuierung in textgrafiken - Google Patents
Verfahren und vorrichtung zur textattribuierung in textgrafiken Download PDFInfo
- Publication number
- WO2009100913A1 WO2009100913A1 PCT/EP2009/001001 EP2009001001W WO2009100913A1 WO 2009100913 A1 WO2009100913 A1 WO 2009100913A1 EP 2009001001 W EP2009001001 W EP 2009001001W WO 2009100913 A1 WO2009100913 A1 WO 2009100913A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- word
- position value
- text
- computer
- selection
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
Definitions
- the invention relates to a method for the assignment of text attributes to a graphical representation of text contained in a computer graphic, and to a device, an arrangement and a computer program product therefor.
- the text which is present in such a system in character-coded form is to be selected by a corresponding user interaction in that the user throws around the beginning of the text passage to be selected with a mouse or a touch-sensitive screen and pulls it to the end of the passage to be selected.
- a selection is described in the system according to the German translation DE 695 19 905 T2 of the European patent EP 0 698 845 B1.
- the fact that the text is in a character-encoded form the text can be easily identified and further processed, depending on the attributed attribute or provided for the selected text data processing operation.
- Text contained in a text graphic defies the usual selection and processing methods used for text encoded in a character-encoded form.
- the calculator can only access pixels of the raster graphic (or vector elements of a vector graphic) forming the text graphic and has no directly processable information about the characters and groupings of the text in the text graphic.
- a system for user-friendly display and handling of text graphics is known from the German translation DE 694 34 434 T2 of European patent EP 0 731 948 B1, the text graphics originating from scanned pages of printed patent documents, and in which the texts represented in the text graphics are also incorporated in a parallel data storage in character-coded form.
- the pagination of scanned print pages of patents in the character-coded text form is modeled, and it is possible a representation in which the text graphics and the character-coded text are displayed in adjacent windows.
- this duplicate approach offers the true-to-life graphic representation and, on the other hand, makes it possible to further process the character-coded text, in particular searching and navigating within a document.
- the object of the present invention is therefore to specify a method which makes it possible to associate text attributes with a graphical representation of text contained in a computer graphic, while avoiding the disadvantages of the prior art, as well as a device, an arrangement and a computer program product therefor ,
- the invention of claim 1 teaches a method of associating text attributes with a graphical representation of text contained in a computer graphic, comprising the steps of:
- a word position value for a word represented in the text graphic By determining a word position value for a word represented in the text graphic, it is possible to address individual words from the text graphic and use them for further processing and assignment of attributes. This makes it possible to process words contained in the text graphic without carrying a character-coded text version in parallel. In this way, the need for memory and communication bandwidth is reduced. In addition, the character coded "source text" of the document displayed in the text graphic does not have to be conveyed to the user's sphere of influence.With the word position value defining a coordinate tuple with respect to the text graphic, such as a book page representation, a data efficient efficient identification value is selected clear identification of a word allowed.
- the selection position value By evaluating the selection position value, it is possible to select those words of the text graphic to be subjected to the assignment of text attributes (attribution) from the set of all words of the text graphic.
- the selection position value which thus represents a selection feature, may be determined, for example, by an interaction of the user or by one or more stored database entries.
- the selection position value can thus determine one or more (selection) points or (selection) areas in the text graphic.
- the check of whether a word is detected by a selection position value is performed for each word of the text graphic by means of a comparison between the respective word position value of the word and the selection position value. The Determination by means of a comparison operation makes it possible to specify flexibly the criteria to be used for a selection.
- the user In contrast to a simple, conventional selection of a text representing graphics area with a Fang rectangle, the user (or the automated system with the corresponding indication in the database) can select according to the invention in an efficient way a lot of words in the text graphics, without about the exact graphic bounds of the word in the graph, since the selection is based on the word position value for each word.
- an attribution area of the text graphic is determined on the basis of the word position value of a word thus recognized as selected makes it possible to determine for which areal areas of the text graphic the attribution is made.
- This range is determined based on the respective word geometry and the word position value, and is independent of the range indicated by the selection position value.
- the attribution area as a whole can be composed of respective attribution areas of several words and can be calculated as the rectangle surrounding the respective word.
- the individual attribution area can also be dimensioned in its height according to the word height of the word which generates the greatest height of the selected font size of the text. This determines the areas of the text graphic to which the attribution is graphically applied.
- the invention can be further developed, for example, by determining the selection position value during a first user session on the basis of a user interaction and storing it in a memory.
- a plurality of selection position values can be stored individually for each user, so that the selected text parts can also be further processed at a later time. If, in further developments of the invention, the selection position value is retrieved from the memory during a second user session, the attribution made in the first session can be restored for the user during a later user session on the basis of the stored selection position values.
- an attribution type is identified which identifies the text attribute to be assigned. This makes it possible to process the selected text differently depending on the attribution type, for example by selecting the second computer graphic depending on the particular attribution type.
- Developments of the invention may be characterized in that the first computer graphics is superimposed opaque with the second computer graphics. This can be accomplished by pixel-by-pixel computational linkage operations by retrieving the first and second graphics from memory, linking them, and storing the result of the linkage into memory. The join result represents the superimposed first graphic.
- the invention can be further developed by determining the attribution area by determining the area of the first computer graphic claimed by the graphical word representation.
- the selection position value has a second coordinate tuple related to the first computer graphic
- the first and the second coordinate tuples can form diagonally opposite points of a rectangular selection region. This provides by its corners comparative values that can be used for the comparison operations of the word selection test.
- the invention may be developed such that the word position value has a second coordinate tuple related to the first computer graphics, and additionally in that the first and second coordinate tuples form diagonally opposite points of a rectangular word area.
- the word selection check under coordinate comparison can be designed so that the word position value for the word is detected by the selection position value when the word area lies at least partially in the selection area.
- Word selection check be designed so that the word position value for the word is detected by the selection position value when the word area is at least partially between the vertical coordinate of the first coordinate tuple of the selection position value and the vertical coordinate of the second coordinate tuple of the selection position value.
- the invention of claim 14 provides an apparatus for associating text attributes with a graphical representation of text contained in a computer graphic according to the method proposed herein, comprising a processing unit and a memory,
- the memory includes a first computer graphic having a graphical representation of text
- the processing unit is adapted to determine at least one word position value, which one on the first
- Computer graphics-related coordinate tuple for a word of the text presented in the first computer graphics
- the processing unit is designed to evaluate at least one selection position value having a coordinate tuple related to the first computer graphics
- the processing unit is adapted to check whether the word position value for the word is detected by the selection position value by comparing the coordinate tuples of the word position value and the selection position value;
- the processing unit is adapted to determine an attribution range of the first computer graphics based on the word position value detected by the selection position value;
- the processing unit is designed to modify the first computer graphics at least in the attribution area.
- the processing unit is set up to carry out the method according to the invention.
- the processing unit may be implemented by programmatically setting up general purpose hardware, such as general purpose processors, or or by a combination of programming and application specific integrated circuits (ASICs).
- ASICs application specific integrated circuits
- the implementation may be resorted to functions provided by operating systems or middleware and / or to Internet-typical technologies, such as PHP (PHP Hypertext Preprocessor) and / or JavaScript.
- Embodiments of the invention according to claim 16 can be realized according to the dependent claims appended to this claim, and according to the other developments and embodiments of all devices and methods according to the invention.
- the invention of claim 27 provides an arrangement for associating text attributes with a graphic representation of text contained in a computer graphic, with a device according to the invention or further developed as a server, and with a client connectable to the server via a network, wherein:
- the processing unit of the server is adapted to transmit a first computer graphic, which has a graphical representation of text, to the client via a communication interface contained in the server via the network;
- the client is configured to display the first computer graphic via a user interface contained in the client, to accept a user interaction, and to use the resulting value via a user interface
- the processing unit of the server is designed to evaluate the selection position value on the basis of the transmitted value, and transmit the computer graphics resulting from the modification to the client.
- the arrangement is brought into conformity with current distributed system architectures, such as are widely used between service provider computers and service requesting computers over the Internet or cellular networks.
- the arrangement can be integrated into existing systems without significant technical overhead.
- the invention of claim 28 provides on a computer readable
- Storage medium stored computer program product which contains computer-readable program means for performing the steps of the method according to the invention by a computer.
- the invention of claim 29 accordingly provides a computer program product embodied in a digital carrier wave.
- the digital carrier wave may be realized by a wireless or wired electrical or optical signal, or by any forms of embodying the information-carrying bits in a medium.
- Both computer program products serve to carry out the method when the program product runs on a computer.
- the computer program product may be similarly stored on a magnetic or optical medium, such as a CD-ROM, DVD-ROM, floppy or hard disk, or in a semiconductor device, such as a memory device or memory portion of a processor.
- a magnetic or optical medium such as a CD-ROM, DVD-ROM, floppy or hard disk
- a semiconductor device such as a memory device or memory portion of a processor.
- Fig. 3 is a schematic overview of an embodiment of a
- Fig. 1 shows a schematic overview of an embodiment of the method.
- step 100 the processing device first selects a text graphic for further procedural processing.
- the text graphic is a computer graphic that has text elements, the text elements are not character-coded, but are shown purely graphically in the computer graphics.
- Computer graphics can be a raster graphic or a vector graphic.
- the processing device determines, for each word contained in the text graphic, the associated word position value, which may include one or two coordinate tuples.
- the coordinate tuple indicates the relative position of the word in the coordinate system of the text graphic. For example, for two coordinate tuples, the first may designate the X coordinate and the Y coordinate the upper left corner of the word, and the second coordinate tuple the X coordinate and the Y coordinate of the lower right corner of the word.
- the word position values may be retrieved from a database containing the word word value associated therewith for each word of a text graphic, or may be determined by image processing methods, such as text recognition or Optical Character Recognition (OCR) methods.
- image processing methods such as text recognition or Optical Character Recognition (OCR) methods.
- step 120 the processing unit then evaluates one or more selection position values, such as may come from a user input or retrieved from a database containing, for each text graphic, associated selection location values.
- a selection position value may be a coordinate tuple or, analogous to the word position value, it may include two tuples forming the corners of a selection region.
- the selection position value or the selection position value may also initially be received or retrieved, in order then to determine only those word position values of the text graphic which could be detected by the selection position value.
- This pre-selection which can be made by evaluating a distance metric around the selection position value, reduces the computation outlay in the case of OCR-based dynamic word position value determination or the access effort for retrieving from a memory or a database.
- step 130 the processing unit then checks each of the determined word position values, that is, for each or every word that is fundamentally relevant to the metric, whether the word represented in the text graphic is detected by the selection position value. In this way, all words represented in the text graphic are determined, which are selected for attribution should be. This can be done, for example, by a selection and possibly a combination of the following four case distinctions, if word position values and selection position values each have two coordinate tuples which represent corner points of a region. A word is marked if at least one of the following case distinctions applies:
- UpLinks stands for the first word position coordinate tuple and "Bottom Right” for the second word position coordinate tuple and “Start” for the first selection position coordinate tuple and “End” for the second selection position coordinate tuple.
- an "upper right” and a “lower left” may be used as the first and second word position coordinate tuples.
- X and "Y” represent the X and Y coordinates of the coordinate tuple, respectively.
- the coordinates of a raster computer graphics run from the origin in the upper left corner to the right in the X direction and down in the Y direction.
- the first case discrimination checks whether the lower right point of the word is equal to or further to the right than the starting point of the marker, and at the same time the lower right point of the word is equal to or lower than the starting point of the marker, and also the lower right point of the word is higher than the endpoint of the label.
- the second case discrimination checks whether the upper left point of the word is lower than the starting point of the marker, and at the same time the upper left point of the word is equal to or even further to the left than the end point of the marker, and, at the same time, the upper left point is equal to or higher even higher than the endpoint of the label.
- the third case distinction checks a situation related to the first case distinction, but reversed with regard to the selection position values.
- the processing unit checks if the upper left point of the word is lower than the starting point of the mark and the lower right point of the word is higher than the end point of the mark.
- the fourth case distinction checks whether the lower right point of the word is equal to or even further to the right than the starting point of the marking, while the upper left point is equal to or even further to the left than the end point of the marking, while the upper left point is the same high or even higher than the starting point of the marking, whereby at the same time the upper left point is equal to or even higher than the end point of the marking, besides the lower right point of the word is the same or even lower than the starting point of the marking, and finally the lower right point is equal to or even lower than the end point of the marking.
- case distinctions can be realized programmatically or circuit-wise in logically equivalent different case distinction constructs.
- the selection scenarios are illustrated by the four case distinctions mentioned above, as shown in the following table.
- the lines indicate the position of the starting point relative to the position of the word in the coordinate system, and the columns indicate the position of the end point relative to the position of the word in the coordinate system.
- the indication in the table cell designates the respective one of the four case distinctions described above.
- the processing unit determines the amount of words that are detected by the user from the selection position value or the underlying selection operation. This can be a set or a vector of word position values. If no word is affected by the selection, the procedure can be aborted at this point.
- the processing unit For each of the word position values determined by the selection position value or the selection position values determined in step 130, the processing unit now calculates one of the respective words in step 140 in step 140
- the processing unit determines the total attribution area for the overall text graphic by summing the individual areas.
- the processing unit selects in step 160 a computer graphic which, in combination with the text graphics, produces a visual effect corresponding to the attribution.
- Embodiments may provide that instead of or in addition to a second computer graphics and overlay, a graphics filter is selected depending on the attribution to be applied, such as an alpha filter or the like, which is applied to the text graphic.
- a graphics filter is selected depending on the attribution to be applied, such as an alpha filter or the like, which is applied to the text graphic.
- a smooth or felt-typed, areal yellow or green computer graphic may be selected as an overlay graphic, which may be semi-transparent or opaque, and then computationally processed by the processing unit at step 170 Text graphic is combined into a result graphic by overlaying the text graphic with the overlay graphic.
- a graphics filter is selected depending on the attribution to be applied, such as an alpha filter or the like, which is applied to the text graphic.
- a smooth or felt-typed, areal yellow or green computer graphic may be selected as an overlay graphic, which may be semi-transparent or opaque, and then computationally processed by the processing unit at step 170 Text graphic is combined into a result graphic by overlaying
- the overlay computer graphics can also be present as a non-transparent graphic, the semitransparent or opaque effect being dynamically generated in the computational combination.
- framing is also possible by dynamically creating a transparent overlay graphic with a solid frame representation in the size of the attribution area.
- FIG. 2 shows a schematic overview of an exemplary embodiment of the method in the context of application.
- a user session is opened on the text attribute mapping device, which is presently a server.
- this server may have received a suitable request from a user at a computer, which in the present case is realized as a client, for example as part of a log-in.
- This client may include a web client, and the server a web server, wherein web client and web server are set up accordingly to carry out the method.
- step 210 the server processing unit for the logged-on user now retrieves specifically stored selection position values from a database that the user created in a previous user session. Then, the processing unit of the server performs the attribution method as shown with reference to Figure 1 in steps 100-170. The resulting overlaid computer graphics with the attributed text elements is then transmitted via the Internet to the web client, which displays the attributed text graphics in step 230. By specifying a starting point and an end point, the user selects a selection area and further selects an attribution type that is offered and acquired by the client in step 240 to the user via a user interface.
- the client then transmits these user selection values to the server in step 250, which respectively accepts these values as a selection position value or computationally derives the selection position value therefrom, and again performs the attribution method of steps 100-170.
- the processing unit of the server adds the selection item value to the user-specific one already stored in the database by using the
- step 270 the server transmits the newly attributed, entire text graphics to the client for display.
- the selection position values may be stored in step 260 immediately following the transmission of the user selection in step 250 and the taking or calculation of the selection position value therefrom, and accordingly Performing the attribution method of steps 100 to 170 following the storing in step 260 is performed.
- FIG. 3 shows a schematic overview of an exemplary embodiment of an arrangement for the assignment of text attributes, with a computer, which in the present case is designed as a client, and with a device for the assignment of text attributes as a server.
- the configured as a server 1 device for the assignment of text attributes has a processing unit 10, a communication interface 12 and a memory 14, which are all communicatively coupled to each other, such as a computer-internal bus system. If the tasks are distributed between individual computers, the connection between a host computer, a communication gateway, and a database server over a local area network can be made in an equivalent manner.
- processing unit 10 is configured to execute steps 100 - 170 of the method, and, in the present client-server configuration, also steps 200 - 220 and 260 and 270.
- the processing unit can also realize functions of an operating system and a web server.
- the processing unit 10 uses the communication interface 12, which is set up, for example, for communication via the Internet via TCP / IP, or via cellular mobile radio networks.
- the memory 14 contains or references a first computer graphic 18 which graphically displays text components.
- Computer graphics 18 is a raster or vector graphic that represents the characters of the text by pixels or vectors without character encoding the text, such as in ASCII, ISO 8859-1, or Unicode format, and is commonly referred to as Text graphic designates.
- a textual amount of text arranged line by line can be represented in the text graphic, which represents the text flow of a book page.
- memory 14 contains or references a second computer graphic 16 (overlay graphic) having a colored area or texture or other graphic design corresponding to one of the text graphics or parts thereof, ie, words to be attributed thereto.
- a colored, such as yellow or green, flat texture can be selected for an attribute assignment of the attribute "highlighted.”
- the second computer graphic 16 can be opaque, ie have a certain degree of transparency, which can be determined by an alpha channel of the graphic 16
- a nontransparent graphic can also be used as the second computer graphic 16, if the processing unit 10 is designed to execute the overlaying of the graphics in such a way that the second graphic as a result the first opaque superimposed appears.
- the client 2 is a computer that interacts with a user and that communicates with the server 1 via a web client or an electronic document viewer, for example, to display text graphics and program or HTML code for those on the client to retrieve displayed user interface from the server and display or execute.
- Client 2 comprises a processing unit 20, which may be realized with a programmed universal processor, as well as a communication interface 22 (network stack) connected thereto and a memory 24, which in turn has a text graphic 26.
- a processing unit 20 which may be realized with a programmed universal processor, as well as a communication interface 22 (network stack) connected thereto and a memory 24, which in turn has a text graphic 26.
- a user interface such as a graphical user interface (GUI) operated by a pointing device or a touch screen
- GUI graphical user interface
- the text graphic 26 is presented to the user via the user interface 28 together with corresponding selection and menu options, and user commands are received by the user interface by obtaining command values corresponding to the user actions.
- the processing unit 20 is in particular configured to interact with the server and to carry out the steps 230 to 250 of the method. Furthermore, the processing unit is designed to detect a user identification and to transmit it to the server 1, which then opens a user session and retrieves user-specific stored values.
- FIG. 4 shows an illustration of a first aspect of the marking process according to the method of FIG. 1.
- the associated selection position value for each of the regions is also clarified, which in this case consists of two coordinate tuples, for point A, point 40 is the starting coordinate tuple of the marker and Point 42 as end coordinate tuple, point B as start coordinate tuple of the marker and point 46 as end coordinate tuple for region B, point 48 as start coordinate tuple of the marker and point 50 as final coordinate tuple for region C, and finally point 52 as star coordinate tuple of the marker and point 54 as end coordinate tuple.
- the calculation of the text graphic area to be attributed for each individual word can already be preferred in the determination of the word position value of the respective word, for example by defining a boundary as word position value for each individual word, which corresponds to the attribution area of the corresponding word.
- the word position value can be directly adopted as the attribution area of the respective word, and then in step 140, only the total attribution area for the overall text graphic is determined.
- FIG. 5 shows an illustration of a second aspect of the marking process according to the method of FIG. 1, in particular of the individual regions, position values and coordinate tuples to each other.
- a starting point 60 of a selection by a user is given by a first coordinate tuple of a selection position value, and an end point 62 of the selection by a second coordinate tuple of the same selection position value.
- the selection area can thus be regarded as a rectangular selection area 70.
- not only words are included that fall at least partially into the rectangle, as illustrated in region 4 for FIG. 5 shows a special case in which the "test word" falls exactly in the selection area 70.
- Word position value is given an upper left corner 64 of a word, and by a second coordinate tuple of the same word position value, a lower left corner 66 of the word, thereby spanning a rectangular word area 68 (shown in dotted outline).
- an attribution area 72 (shown here as a box) surrounding the word area 68 with a distance range is calculated accordingly.
- the distance range is approximately such that it is as high as the maximum high word of the same font and font size of the word to be attributed.
- the width of the word area can be taken over as the width, or a horizontal spacing area oriented at the word spacing between the word area and the edge of the attribution area can be added.
- FIG. 6 shows an illustration of a third aspect of the marking process according to the method of FIG. 1.
- a corresponding entry for storing the selections and / or attributions may include, in a user or user session database using, for example, fields for a document identifier for identifying the document represented by the text graphic, a page identifier for identifying the document page
- Start coordinate tuple of the selection position value an end coordinate tuple of the selection position value, a coordinate tuple of a left upper corner of the word position value, a coordinate tuple of a lower right corner of the word position value, and a time stamp.
- the present system thus provides the possibility of text in text graphics, which is not coded, but purely graphically presented in the text graphics to provide attributes such as highlighting or framing, without requiring a parallel provision of the text in a character-coded form, and without that attribution too submitting text of the text graphic must be selected using the conventional marking techniques for computer graphics.
- the selection of the text to be attributed can be defined, for example, by a starting point and an end point of a marking, and it is not necessary to precisely position a catching rectangle around each of the text parts to be marked.
- a user can thus make a mark approximately by just two mouse clicks, and receives, as with a displayed book page, a marker of all words in the flow of words between the two points.
- a user may also use the present system to save all attributions as part of a user session and have them restored in a later user session.
- the text thus attributed may be in the context of an open book page with textual and other contents.
- the user interface 28 shown in FIG. 3, which may be configured as a GUI may display a book text as shown in FIG. 4.
- the steps to be performed in the device 1, which may be a server or a web server may be implemented by a software including instructions to execute the respective steps, and those described in U.S. Patent Nos. 4,377,074 Memory 14 is included.
- the steps to be performed in the computer 2 which may be a client or a web client, (see also Fig.
- the presentation may be in functional connection with a web browser installed on the computer, or with other proprietary display programs, such as when the computer is implemented by a mobile terminal, such as a mobile phone.
- the software to be executed on the computer 2 may be preinstalled, such as a plug-in module of a display software or a browser plug-in, or, in the case of a web browser, it may also be by submitting program instructions embedded in a WWW page to the computer or integrated into programs contained therein. In the latter case, functions included in the browser, such as JavaScript functions, are called through the program statements embedded in the WWW page. As one skilled in the art will readily appreciate, the invention is therefore not limited to the use of plug-ins.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit den Schritten: Bestimmen mindestens eines Wortpositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in einer ersten Computergrafik dargestellten Textes; Auswerten mindestens eines Selektionspositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist; Prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes; Bestimmen eines Attribuierungsbereiches der ersten Computergrafik auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes; Modifizieren der ersten Computergrafik mindestens im Attribuierungsbereich, sowie eine Vorrichtung, eine Anordnung und ein Computerprogrammprodukt hierfür.
Description
Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken
Beschreibung:
Technisches Gebiet
Die Erfindung betrifft ein Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, sowie eine Vorrichtung, eine Anordnung und ein Computerprogrammprodukt hierfür.
Hintergrund der Erfindung
Bei Systemen zur Darstellung und Verarbeitung von natürlichsprachlichem Text, etwa bei Textverarbeitungsprogrammen oder Texteditoren, ist es bekannt, Textpassagen auszuwählen, um ihnen Attribute zuzuweisen, wie Absatzstile, Hervorhebungen, Schriftart, Schriftgrad, Schriftstil, Farbe, Laufweite, etc.
Dabei ist der Text, der in solcherart System in zeichencodierter Form vorliegt, durch eine entsprechende Nutzerinteraktion auszuwählen, indem der Nutzer etwa den Beginn der auszuwählenden Textpassage mit einer Maus oder einem berührungsempfindlichen Bildschirm andickt und bis zum Ende der auszuwählenden Passage zieht. Eine solches Auswählen ist in dem System nach der deutschen Übersetzung DE 695 19 905 T2 der europäischen Patentschrift EP 0 698 845 B1 beschrieben. Dadurch, dass der Text in zeichencodierter Form vorliegt, kann der Text hierzu einfach identifiziert und weiterverarbeitet werden, je nach dem zuzuweisenden Attribut oder der für den ausgewählten Text vorgesehenen Datenverarbeitungsoperation.
Zur Auswahl von Teilen einer Computergrafik ist bekannt, ein Selektions-, oder Fangrechteck durch Klicken des Rechteckursprungs und Ziehen bis zum Rechteckende zu definieren. Dabei werden typischerweise die Grafikelemente
(Pixel im Falle einer Rastergrafik) innerhalb der genauen Ausmaße des Fangrechtecks markiert.
Jedoch wäre es auch wünschenswert, Textpassagen ein Attribut zuweisen zu können, die nicht in zeichencodierter Form vorliegen, sondern als eine Computergrafik, beispielsweise einer Rastergrafik, in der Text dargestellt ist. Eine solche, Text verkörpernde Grafik wird auch als Textgrafik bezeichnet.
In einer Textgrafik enthaltener Text entzieht sich den üblichen Auswahl- und Verarbeitungsmethoden, die für zeichencodiert vorliegenden Text angewendet werden. Der Rechner kann nur auf Pixel der die Textgrafik bildenden Rastergrafik (oder Vektorelemente einer Vektorgrafik) zugreifen, und hat keine unmittelbar verarbeitbaren Informationen über die Zeichen und Gruppierungen des Textes in der Textgrafik.
Aus der deutschen Übersetzung DE 694 34 434 T2 der europäischen Patentschrift EP 0 731 948 B1 ist ein System zur benutzerfreundlichen Anzeige und Handhabung von Textgrafiken bekannt, wobei die Textgrafiken aus eingescannten Seiten gedruckter Patentdokumente stammen, und bei welchem die in den Textgrafiken dargestellten Texte zudem in einer parallelen Datenhaltung in zeichencodierter Form vorliegen. Dabei wird die Paginierung von eingescannten Druckseiten von Patentschriften in der zeichencodierten Textform nachempfunden, und es ist eine Darstellungsform möglich, bei der in nebeneinanderliegenden Fenstern die Textgrafik und der zeichencodierte Text dargestellt werden. Durch diesen doppelten Ansatz wird einerseits die originalgetreue grafische Darstellung angeboten und andererseits die Weiterverarbeitbarkeit des zeichencodierten Textes ermöglicht, insbesondere das Suchen und Navigieren innerhalb eines Dokumentes.
Jedoch verlangt dieser Ansatz eine doppelte Datenhaltung, was grundsätzlich den Bedarf an Speicher, und bei Netzwerkanwendungen, auch an Kommunikationsbandbreite deutlich erhöht, da jeweils der grafisch codierte und zeichencodierte Text übermittelt werden muss. Ferner ist hierbei der in der Textgrafik enthaltene Text zwar mit den üblichen Bearbeitungsmethoden
für Grafik bearbeitbar, wie Vergrößern, Verkleinern, Drehen, usw., aber es werden keine textspezifischen Attribuierungen vorgenommen.
Aufgabe der vorliegenden Erfindung ist es daher, ein Verfahren anzugeben, welches das Zuordnen von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text ermöglicht, und dabei die Nachteile des Standes der Technik vermeidet, sowie eine Vorrichtung, eine Anordnung und ein Computerprogrammprodukt hierfür.
Überblick über die Erfindung
Diese Aufgabe wird erfindungsgemäß jeweils durch den Gegenstand der Ansprüche 1 , 14 und 27 bis 29 gelöst.
Die Erfindung nach Anspruch 1 lehrt ein Verfahren zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit den folgenden Schritten:
Auswählen einer ersten Computergrafik, welche eine grafische Darstellung von Text aufweist;
Bestimmen mindestens eines Wortpositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes;
Auswerten mindestens eines Selektionspositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist;
Prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes;
- A -
Bestimmen eines Attribuierungsbereiches der ersten Computergrafik auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes;
Modifizieren der ersten Computergrafik mindestens im Attribuierungsbereich.
Indem ein Wortpositionswert für ein in der Textgrafik dargestelltes Wort bestimmt wird, wird es ermöglicht, einzelne Worte aus der Textgrafik zu addressieren und für die weitere Verarbeitung und Zuordnung von Attributen heranzuziehen. Hierdurch wird ermöglicht, in der Textgrafik enthaltene Wort zu verarbeiten, ohne parallel eine zeichencodierte Textfassung mitzuführen. Auf diese Weise wird der Bedarf an Speicher und Kommunikationsbandbreite verringert. Zudem muss der zeichencodierte „Quelltext" des in der Textgrafik dargestellten Dokumentes nicht für die Darstellung in den Einflussbereich des Benutzers übermittelt werden. Indem der Wortpositionswert ein Koordinatentupel bezüglich der Textgrafik, beispielsweise einer Buchseitendarstellung, festlegt, wird ein datenmäßig effizienter Identifikationswert gewählt, der zugleich die eindeutige Identifikation eines Wortes erlaubt.
Durch das Auswerten des Selektionspositionswertes wird es ermöglicht, diejenigen Worte der Textgrafik, die der Zuweisung von Textattributen (Attribuierung) zu unterziehen sind, aus der Menge aller Worte der Textgrafik auszuwählen. Der Selektionspositionswert, der somit ein Auswahlmerkmal darstellt, kann zum Beispiel durch eine Interaktion des Benutzers oder durch einen oder mehrere gespeicherte Datenbankeinträge bestimmt sein. Der Selektionspositionswert kann so etwa einen oder mehrere (Auswahl-)Punkte oder (Auswahl-)Bereiche in der Textgrafik bestimmen. Die Prüfung, ob ein Wort durch einen Selektionspositionswert erfasst wird, wird für jedes Wort der Textgrafik durchgeführt mithilfe eines Vergleiches zwischen dem jeweiligen Wortpositionswert des Wortes und dem Selektionspositionswert. Die
Feststellung aufgrund einer Vergleichsoperation ermöglicht, die für eine Selektion anzuwendenden Kriterien flexibel festzulegen.
Im Gegensatz zu einer einfachen, herkömmlichen Auswahl eines Text darstellenden Grafikbereiches mit einem Fangrechteck, kann der Nutzer (oder das automatisierte System mit der entsprechenden Angabe in der Datenbank) erfindungsgemäß auf effiziente Art eine Menge von Worten in der Textgrafik auswählen, ohne etwa an die genauen grafischen Umgrenzungen des Wortes in der Grafik gebunden zu sein, da die Auswahl anhand des Wortpositionswertes für jedes Wort stattfindet. Es wird dabei ferner ermöglicht, einem Textabschnitt zugehörige Worte als zur Auswahl gehörig zu erkennen, die nicht innerhalb der grafischen Umgrenzung eines Auswahlbereiches liegen, aber zum Fluss des markierten Textes gehören.
Dadurch, dass aufgrund des Wortpositionswertes eines so als ausgewählt erkannten Wortes ein Attribuierungsbereich der Textgrafik bestimmt wird, wird ermöglicht, festzustellen, für welche flächenmäßigen Bereiche der Textgrafik die Attribuierung vorgenommen wird. Dieser Bereich wird aufgrund der jeweiligen Wortgeometrie und dem Wortpositionswert ermittelt, und ist von dem durch den Selektionspositionswert angegebenen Bereich unabhängig. Der Attribuierungsbereich insgesamt kann sich dabei aus jeweiligen Attribuierungsbereichen mehrerer Worte zusammensetzen und kann dabei etwa als das jeweilige Wort eng umgrenzendes Rechteck berechnet werden. Der einzelne Attribuierungsbereich kann dabei ferner in seiner Höhe nach der Worthöhe desjenigen Wortes bemessen sein, welches die größte Höhe der gewählten Schriftgröße des Textes erzeugt. Somit werden die Bereiche der Textgrafik ermittelt, auf die die Attribuierung grafisch angewendet wird.
Indem nun die Textgrafik in den Attributierungsbereichen modifiziert wird, wird es ermöglicht, die Attributierung auf die Computergrafik anzuwenden, sodass diese direkt darstellbar wird. Dies kann etwa durch die Anwendung eines Grafikfilters auf die Textgrafik, wie etwa eines Alpha-Filters, oder durch Überlagern der Textgrafik mit einer zweiten Computergrafik geschehen. Im Falle eines Attributes „Hervorheben" kann hierfür beispielsweise eine
gleichmäßige oder strukturierte gelbe oder grüne Grafik, opak (teiltransparent, halbtransparent) über die Textgrafik gelegt werden. Es wird hierdurch ermöglicht, Attributierungen vorzunehmen, ohne dass hierfür ein Anzeigegerät angepasst werden müsste, oder zusätzlicher technischer Aufwand in der Handhabung, Übertragung oder Anzeige der attribuierten Textgrafik entstünde.
Hierdurch kann eine Anzahl verschiedener Attribuierungen auf Worte einer Textgrafik flexibel angewendet werden.
Weitere Ausführungsformen der Erfindung nach Anspruch 1 können entsprechend der auf diesen Anspruch rückbezogenen Unteransprüche verwirklicht werden.
Die Erfindung kann etwa dadurch weitergebildet sein, dass der Selektionspositionswert während einer ersten Benutzersitzung auf Basis einer Benutzerinteraktion bestimmt wird und in einem Speicher abgelegt wird. Dabei kann eine Mehrzahl von Selektionspositionswerten für jeden Nutzer individuell gespeichert werden, sodass die ausgewählten Textteile auch zu einem späteren Zeitpunkt weiterverarbeitet werden können. Wird in Weiterbildungen der Erfindung der Selektionspositionswert während einer zweiten Benutzersitzung aus dem Speicher abgerufen, so kann für den Benutzer während einer späteren Benutzersitzung die in der ersten Sitzung vorgenommene Attribuierung aufgrund der gespeicherten Selektionspositionswerte wiederhergestellt werden.
In Weiterbildungen der Erfindung wird ein Attribuierungstyp bestimmt, der das zuzuordnende Textattribut identifiziert. Hierdurch wird ermöglicht, den markierten Text in Abhängigkeit des Attribuierungstyps unterschiedlich weiterzuverarbeiten, etwa dadurch, dass die zweite Computergrafik in Abhängigkeit von dem bestimmten Attribuierungstyp ausgewählt wird.
Weiterbildungen der Erfindung können dadurch gekennzeichnet sein, dass das die erste Computergrafik mit der zweiten Computergrafik opak überlagert wird. Dies kann durch pixelweise rechnerische Bildverknüpfungsoperationen verwirklicht werden, indem die erste und zweite Grafik aus dem Speicher abgerufen, verknüpft und das Verknüpfungsergebnis in den Speicher abgelegt wird. Das Verknüpfungsergebnis stellt die überlagerte erste Grafik dar.
Die Erfindung kann dadurch weitergebildet sein, dass der Attribuierungsbereich bestimmt wird unter Ermittlung des durch die grafische Wortdarstellung beanspruchten Bereiches der ersten Computergrafik.
Weist der Selektionspositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel auf, können das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Selektionsbereiches bilden. Dieser stellt durch seine Ecken Vergleichswerte bereit, die für die Vergleichsoperationen der Wortselektionsprüfung herangezogen werden können.
Entsprechend kann die Erfindung dahingehend weitergebildet werden, dass der Wortpositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist, und zusätzlich dahingehend, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Wortbereiches bilden.
Hierdurch kann die Wortselektionsprüfung unter Koordinatenvergleich so gestaltet sein, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise im Selektionsbereich liegt. Um auch Worte zu erfassen, die nicht im Selektionsbereich liegen, aber zum Textfluss zugehören, kann zudem die
Wortselektionsprüfung so gestaltet werden, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise zwischen der vertikalen Koordinate des ersten Koordinatentupels des Selektionspositionswertes und der vertikalen Koordinate des zweiten Koordinatentupels des Selektionspositionswertes liegt.
Die Erfindung nach Anspruch 14 stellt eine Vorrichtung zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text nach dem hier vorgeschlagenen Verfahren bereit, mit einer Verarbeitungseinheit und einem Speicher,
dadurch gekennzeichnet, dass
der Speicher eine erste Computergrafik enthält, welche eine grafische Darstellung von Text aufweist;
die Verarbeitungseinheit ausgebildet ist, mindestens einen Wortpositionswert zu bestimmen, welcher ein auf die erste
Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes;
die Verarbeitungseinheit ausgebildet ist, mindestens einen Selektionspositionswert auszuwerten, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist;
die Verarbeitungseinheit ausgebildet ist, zu prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes;
- die Verarbeitungseinheit ausgebildet ist, einen Attribuierungsbereich der ersten Computergrafik zu bestimmen auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes;
die Verarbeitungseinheit ausgebildet ist, die erste Computergrafik mindestens im Attribuierungsbereich zu modifizieren.
Durch diese Einrichtungen und Ausbildungen des Speichers und der
Verarbeitungseinheit ist die Vorrichtung eingerichtet, das erfindungsgemäße Verfahren auszuführen.
Die Verarbeitungseinheit kann durch programmtechnisches Einrichten von Mehrzweckhardware, wie Mehrzweckprozessoren, und oder durch eine Kombination von Programmierung und anwendungsspezifischen Prozessor komponenten (Application Specific Integrated Circuits, ASICs) verwirklicht werden. Insbesondere kann für die Verwirklichung Rückgriff auf durch Betriebssysteme oder Middleware bereitgestellte Funktionen genommen werden und/oder auf internettypische Technologien, wie PHP (PHP Hypertext Preprocessor) und/oder JavaScript.
Ausführungsformen der Erfindung nach Anspruch 16 können entsprechend den auf diesen Anspruch rückbezogenen Unteransprüchen verwirklicht werden, sowie entsprechend den übrigen Weiterbildungen und Ausführungsformen aller erfindungsgemäßen Vorrichtungen und Verfahren.
Die Erfindung nach Anspruch 27 stellt eine Anordnung zur Zuordnung von Textattributen zu einer in einer Computergrafik enthaltenen, grafischen Darstellung von Text, mit einer als Server ausgebildeten erfindungsgemäßen oder weitergebildeten Vorrichtung und einem mit dem Server über ein Netzwerk verbindbaren Client, wobei:
die Verarbeitungseinheit des Servers ausgebildet ist, eine erste Computergrafik, welche eine grafische Darstellung von Text aufweist, über eine im Server enthaltene Kommunikationsschnittstelle über das Netzwerk an den Client zu übermitteln;
der Client ausgebildet ist, die erste Computergrafik über eine im Client enthaltene Benutzerschnittstelle darzustellen, eine Benutzerinteraktion entgegenzunehmen, und den daraus resultierenden Wert über eine im
Client enthaltene Kommunikationsschnittstelle über das Netzwerk an den Server zu übermitteln,
und die Verarbeitungseinheit des Servers ausgebildet ist, den Selektionspositionswert auf Basis des übermittelten Wertes auszuwerten,
und die aus der Modifizierung entstandene Computergrafik an den Client zu übermitteln.
Durch die Konfiguration der Anordnung mit Client und Server wird die Anordnung in Übereinstimmung mit gängigen Architekturen dezentraler Systeme gebracht, wie sie zwischen Diensteanbietercomputem und Dienstenachfragercomputern über das Internet oder über Mobilfunknetze weit verbreitet sind. Somit läßt sich die Anordnung ohne wesentlichen technischen Zusatzaufwand in bestehende Systeme integrieren.
Die Erfindung nach Anspruch 28 stellt ein auf einem computerlesbaren
Speichermedium gespeichertes Computerprogrammprodukt bereit, welches computerlesbare Programmmittel zur Ausführung der Schritte des erfindungsgemäßen Verfahrens durch einen Computer enthält. Die Erfindung nach Anspruch 29 stellt entsprechend ein Computerprogrammprodukt bereit, welches in einer digitalen Trägerwelle verkörpert ist. Die digitale Trägerwelle kann etwa durch ein kabelloses oder kabelgebundenes elektrisches oder optisches Signal oder durch alle Formen der Verkörperung der informationstragenden Bits in einem Medium realisiert sein. Beide Computerprogrammprodukte dienen zur Durchführung des Verfahrens, wenn das Programmprodukt auf einem Rechner abläuft.
Das Computerprogrammprodukt kann in entsprechender Weise auf einem magnetischen oder optischen Datenträger gespeichert sein, wie einer CD-ROM, DVD-ROM, Diskette oder Festplatte, oder in einem Halbleiterbaustein, wie etwa einem Speicherbaustein oder einem Speicherteil eines Prozessors.
Kurzbeschreibung der Zeichnungen
Die Erfindung wird nachfolgend beispielhaft anhand mehrerer Figuren erläutert. Es zeigen:
Fig. 1 eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens,
Fig. 2 eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens im Anwendungszusammenhang,
Fig. 3 eine schematische Übersicht über ein Ausführungsbeispiel einer
Anordnung zur Zuordnung von Textattributen, mit einem Client und mit einer Vorrichtung zur Zuordnung als Server
Fig. 4 eine Veranschaulichung eines ersten Aspektes des
Markierungsvorgangs gemäß des Verfahrens der Fig. 1 ,
Fig. 5 eine Veranschaulichung eines zweiten Aspektes des
Markierungsvorgangs gemäß des Verfahrens der Fig. 1 , und
Fig. 6 eine Veranschaulichung eines dritten Aspektes des
Markierungsvorgangs gemäß des Verfahrens der Fig. 1.
Detaillierte Beschreibung
Fig. 1 zeigt eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens.
In Schritt 100 wählt die Verarbeitungsvorrichtung zunächst eine Textgrafik zur weiteren verfahrensmäßigen Bearbeitung aus. Bei der Textgrafik handelt es sich um eine Computergrafik, die Textelemente aufweist, wobei die Textelemente nicht zeichencodiert sind, sondern rein graphisch in der Computergrafik dargestellt sind. Bei der Computergrafik kann es sich um eine Rastergrafik oder eine Vektorgrafik handeln.
In Schritt 110 ermittelt die Verarbeitungsvorrichtung dann für jedes in der Textgrafik enthaltene Wort der zugehörige Wortpositionswert, welcher ein oder zwei Koordinatentupel enthalten kann. Das Koordinatentupel bezeichnet dabei die relative Position des Wortes im Koordinatensystem der Textgrafik.
Bei zwei Koordinatentupeln etwa kann das erste die X-Koordinate und die Y- Koordinate der linke obere Ecke des Wortes bezeichnen, und das zweite Koordinatentupel die X-Koordinate und die Y-Koordinate der rechten unteren Ecke des Wortes.
Die Wortpositionswerte können etwa aus einer Datenbank abgerufen werden, welche für jedes Wort einer Textgrafik den zugehörigen Wortpositionswert enthält, oder sie können durch Bildverarbeitungsmethoden, beispielsweise Texterkennungs- oder Optische Zeichenerkennungsmethoden (Optical Character Recognition, OCR) bestimmt werden.
In Schritt 120 wertet dann die Verarbeitungseinheit einen oder mehrere Selektionspositionswerte aus, die etwa aus eine Benutzereingabe stammen können oder aus einer Datenbank abgerufen wurde, die für jede Textgrafik dieser zugeordnete Selektionspositionswerte enthält.
Ein Selektionspositionswert kann, wie der Wortpositionswert, ein Koordinatentupel sein, oder er kann analog zum Wortpositionswert zwei Tupel beinhalten, die die Ecken eines Selektionsbereiches bilden.
Alternativ zum in den Schritten 110 und 120 beschriebenen Vorgehen kann auch zunächst der oder die Selektionspositionswert empfangen bzw. abgerufen werden, um dann nur diejenigen Wortpositionswerte der Textgrafik zu ermitteln, welche durch den Selektionspositionswert erfasst sein könnten. Durch diese Vorauswahl, die durch Auswertung einer Abstandsmetrik um den Selektionspositionswert herum getroffen werden kann, wird der Rechenaufwand bei OCR-basierter dynamischer Wortpositionswertermittlung oder der Zugriffsaufwand bei Abrufen aus einem Speicher oder einer Datenbank vermindert.
In Schritt 130 prüft dann die Verarbeitungseinheit jeden der ermittelten Wortpositionswerte, d.h. für jedes oder jedes nach der Metrik grundsätzlich in Frage kommendes Wort, ob das in der Textgrafik dargestellte Wort durch den Selektionspositionswert erfasst wird. Auf diese Weise werden alle in der Textgrafik dargestellten Worte ermittelt, die für die Attribuierung ausgewählt
werden sollen. Dies kann etwa durch eine Auswahl und ggf. Kombination der folgenden vier Fallunterscheidungen geschehen, wenn Wortpositionswerte und Selektionspositionswerte jeweils zwei Koordinatentupel aufweisen, welche Eckpunkte eines Bereiches darstellen. Ein Wort wird dann markiert wenn mindestens eine der folgenden Fallunterscheidungen zutrifft:
1. Fallunterscheidung
FALLS (WortUntenRechts_X >= SelektionStart_X
UND WortUntenRechts_Y >= SelektionStart_Y
UND WortUntenRechts_Y < SelektionEnde_Y)
DANN MarkiereWort
2. Fallunterscheidung
FALLS (WortObenLinks_Y > SelektionStart_Y
UND WortObenLinks_X <= SelektionEnde_X
UND WortObenLinks_Y <= SelektionEnde_Y)
DANN MarkiereWort
3. Fallunterscheidung
FALLS (WortObenLinks_Y > SelektionStart_Y
UND WortUntenRechts_Y < SelektionEnde_Y)
DANN MarkiereWort
4. Fallunterscheidung
FALLS (WortUntenRechts_X >= SelektionStart_X
UND WortObenLinks_X <= SelektionEnde_X
UND WortObenLinks_Y <= SelektionStart_Y
UND WortObenLinks_Y <= SelektionEnde_Y
UND WortUntenRechts_Y >= SelektionStart_Y
UND WortUntenRechts_Y >= SelektionEnde_Y)
DANN MarkiereWort
Bei allen Fallunterscheidungen steht „ObenLinks" für das erste Wortpositions- Koordinatentupel und „UntenRechts" für das zweite Wortpositions- Koordinatentupel und „Start" für das erste Selektionspositions- Koordinatentupel und „Ende" für das zweite Selektionspositions- Koordinatentupel. Der Fachmann wird hieraus ersehen, dass unter entsprechender Anpassung der Fallunterscheidungsbedingungen auch ein „ObenRechts" und ein „UntenLinks" als erstes und zweites Wortpositions- Koordinatentupel verwendet werden kann. „X" und „Y" stehen für die X- bzw. Y-Koordinate des Koordinatentupels. Im beispielhaften Koordinatensystem verlaufen die Koordinatenangaben einer Rastercomputergrafik vom Ursprung in der linken oberen Ecke nach rechts in X-Richtung und nach unten in Y- Richtung.
Die erste Fallunterscheidung prüft, ob der untere rechte Punkt des Wortes gleich oder weiter rechts liegt als der Startpunkt der Markierung, und dabei gleichzeitig der untere rechte Punkt des Wortes gleich hoch oder tiefer liegt als der Startpunkt der Markierung, und ferner gleichzeitig der untere rechte Punkt des Wortes höher liegt als der Endpunkt der Markierung.
Die zweite Fallunterscheidung prüft, ob der obere linke Punkt des Wortes tiefer als der Startpunkt der Markierung liegt und dabei gleichzeitig der obere linke Punkt des Wortes gleich oder sogar weiter links als der Endpunkt der Markierung liegt, und ferner gleichzeitig der obere linke Punkt gleich hoch oder sogar höher als der Endpunkt der Markierung liegt.
Die dritte Fallunterscheidung prüft eine der ersten Fallunterscheidung verwandte, jedoch hinsichtlich der Selektionspositionswerte umgekehrte Situation. Hier prüft die Verarbeitungseinheit, ob der obere linke Punkt des Wortes tiefer liegt als der Startpunkt der Markierung und dabei der untere rechte Punkt des Wortes höher liegt als der Endpunkt der Markierung.
Die vierte Fallunterscheidung schließlich prüft, ob der untere rechte Punkt des Wortes gleich oder sogar weiter rechts liegt als der Startpunkt der Markierung, dabei gleichzeitig der obere linke Punkt gleich oder sogar weiter links liegt als der Endpunkt der Markierung, dabei gleichzeitig der obere linke Punkt gleich hoch oder sogar höher liegt als der Startpunkt der Markierung, dabei wiederum gleichzeitig der obere linke Punkt gleich hoch oder sogar höher liegt als der Endpunkt der Markierung, dabei zudem der untere rechte Punkt des Wortes gleich hoch oder sogar tiefer liegt als der Startpunkt der Markierung, und dabei schließlich der untere rechte Punkt gleich hoch oder sogar tiefer liegt als der Endpunkt der Markierung.
Die Fallunterscheidungen können gegebenenfalls in logisch äquivalenten unterschiedlichen Fallunterscheidungskonstrukten programm- oder schaltungstechnisch realisiert werden.
Anschaulich werden die Auswahlszenarien durch die vier oben genannten Fallunterscheidungen wie in der folgenden Tabelle erfasst. Die Zeilen bezeichnen die Position des Startpunktes relativ zur Position des Wortes im Koordinatensystem, und die Spalten bezeichnen die Position des Endpunktes relativ zur Position des Wortes im Koordinatensystem. Die Angabe in der Tabellenzelle bezeichnet die jeweilige der oben beschriebenen vier Fallunterscheidungen.
Als Ergebnis der Fallunterscheidung in Schritt 130 ermittelt somit die Verarbeitungseinheit die Menge der Worte, die von dem Selektionspositionswert bzw. der zugrundeliegenden Selektionsoperation durch einen Benutzer erfasst werden. Hierbei kann es sich um eine Menge oder einen Vektor von Wortpositionswerten handeln. Ist kein Wort von der Selektion betroffen, so kann das Verfahren an dieser Stelle abgebrochen werden.
Für jeden der in Schritt 130 ermittelten, vom Selektionspositionswert oder den Selektionspositionswerten betroffenen Wortpositionswerten berechnet nun die Verarbeitungseinheit in Schritt 140 einen der das jeweilige Wort in der
Textgrafikdarstellung umgebenden Bereich. Der Attribuierungsbereich ist vom Wortpositionswert verschieden. In praktischen Implementierungen ist der Attribuierungsbereich ein Bereich der Textgrafik, der in horizontaler Ausdehnung das Wort eng umgrenzt, und in vertikaler Ausdehnung so hoch ist, wie das maximal hohe Wort der gleichen Schriftart und Schriftgröße des zu attribuierenden Wortes sein kann. Hierdurch wird eine grafisch gleichmäßig hohe Attribuierung in zeilenweise angeordnetem Fließtext sichergestellt, unabhängig von der tatsächlichen Worthöhe einzelner, zu attribuierender Worte. Ferner bestimmt die Verarbeitungseinheit in Schritt 140 den Gesamtattribuierungsbereich für die Gesamttextgrafik durch Summierung der Einzelbereiche.
Abhängig von der vornehmenden Attribuierung, die beispielsweise durch eine Benutzerinteraktion ausgewählt und dann entsprechend in Schritt 150 bestimmt werden kann, wählt die Verarbeitungseinheit in Schritt 160 dann eine Computergrafik aus, die in Kombination mit der Textgrafik einen der Attribuierung entsprechenden visuellen Effekt erzeugt. Alternative
Ausführungsformen können vorsehen, dass anstelle oder zusätzlich zu einer zweiten Computergrafik und der Überlagerung ein Grafikfilter in Abhängigkeit von der anzuwendenden Attribuierung ausgewählt wird, etwa ein Alpha-Filter, oder dergleichen, der auf die Textgrafik angewendet wird. Für ein Hervorheben oder ein Highlighting nach Art eines Textmarkers kann eine glatte oder filzstiftartig texturierte, flächig gelbe oder grüne Computergrafik als Overlay-Grafik ausgewählt werden, die semi-transparent oder opak sein kann, und die dann rechnerisch von der Verarbeitungseinheit in Schritt 170 mit der Textgrafik zu einer Ergebnisgrafik kombiniert wird, indem die Textgrafik mit der Overlay-Grafik überlagert wird. Hierbei wird im Unterschied zu herkömmlichen Hervorhebungseffekten nicht lediglich die Hintergrundfarbe verändert, sondern zugleich auch die Schriftfarbe graduell eingefärbt, was auch den visuellen Effekt des Highlightings verbessert.
Alternativ kann die Overlay-Computergrafik auch als nicht transparente Grafik vorliegen, wobei der semitransparente oder opake Effekt bei der rechnerischen Kombination dynamisch erzeugt wird.
Das Überlagern findet dabei nur in denjenigen Bereichen der Textgrafik statt, die Attribuierungsbereiche sind, während die übrigen Bereiche unverändert bleiben.
Alternativ zum Highlighting sind auch Umrahmungen möglich, indem eine transparente Overlay-Grafik mit einer soliden Rahmendarstellung in Größe des Attribuierungsbereiches dynamisch erzeugt wird.
Fig. 2 zeigt eine schematische Übersicht über ein Ausführungsbeispiel des Verfahrens im Anwendungszusammenhang.
In Schritt 200 wird auf der Vorrichtung zur Zuordnung von Textattributen, die vorliegend als Server verwirklicht ist, eine Benutzersitzung eröffnet. Dieser Server kann hierfür einen geeignete Anfrage von einem Benutzer an einem Computer, der vorliegend als Client verwirklicht ist, erhalten haben, etwa im Rahmen eines Einloggens. Dieser Client kann hierbei einen Web-Client beinhalten, und der Server einen Web-Server, wobei Web-Client und Web- Server entsprechend zur Durchführung des Verfahrens eingerichtet sind.
In Schritt 210 ruft nun die Verarbeitungseinheit des Servers für den angemeldeten Nutzer spezifisch gespeicherte Selektionspositionswerte aus einer Datenbank ab, die der Nutzer in einer vorausgehenden Benutzersitzung erzeugt hat. Dann führt die Verarbeitungseinheit des Servers das Attribuierungsverfahren durch, wie es mit Bezug auf Figur 1 in den Schritten 100 - 170 gezeigt wurde. Die als Ergebnis gewonnene überlagerte Computergrafik mit den attribuierten Textelementen wird dann über das Internet an den Web-Client übermittelt, der die attribuierte Textgrafik in Schritt 230 darstellt. Durch Angabe eines Startpunktes und eines Endpunktes wählt der Benutzer einen Auswahlbereich aus, und wählt ferner eine Attribuierungsart aus, die vom Client in Schritt 240 dem Benutzer über eine Benutzerschnittstelle angeboten und erfasst wird. Der Client übermittelt dann diese Werte der Benutzerauswahl in Schritt 250 an den Server, der entsprechend diese Werte als Selektionspositionswert übernimmt oder den Selektionspositionswert rechnerisch hieraus ableitet, und abermals das Attribuierungsverfahren der Schritte 100 bis 170 durchführt. Dabei fügt die Verarbeitungseinheit des Servers den Selektionspositionswert den bereits in der Datenbank nutzerspezifisch gespeicherten hinzu, indem den die
Selektionspositionswert in Schritt 260 speichert. In Schritt 270 Übermittelt der Server die neuerlich attribuierte, gesamte Textgrafik an den Client zur Darstellung.
In einer alternativen Ausführung kann das Speichern der Selektionspositionswerte in Schritt 260 direkt im Anschluß an das Übermitteln der Benutzerauswahl in Schritt 250 und Übernehmen oder Berechnen des Selektionspositionswertes daraus erfolgen, und entsprechend kann das
Durchf ühren des Attribuierungsverfahrens der Schritte 100 bis 170 im Anschluß an das Speichern in Schritt 260 durchgeführt werden.
Fig. 3 zeigt eine schematische Übersicht über ein Ausführungsbeispiel einer Anordnung zur Zuordnung von Textattributen, mit einem Computer, der vorliegend als Client ausgebildet ist, und mit einer Vorrichtung zur Zuordnung von Textattributen als Server.
Die als Server 1 ausgebildete Vorrichtung zur Zuordnung von Textattributen weist eine Verarbeitungseinheit 10, eine Kommunikationsschnittstelle 12 und einen Speicher 14 auf, welche alle miteinander kommunikativ gekoppelt sind, etwa durch ein rechnerinternes Bussystem. Falls die Aufgaben zwischen einzelnen Computern verteilt werden, kann die Verbindung zwischen einem Verarbeitungsrechner, einem Kommunikationsgateway und einem Datenbankserver über ein lokales Netzwerk in äquivalenter Weise erfolgen.
Die Verarbeitungseinheit 10 ist insbesondere eingerichtet, die Schritte 100 - 170 des Verfahrens, und, in der vorliegenden Client-Server-Konfiguration, auch die Schritte 200 - 220 und 260 und 270 auszuführen. Hierfür kann die Verarbeitungseinheit auch Funktionen eines Betriebssystems und eines Webservers verwirklichen. Zur Kommunikation über ein Netzwerk bedient sich die Verarbeitungseinheit 10 dabei der Kommunikationsschnittstelle 12, welche beispielsweise zur Kommunikation über Internet via TCP/IP, oder über zelluläre Mobilfunknetze eingerichtet ist.
Im Speicher 14 ist eine erste Computergrafik 18 enthalten oder referenziert, welche Textbestandteile grafisch darstellt. Die Computergrafik 18 ist dabei eine Raster- oder Vektorgrafik, die die Zeichen des Textes durch Pixel oder Vektoren darstellt, ohne den Text zeichencodiert, etwa in einem ASCII-, ISO 8859-1 -, oder Unicode-Format zu enthalten, und wird üblicherweise als Textgrafik bezeichnet.
So kann etwa eine zeilenweise angeordnete Textmenge in der Textgrafik dargestellt sein, die den Textfluß einer Buchseite darstellt.
Ferner ist im Speicher 14 eine zweite Computergrafik 16 (Overlay-Grafik) enthalten oder referenziert, welche eine farbige Fläche oder Textur oder eine andere grafische Gestaltung aufweist, die einer der Textgrafik oder Teilen davon, d.h. Worten darin, zuzuweisenden Attribuierung entsprechen. So kann für eine Attributzuweisung des Attributs „Hervorgehoben" eine farbige, etwa gelbe oder grüne, flächige Textur ausgewählt werden. Die zweite Computergrafik 16 kann dabei opak sein, d.h. einen bestimmten Transparenzgrad aufweisen, der durch einen Alphakanal der Grafik 16 bestimmt sein kann. Der Alphakanal für die Grafik kann intern oder in einer externen Datenhaltung vorliegen. Alternativ kann auch eine nichttransparente Grafik als zweite Computergrafik 16 verwendet werden, wenn die Verarbeitungseinheit 10 ausgebildet ist, den Schritt 170 der Überlagerung der Grafiken so auszuführen, dass im Ergebnis die zweite Grafik als der ersten opak überlagert erscheint.
Der Client 2 ist ein Computer, der einem Benutzer zur Interaktion dient, und der, beispielsweise über einen Web-Client oder ein Anzeigeprogramm für elektronische Dokumente, mit dem Server 1 kommuniziert, um Textgrafiken sowie Programm- oder HTML-Code für die auf dem Client darzustellende Nutzeroberfläche vom Server abzurufen und darzustellen bzw. auszuführen.
Client 2 umfasst dabei eine Verarbeitungseinheit 20, die etwa mit einem programmierten Universalprozessor verwirklicht sein kann, sowie eine damit verbundene Kommunikationsschnittstelle 22 (Network-Stack) und einen Speicher 24, welcher wiederum eine Textgrafik 26 aufweist.
Ferner ist eine Benutzerschnittstelle, beispielsweise eine grafische Benutzerschnittstelle (GUI), die durch ein Zeigegerät oder einen Touch-Screen bedient wird, im Client 2 enthalten oder mit diesem verbunden. Die Textgrafik 26 wird über die Benutzerschnittstelle 28 zusammen mit entsprechenden Auswahl- und Menüoptionen dem Nutzer dargestellt und es werden durch die Benutzerschnittstelle Befehle des Benutzers entgegengenommen, indem aus den Nutzeraktionen entsprechende Befehlswerte gewonnen werden.
Die Verarbeitungseinheit 20 ist insbesondere eingerichtet, mit dem Server zu interagieren und die Schritte 230 bis 250 des Verfahrens auszuführen. Ferner ist die Verarbeitungseinheit ausgebildet, eine Nutzeridentifikation zu erfassen und an den Server 1 zu übermitteln, der daraufhin eine Benutzersitzung eröffnet und nutzerspezifisch gespeicherte Werte abruft.
Fig. 4 zeigt eine Veranschaulichung eines ersten Aspektes des Markierungsvorgangs gemäß des Verfahrens der Fig. 1.
Hier sind vier Bereiche A, B, C, D einer Textgrafik dargestellt, die eine Doppelseite eines aufgeschlagenen Buches mit zeilenweise fließendem Text zeigt. Die vier Bereiche A, B, C und D sind jeweils Bereiche, in denen dem darin dargestellten Text das Attribut „Hervorhebung" verfahrensgemäß zugeordnet wurde. Wie in der Figur dargestellt, ist dem attribuierten Textteil der Grafik eine grau dargestellte grafische Kennzeichnung hinzugefügt worden, wobei die grau dargestellten Teile zugleich den verfahrensgemäß bestimmten Attribuierungsbereich der Textgrafik kennzeichnen. Zur Verdeutlichung ist zudem für jeden der Bereiche noch der zugehörige Selektionspositionswert verdeutlicht, der vorliegend jeweils aus zwei Koordinatentupeln besteht. Es ist dies für den Bereich A der Punkt 40 als Startkoordinatentupel der Markierung und Punkt 42 als Endkoordinatentupel, für den Bereich B der Punkt 44 als Startkoordinatentupel der Markierung und Punkt 46 als Endkoordinatentupel, für den Bereich C der Punkt 48 als Startkoordinatentupel der Markierung und Punkt 50 als Endkoordinatentupel, und schließlich für den Bereich D der Punkt 52 als Startkoordinatentupel der Markierung und Punkt 54 als Endkoordinatentupel.
Insbesondere am Bereich C wird anschaulich, dass auch Worte und Bereiche der Textgrafik attribuiert wurden, die nicht in einem durch Start- und Endkoordinatentupel aufgespannten Fangrechteck mindestens teilweise enthalten sind, sondern vollständig außerhalb liegen. Ferner ist hier sichtbar, dass die attribuierten Grafikbereiche alle gleich hoch sind, und nicht mit der tatsächlichen Worthöhe variieren. Dies wird dadurch sichergestellt, dass der
Attribuierungsbereich grundsätzlich unabhängig von der tatsächlichen Worthöhe berechnet wird.
In Varianten des Verfahrens kann die Berechnung des zu attribuierenden Textgrafikbereiches für jedes einzelne Wort auch schon in die Bestimmung des Wortpositionswertes des jeweiligen Wortes vorgezogen werden, etwa indem für jedes einzelne Wort dabei eine Umgrenzung als Wortpositionswert bestimmt wird, die mit dem weiter oben definierten Attribuierungsbereich des jeweiligen Wortes übereinstimmt. In diesem Fall kann der Wortpositionswert direkt als Attribuierungsbereich des jeweiligen Wortes übernommen werden, und es wird in Schritt 140 dann nur noch der Gesamtattribuierungsbereich für die Gesamttextgrafik bestimmt.
Fig. 5 zeigt eine Veranschaulichung eines zweiten Aspektes des Markierungsvorgangs gemäß des Verfahrens der Fig. 1 , insbesondere der einzelnen Bereiche, Positionswerte und Koordinatentupel zueinander.
In einer Textgrafik mit mehreren Worten ist durch ein erstes Koordinatentupel eines Selektionspositionswertes ein Startpunkt 60 einer Auswahl durch einen Benutzer gegeben, und durch ein zweites Koordinatentupel desselben Selektionspositionswertes ein Endpunkt 62 der Auswahl. Der Auswahlbereich kann somit als ein rechteckiger Selektionsbereich 70 angesehen werden. Im Unterschied zum herkömmlichen Fangrechteck aber werden wegen der besonderen Fallunterscheidungen in Schritt 130 nicht bloß Worte einbezogen, die mindestens teilweise in das Rechteck fallen, wie auch in Fig. 4 für Bereich C veranschaulicht. Fig. 5 zeigt insofern einen Spezialfall, bei dem das „Testwort" genau in den Selektionsbereich 70 fällt.
Entsprechend ist vorliegend durch ein erstes Koordinatentupel eines
Wortpositionswertes eine obere linke Ecke 64 eines Wortes gegeben, und durch ein zweites Koordinatentupel desselben Wortpositionswertes eine untere linke Ecke 66 des Wortes, wodurch ein (gepunktet umrissen dargestellter) rechteckiger Wortbereich 68 aufgespannt wird.
Hierfür wird entsprechend ein den Wortbereich 68 mit einem Abstandsbereich umgebender Attribuierungsbereich 72 (hier als Kasten dargestellt) berechnet. Der Abstandsbereich wird etwa so bemessen, dass er so hoch ist, wie das maximal hohe Wort der gleichen Schriftart und Schriftgröße des zu attribuierenden Wortes sein kann. Dabei kann als Breite die Breite des Wortbereiches übernommen werden, oder es kann ein am Wortabstand orientierter horizontaler Abstandsbereich zwischen Wortbereich und Rand des Attribuierungsbereiches hinzugerechnet werden.
Fig. 6 zeigt eine Veranschaulichung eines dritten Aspektes des Markierungsvorgangs gemäß des Verfahrens der Fig. 1.
Die durch die Bezugszeichen referenzierten Elemente entsprechen denen der Figur 5, jedoch wird hier noch ein mal der Fall detailliert dargestellt, bei dem ein Wort mit seinem Wortbereich vollständig außerhalb des durch den Selektionspositionswert gebildeten Rechtecks liegt.
Ein entsprechender Eintrag zur Speicherung der Selektionen und /oder Attribuierungen kann in einer Benutzer- oder Benutzersitzungsdatenbank etwa unter Verwendung von Feldern jeweils für eine Dokumentenkennung zur Identifikation des Dokumentes, welches durch die Textgrafik dargestellt wird, eine Seitenkennung zur Identifikation der Dokumentseite, ein
Startkoordinatentupel des Selektionspositionswertes, ein Endkoordinatentupel des Selektionspositionswertes, ein Koordinatentupel einer linken oberen Ecke des Wortpositionswertes, ein Koordinatentupel einer rechten unteren Ecke des Wortpositionswertes, sowie eines Zeitstempels erfolgen.
Das vorliegende System stellt somit die Möglichkeit bereit, Text in Textgrafiken, der nicht zeichencodiert vorliegt, sondern rein grafisch in der Textgrafik dargestellt wird, mit Attributen wie Hervorhebung oder Umrahmung zu versehen, ohne hierfür einer parallelen Vorhaltung des Textes in zeichencodierter Form zu bedürfen, und ohne, dass die der Attribuierung zu
unterziehende Text der Textgrafik mit den herkömmlichen Markierungsmethoden für Computergrafiken ausgewählt werden muss.
Hierdurch kann die Auswahl des zu attribuierenden Textes etwa durch einen Startpunkt und einen Endpunkt einer Markierung definiert werden und es erübrigt sich die genaue Positionierung eines Fangrechtecks um jeden der zu markierenden Textteile herum. Ein Benutzer kann somit eine Markierung etwa durch lediglich zwei Mausklicks vornehmen, und erhält, etwa bei einer dargestellten Buchseite, eine Markierung aller im Textfluss stehenden Wörter zwischen den beiden Punkten. Ein Nutzer kann mit dem vorliegenden System ferner alle Attribuierungen im Rahmen einer Benutzersitzung speichern und sie in einer späteren Benutzersitzung wiederherstellen lassen. Bei einer Nutzung durch mehrere Nutzer wird im vorliegenden System lediglich die Selektionsund Attribuierungsinformation gespeichert, sodass die Attribuierung einerseits für jeden Nutzer individuell und unterschiedlich wiederhergestellt werden kann, andererseits aber eine Mehrfachspeicherung der attribuierten Textgrafiken vermeidet, da jeweils die Attribuierung auf Basis der ursprünglichen Textgrafik wiederhergestellt wird, und somit bei einer Vielzahl von Nutzern erheblich ressourcensparend wird. Das Überlagern der Textgrafik mit der opaken grafischen Darstellung des Textattributes kann zudem den visuellen Eindruck verbessern. Das System kann dabei leicht so weitergebildet werden, dass sich eine Markierung über mehrere dargestellte Seiten Textgrafik erstreckt, indem die Markierung auf einer ersten Seite bis zum letzten Wort der letzten Zeile geführt wird, indem dort ein Endpunkt eingefügt wird, und auf der folgenden Seite am ersten Wort der ersten Zeile wieder beginnt, indem dort ein Startpunkt eingefügt wird.
Wie der Fachmann aus den vorausgegangenen Darstellungen und Erläuterungen erkennt, kann der solcherart attribuierte Text im Darstellungszusammenhang einer aufgeschlagenen Buchseite mit textuellen und sonstigen Inhalten stehen. So kann beispielsweise die in Fig. 3 dargestellte Benutzerschnittstelle 28, die als GUI ausgebildet sein kann, einen wie in Fig. 4 dargestellten Buchtext anzeigen.
Die in der Vorrichtung 1, die als Server oder als Web-Server ausgebildet sein kann, auszuführenden Schritte (vgl. Fig. 2 und die Beschreibung hierzu) können durch eine Software verwirklicht sein, die Anweisungen enthält, die jeweiligen Schritte auszuführen, und die im Speicher 14 enthalten ist. Entsprechend können die in dem Computer 2, der als Client oder als Web-Client ausgebildet sein kann, auszuführenden Schritte (vgl. ebenfalls Fig. 2 und die Beschreibung hierzu) durch eine Software verwirklicht sein, die Anweisungen enthält, die jeweiligen Schritte auszuführen, und die im Speicher 24 enthalten ist. Die Software kann hierbei durch einen Universalprozessor ausgeführt werden, oder zusätzlich in Rückgriff auf durch Zusatzsoftware bereitgestellten spezifischen Funktionalitäten. So kann auf der Seite des Computers die Darstellung im funktionalen Zusammenhang mit einem auf dem Computer installierten WebBrowser erfolgen, oder mit anderen, proprietären Anzeigeprogrammen, etwa, wenn der Computer durch ein mobiles Endgerät, wie ein Mobiltelefon verwirklicht ist.
Die auf dem Computer 2 auszuführende Software kann vorinstalliert werden, etwa als Plug-In-Modul einer Anzeigesoftware oder als Browser-Plug-In, oder sie kann, im Falle eines Web-Browsers, auch durch Übermittlung von in einer WWW-Seite eingebetteten Programmanweisungen auf den Computer gelangen bzw. in darin enthaltene Programme integriert werden. Im letzteren Fall werden durch die mit der WWW-Seite eingebetteten Programmanweisungen im Browser enthaltene Funktionen aufgerufen, wie beispielsweise JavaScript- Funktionen. Wie der Fachmann ohne weiteres erkennt, ist somit die Erfindung nicht auf die Verwendung von Plug-ins beschränkt.
Bezugszeichenliste
1 Vorrichtung zur Zuordnung von Textattributen (Server)
2 Benutzercomputer (Client) 10 Verarbeitungseinheit
12 Kommunikationsschnittstelle
14 Speicher
16 zweite Computergrafik (Textattribut-Overlay)
18 erste Computergrafik mit Textgrafik 20 Verarbeitungseinheit
22 Kommunikationsschnittstelle
24 Speicher
26 Überlagerte Computergrafik
28 Benutzerschnittstelle 40 Startpunkt Selektionsbereich A
42 Endpunkt Selektionsbereich A
44 Startpunkt Selektionsbereich B
46 Endpunkt Selektionsbereich B
48 Startpunkt Selektionsbereich C 50 Endpunkt Selektionsbereich C
52 Startpunkt Selektionsbereich D
54 Endpunkt Selektionsbereich D
60 Startpunkt Selektionsbereich
62 Endpunkt Selektionsbereich
64 Erster Eckpunkt Wortbereich 66 Zweiter Eckpunkt Wortbereich
68 Wortbereich
70 Selektionsbereich
72 Attribuierungsbereich eines Wortes
100 Auswählen der ersten Computergrafik (Textgrafik) 110 Bestimmen der Wortpositionswerte
120 Auswerten des Selektionspositionswertes
130 Prüfen, ob Worte in Grafik durch Selektion erfasst
140 Bestimmen des Attribuierungsbereiches
150 Bestimmen des Attribuierungstyps 160 Auswählen der zweiten Computergrafik (Attribut-Overlay)
170 Überlagern der Computergrafiken
200 Eröffnen einer Benutzersitzung
210 Abrufen gespeicherter Selektionspositionswerte
220 Übermitteln der überlagerten Computergrafik 230 Darstellen der Computergrafik
240 Erfassen der Benutzerauswahl
250 Übermitteln der Benutzerauswahl
260 Speichern des Selektionspositionswertes
270 Übermitteln der überlagerten Computergrafik
Claims
1. Verfahren zur Zuordnung von Textattributen zu einer in einer
Computergrafik enthaltenen, grafischen Darstellung von Text, mit den folgenden Schritten:
Auswählen einer ersten Computergrafik, welche eine grafische Darstellung von Text aufweist;
Bestimmen mindestens eines Wortpositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes;
Auswerten mindestens eines Selektionspositionswertes, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist;
Prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des
Selektionspositionswertes;
Bestimmen eines Attribuierungsbereiches der ersten Computergrafik auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes;
- Modifizieren der ersten Computergrafik mindestens im
Attribuierungsbereich.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass der
Selektionspositionswert während einer ersten Benutzersitzung auf Basis einer Benutzerinteraktion bestimmt wird und in einem Speicher abgelegt wird.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass der Selektionspositionswert während einer zweiten Benutzersitzung aus dem Speicher abgerufen wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass ein Attribuierungstyp bestimmt wird, der das zuzuordnende
Textattribut identifiziert.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass eine zweite Computergrafik ausgewählt wird und die erste Computergrafik mit der zweiten Computergrafik überlagert wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die erste
Computergrafik mit der zweiten Computergrafik opak überlagert wird.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass der Attribuierungsbereich bestimmt wird unter Ermittlung des durch die grafische Wortdarstellung beanspruchten Bereiches der ersten Computergrafik.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass der Selektionspositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Selektionsbereiches bilden.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass der Wortpositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Wortbereiches bilden.
12. Verfahren nach den Ansprüchen 9 und 11, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise im Selektionsbereich liegt.
13. Verfahren nach den Ansprüchen 9 und 11 oder nach Anspruch 12, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise zwischen der vertikalen Koordinate des ersten Koordinatentupels des Selektionspositionswertes und der vertikalen Koordinate des zweiten Koordinatentupels des Selektionspositionswertes liegt.
14. Vorrichtung zur Zuordnung von Textattributen zu einer in einer
Computergrafik enthaltenen, grafischen Darstellung von Text nach dem Verfahren nach einem der Ansprüche 1 bis 13, mit einer
Verarbeitungseinheit und einem Speicher,
dadurch gekennzeichnet, dass
der Speicher eine erste Computergrafik enthält, welche eine grafische Darstellung von Text aufweist;
- die Verarbeitungseinheit ausgebildet ist, mindestens einen
Wortpositionswert zu bestimmen, welcher ein auf die erste Computergrafik bezogenes Koordinatentupel aufweist, für ein Wort des in der ersten Computergrafik dargestellten Textes;
die Verarbeitungseinheit ausgebildet ist, mindestens einen Selektionspositionswert auszuwerten, welcher ein auf die erste
Computergrafik bezogenes Koordinatentupel aufweist; die Verarbeitungseinheit ausgebildet ist, zu prüfen, ob der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, unter Vergleich der Koordinatentupel des Wortpositionswertes und des Selektionspositionswertes;
- die Verarbeitungseinheit ausgebildet ist, einen Attribuierungsbereich der ersten Computergrafik zu bestimmen auf Basis des durch den Selektionspositionswert erfassten Wortpositionswertes;
die Verarbeitungseinheit ausgebildet ist, die erste Computergrafik mindestens im Attribuierungsbereich zu modifizieren.
15. Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, dass ferner eine Kommunikationsschnittstelle enthalten ist, welche ausgebildet ist, einen aus einer Benutzerinteraktion resultierenden Wert zu empfangen, und die Verarbeitungseinheit ausgebildet ist, den Selektionspositionswert während einer ersten Benutzersitzung auf Basis des Wertes zu bestimmen und in dem Speicher abzulegen.
16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, den Selektionspositionswert während einer zweiten Benutzersitzung aus dem Speicher abzurufen.
17. Vorrichtung nach einem der Ansprüche 14 bis 16, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, einen Attribuierungstyp zu bestimmen, der das zuzuordnende Textattribut identifiziert.
18. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, eine zweite Computergrafik auszuwählen.
19. Vorrichtung nach Anspruch 18, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, die erste Computergrafik mit der zweiten Computergrafik opak zu überlagern.
20. Vorrichtung nach einem der Ansprüche 14 bis 19, dadurch gekennzeichnet, dass die Verarbeitungseinheit ausgebildet ist, den
Attribuierungsbereich unter Ermittlung des durch die grafische Wortdarstellung beanspruchten Bereiches der ersten Computergrafik zu bestimmen.
21. Vorrichtung nach einem der Ansprüche 14 bis 20, dadurch gekennzeichnet, dass der Selektionspositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
22. Vorrichtung nach Anspruch 21 , dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Selektionsbereiches bilden.
23. Vorrichtung nach einem der Ansprüche 14 bis 22, dadurch gekennzeichnet, dass der Wortpositionswert ein zweites auf die erste Computergrafik bezogenes Koordinatentupel aufweist.
24. Vorrichtung nach Anspruch 23, dadurch gekennzeichnet, dass das erste und das zweite Koordinatentupel diagonal gegenüberliegende Punkte eines rechteckigen Wortbereiches bilden.
25. Vorrichtung nach den Ansprüchen 22 und 24, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich mindestens teilweise im Selektionsbereich liegt.
26. Vorrichtung nach den Ansprüchen 22 und 24 oder nach Anspruch 25, dadurch gekennzeichnet, dass der Wortpositionswert für das Wort durch den Selektionspositionswert erfasst ist, wenn der Wortbereich zwischen der vertikalen Koordinate des ersten Koordinatentupels des Selektionspositionswertes und der vertikalen Koordinate des zweiten Koordinatentupels des Selektionspositionswertes liegt.
27. Anordnung zur Zuordnung von Textattributen zu einer in einer
Computergrafik enthaltenen, grafischen Darstellung von Text, mit einer als Server ausgebildeten Vorrichtung nach einem der Ansprüche 14 bis 26 und einem mit dem Server über ein Netzwerk verbindbaren Client, wobei:
die Verarbeitungseinheit des Servers ausgebildet ist, eine erste Computergrafik, welche eine grafische Darstellung von Text aufweist, über eine im Server enthaltene Kommunikationsschnittstelle über das Netzwerk an den Client zu übermitteln;
der Client ausgebildet ist, die erste Computergrafik über eine im Client enthaltene Benutzerschnittstelle darzustellen, eine Benutzerinteraktion entgegenzunehmen, und den daraus resultierenden Wert über eine im Client enthaltene
Kommunikationsschnittstelle über das Netzwerk an den Server zu übermitteln,
und die Verarbeitungseinheit des Servers ausgebildet ist, den Selektionspositionswert auf Basis des übermittelten Wertes auszuwerten, und die aus der Modifizierung entstandene
Computergrafik an den Client zu übermitteln.
28. Auf einem computerlesbaren Speichermedium gespeichertes Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 13 durch einen Computer.
29. In einer digitalen Trägerwelle verkörpertes Computerprogrammprodukt mit computerlesbaren Programmmitteln zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 13 durch einen Computer.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/867,696 US20100318900A1 (en) | 2008-02-13 | 2009-02-09 | Method and device for attributing text in text graphics |
EP09711265A EP2252942A1 (de) | 2008-02-13 | 2009-02-09 | Verfahren und vorrichtung zur textattribuierung in textgrafiken |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102008009442.0 | 2008-02-13 | ||
DE102008009442A DE102008009442A1 (de) | 2008-02-13 | 2008-02-13 | Verfahren und Vorrichtung zur Textattribuierung in Textgrafiken |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US12/867,540 A-371-Of-International US8619434B2 (en) | 2008-02-13 | 2009-02-12 | Arrangement system |
US14/085,504 Division US9622371B2 (en) | 2008-02-13 | 2013-11-20 | Arrangement system |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2009100913A1 true WO2009100913A1 (de) | 2009-08-20 |
Family
ID=40651295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/EP2009/001001 WO2009100913A1 (de) | 2008-02-13 | 2009-02-09 | Verfahren und vorrichtung zur textattribuierung in textgrafiken |
Country Status (4)
Country | Link |
---|---|
US (1) | US20100318900A1 (de) |
EP (1) | EP2252942A1 (de) |
DE (1) | DE102008009442A1 (de) |
WO (1) | WO2009100913A1 (de) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8786556B2 (en) | 2009-03-12 | 2014-07-22 | Nokia Corporation | Method and apparatus for selecting text information |
US20130031460A1 (en) * | 2011-07-29 | 2013-01-31 | Konica Minolta Laboratory U.S.A., Inc. | Using a common input/output format to generate a page of an electronic document |
CN104281399B (zh) * | 2013-07-12 | 2017-08-25 | 英业达科技有限公司 | 依据手势翻译对应目标文字的系统及其方法 |
US9898310B2 (en) * | 2013-10-16 | 2018-02-20 | International Business Machines Corporation | Symmetrical dimensions in context-oriented programming to optimize software object execution |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001090928A1 (en) | 2000-05-24 | 2001-11-29 | Goreader, Inc. | Method, apparatus, and system for manipulation of electronic content |
US6551357B1 (en) | 1999-02-12 | 2003-04-22 | International Business Machines Corporation | Method, system, and program for storing and retrieving markings for display to an electronic media file |
US20040100498A1 (en) | 2002-11-21 | 2004-05-27 | International Business Machines Corporation | Annotating received world wide web/internet document pages without changing the hypertext markup language content of the pages |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5623681A (en) | 1993-11-19 | 1997-04-22 | Waverley Holdings, Inc. | Method and apparatus for synchronizing, displaying and manipulating text and image documents |
CN1059303C (zh) | 1994-07-25 | 2000-12-06 | 国际商业机器公司 | 在个人通讯设备的显示屏幕上标记文本的装置和方法 |
US7031553B2 (en) * | 2000-09-22 | 2006-04-18 | Sri International | Method and apparatus for recognizing text in an image sequence of scene imagery |
US20060062453A1 (en) * | 2004-09-23 | 2006-03-23 | Sharp Laboratories Of America, Inc. | Color highlighting document image processing |
US7796837B2 (en) * | 2005-09-22 | 2010-09-14 | Google Inc. | Processing an image map for display on computing device |
US20100254606A1 (en) * | 2005-12-08 | 2010-10-07 | Abbyy Software Ltd | Method of recognizing text information from a vector/raster image |
DE102006059659B4 (de) * | 2006-12-18 | 2009-12-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild |
US8520983B2 (en) * | 2009-10-07 | 2013-08-27 | Google Inc. | Gesture-based selective text recognition |
-
2008
- 2008-02-13 DE DE102008009442A patent/DE102008009442A1/de not_active Ceased
-
2009
- 2009-02-09 US US12/867,696 patent/US20100318900A1/en not_active Abandoned
- 2009-02-09 EP EP09711265A patent/EP2252942A1/de not_active Withdrawn
- 2009-02-09 WO PCT/EP2009/001001 patent/WO2009100913A1/de active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6551357B1 (en) | 1999-02-12 | 2003-04-22 | International Business Machines Corporation | Method, system, and program for storing and retrieving markings for display to an electronic media file |
WO2001090928A1 (en) | 2000-05-24 | 2001-11-29 | Goreader, Inc. | Method, apparatus, and system for manipulation of electronic content |
US20040100498A1 (en) | 2002-11-21 | 2004-05-27 | International Business Machines Corporation | Annotating received world wide web/internet document pages without changing the hypertext markup language content of the pages |
Non-Patent Citations (2)
Title |
---|
ANONYMOUS: "Skim - PDF reader and annotation software", OPENWETWARE.ORG, 13 October 2007 (2007-10-13), XP002529707, Retrieved from the Internet <URL:http://openwetware.org/index.php?title=Skim_-_PDF_reader_and_annotation_software&oldid=158232> [retrieved on 20090528] * |
THOMAS MERZ: "Die Postscript- & Acrobat-Bibel", 1996, TMVERLAG, MÜNCHEN, ISBN: 3-9804943-0-6, XP002529708 * |
Also Published As
Publication number | Publication date |
---|---|
EP2252942A1 (de) | 2010-11-24 |
US20100318900A1 (en) | 2010-12-16 |
DE102008009442A1 (de) | 2009-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69610882T2 (de) | Blockselektionsystem, bei dem überlappende Blöcke aufgespaltet werden | |
DE69619606T2 (de) | Merkmalermittlungsanlage | |
DE69426615T2 (de) | Vorrichtung und Verfahren zum Verarbeiten von Dokumenten | |
DE60116343T2 (de) | Webserver | |
DE3729023C2 (de) | Bildbearbeitungsgerät | |
DE19507780B4 (de) | Vorrichtung zur verteilten Bildverarbeitung | |
EP2050023B1 (de) | Verfahren zum analysieren und/oder testen zumindest einer benutzeroberfläche, datenverarbeitungseinrichtung und computerprogrammprodukt | |
DE602004005216T2 (de) | Dokumentenscanner | |
DE69605255T2 (de) | Vorrichtung und Verfahren für die Extraktion von Artikeln eines Dokuments | |
EP2289022B1 (de) | Verfahren und vorrichtung zur automatischen ermittlung von steuerelementen in computeranwendungen | |
DE10135445A1 (de) | Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage | |
DE3335162A1 (de) | Vorrichtung und verfahren fuer graphische darstellungen mittels computern | |
EP3695293A1 (de) | Verfahren zur bereitstellung einer haptischen rückmeldung an einen bediener einer berührungssensitiven anzeigeeinrichtung | |
EP3570164B1 (de) | Verfahren und system zum generieren einer mobilen applikation aus einer desktop-anwendung | |
DE202012013457U1 (de) | Sammeln von Feedback von Benutzern zu den Internetseiten | |
DE102013203526A1 (de) | Verfahren und System für die Verwendung von Einstellungs-Handles zur Erleichterung der dynamischen Layout-Editierung | |
DE69230392T2 (de) | Verfahren und Gerät zur Bildverarbeitung | |
DE112021000371T5 (de) | Digitale bildbearbeitung | |
WO2009100913A1 (de) | Verfahren und vorrichtung zur textattribuierung in textgrafiken | |
DE3914905C2 (de) | ||
DE69808582T2 (de) | Verfahren zur Dimensionierung eines auf einem Bildschirm angezeigten graphischen Objekts | |
WO2009103620A1 (de) | Verfahren und vorrichtung zur seitenweisen bereitstellung eines elektronischen dokumentes als computergrafik | |
EP3119035B1 (de) | Verfahren zum überprüfen von netzwerkeinrichtungen und netzwerk | |
EP1256043B1 (de) | Verfahren und datenverarbeitungssystem zur koordinierung von anwendungen einer computer-software | |
DE102018115630B4 (de) | Verfahren zum Erstellen und Betreiben einer Website mit Eingabemöglichkeit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 09711265 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 12867696 Country of ref document: US |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2009711265 Country of ref document: EP |