WO2019098107A1 - 翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法 - Google Patents

翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法 Download PDF

Info

Publication number
WO2019098107A1
WO2019098107A1 PCT/JP2018/041374 JP2018041374W WO2019098107A1 WO 2019098107 A1 WO2019098107 A1 WO 2019098107A1 JP 2018041374 W JP2018041374 W JP 2018041374W WO 2019098107 A1 WO2019098107 A1 WO 2019098107A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
translation
display
image
information
Prior art date
Application number
PCT/JP2018/041374
Other languages
English (en)
French (fr)
Inventor
星 今井
Original Assignee
株式会社I.Meisters
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社I.Meisters filed Critical 株式会社I.Meisters
Publication of WO2019098107A1 publication Critical patent/WO2019098107A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Definitions

  • the present disclosure relates to a translation support apparatus configured using an information processing apparatus to support a translation operation by a translator, a translation support program executed on the information processing apparatus, and a method for supporting translation.
  • the translator or layout worker needs a lot of time and is inefficient because it needs to do the following work. For example, it has been necessary to confirm the correspondence between original text and translated text in the layout image while visually comparing the text in which the original text and the translated text are shown in a bilingual form with the layout image for each page. Also, the final layout and image after translation were created by translators and layout workers while thinking in their minds. Therefore, not only the work efficiency is not good, but as a result of arranging the created translated text in the layout of each page, if the final finish feels strange, the translator re-translates etc. There was also a case where a return occurred.
  • a translation support system described in Patent Document 1 below is configured to input a translation while clearly indicating the original text of the translation designated by the user. In this way, the correspondence between a plurality of translated parts arranged in accordance with the layout of each page of the cartoon and the translated text created by the translator is not deviated.
  • Patent Document 2 below a text range is selected by a block cursor while the layout / image of document data is displayed, and when the format setting key is pressed, the character attribute of the selected text range is selected in a menu format I am able to do it. This enables the editing operation of the text and the change of the character attribute of the edited text while the layout image is displayed.
  • the input content of a translated sentence is not immediately reflected in the layout of each page.
  • a system configuration in which a translated text editing screen is provided separately from the layout / image display screen is not assumed. Therefore, also in the invention described in Patent Document 2, when the translator inputs a translation on the translation editing screen, the input content of the translation is immediately reflected on the corresponding arrangement location of the layout display screen which is another screen.
  • some embodiments according to the present invention can efficiently translate text information layout-arranged page by page, without burdens such as visual confirmation of the layout display, for translation work.
  • An object of the present invention is to obtain a translation support device that is unlikely to cause a return.
  • a translation support apparatus that supports translation of original text in an electronic publication in which an image and text are mixed
  • a text information extraction unit for extracting a text display area displayed in the image of the electronic publication and extracting text information representing the character string and character attribute of the original text together with the area information; the text from the electronic publication
  • An image extraction unit that extracts the image that does not contain the image, a form display unit that displays a translated sentence editing form on which the translated sentence for each text display area can be edited from the text information, and an input to the translated sentence editing form
  • To display the screen by superimposing the edited translation on the image according to the display layout defined by the area information and the character attribute Includes a layout display unit that, the.
  • a series of processing steps for supporting translation of original text in an electronic publication in which images and text are mixed is provided.
  • the translation support program which causes the computer device to execute, upon receiving the electronic publication as input, extracts the text display area displayed in the image, and a text representing the character string and character attribute of the original text together with the area information Extracting information, extracting the image not containing the text from the electronic publication, displaying on the screen a translation editing form capable of editing a translation for each of the text display areas from the text information; And a display level defined by the area information and the character attribute in response to an input to the translation editing form. According out, and a step of screen display by superimposing the translation edited in the image.
  • an information processing apparatus is used to support translation of original text in an electronic publication in which an image and text are mixed.
  • the method to be executed extracts the text display area displayed in the image when the electronic publication is input to the information processing apparatus, and the text representing the character string and character attribute of the original text together with the area information Extracting information, extracting the image not containing the text from the electronic publication, displaying on the screen a translation editing form capable of editing a translation for each of the text display areas from the text information; After editing according to the display layout defined by the area information and the character attribute in response to the input to the translation editing form And a step of displaying on the display screen by superimposing the translation in the image.
  • FIG. 1 is a communication network configuration diagram illustrating a translation assistance system configured to include a translation assistance device according to some embodiments for implementation of the present invention. It is a block diagram which shows the exemplary structure of the translation assistance apparatus which concerns on some embodiment of this invention. It is a figure which shows exchange of the data and information between the terminal in which a translator is working, and a translation assistance apparatus. It is a figure which shows the flow of the process which each function part which comprises a translation assistance apparatus, and a translator terminal perform. It is a figure which shows an example of the layout image of the cartoon before translation.
  • FIG. 6 is a view showing an arrangement of text boxes including images after excluding text information and excluded texts in the layout image shown in FIG. 5; FIG.
  • FIG. 8 is a diagram showing a parallel translation screen for editing a translation sentence and a display screen on which an editing operation of a translation sentence is immediately reflected in a layout image.
  • FIG. 5 is a diagram showing an exemplary configuration in which a translation support system is configured using only a single stand-alone computer device according to an alternative embodiment of the present invention.
  • FIG. 6 is a diagram comparing a procedure conventionally performed for a cartoon translation operation with a procedure performed according to some embodiments of the present invention. It is a display screen of parallel translation data of a tabular form provided to a translator in accordance with the procedure conventionally performed for the translation work of a cartoon. It is a figure which shows a mode that the original text in a layout image is manually substituted with a translation sentence according to the procedure conventionally performed for the translation operation of a comics.
  • Steps 101 to 105 in FIG. 9 are examples of workflows conventionally performed for translating a cartoon.
  • the clerk 91 receiving the cartoon data as an electronic file having a standardized file format in step 101 of FIG. 9 creates a bilingual table as shown in FIG. 10 in step 102. Specifically, data is created in which the character strings included in the cartoon are embedded in the table shown in FIG.
  • the translator 93 receiving the data of the bilingual table from the clerk 91 prepares a corresponding translation by filling the table while looking at the layout image for each page.
  • step 104 the layout operator 95 replaces the individual original texts in the layout image with the corresponding translated sentences using graphics creation software or the like. For example, in the example shown in FIG. 11, the original texts placed in the text boxes 77 and 78 are manually replaced with translated sentences (32 (x) and 32 (y) shown in FIG. 11).
  • step 105 an electronic file for electronic publication of a cartoon in which the clerk 97 is translated from the layout image completed by such an operation is generated.
  • steps 101 to 105 shown in FIG. 9 the translator 93 visually checks where in the layout image each sentence corresponding to each row in the bilingual table shown in FIG. It took a lot of work time to find it. Similarly, the layout worker 95 has to look for the location of the corresponding original text in the layout image shown in FIG. .
  • the translator has created the final translation result while thinking in a head, in order to compare the correspondence translation and the layout image with the naked eye. Therefore, if the translator sees the result that the translation is embedded in the layout and image and notices the difference in the nuance between the corresponding original text and the translation, there is a relapse for retranslation. It happened also.
  • the layout worker 95 is not a translation expert and does not know the translated language. For example, the layout worker 95 can not find a linguistic problem such as improper line feed position or punctuation mark in a translated sentence, and can not perform layout in consideration of language-specific nuances after translation. .
  • the layout worker 95 and the clerks 91 and 97 having skills and experiences different from the translation skills must be involved, and the translator 93 alone is for translation. It was not possible to carry out the whole process.
  • the layout worker 95 has the skills and experience as an artist and designer who can make full use of a dedicated tool for layout, and in the processes 101 to 105, they have skills and experiences other than such translation. Involvement of the elderly was also necessary.
  • FIG. 1 is a communication network configuration diagram illustrating a translation support system 1 configured to include a translation support device 10 according to the first embodiment.
  • FIG. 2 is a block diagram showing an exemplary configuration of the translation assistance device 10 according to the first embodiment.
  • the translation support system 1 includes communication networks 6a and 6b connected to the translation support apparatus 10, and the communication networks 6a and 6b are the same communication network even though they are separate communication networks. It may be Also, the communication networks 6a and 6b may be configured as single virtual networks as separate virtual networks using VPN technology and tunneling technology.
  • a plurality of terminals 2 (2a, 2b) and a plurality of terminals 3 (3a to 3c) may be connected to the communication network 6a as information terminals capable of communicating with the translation support device 10.
  • the terminal 2 may be an information terminal used by a creator who wishes to request translation of a cartoon created by himself to a foreign language in order to expand sales channels abroad.
  • the terminal 2 may be an information terminal of a publisher who wishes to request a translation of a cartoon on behalf of the creator of the cartoon.
  • the creator or the publisher may operate the terminal 2 to transmit computerized cartoon data to which a request for translation is requested from the terminal 2 to the translation support device 10.
  • the terminal 3 may be configured as a translator terminal used for the translator to edit the cartoon data held by the translation support device 10 remotely via the communication network 6a.
  • a plurality of terminals 5 used by the consumer to purchase on-line the cartoon data translated into the foreign language using the translation support device 10 are connected.
  • an electronic commerce system 4 for receiving the translated cartoon data transmitted from the translation support device 10 for online sale is connected.
  • the electronic commerce system 4 is configured such that a consumer who has purchased the translated cartoon data received from the translation support device 10 as a product can download the translated cartoon data to the terminal 5 operated by the consumer. ing.
  • the translation support apparatus 10 is configured as an information processing apparatus for supporting the translator's work of translating original texts in cartoon data in which images and texts are mixed.
  • the translation support device 10 may be realized by connecting a server device having a memory and a CPU to the communication networks 6a and 6b and causing the CPU to execute dedicated software on the server.
  • the translation support device 10 includes a text information extraction unit 11, an image information extraction unit 12, a form display unit 13, a layout display unit 14, an internal bus 15, and an input / output control unit 16. And is comprised.
  • the translation support device 10 is configured to include a document data storage unit 17a, a text information storage unit 17b, an image information storage unit 17c, and a layout information storage unit 17d.
  • the document data storage unit 17a, the text information storage unit 17b, the image information storage unit 17c, and the layout information storage unit 17d may be collectively referred to as a storage unit 17.
  • the text information extraction unit 11, the image information extraction unit 12, the form display unit 13 and the layout display unit 14 are controlled by the input / output control unit 16 to communicate data and information with the external terminal 2, terminal 3 and electronic commerce system 4 etc. Exchange. Further, when the input / output control unit 16 receives, from the external terminal 2, cartoon data to be requested for translation by the creator, the input / output control unit 16 stores the received cartoon data in the document data storage unit 17 a.
  • the text information extraction unit 11, the image information extraction unit 12, the form display unit 13, the layout display unit 14 and the storage units 17 (17 a to 17 d) exchange data and information with one another via the internal bus 15.
  • the text information extraction unit 11 reads cartoon data, which is an electronic publication, from the document data storage unit 17a. Then, the text information extraction unit 11 identifies the text display area displayed in the read image of the cartoon data. Subsequently, for each of the identified text display areas, the text information extraction unit 11 extracts text information representing the character string and character attribute of the original text as well as the area information and stores the text information in the text information storage unit 17b.
  • this area information may define the display layout by describing the character frame in each of the original text display area and the arrangement of the character frame.
  • the character attribute describes the font type and font size of the character string of the original text for each character, and further describes the orientation of the entire character string to define the display layout described above. It may be When the display layout is defined for each text display area by the above area information, the definition information of the display layout is stored in the layout information storage section 17d by the text information extraction section 11.
  • the image information extraction unit 12 reads the above-described cartoon data from the document data storage unit 17a. Then, the image information extraction unit 12 extracts an image not including text from the read out comic data and stores the image in the image information storage unit 17c.
  • the form display unit 13 reads the text information of the original text extracted for each text display area by the text information extraction unit 11 from the text information storage unit 17 b. Then, the form display unit 13 uses a terminal for the translation editing form 35 capable of editing a translation for each text display area based on the text information received from the text information extraction unit 11 via the text information storage unit 17b. The screen is displayed on the screen 30 of FIG.
  • the translated sentence editing form 35 is configured to display the original text display box 31 in which the original text is displayed and the input box 32 for inputting the translated text on the screen 30 in association with each other in the text display area.
  • the layout display unit 14 After displaying the translation editing form 35, the layout display unit 14 reads the definition information of the display layout from the layout information storage unit 17d, and identifies the area information defined for each text display area. Subsequently, the layout display unit 14 cooperates with the translation editing form 35 by mutually communicating with the translation editing form 35 displayed on the screen of the terminal 3 via the communication network 6 a. By this cooperative operation, the layout display unit 14 reflects the translation edited by the translation editing form 35 in the layout image 33 displayed on the screen 30 of the terminal 3.
  • the layout display unit 14 identifies the display layout defined by the area information and the character attribute from the information read out from the layout information storage unit 17 d, and executes the following operation in cooperation with the translation editing form 35 Do. That is, in accordance with the input to the input box 32, the layout display unit 14 superimposes the edited translation on the image included in the layout image 33 and displays the screen according to the display layout identified as described above. At that time, in accordance with the input operation by the translator in the input box 32, the input content is reflected in the corresponding text area in accordance with the display layout described above.
  • the input / output control unit 16 stores the received cartoon data in the document data storage unit 17a when the creator receives cartoon data to be requested for translation from the external terminal 2 (see FIG. 4). See m1 and m2 in FIG. 4).
  • the text information extraction unit 11 reads cartoon data, which is an electronic publication, from the document data storage unit 17a (see m3 in FIG. 4). Then, the text information extraction unit 11 starts the execution of step S10 and identifies the text display area displayed in the image of the read comic data. Subsequently, for each of the identified text display areas, the text information extraction unit 11 extracts text information representing the character string and character attribute of the original text together with the area information.
  • the definition information of the display layout is output from the text information extraction unit 11 to the layout display unit 14 via the storage unit 17 (FIG. 4) see m6).
  • the image information extraction unit 12 reads the above-described cartoon data from the document data storage unit 17a (see m4 in FIG. 4). Then, the image information extraction unit 12 executes step S11 and extracts an image not including text from the read comic data. The image not including the extracted text is output from the image information extraction unit 12 to the layout display unit 14 via the storage unit 17.
  • the form display unit 13 receives the text information of the original text extracted for each text display area by the text information extraction unit 11 from the text information extraction unit 11 via the storage unit 17 (see m5 in FIG. 4).
  • the form display unit 13 executes step S12, and generates the translation editing form 35 based on the received text information.
  • the translation editing form 35 generated in step S12 displays the original text display box 31 in which the original text is displayed for each text display area and the input box 32 for inputting a translated text on the screen 30 in association with each other. It is configured.
  • the form display unit 13 executes step S13 and embeds the original text received from the text information extraction unit 11 in the original display box 31 of the translation editing form 35. Finally, the form display unit 13 transmits the generated translation editing form to the terminal 3 (see m8 in FIG. 4) and causes the screen 30 of the terminal 3 to be displayed.
  • the layout display unit 14 starts execution of step S14 and performs layout analysis processing for identifying a display layout defined by the area information and the character attribute from the text information received from the text information extraction unit 11 via the storage unit 17. . Subsequently, the layout display unit 14 proceeds to step S15 to execute layout on the screen 30 of the terminal 3 based on the text information received from the text information extraction unit 11 and the image information received from the image information extraction unit 12. The image 33 is displayed on the screen (see m9 in FIG. 4).
  • step S16 the translator inputs a translation editing operation in the input box 32, which is a text editing box displayed on the terminal 3.
  • the contents of the editing operation at this time are transmitted from the terminal 3 to the layout display unit (m10 in FIG. 4).
  • step S17 the layout display unit 14 that receives the editing operation indicated by m10 performs a process of reflecting the edited translation on the layout image 33 according to the display layout, in accordance with the editing operation m10.
  • step S17 screen display control data for reflecting the edited translation on the layout image 33 is transmitted from the layout display unit 14 to the terminal 3 (m11 in FIG. 4).
  • the terminal 3 having received the screen display control data indicated by m11 from the layout display unit 14 starts execution of step S18, and updates the display content of the layout image 33 on the screen 30 according to the screen display control data.
  • step S18 the terminal 3 having received the screen display control data indicated by m11 from the layout display unit 14 starts execution of step S18, and updates the display content of the layout image 33 on the screen 30 according to the screen display control data.
  • the translation in the middle of the editing input by the translator in the input box 32 of the translation editing form 35 is replaced with a part of the original text in the corresponding text display area of the layout image 33 displayed on the screen 30. Is displayed.
  • steps S16 to S18 are repeatedly executed until the translator finishes editing the translation and determines the contents of the translation for all text display areas. Then, after steps S19 to S21 are executed as the final editing process of the translated sentence, the translator causes the translator to finish the editing operation of the translated sentence in step S22, and the contents of all the translated sentences are An edit end operation is performed to confirm.
  • step S23 data of all translated sentences determined for all text display areas are transmitted from the terminal 3 to the translation support apparatus 10, and temporarily stored in the storage unit 17 (m14 in FIG. 4).
  • step S23 the input / output control unit 16 reads out the data of all the translated sentences determined for all the text display areas from the storage unit 17 (m15 in FIG. 4), in the layout image of the cartoon Include and complete post-translational cartoon data.
  • the completed translated cartoon data is uploaded from the input / output control unit 16 to the electronic commerce system 4 for online sale (m16 in FIG. 4).
  • the translation work of the text contained in the digitized cartoon data will be simplified as shown in steps 201 to 204. Specifically, in the work flow shown in the right half of FIG. 9, the original cartoon data prepared in step 201 is converted into an electronic file of a data format that can be processed by the translation support device 10 in step 202, At 203, the translator 99 creates translated sentence data using the translation support apparatus 10. Finally, in step 204, the preformatted cartoon data incorporating the translation is converted into an electronic file format for electronic publication and uploaded to the electronic commerce system 4.
  • steps 101 to 105 which are the conventional workflows for translating cartoons
  • steps 201 to 204 according to the above embodiment of the present invention
  • the translation work is greatly streamlined, and many tasks are performed. Is automated.
  • steps 101 to 105 only the translator 99 is required to be involved in the work flow until preparing the translated cartoon data.
  • the text information extraction unit 11 extracts the text display areas 51 to 56 displayed in the layout image shown in FIG. 5 and combines the character string and character attribute of the original text together with the area information corresponding to the text display areas 51 to 56. Extract the text information to represent.
  • the area information corresponding to the text display areas 51 to 56 shown in FIG. 5 corresponds to a text box for editing work for replacing the original text in each area with a translated sentence in the layout image shown in FIG. More specifically, FIG. 6 (a) shows text boxes 71 to 76 for editing work for replacing original texts contained in each of the text display areas 51 to 56 shown in FIG. 5 with translated sentences. .
  • the text boxes 71 to 76 are areas in the layout image in which the translation edited by the translator in the text display areas 51 to 56 is reflected.
  • the text boxes 71 to 76 correspond to the area information, and the area information is information included in the text information extracted by the text information extraction unit 11 from the layout image.
  • the image information extraction unit 12 extracts an image not including text from the layout image shown in FIG. As a result, an image 60 obtained by removing the text from the layout image shown in FIG. 5 is obtained as shown in FIG.
  • the balloons 51 'and 52' for describing the speech of the characters depicted in the image 61 are shown.
  • the positions of the balloons 51 'and 52' correspond to where the text display areas 51 and 52 shown in FIG. 5 are arranged in the layout image. Furthermore, the positions of the balloons 51 'and 52' are also coincident with the locations where the text boxes 71 to 76 shown in FIG. 6A are arranged in the layout image.
  • the text information of the original text extracted by the text information extraction unit 11 from the text display areas 51 to 56 shown in FIG. 5 is output to the form display unit 13 via the text information storage unit 17b.
  • This text information includes area information for each text display area.
  • the area information in this case includes the description information of the text boxes 71 to 76 respectively corresponding to the text display areas 51 to 56 shown in FIG.
  • the form display unit 13 generates a translation editing form shown in FIG. 7 from the text information of the original text received from the text information extracting unit 11 and displays the translation editing form on the screen 30 of the terminal 3.
  • the translation editing form 35 shown in FIG. 7 is configured as a text editing form in which the translation for each text display area can be edited.
  • the translated sentence editing form 35 shown in FIG. 7 includes original text display boxes 31 (a) to 31 (h) in which original texts are displayed and input boxes 32 (a) to 32 (h) for inputting translated sentences for each text display area. And the like are associated with each other and displayed on the screen.
  • the layout display unit 14 After displaying the translation editing form 35, the layout display unit 14 operates in cooperation with the translation editing form 35 by mutually communicating with the translation editing form 35 and the communication network 6a.
  • the layout display unit 14 displays the translation edited by the translation editing form 35 in the layout / image display area 33-2 displayed on the screen 30 of the terminal 3 based on this cooperation operation.
  • the layout / image display area 33-1 in the screen 30 shown in FIG. 7 is a display format that can be compared with the layout / image display area 33-2 for each frame constituting a comic page and remains the same as the original text before the start of translation. It displays the layout image of
  • the layout display unit 14 displays a layout / image of the edited translation according to the display layout defined by the area information and the character attribute in response to the input to the input boxes 32 (a) to 32 (h).
  • the screen is displayed superimposed on the image included in the area 33-2.
  • the input contents are reflected in the corresponding text area in the layout / image display area 33-2 according to the display layout described above. Be done.
  • the text box 71 (FIG. 6 (a) is displayed in the layout / image display area 33-2 in response to the translator performing a translation editing operation in the input box 32 (a) shown in FIG.
  • the translated text being edited is reflected at the position corresponding to
  • the layout / image display area 33-2 in accordance with the translator's editing operation of the translation in the input boxes 32 (b) to 32 (f) shown in FIG.
  • the translation in process of editing is reflected at the position corresponding to 76 (see FIG. 6A). That is, the translation in the middle of the editing input by the translator in the input boxes 32 (a) to (h) of the translation editing form 35 is replaced with a part of the original text in the corresponding text display area of the layout image 33. Is displayed.
  • the translated text is read from the image information storage unit 17c. All text display areas 51 to 56 in which the translation is incorporated are superimposed on the images 61 to 63.
  • translated cartoon data is completed in which all original texts in the layout image shown in FIG. 5 are replaced with translated sentences.
  • the completed translated cartoon data is stored in the document data storage unit 17 a, and the input / output control unit 16 reads out the translated cartoon data from the document data storage unit 17 a and uploads it to the electronic commerce system 4.
  • the layout display unit 14 translates the translated text according to the input content input to the input boxes 32 (a) to 32 (f) of the translated text editing form 35 to edit the translated text in each of the text display areas 51 to 56.
  • a specific mechanism of the cooperation operation performed with the editing form 35 will be described with reference to FIG. According to the input operation by the translator in the input boxes 32 (a) to 32 (h) according to the structure described later with reference to FIG. Is reflected in the corresponding text area of.
  • the terminal 3 used by the translator for inputting the translation includes the screen 30, the communication unit 310, the information display unit 320, the layout / image display window 330, and the editing command conversion.
  • a section 340 and a parallel translation window 350 are included.
  • the parallel translation window 350 is associated with an input operation interface 351 that receives an input operation from a translator via an input device such as a keyboard and a mouse.
  • the text information from the text information extraction unit 11 passes through the input / output control unit 16 and the communication unit 310 of the terminal 3 in the terminal 3. It is transmitted to the information display unit 320.
  • This text information is extracted from the text information extraction unit 11 in a form respectively corresponding to the text display areas 51 to 56 in FIG. 5, and the character string of the original text together with the area information corresponding to the text display areas 51 to 56. And include character attributes.
  • This image information is image information obtained as a result of extracting the image 60 not including text from the layout image shown in FIG. 5 by the image information extraction unit 12 (see FIG. 6B).
  • the information display unit 320 in the terminal 3 receives the text information from the text information extraction unit 11 and the image information extraction unit 12 in the translation support device 10 and the image 60 shown in FIG. Data necessary for the above are output to the layout / image display window 330 and the parallel translation window 350. Specifically, the information display unit 320 outputs text information corresponding to the text display areas 51 to 56 to the layout / image display window 330. Further, the information display unit 320 outputs the text information of the original text among the text information to the parallel translation window 350. Further, the image 60 shown in FIG. 6B is output to the layout / image display window 330.
  • the layout / image display window 330 When the layout / image display window 330 receives the image information shown in FIG. 6B from the information display unit 320, the layout / image display window 330 displays the image information as a background image of the layout image 33. Subsequently, when the layout / image display window 330 receives the text information from the information display unit 320, the original text is placed at the position corresponding to the text display areas 51 to 56 in a form superimposed on the image 60 shown in FIG. indicate. Specifically, the original text appropriately layout-arranged based on the area information in the text information corresponding to the text display areas 51 to 56 is displayed so as to be superimposed on the image 60 of FIG. 6B.
  • the layout display unit 14 on the translation support device 10 side identifies a display layout for displaying the layout / image 33 in the correct layout according to the area information respectively corresponding to the text display areas 51 to 56. Subsequently, the layout display unit 14 sets text boxes 71 to 76 shown in FIG. 6A in the layout image 33 corresponding to the layout arrangement of the text display areas 51 to 56 based on the identified display layout. Do.
  • the text boxes 71 to 76 are text boxes set in the layout image 33 in order to display a translation edited in place of the original text at the text display position of each of the text display areas 51 to 56. .
  • the translator 80 edits the translation.
  • the translator 80 performs an input operation in the input boxes 32 (a) to 32 (h) of FIG. 7 via the input operation interface 351 for editing the translation
  • the input operation is performed from the parallel translation window 350. It is output to the editing command converter 340.
  • the editing command conversion unit 340 converts the input operation received from the parallel translation window 350 into an editing command, and transmits the editing command to the layout display unit 14 on the translation support device 10 via the communication unit 310 and the input / output control unit 16.
  • the editing command transmitted by the editing command conversion unit 340 is a command for causing the layout display unit 14 to interpret the content of the editing operation by the translator 80 and to execute the layout display process according to the interpretation.
  • the layout display unit 14 executes the following operation in order to analyze the editing command received from the editing command conversion unit 340. First, it is identified which of the text display areas 51 to 56 in the layout image 33 the input operation performed by the translator is a text editing operation. Subsequently, it is identified which character string portion in the original text contained in the text display area to be edited is replaced with what kind of translated text the input operation performed by the translator. Finally, the layout arrangement in the layout image 33 of the text box (one of the text boxes 71 to 76 in FIG. 6A) identified for editing is specified according to the display layout already identified for the layout image 33. Do.
  • the layout display unit 14 transmits the analysis result of the editing command described above to the information display unit 320 via the input / output control unit 16 and the communication unit 310. Then, the information display unit 320 outputs the analysis result of the editing command generated by the layout display unit 14 to the layout / image display window 330. Then, the layout / image display window 330 identifies the corresponding character string portion in the original text included in the text display area to be edited, according to the analysis result of the editing command by the layout display unit 14. Subsequently, the layout / image display window 330 displays the text in which the corresponding character string portion in the original text is replaced with the translation in process of editing in an appropriate layout arrangement.
  • the translation support system 1 is configured by the terminal 2 used by the creator, the terminal 3 used by the translator, a server device, etc. It comprised by connecting the support apparatus 10 and the electronic commerce system by a communication network.
  • the translation support system 1 may be configured using only a single stand-alone computer device. In that case, the consumer can purchase and download the translated version of the cartoon data by directly accessing the stand-alone computer device from the consumer terminal through the communication network.
  • FIG. 8 An example of a translation support system configured using only a single stand-alone computer device is shown in FIG. 8 as a stand-alone translation support system 100.
  • the stand-alone translation support system 100 shown in FIG. 8 is configured to include a CPU having a multi-core architecture in which at least three or more processor cores PC1 to PC3 are integrated on chip.
  • the stand-alone translation support system 100 shown in FIG. 8 is configured to include an internal bus 15, a storage unit 17, and a network interface 19.
  • the storage unit 17 is realized by integrating the document data storage unit 17a, the text information storage unit 17b, the image information storage unit 17c, and the layout information storage unit 17d shown in FIG. 2 into a single storage device. .
  • the stand-alone translation support system 100 is connected to a display device including a flat panel display device, a keyboard, a mouse, a touch pen and the like and an input operation device 30 '.
  • the display device and the input operation device 30 ' provide a screen display function and an input operation interface which are needed when the creator, translator and system operation manager try to operate the stand-alone translation support system 100.
  • the internal bus 15 shown in FIG. 8 functions as an interprocessor interconnect bus enabling communication among a plurality of processor cores PC1 to PC3.
  • the internal bus 15 also functions as an input / output bus for the processor cores PC1 to PC3 to input / output data to / from the storage unit 17 and the network interface 19.
  • the processor core PC 1 executes the input / output control unit 16 provided in the translation support device 10 shown in FIG. 2 as system software having the same role as the operating system.
  • the processor core PC 1 uses the text information extraction unit 11, the image information extraction unit 12, the form display unit 13 as a thread, a process, etc. executed on the input / output control unit 16 operating as an operating system. , Layout display unit 14 and the like.
  • the text information extraction unit 11, the image information extraction unit 12, the form display unit 13, and the layout display unit 14 executed by the processor core PC 1 shown in FIG. 8 have the same functions as those provided in the translation support device 10 shown in FIG. And play the same role.
  • the processor core PC 2 is equivalent to a function that needs to be realized in the terminal 2 used by the creator for creating cartoon data and the translator terminal 3 used by the translator. Execute functions in the form of threads or processes.
  • the processor core PC 2 shown in FIG. 8 is executing a general-purpose operating system 201 provided with a multi-window environment.
  • the information display unit 320, the layout / image display window 330, the editing command conversion unit 340, the parallel translation window 350, etc. executed on the operating system 201 shown in FIG. 8 have the same functions as those shown in FIG. Perform and have an equivalent role. That is, on the operating system 201, functions equivalent to the plurality of functional modules (320 to 350 and 351 shown in FIG.
  • Thread or process is running.
  • a creator application group 220 and A creator window environment 210 is running.
  • the creator application group 220 includes an image editing and processing application AP1 for editing and processing digital image data to be inserted into cartoon data by the creator, a text data creation and layout design application AP2, and the like.
  • the creator window environment 210 is a window environment for operating the applications AP1 and AP2 through the GUI and displaying the content data being edited on the screen.
  • the creator application group 220 and the creator window environment 210 communicate with the input / output control unit 16 running on the processor core PC 1 via the operating system 201 and the internal bus 15 to exchange data and information. can do.
  • the processor core PC 3 executes a function equivalent to the function of the electronic commerce system 4 that sells and downloads to the consumer the translated cartoon data output by the translation support device 10 in the embodiment shown in FIG.
  • the processor core PC 3 may execute the operating system 401 and execute at least the electronic publishing data conversion tool 402 and the web server software 403 on the operating system 401.
  • the electronic publishing data conversion tool 402 when the electronic publishing data conversion tool 402 generates cartoon data according to the processing flow shown in FIG. 4 while the functional unit on the processor core PC 1 and the functional unit on the processor core PC 2 communicate with each other, Convert data into a data format that can be published as an electronic publication.
  • the Web server application 404 for electronic commerce may be executed as a container application, a Java (registered trademark) Servlet, or the like.
  • the electronic publication data conversion tool 402 outputs a translated version of cartoon data in the form of an electronic publication
  • the electronic publication can be purchased and downloaded online by the electronic commerce Web server application 404. It becomes.
  • the electronic commerce Web server application 404 receives an online purchase request for the electronic publication from the terminal of the consumer via the communication network
  • the electronic publication purchased is downloaded from the terminal of the consumer It becomes possible.
  • the Web server application for electronic commerce 404, Web server software 403, data conversion tool for electronic publication 402, etc. are input / output being executed on the processor core PC 1 via the operating system 401 and the internal bus 15. It can communicate with the control unit 16 to exchange data and information.
  • translation work is enabled without the need to confirm the correspondence between original text and translated text in the layout image while comparing text information and the layout image for each page. be able to. Further, in the embodiment described above, it is possible to interactively confirm in parallel with the translation editing operation whether there is a sense of discomfort in the result of arranging the translation in the middle of editing in the layout image. .
  • cartoon data digitized as an electronic publication comprises a text display layer including one or more original text display areas 51 to 56 (see FIG. 5) above the image layer. It may be configured as superimposed digital image data.
  • the text information extraction unit 11 may be configured to separate the text display layer from the image layer of the cartoon data. Then, even if the text information extraction unit 11 is configured to extract and output area information and text information corresponding to each of the text display areas 51 to 56 (see FIG. 5) of the original text from the original text display layer. Good.
  • an example of the image layer may be an image layer including the images 61 to 63 obtained as shown in FIG. 6 (b) by removing the text from the layout image 33.
  • the text display layer described above may be a layer including character information of original text to be incorporated in text boxes 71 to 76 corresponding to the text display areas 51 to 56 shown in FIG.
  • cartoon data digitized as an electronic publication may be configured as analog image information.
  • the text information extraction unit 11 may be further configured to extract area information and text information corresponding to each of the text display areas 51-56 (see FIG. 5) by image analysis. .
  • cartoon data digitized as an electronic publication may be configured as analog image information that can be displayed as a desired graphic by scanning as an analog RGB signal.
  • the text information extraction unit 11 generates area information and text information corresponding to each of the text display areas of the original text based on the matching between the scanning pattern of the analog RGB signal and the topology pattern representing the character stroke. May be further configured to output
  • Translation Support System 2 (2a, 2b) Terminal 3 (3a to 3c) Terminal 4 Electronic Commerce System 5 (5a to 5c) Terminal 6 (6a, 6b) Communication Network 10 Translation Support Device 11 Text Information Extraction Unit 12 Image Information Extraction Part 13 Form display part 14 Layout display part 14 15 Internal Bus 16 Input / Output Control Unit 17 (17a to 17d) Storage Unit 19 Network Interface 30 Screen 30 'Display Device and Input Operation Device 31 Text Display Box 32 Input Box 33 Layout Image 33-1 Layout Image Display Area 33 -2 Layout / image display area 51-56 Text display area 51'-56 'Callout 61-63 Image 71-76 Text box 100 Stand-alone type translation support system 201 Operating system 210 Creator's window environment 220 Creator's application group 310 Communication unit 320 Information display unit 330 Layout / image display window 340 Editing command conversion unit 350 Bilingual window 351 Input operation interface 401 Operation Ingu system 402 electronic publishing for data conversion tool 403 Web server software 404 Web server applications for e-commerce

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)
  • Processing Or Creating Images (AREA)

Abstract

翻訳支援装置は、画像とテキストが混在した電子出版物の画像中に表示されたテキスト表示領域を抽出し、領域情報と共に原文テキストの文字列および文字属性を表すテキスト情報を抽出するテキスト情報抽出部と、電子出版物からテキストを含まない画像を抽出する画像抽出部と、テキスト情報からテキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するフォーム表示部と、訳文編集フォームへの入力に応じて、領域情報及び文字属性により規定される表示レイアウトに従って、編集後の翻訳文を上記の画像に重畳して画面表示するレイアウト表示部と、を備える。

Description

翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法
 本開示は、翻訳者による翻訳作業を支援するために情報処理装置を用いて構成される翻訳支援装置、当該情報処理装置上で実行される翻訳支援プログラムおよび翻訳を支援する方法に関する。
 画像とテキストが混在した電子出版物の海外への販路拡大と流通促進を行う際、電子出版物に文字情報として含まれるテキストを販売先となる現地の言語に翻訳する作業が必須となる。以下、一例として、漫画が完成した状態のページ毎のレイアウト設計に基づいて画像の上にテキストが重畳的に配置されたものを指してレイアウト・イメージと呼び、従来行われてきた漫画の翻訳作業について述べる。
 従来行われてきた漫画の翻訳作業では、翻訳者またはレイアウト作業者は、以下のような作業をする必要があるため、多くの作業時間を要し、効率が悪かった。例えば、原文と翻訳文とが対訳形式で示されたテキストとページ毎のレイアウト・イメージを肉眼で見比べながらレイアウト・イメージ内における原文テキストと翻訳文の対応関係を確認する必要があった。また、翻訳後の最終的なレイアウト・イメージは、翻訳者およびレイアウト作業者が頭の中で想像しながら作成を行っていた。そのため、単に作業効率が悪いだけでなく、作成した翻訳文をページ毎のレイアウト中に配置する作業を行った結果、最終的な仕上がりに違和感がある場合には、翻訳者が翻訳し直すなどの手戻りが生じる場合もあった。
 このような問題に対処するための従来技術として、下記の特許文献1記載の翻訳支援システムでは、ユーザが指定した翻訳箇所の原文を明示させた状態で、訳文を入力させるようにしている。これにより、漫画のページ毎のレイアウトに従って配置された複数の翻訳箇所と翻訳者が作成した訳文との対応がずれないようにしている。また、下記の特許文献2は、文書データのレイアウト・イメージを表示した状態のまま、ブロックカーソルによりテキスト範囲を選択し、書式設定キーを押下すると、選択したテキスト範囲の文字属性をメニュー形式で選択できるようにしている。これにより、レイアウト・イメージを表示した状態のまま、テキストの編集操作と編集したテキストの文字属性の変更を可能としている。
特開2007-304867号公報 特開平8-212195号公報
 しかしながら、特許文献1および特許文献2に記載の発明では、テキスト情報とページ毎のレイアウト・イメージを見比べながらレイアウト・イメージ内における原文テキストと翻訳文の対応関係を確認する必要なしに翻訳作業を可能にするための技術を開示も示唆もしていない。また、特許文献1および特許文献2に記載の発明では、編集途中の翻訳文をレイアウト・イメージ内に配置した結果に違和感があるか否かを翻訳文編集操作と並行してインタラクティブに確認可能とするための技術を開示も示唆もしていない。
 例えば、特許文献1記載の発明では、翻訳文の入力内容がページ毎のレイアウト内に即座に反映されるわけではない。また、特許文献2記載の発明では、レイアウト・イメージの表示画面とは別に翻訳文の編集画面が設けられたシステム構成は想定されていない。従って、特許文献2記載の発明においても、翻訳者が翻訳文の編集画面にて翻訳文を入力した際、別画面であるレイアウト表示画面の対応する配置箇所に翻訳文の入力内容を即座に反映させる仕組みは開示も示唆もされていない。
 以上の問題点に鑑み、本発明に係る幾つかの実施形態は、レイアウト表示の目視による確認等の作業負担なしに、ページ毎にレイアウト配置されたテキスト情報を効率的に翻訳でき、翻訳作業の手戻りが生じにくい翻訳支援装置を得ることを目的とする。
 以上の問題点を解決するため、本発明に係る幾つかの実施形態の第1の側面によれば、画像とテキストが混在した電子出版物において原文テキストの翻訳を支援する翻訳支援装置は、前記電子出版物の前記画像中に表示されたテキスト表示領域を抽出し、領域情報と共に前記原文テキストの文字列および文字属性を表すテキスト情報を抽出するテキスト情報抽出部と、前記電子出版物から前記テキストを含まない前記画像を抽出する画像抽出部と、前記テキスト情報から前記テキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するフォーム表示部と、前記訳文編集フォームへの入力に応じて、前記領域情報及び前記文字属性により規定される表示レイアウトに従って、編集後の前記翻訳文を前記画像に重畳して画面表示するレイアウト表示部と、を備える。
 以上の問題点を解決するため、本発明に係る幾つかの実施形態の第2の側面によれば、画像とテキストが混在した電子出版物において原文テキストの翻訳を支援するための一連の処理ステップをコンピュータ装置に実行させる翻訳支援プログラムは、前記電子出版物を入力として受け取ると、前記画像中に表示されたテキスト表示領域を抽出し、領域情報と共に前記原文テキストの文字列および文字属性を表すテキスト情報を抽出するステップと、前記電子出版物から前記テキストを含まない前記画像を抽出するステップと、前記テキスト情報から前記テキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するステップと、前記訳文編集フォームへの入力に応じて、前記領域情報及び前記文字属性により規定される表示レイアウトに従って、編集後の前記翻訳文を前記画像に重畳して画面表示するステップと、を備える。
 以上の問題点を解決するため、本発明に係る幾つかの実施形態の第3の側面によれば、画像とテキストが混在した電子出版物において原文テキストの翻訳を支援するために情報処理装置により実行される方法は、前記電子出版物が前記情報処理装置に入力されると、前記画像中に表示されたテキスト表示領域を抽出し、領域情報と共に前記原文テキストの文字列および文字属性を表すテキスト情報を抽出するステップと、前記電子出版物から前記テキストを含まない前記画像を抽出するステップと、前記テキスト情報から前記テキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するステップと、前記訳文編集フォームへの入力に応じて、前記領域情報及び前記文字属性により規定される表示レイアウトに従って、編集後の前記翻訳文を前記画像に重畳して前記表示画面に表示するステップと、を備える。
 以上より、本発明に係る幾つかの実施形態によれば、レイアウト表示の目視による確認等の作業負担なしに、ページ毎にレイアウト配置されたテキスト情報を効率的に翻訳でき、翻訳作業の手戻りが生じにくい翻訳支援装置を得ることができる。
本発明の実施のために幾つかの実施形態に係る翻訳支援装置を含んで構成される翻訳支援システムを例示する通信ネットワーク構成図である。 本発明の幾つかの実施形態に係る翻訳支援装置の例示的な構成を示す構成図である。 翻訳者が作業中の端末と翻訳支援装置との間でのデータや情報のやり取りを示す図である。 翻訳支援装置を構成する各機能部と翻訳者端末とが実行する処理の流れを示す図である。 翻訳前の漫画のレイアウト・イメージの一例を示す図である。 図5に示すレイアウト・イメージにおいて、テキスト情報を除外した後の画像と除外されたテキストをそれぞれ含むテキストボックスの配置を示す図である。 翻訳文を編集するための対訳画面と翻訳文の編集操作がレイアウト・イメージ内に即時に反映される表示画面とを示す図である。 本発明の代替的な実施形態に従い、翻訳支援システムを単一のスタンドアロン型コンピュータ装置のみを用いて構成した構成例を示す図である。 漫画の翻訳作業のために従来行われてきた手順と本発明に係る幾つかの実施形態に従って行われる手順とを比較する図である。 漫画の翻訳作業のために従来行われてきた手順に従い、翻訳者に提供される表形式の対訳データの表示画面である。 漫画の翻訳作業のために従来行われてきた手順に従い、レイアウト・イメージ内の原文テキストを手作業により翻訳文で置き換える様子を示す図である。
 近年、自国内で創作され、出版された漫画等のような電子出版物の海外への販路拡大と流通促進を、情報システムを活用して実現することが以前よりも一層幅広く試みられている。上記のような電子出版物は、画像に重畳して文字情報が混在した情報材である。そのため、海外への販路拡大や流通促進のためには、電子出版物に文字情報として含まれるテキストを販売先となる現地の言語に翻訳する必要がある。以下、本発明の実施形態の説明に先立って、漫画の翻訳を例にとって従来の翻訳作業における問題点について図9~図11を参照しながら述べる。
 (従来の翻訳作業における問題点)
 まず、電子化されていない紙媒体の漫画を翻訳しなければならない場合には、実際の翻訳作業に入る前にレイアウト・イメージ全体を見て、その中から文字列をテキスト・データとして抜き出す作業が必要であった。しかしながら、OCR等を用いて漫画の紙面からの文字の読み取りを自動化しても、読み取り精度が十分ではないため、読み取り結果を手動で直す必要があった。また、漫画が電子化され、漫画データとして電子的に出版されている場合においても、さらに以下のような問題もあった。
 図9の工程101~105は、漫画の翻訳のために従来行われていた作業フローの例である。まず、図9の工程101にて、漫画データを標準化されたファイル形式を有する電子ファイルとして受け取った事務員91は、工程102にて、図10に示すような対訳形式の表を作成する。具体的には、漫画に含まれる文字列を文毎に対訳形式で図10に示す表の中に埋め込んだデータを作成する。続いて、工程103にて、事務員91から対訳形式の表のデータを受け取った翻訳者93は、ページ毎のレイアウト・イメージを見ながら表を埋める形で対応訳の作成を行ってゆく。
 翻訳完了後、工程104にて、レイアウト作業者95は、グラフィクス作成専用ソフト等を使用して、レイアウト・イメージ内の個々の原文テキストを対応する翻訳文で置き換える。例えば、図11に示す例では、テキストボックス77および78内にそれぞれ配置された原文テキストを手作業により翻訳文(図11に示す32(x)および32(y))にそれぞれ置き換えている。工程105では、このような作業により完成したレイアウト・イメージから事務員97が翻訳された漫画の電子出版用の電子ファイルを生成する。
 このように、図9に示す工程101~105では、図10に示す対訳形式の表における各行に該当する各文がレイアウト・イメージ内のどこに配置されているかを、翻訳者93がその都度目視で探さなくてはならないため、多くの作業時間を要していた。同様に、レイアウト作業者95は、図11に示すレイアウト・イメージ内において対応する原文テキストがどこに配置されているかを、その都度目視で探さなくてはならないため、多くの作業時間を要していた。
 さらに、図9に示す工程101~105では、翻訳者は、対応訳とレイアウト・イメージを肉眼で見比べながら行うため、最終的な翻訳結果は頭の中で想像しながら作成を行っていた。そのため、翻訳文がレイアウト・イメージ内に組み込まれた結果を見て、対応する原文と翻訳文との間のニュアンスの違いに翻訳者が気づいた場合には、翻訳をし直すための手戻りがおこることもあった。何故なら、レイアウト作業者95は、翻訳の専門家ではなく、翻訳済みの言語を熟知していないからである。例えば、レイアウト作業者95は、翻訳文中における改行位置や句読点が不適切であるといったような言語的問題を発見することができず、翻訳後の言語特有のニュアンスを考慮したレイアウトを行うこともできない。
 しかも、図9に示す工程101~105では、翻訳スキルとは異なる技能や経験を有するレイアウト作業者95や事務員91および97が関与しなくてはならず、翻訳者93だけでは翻訳のための全工程を実施することができなかった。例えば、レイアウト作業者95はレイアウトのための専用ツールを駆使することができるアーティストやデザイナとしての技能や経験を有しており、工程101~105では、このような翻訳以外の技能や経験を有する者の関与も必要であった。
 次に、従来の翻訳作業における上述した問題点を解決するために利用可能な翻訳支援の仕組みとして、以下、本開示の実施形態について図面を参照して説明する。なお、以下に説明する実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態に示される構成要素のすべてが、本開示の必須の構成要素であるとは限らない。
 (第1実施形態)
 図1は、第1実施形態に係る翻訳支援装置10を含んで構成される翻訳支援システム1を例示する通信ネットワーク構成図である。図2は、第1実施形態に係る翻訳支援装置10の例示的な構成を示す構成図である。図1に示すように、翻訳支援システム1は、翻訳支援装置10に接続された通信網6aおよび6bを含んで構成され、通信網6aおよび6bは別々の通信網であっても同一の通信網であってもよい。また、通信網6aおよび6bは、単一の物理ネットワークがVPN技術およびトンネリング技術を用いて別々の仮想ネットワークとして構成されたものであってもよい。
 通信網6aには、翻訳支援装置10と通信可能な情報端末として、複数の端末2(2a,2b)と複数の端末3(3a~3c)が接続されていてもよい。端末2は、国外への販路拡大のために自身が創作した漫画の外国語への翻訳を依頼しようとする創作者が利用する情報端末であってもよい。代替的に、端末2は、漫画の創作者に代わって漫画の翻訳を依頼しようとする出版社の情報端末であってもよい。
 創作者または出版社は、端末2を操作することで、翻訳を依頼したい電子化された漫画のデータを端末2から翻訳支援装置10に送信してもよい。端末3は、翻訳支援装置10が保持する漫画データを翻訳者が通信網6aを介してリモートに編集操作するために使用される翻訳者用端末として構成されても良い。
 また、通信網6bには、翻訳支援装置10を用いて外国語に翻訳された漫画データをオンラインで購入するために消費者が利用する複数の端末5(5a~5c)が接続されている。また、通信網6bには、翻訳支援装置10から送信された翻訳後の漫画データをオンライン販売のために受け付ける電子商取引システム4が接続されている。電子商取引システム4は、翻訳支援装置10から受け付けた翻訳後の漫画データを商品として購入した消費者が翻訳後の漫画データを消費者が操作する端末5へとダウンロードすることができるように構成されている。
 翻訳支援装置10は、画像とテキストが混在した漫画データにおいて原文テキストを翻訳者が翻訳する作業を支援するための情報処理装置として構成される。一例において、翻訳支援装置10は、メモリとCPUを備えたサーバ装置を、通信網6aおよび6bに接続し、当該サーバ上でCPUに専用のソフトウェアを実行させることにより実現されてもよい。図2に示すように、翻訳支援装置10は、テキスト情報抽出部11と、画像情報抽出部12と、フォーム表示部13と、レイアウト表示部14と、内部バス15と、入出力制御部16と、を含んで構成される。さらに、翻訳支援装置10は、文書データ記憶部17a、テキスト情報記憶部17b、画像情報記憶部17cおよびレイアウト情報記憶部17dと、を含んで構成される。なお、以下の記述では、文書データ記憶部17a、テキスト情報記憶部17b、画像情報記憶部17cおよびレイアウト情報記憶部17dを総称して記憶部17と略記する場合がある。
 テキスト情報抽出部11、画像情報抽出部12、フォーム表示部13およびレイアウト表示部14は、入出力制御部16の制御に従い、外部の端末2、端末3および電子商取引システム4などとデータや情報をやり取りする。また、入出力制御部16は、創作者が翻訳を依頼しようとする漫画データを外部の端末2から受信すると、受信した漫画データを文書データ記憶部17aに格納する。
 また、テキスト情報抽出部11、画像情報抽出部12、フォーム表示部13、レイアウト表示部14および記憶部17(17a~17d)は、内部バス15を介して相互にデータや情報をやり取りする。テキスト情報抽出部11は、電子出版物である漫画データを文書データ記憶部17aから読み出す。その上で、テキスト情報抽出部11は、読み出した当該漫画データの画像中に表示されたテキスト表示領域を識別する。続いて、テキスト情報抽出部11は、識別したテキスト表示領域の各々について、領域情報と共に原文テキストの文字列および文字属性を表すテキスト情報を抽出し、テキスト情報記憶部17bに格納する。
 一実施形態では、この領域情報は、原文表示領域の各々における文字枠と当該文字枠の配置を記述することで表示レイアウトを規定するものであってもよい。また、別の一実施形態では、文字属性は、原文テキストの文字列のフォント種別およびフォントサイズを文字毎に記述し、文字列全体の向きをさらに記述することで上述した表示レイアウトを規定するものであってもよい。上記の領域情報によってテキスト表示領域毎に表示レイアウトが定義されると、この表示レイアウトの定義情報は、テキスト情報抽出部11によりレイアウト情報記憶部17dに格納される。
 また、画像情報抽出部12は、上述した漫画データを文書データ記憶部17aから読み出す。その上で、画像情報抽出部12は、読み出した当該漫画データからテキストを含まない画像を抽出して画像情報記憶部17cに格納する。
 また、フォーム表示部13は、テキスト情報抽出部11によりテキスト表示領域毎に抽出された原文のテキスト情報を、テキスト情報記憶部17bから読み出す。その上で、フォーム表示部13は、テキスト情報抽出部11からテキスト情報記憶部17bを介して受け取った当該テキスト情報に基づいて、テキスト表示領域毎の翻訳文を編集可能な訳文編集フォーム35を端末3の画面30上に画面表示する。訳文編集フォーム35は、テキスト表示領域毎に、原文テキストが表示される原文表示ボックス31と翻訳文を入力する入力ボックス32とを対応付けて画面30上に画面表示するように構成されている。
 訳文編集フォーム35の表示後に、レイアウト表示部14は、レイアウト情報記憶部17dから表示レイアウトの定義情報を読み出し、テキスト表示領域毎に定義された領域情報を識別する。続いて、レイアウト表示部14は、端末3に画面表示された訳文編集フォーム35と通信網6aを介して相互に通信しあうことで、訳文編集フォーム35と連携動作する。この連携動作により、レイアウト表示部14は、訳文編集フォーム35にて編集された翻訳文を端末3の画面30上に表示されたレイアウト・イメージ33内に反映させる。
 具体的には、レイアウト表示部14は、レイアウト情報記憶部17dから読み出した情報から領域情報及び文字属性により規定される表示レイアウトを識別した後に、訳文編集フォーム35と連携して以下の動作を実行する。すなわち、レイアウト表示部14は、入力ボックス32への入力に応じて、上記のように識別した表示レイアウトに従って、編集後の翻訳文をレイアウト・イメージ33に含まれる画像に重畳して画面表示する。その際、入力ボックス32にて翻訳者による入力操作に応じて、入力内容が上述した表示レイアウトに従って対応するテキスト領域内に反映される。
 以上のようにして、全てのテキスト表示領域において原文テキストが翻訳文に置き換えられると、画像情報記憶部17cから読み出された画像の上に翻訳文が組み込まれた全てのテキスト表示領域が重ね合わされる。その結果、翻訳後の漫画データが完成し、当該漫画データは文書データ記憶部17aに格納される。最後に、翻訳後の漫画データは入出力制御部16により読み出されて通信網6bを介して電子商取引システム4にアップロードされる。
 次に、テキスト情報抽出部11、画像情報抽出部12、フォーム表示部13およびレイアウト表示部14が入出力制御部16の制御に従い、端末3と通信しながら実行する一連の処理の流れについて、図4を参照しながら説明する。まず、図4に示すように、入出力制御部16は、創作者が翻訳を依頼しようとする漫画データを外部の端末2から受信すると、受信した漫画データを文書データ記憶部17aに格納する(図4のm1とm2を参照)。
 テキスト情報抽出部11は、電子出版物である漫画データを文書データ記憶部17aから読み出す(図4のm3を参照)。その上で、テキスト情報抽出部11は、ステップS10の実行を開始し、読み出した当該漫画データの画像中に表示されたテキスト表示領域を識別する。続いて、テキスト情報抽出部11は、識別したテキスト表示領域の各々について、領域情報と共に原文テキストの文字列および文字属性を表すテキスト情報を抽出する。上記の領域情報によってテキスト表示領域毎に表示レイアウトが定義されると、この表示レイアウトの定義情報は、記憶部17を介してテキスト情報抽出部11からレイアウト表示部14に出力される(図4のm6を参照)。
 また、画像情報抽出部12は、上述した漫画データを文書データ記憶部17aから読み出す(図4のm4を参照)。その上で、画像情報抽出部12は、ステップS11を実行し、読み出した当該漫画データからテキストを含まない画像を抽出する。抽出されたテキストを含まない画像は、画像情報抽出部12から記憶部17を介してレイアウト表示部14に出力される。
 また、フォーム表示部13は、テキスト情報抽出部11によりテキスト表示領域毎に抽出された原文のテキスト情報を、記憶部17を介してテキスト情報抽出部11から受け取る(図4のm5を参照)。フォーム表示部13は、ステップS12を実行し、受け取った当該テキスト情報に基づいて、訳文編集フォーム35を生成する。ステップS12で生成される訳文編集フォーム35は、テキスト表示領域毎に原文テキストが表示される原文表示ボックス31と翻訳文を入力する入力ボックス32とを対応付けて画面30上に画面表示するように構成されている。
 続いて、フォーム表示部13は、ステップS13を実行し、訳文編集フォーム35の原文表示ボックス31にテキスト情報抽出部11から受け取った原文テキストを埋め込む。最後に、フォーム表示部13は、生成した訳文編集フォームを端末3に送信し(図4のm8を参照)、端末3の画面30上に画面表示させる。
 レイアウト表示部14は、ステップS14の実行を開始し、テキスト情報抽出部11から記憶部17を介して受け取ったテキスト情報から領域情報及び文字属性により規定される表示レイアウトを識別するレイアウト解析処理を行う。続いて、レイアウト表示部14は、ステップS15の実行に進み、テキスト情報抽出部11から受け取ったテキスト情報と画像情報抽出部12から受け取った画像情報に基づいて、端末3の画面30上にレイアウト・イメージ33を画面表示(図4のm9を参照)する処理を行う。
 続いて、ステップS16において、翻訳者が端末3上に表示されたテキスト編集ボックスである入力ボックス32において翻訳文の編集操作を入力する。このときの編集操作の内容は、端末3からレイアウト表示部に送信される(図4のm10)。続いて、ステップS17において、m10で示す編集操作を受け取ったレイアウト表示部14は、編集操作m10に応じて、編集後の翻訳文を、表示レイアウトに従ってレイアウト・イメージ33に反映させる処理を行う。
 続いて、ステップS17において、編集後の翻訳文をレイアウト・イメージ33に反映させるための画面表示制御データがレイアウト表示部14から端末3に送信される(図4のm11)。続いて、レイアウト表示部14からm11で示す画面表示制御データを受け取った端末3は、ステップS18の実行を開始し、当該画面表示制御データに従って、画面30上のレイアウト・イメージ33の表示内容を更新する。これにより、訳文編集フォーム35の入力ボックス32に翻訳者が入力した編集途中の翻訳文が、画面30に表示されたレイアウト・イメージ33の該当するテキスト表示領域中の原文の一部と置き換えられて表示される。
 続いて、翻訳者が翻訳文の編集を終了し、全てのテキスト表示領域について翻訳文の内容を確定するまで、ステップS16~ステップS18と同様の処理が繰り返し実行される。そして、翻訳文の最後の編集処理として、ステップS19~ステップS21が実行された後に、ステップS22にて、翻訳者は、翻訳者が翻訳文の編集操作を終了させ、全ての翻訳文の内容を確定するために、編集終了操作を行う。
 続いて、全てのテキスト表示領域について確定された全ての翻訳文のデータは、端末3から翻訳支援装置10に送信され、記憶部17に一旦記憶される(図4のm14)。続いて、ステップS23にて、入出力制御部16は、記憶部17から全てのテキスト表示領域について確定された全ての翻訳文のデータを読み出し(図4のm15)、漫画のレイアウト・イメージ中に組み込んで翻訳後の漫画データを完成させる。完成した翻訳後の漫画データはオンライン販売のために、入出力制御部16から電子商取引システム4へとアップロードされる(図4のm16)。
 再び図9を参照すると、本発明の上記実施の形態に係る方法に従って、電子化された漫画データに含まれるテキストの翻訳作業は、工程201~工程204に示すように簡素化されることとなる。具体的には、図9の右半分に示す作業フローでは、工程201で用意された原文の漫画データは、工程202において、翻訳支援装置10によって処理可能なデータ形式の電子ファイルに変換され、工程203にて、翻訳支援装置10を用いて翻訳者99が翻訳文データの作成を行う。最後に、工程204にて、翻訳文が組み込まれた写植済みの漫画データが電子出版用の電子ファイル形式に変換され、電子商取引システム4にアップロードされる。
 以上より、漫画を翻訳するための従来の作業フローである工程101~工程105と比べると、本発明の上記実施形態に従う工程201~工程204では、翻訳作業が大幅に効率化され、多くの作業が自動化される。また、従来の作業フローである工程101~工程105と比べると、翻訳後の漫画データを用意するまでの作業フローに関与する人間は翻訳者99だけで済むようになる。
 次に、図2に示すテキスト情報抽出部11、画像情報抽出部12、フォーム表示部13およびレイアウト表示部14が、図5に示すレイアウト・イメージに対して実行する処理について、図6および図7を参照しながら具体的に説明する。図5に示すレイアウト・イメージの最上段のコマでは、テキスト情報を含まない画像61に重畳して、原文テキストを表示するテキスト表示領域51および52が示されている。同様に、図5に示すレイアウト・イメージの中段のコマでは、画像62に重畳して、テキスト表示領域53および54が示され、最下段のコマでは、画像63に重畳して、テキスト表示領域55および56が示されている。
 テキスト情報抽出部11は、図5に示すレイアウト・イメージ中に表示されたテキスト表示領域51~56を抽出し、テキスト表示領域51~56に対応する領域情報と共に原文テキストの文字列および文字属性を表すテキスト情報を抽出する。図5に示すテキスト表示領域51~56に対応する領域情報は、図5に示すレイアウト・イメージにおいて、各領域中の原文テキストを翻訳文に置き換えるための編集作業用のテキストボックスに対応する。より具体的には、図5に示すテキスト表示領域51~56の各々に含まれる原文テキストを翻訳文に置き換えるための編集作業用のテキストボックス71~76が図6(a)に示されている。
 テキストボックス71~76は、テキスト表示領域51~56において翻訳者が編集した翻訳文が反映されるレイアウト・イメージ内の領域である。また、テキストボックス71~76は領域情報と対応し、この領域情報は、テキスト情報抽出部11がレイアウト・イメージから抽出するテキスト情報に含まれる情報である。
 また、画像情報抽出部12は、図5に示すレイアウト・イメージからテキストを含まない画像を抽出する。その結果、図5に示すレイアウト・イメージからテキストが除かれた画像60が、図6(b)に示すとおりに得られる。ここで、図6(b)に示すテキスト除去後の画像60では、画像61に描かれた登場人物の台詞を記述するための吹き出し51’および52’が示されている。
 図6(b)から分かるように、吹き出し51’および52’の位置は、図5に示すテキスト表示領域51および52がレイアウト・イメージ内に配置されている場所と一致している。さらに、吹き出し51’および52’の位置は、図6(a)に示すテキストボックス71~76がレイアウト・イメージ内に配置されている場所とも一致している。
 続いて、図5に示すテキスト表示領域51~56からテキスト情報抽出部11により抽出された原文のテキスト情報は、テキスト情報記憶部17bを介してフォーム表示部13に出力される。このテキスト情報は、テキスト表示領域毎の領域情報を含む。この場合の領域情報には、図5に示すテキスト表示領域51~56にそれぞれ対応するテキストボックス71~76の記述情報が含まれる。フォーム表示部13は、テキスト情報抽出部11から受け取った原文のテキスト情報から図7に示す訳文編集フォームを生成して端末3の画面30上に表示する。
 図7に示す訳文編集フォーム35は、テキスト表示領域毎の翻訳文を編集可能なテキスト編集フォームとして構成される。図7に示す訳文編集フォーム35は、テキスト表示領域毎に、原文テキストが表示される原文表示ボックス31(a)~31(h)と翻訳文を入力する入力ボックス32(a)~32(h)とをそれぞれ対応付けて画面表示するように構成されている。
 訳文編集フォーム35の表示後に、レイアウト表示部14は、訳文編集フォーム35と通信網6aを介して相互に通信しあうことで、訳文編集フォーム35と連携動作する。図7に示す例では、この連携動作に基づき、レイアウト表示部14は、訳文編集フォーム35にて編集された翻訳文を端末3の画面30上に表示されたレイアウト・イメージ表示エリア33-2内に反映させる。なお、図7に示す画面30内のレイアウト・イメージ表示エリア33-1は、漫画ページを構成するコマ毎にレイアウト・イメージ表示エリア33-2と対比可能な表示形式で翻訳開始前の原文のままのレイアウト・イメージを表示するものである。
 続いて、レイアウト表示部14は、入力ボックス32(a)~32(h)への入力に応じて、領域情報及び文字属性により規定される表示レイアウトに従って、編集後の翻訳文をレイアウト・イメージ表示エリア33-2に含まれる画像に重畳して画面表示する。その際、入力ボックス32(a)~32(h)にて翻訳者による入力操作に応じて、入力内容が上述した表示レイアウトに従ってレイアウト・イメージ表示エリア33-2内の対応するテキスト領域内に反映される。
 例えば、図7に示す入力ボックス32(a)にて翻訳者が翻訳文の編集操作を行うのに応じて、レイアウト・イメージ表示エリア33-2内において、テキストボックス71(図6(a)を参照)に対応する位置に編集途中の翻訳文が反映される。同様に、図7に示す入力ボックス32(b)~32(f)にて翻訳者が翻訳文の編集操作を行うのに応じて、レイアウト・イメージ表示エリア33-2内において、テキストボックス72~76(図6(a)を参照)に対応する位置に編集途中の翻訳文が反映される。つまり、訳文編集フォーム35の入力ボックス32(a)~(h)に翻訳者が入力した編集途中の翻訳文が、レイアウト・イメージ33の該当するテキスト表示領域中の原文テキストの一部と置き換えられて表示される。
 以上のようにして、図7に示す入力ボックス32(a)~32(h)の全てに翻訳文が入力され、翻訳文の内容が確定されると、画像情報記憶部17cから読み出された画像61~63の上に翻訳文が組み込まれた全てのテキスト表示領域51~56が重ね合わされる。その結果、図5に示すレイアウト・イメージ内の全ての原文テキストが翻訳文に置き換えられて成る翻訳後の漫画データが完成する。完成した翻訳後の漫画データは文書データ記憶部17aに格納され、入出力制御部16は、文書データ記憶部17aから翻訳後の漫画データを読み出して電子商取引システム4にアップロードする。
 次に、テキスト表示領域51~56の各々における翻訳文を編集するために訳文編集フォーム35の入力ボックス32(a)~32(f)に入力された入力内容に応じてレイアウト表示部14が訳文編集フォーム35との間で実行する連携動作の具体的な仕組みについて図3を参照しながら説明する。図3を参照して後述する仕組みにより、入力ボックス32(a)~32(h)にて翻訳者による入力操作に応じて、入力内容が上述した表示レイアウトに従ってレイアウト・イメージ表示エリア33-2内の対応するテキスト領域内に反映される。
 図3に示す実施形態では、翻訳者が翻訳文の入力のために使用する端末3は、画面30と、通信部310と、情報表示部320と、レイアウト・イメージ表示ウィンドウ330と、編集コマンド変換部340と、対訳ウィンドウ350と、を含んで構成される。なお、対訳ウィンドウ350は、キーボードやマウスなどの入力デバイスを介して翻訳者から入力操作を受け付ける入力操作インターフェース351と関連付けられている。
 レイアウト表示部14が訳文編集フォーム35との間で実行する連携動作が開始すると、テキスト情報がテキスト情報抽出部11から入出力制御部16および端末3の通信部310を経由して端末3内の情報表示部320に送信される。このテキスト情報は、図5のテキスト表示領域51~56にそれぞれ対応する形でテキスト情報抽出部11から抽出されたものであり、テキスト表示領域51~56に対応する領域情報と共に原文テキストの文字列および文字属性を含んでいる。
 また、図5に示すレイアウト・イメージからテキストが除かれた図6(b)の画像情報が、画像情報記憶部17cに一旦記憶された後に、入出力制御部16および端末3の通信部310を経由して端末3内の情報表示部320に送信される。この画像情報は、画像情報抽出部12により図5に示すレイアウト・イメージからテキストを含まない画像60を抽出した結果(図6(b)参照)として得られた画像情報である。
 続いて、端末3内の情報表示部320は、翻訳支援装置10内のテキスト情報抽出部11と画像情報抽出部12からテキスト情報と図6(b)に示す画像60を受け取ると、翻訳文編集に必要なデータをレイアウト・イメージ表示ウィンドウ330と対訳ウィンドウ350に出力する。具体的には、情報表示部320は、テキスト表示領域51~56に対応するテキスト情報を、レイアウト・イメージ表示ウィンドウ330に出力する。また、情報表示部320は、当該テキスト情報のうち、原文テキストの文字情報を対訳ウィンドウ350に出力する。また、図6(b)に示す画像60をレイアウト・イメージ表示ウィンドウ330に出力する。
 レイアウト・イメージ表示ウィンドウ330は、情報表示部320から図6(b)に示す画像情報を受け取ると、レイアウト・イメージ33の背景画像として、当該画像情報を表示する。続いて、レイアウト・イメージ表示ウィンドウ330は、情報表示部320からテキスト情報を受け取ると、図6(b)に示す画像60に重畳する形でテキスト表示領域51~56に対応する位置に原文テキストを表示する。具体的には、テキスト表示領域51~56に対応するテキスト情報内の領域情報に基づいて適切にレイアウト配置された原文テキストを図6(b)の画像60に重畳する形で表示する。
 一方、翻訳支援装置10側のレイアウト表示部14は、テキスト表示領域51~56にそれぞれ対応する領域情報に従って、レイアウト・イメージ33を正しいレイアウトで表示するための表示レイアウトを識別する。続いて、レイアウト表示部14は、識別した表示レイアウトに基づき、テキスト表示領域51~56のレイアウト配置に対応して、図6(a)に示すテキストボックス71~76をレイアウト・イメージ33内に設定する。このテキストボックス71~76は、テキスト表示領域51~56の各々のテキスト表示位置において原文テキストと置き換える形で編集された翻訳文を表示するためにレイアウト・イメージ33内に設定されるテキストボックスである。
 その後、対訳ウィンドウ350内に図7に示す訳文編集フォーム35が表示された状態で、翻訳者80(図3)は翻訳文を編集する。その際、翻訳者80が翻訳文の編集のために入力操作インターフェース351を介して図7の入力ボックス32(a)~32(h)にて入力操作を行うと、入力操作が対訳ウィンドウ350から編集コマンド変換部340に出力される。
 編集コマンド変換部340は、対訳ウィンドウ350から受け取った入力操作を編集コマンドに変換し、通信部310および入出力制御部16を経由して翻訳支援装置10上のレイアウト表示部14に送信する。編集コマンド変換部340が送信するこの編集コマンドは、レイアウト表示部14に翻訳者80による編集操作内容を解釈させ、当該解釈に応じたレイアウト表示処理を実行させるためのコマンドである。
 レイアウト表示部14は、編集コマンド変換部340から受け取った編集コマンドを解析するために、以下の動作を実行する。まず、翻訳者が行った入力操作がレイアウト・イメージ33内のテキスト表示領域51~56の何れを対象としたテキスト編集操作であるかを識別する。続いて、翻訳者が行った入力操作が、編集対象となるテキスト表示領域に含まれる原文テキスト中のどの文字列部分を如何なる内容の翻訳文と置き換える操作であるかを識別する。最後に、レイアウト・イメージ33に関して識別済みの表示レイアウトに従って、編集対象として識別したテキストボックス(図6(a)のテキストボックス71~76の何れか)のレイアウト・イメージ33内でのレイアウト配置を特定する。
 続いて、レイアウト表示部14は、入出力制御部16および通信部310を経由して上述した編集コマンドの解析結果を情報表示部320に送信する。そして、情報表示部320がレイアウト表示部14により生成された編集コマンドの解析結果をレイアウト・イメージ表示ウィンドウ330に出力する。すると、レイアウト・イメージ表示ウィンドウ330は、レイアウト表示部14による編集コマンドの解析結果に従い、編集対象となるテキスト表示領域に含まれる原文テキスト中の該当する文字列部分を識別する。続いて、レイアウト・イメージ表示ウィンドウ330は、原文テキスト中の該当する文字列部分を編集途中の翻訳文で置き換えたテキストを適切なレイアウト配置で表示する。
 (第2実施形態)
 以上のように、図1~図4を参照して上述した実施形態では、翻訳支援システム1は、創作者が利用する端末2、翻訳者が利用する端末3、サーバ装置などにより構成された翻訳支援装置10および電子商取引システムを通信網で接続することにより構成されていた。しかしながら、本発明の幾つかの実施形態に係る翻訳支援システム1は、単一のスタンドアロン型コンピュータ装置のみを用いて構成されてもよい。その場合、消費者が消費者用端末から通信網を介して当該スタンドアロン型コンピュータ装置に直にアクセスすることで翻訳版の漫画データを購入し、ダウンロードすることが可能となる。
 単一のスタンドアロン型コンピュータ装置のみを用いて構成した翻訳支援システムの一例をスタンドアロン型翻訳支援システム100として図8に示す。図8に示すスタンドアロン型翻訳支援システム100は、少なくとも3つ以上のプロセッサ・コアPC1~PC3がオンチップ集積されたマルチコア・アーキテクチャを有するCPUを含んで構成される。さらに、図8に示すスタンドアロン型翻訳支援システム100は、内部バス15と、記憶部17と、ネットワーク・インターフェース19と、を含んで構成される。ここで、記憶部17は、図2に示す文書データ記憶部17a、テキスト情報記憶部17b、画像情報記憶部17cおよびレイアウト情報記憶部17dを単一のストレージ装置に統合して実現したものである。
 図8を参照して後述するとおり、図8に示す実施形態では、プロセッサ・コアPC1~PC3によって以下の三つの機能の全てがスタンドアロン型翻訳支援システム100内で実行される。まず、プロセッサ・コアPC1において、図2に示す翻訳支援装置10が実行していた機能と同等の機能が実行される。また、プロセッサ・コアPC2において創作者の端末2(図1)が実行していた機能および図3に示す実施形態に従って翻訳者の端末3が実行していた機能と同等の機能が実行される。また、プロセッサ・コアPC1において、図1に示す電子商取引機能を有する電子出版システム4が実行していた機能と同等の機能が実行される。
 また、スタンドアロン型翻訳支援システム100は、フラットパネル・ディスプレイ装置、キーボード、マウスおよびタッチペンなどを含むディスプレイ装置および入力操作デバイス30’と接続されている。ディスプレイ装置および入力操作デバイス30’は、スタンドアロン型翻訳支援システム100を、創作者、翻訳者およびシステム運用管理者が操作しようとする際に必要となる画面表示機能と入力操作インターフェースを提供する。なお、図2に示す実施形態とは異なり、図8に示す内部バス15は、複数のプロセッサ・コアPC1~PC3間の通信を可能とするプロセッサ間相互接続バスとして機能する。また、内部バス15は、プロセッサ・コアPC1~PC3が記憶部17およびネットワーク・インターフェース19との間でデータ入出力を行うための入出力バスとしても機能する。
 図8に示すスタンドアロン型翻訳支援システム100では、プロセッサ・コアPC1は、図2に示す翻訳支援装置10が備える入出力制御部16をオペレーティング・システムと同様の役割を有するシステム・ソフトウェアとして実行する。その上で、プロセッサ・コアPC1は、オペレーティング・システムとして動作中の入出力制御部16の上で実行されるスレッドやプロセス等として、テキスト情報抽出部11、画像情報抽出部12、フォーム表示部13、レイアウト表示部14等を実行している。図8に示すプロセッサ・コアPC1が実行するテキスト情報抽出部11、画像情報抽出部12、フォーム表示部13、レイアウト表示部14は、図2に示す翻訳支援装置10が備えるものと同じ機能を有し、同じ役割を果たす。
 また、プロセッサ・コアPC2は、図1に示す実施形態において、創作者が漫画データの作成に用いる端末2および翻訳者が利用する翻訳者用の端末3において実現される必要のある機能と同等の機能をスレッドやプロセスの形態で実行している。具体的には、図8に示すプロセッサ・コアPC2は、マルチウィンドウ環境を備えた汎用のオペレーティング・システム201を実行している。さらに、図8に示すオペレーティング・システム201の上で実行される情報表示部320、レイアウト・イメージ表示ウィンドウ330、編集コマンド変換部340、対訳ウィンドウ350等は、図3に示すものと同等の機能を実行し、同等の役割を有している。つまり、オペレーティング・システム201の上では、図3に示す翻訳者用の端末3の内部で実行されている複数の機能モジュール(図3に示す320~350、および351)と同等の機能を実行するスレッドやプロセスが実行されている。図8に示すプロセッサ・コアPC2が実行している情報表示部320、レイアウト・イメージ表示ウィンドウ330、編集コマンド変換部340、対訳ウィンドウ350などは、オペレーティング・システム201および内部バス15を介してプロセッサ・コアPC1の上で実行中の入出力制御部16と通信し、データや情報をやり取りすることができる。
 加えて、プロセッサ・コアPC2が実行するオペレーティング・システム201の上では、創作者が利用する端末2の上で原作漫画の漫画データを作成するために必要な機能として、創作者用アプリケーション群220と創作者用ウィンドウ環境210が実行されている。創作者用アプリケーション群220には、創作者が漫画データに挿入すべきデジタル画像データを編集加工するための画像編集加工アプリケーションAP1やテキスト・データ作成およびレイアウト設計アプリケーションAP2等が含まれている。また、創作者用ウィンドウ環境210は、これらのプリケーションAP1およびAP2を、GUIを介して操作したり、編集中のコンテンツ・データを画面表示したりするためのウィンドウ環境である。創作者用アプリケーション群220と創作者用ウィンドウ環境210は、オペレーティング・システム201および内部バス15を介してプロセッサ・コアPC1の上で実行中の入出力制御部16と通信し、データや情報をやり取りすることができる。
 また、プロセッサ・コアPC3は、図1に示す実施形態において、翻訳支援装置10が出力する翻訳後の漫画データを消費者に販売しダウンロードさせる電子商取引システム4の機能と同等の機能を実行する。具体的には、プロセッサ・コアPC3は、オペレーティング・システム401を実行し、オペレーティング・システム401の上で、少なくとも電子出版用データ変換ツール402およびWebサーバ・ソフトウェア403を実行してもよい。
 ここで、電子出版用データ変換ツール402は、プロセッサ・コアPC1上の機能部とプロセッサ・コアPC2上の機能部とが互いに通信しながら図4に示す処理フローに従って漫画データを生成すると、当該漫画データを電子出版物として出版可能なデータ形式に変換する。また、Webサーバ・ソフトウェア403の内部では、電子商取引用Webサーバ・アプリケーション404がコンテナ・アプリケーションやJava(登録商標) Servletなどとして実行されてもよい。
 その結果、電子出版用データ変換ツール402が翻訳版の漫画データを電子出版物の形式で出力すると、当該電子出版物は、電子商取引用Webサーバ・アプリケーション404により、オンライン購入とダウンロードが可能な状態となる。そして、電子商取引用Webサーバ・アプリケーション404が、当該電子出版物のオンライン購入要求を、通信網を経由して消費者の端末から受け付けると、購入された当該電子出版物を消費者の端末からダウンロード可能となる。なお、電子商取引用Webサーバ・アプリケーション404、Webサーバ・ソフトウェア403および電子出版用データ変換ツール402などは、オペレーティング・システム401および内部バス15を介してプロセッサ・コアPC1の上で実行中の入出力制御部16と通信し、データや情報をやり取りすることができる。
 本発明に関し、以上のとおり述べた実施形態では、テキスト情報とページ毎のレイアウト・イメージを見比べながらレイアウト・イメージ内における原文テキストと翻訳文の対応関係を確認する必要なしに翻訳作業を可能にすることができる。また、以上のとおり述べた実施形態では、編集途中の翻訳文をレイアウト・イメージ内に配置した結果に違和感があるか否かを翻訳文編集作業と並行してインタラクティブに確認可能とすることができる。
 (その他の実施形態)
 その他の例示的な実施形態では、電子出版物として電子化された漫画データは、画像レイヤの上に一つ以上の原文のテキスト表示領域51~56(図5を参照)を含むテキスト表示レイヤが重畳されたデジタル画像データとして構成されていてもよい。そのような実施形態では、テキスト情報抽出部11は、漫画データの画像レイヤから原文表示レイヤを分離するように構成されていてもよい。そして、テキスト情報抽出部11は、当該原文表示レイヤから原文のテキスト表示領域51~56(図5を参照)の各々に対応する領域情報およびテキスト情報を抽出して出力するように構成されてもよい。
 この実施形態では、画像レイヤの一例は、レイアウト・イメージ33からテキストを除去することで、図6(b)に示すとおりに得られる画像61~63を含む画像レイヤであってもよい。また、上記のテキスト表示レイヤは、図5に示すテキスト表示領域51~56に対応するテキストボックス71~76にそれぞれ組み込まれるべき原文テキストの文字情報を備えるレイヤであってもよい。
 さらに別の実施形態では、電子出版物として電子化された漫画データは、アナログ画像情報として構成されていてもよい。そのような実施形態では、テキスト情報抽出部11は、画像解析によりテキスト表示領域51~56(図5を参照)の各々に対応する領域情報およびテキスト情報を抽出するようにさらに構成されてもよい。
 一実施形態では、電子出版物として電子化された漫画データは、アナログRGB信号として走査することで所望のグラフィックとして画面表示可能なアナログ画像情報として構成されてもよい。この実施形態では、テキスト情報抽出部11は、当該アナログRGB信号の走査パターンと文字の字画を表現するトポロジー・パターンとのマッチングに基づいて 原文のテキスト表示領域の各々に対応する領域情報およびテキスト情報を出力するようにさらに構成されてもよい。
1 翻訳支援システム
2(2a,2b) 端末
3(3a~3c) 端末
4 電子商取引システム
5(5a~5c) 端末
6(6a,6b) 通信網
10 翻訳支援装置
11 テキスト情報抽出部
12 画像情報抽出部
13 フォーム表示部
14 レイアウト表示部14
15 内部バス
16 入出力制御部
17(17a~17d) 記憶部
19 ネットワーク・インターフェース
30 画面
30’ ディスプレイ装置および入力操作デバイス
31 原文表示ボックス
32 入力ボックス
33 レイアウト・イメージ
33-1 レイアウト・イメージ表示エリア
33-2 レイアウト・イメージ表示エリア
51~56 テキスト表示領域
51’~56’ 吹き出し
61~63 画像
71~76 テキストボックス
100 スタンドアロン型翻訳支援システム
201 オペレーティング・システム
210 創作者用ウィンドウ環境
220 創作者用アプリケーション群
310 通信部
320 情報表示部
330 レイアウト・イメージ表示ウィンドウ
340 編集コマンド変換部
350 対訳ウィンドウ
351 入力操作インターフェース
401 オペレーティング・システム
402 電子出版用データ変換ツール
403 Webサーバ・ソフトウェア
404 電子商取引用Webサーバ・アプリケーション
 

 

Claims (9)

  1.  画像とテキストが混在した電子出版物において原文テキストの翻訳を支援する翻訳支援装置であって、
     前記電子出版物の前記画像の中に表示されたテキスト表示領域を抽出し、領域情報と共に前記原文テキストの文字列および文字属性を表すテキスト情報を抽出するテキスト情報抽出部と、
     前記電子出版物から前記テキストを含まない前記画像を抽出する画像抽出部と、
     前記テキスト情報からテキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するフォーム表示部と、
     前記訳文編集フォームへの入力に応じて、前記領域情報及び前記文字属性により規定される表示レイアウトに従って、編集後の前記翻訳文を前記画像に重畳して画面表示するレイアウト表示部と、
    を備える翻訳支援装置。
  2.  前記訳文編集フォームは、テキスト表示領域毎に、原文テキストが表示される表示ボックスと翻訳文を入力する入力ボックスとを対応付けて画面表示するように構成され、
     前記入力ボックスにて入力操作に応じて、入力内容が前記表示レイアウトに従って対応する前記テキスト表示領域内に反映される、
    ことを特徴とする請求項1記載の翻訳支援装置。
  3.  前記領域情報は、原文を含むテキスト表示領域の各々における文字枠と前記文字枠の配置を記述することで前記表示レイアウトを規定する、
    ことを特徴とする請求項1または請求項2に記載の翻訳支援装置。
  4.  前記文字属性は、前記原文テキストの文字列のフォント種別およびフォントサイズを文字毎に記述し、文字列全体の向きをさらに記述することで前記表示レイアウトを規定する、
    ことを特徴とする請求項1から請求項3の何れか一項に記載の翻訳支援装置。
  5.  前記電子出版物は画像レイヤの上に一つ以上の原文の前記テキスト表示領域を含む原文表示レイヤが重畳されたデジタル画像データとして構成され、
     前記テキスト情報抽出部は、前記画像レイヤから分離された前記原文表示レイヤから原文を含む前記テキスト表示領域の各々に対応する前記領域情報および前記テキスト情報を抽出して出力するようにさらに構成される、
    ことを特徴とする請求項1から請求項4の何れか一項に記載の翻訳支援装置。
  6.  前記電子出版物は、アナログ画像情報として構成され、
     前記テキスト情報抽出部は、画像解析により前記テキスト表示領域の各々に対応する前記領域情報および前記テキスト情報を抽出するようにさらに構成される、
    ことを特徴とする請求項1から請求項4の何れか一項に記載の翻訳支援装置。
  7.  前記フォーム表示部は、前記領域情報及び前記テキスト情報に基づいて、前記訳文編集フォームを画面表示するようにさらに構成され、
     前記レイアウト表示部は、前記翻訳文が編集されるたびに、前記原文表示レイヤに編集内容を反映し、前記電子出版物のレイアウト・イメージの表示を更新することで、編集後の前記翻訳文を画面表示するようにさらに構成される、
    ことを特徴とする請求項5に記載の翻訳支援装置。
  8.  画像とテキストが混在した電子出版物において原文テキストの翻訳を支援するための一連の処理ステップをコンピュータ装置に実行させる翻訳支援プログラムであって、
     前記電子出版物を入力として受け取ると、前記画像の中に表示されたテキスト表示領域を抽出し、領域情報と共に前記原文テキストの文字列および文字属性を表すテキスト情報を抽出するステップと、
     前記電子出版物から前記テキストを含まない前記画像を抽出するステップと、
     前記テキスト情報からテキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するステップと、
     前記訳文編集フォームへの入力に応じて、前記領域情報及び前記文字属性により規定される表示レイアウトに従って、編集後の前記翻訳文を前記画像に重畳して画面表示するステップと、
    を備える翻訳支援プログラム。
  9.  画像とテキストが混在した電子出版物において原文テキストの翻訳を支援するために情報処理装置により実行される方法であって、
     前記電子出版物が前記情報処理装置に入力されると、前記画像の中に表示されたテキスト表示領域を抽出し、領域情報と共に前記原文テキストの文字列および文字属性を表すテキスト情報を抽出するステップと、
     前記電子出版物から前記テキストを含まない前記画像を抽出するステップと、
     前記テキスト情報からテキスト表示領域毎の翻訳文を編集可能な訳文編集フォームを画面表示するステップと、
     前記訳文編集フォームへの入力に応じて、前記領域情報及び前記文字属性により規定される表示レイアウトに従って、編集後の前記翻訳文を前記画像に重畳して表示画面に表示するステップと、
    を備える方法。

     
PCT/JP2018/041374 2017-11-16 2018-11-07 翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法 WO2019098107A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-221368 2017-11-16
JP2017221368A JP2019091361A (ja) 2017-11-16 2017-11-16 翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法

Publications (1)

Publication Number Publication Date
WO2019098107A1 true WO2019098107A1 (ja) 2019-05-23

Family

ID=66540219

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/041374 WO2019098107A1 (ja) 2017-11-16 2018-11-07 翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法

Country Status (3)

Country Link
JP (1) JP2019091361A (ja)
TW (1) TW201923625A (ja)
WO (1) WO2019098107A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666776A (zh) * 2020-06-23 2020-09-15 北京字节跳动网络技术有限公司 文档翻译方法和装置、存储介质和电子设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020230418A1 (ja) 2019-05-14 2020-11-19 パナソニックIpマネジメント株式会社 表示装置
JP7329281B1 (ja) 2022-08-02 2023-08-18 株式会社オレンジ 情報処理装置、方法、プログラム、およびシステム
JP7246795B1 (ja) 2022-08-30 2023-03-28 株式会社オレンジ 情報処理装置、方法、プログラム、およびシステム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016100025A (ja) * 2014-11-26 2016-05-30 ネイバー コーポレーションNAVER Corporation 翻訳文エディタ提供装置、並びに翻訳文エディタ提供方法
JP2017004483A (ja) * 2015-06-11 2017-01-05 チャンヨン コー 多国語ウェブトゥーンの製作システム及びその方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016100025A (ja) * 2014-11-26 2016-05-30 ネイバー コーポレーションNAVER Corporation 翻訳文エディタ提供装置、並びに翻訳文エディタ提供方法
JP2017004483A (ja) * 2015-06-11 2017-01-05 チャンヨン コー 多国語ウェブトゥーンの製作システム及びその方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666776A (zh) * 2020-06-23 2020-09-15 北京字节跳动网络技术有限公司 文档翻译方法和装置、存储介质和电子设备
US11580314B2 (en) 2020-06-23 2023-02-14 Beijing Bytedance Network Technology Co., Ltd. Document translation method and apparatus, storage medium, and electronic device

Also Published As

Publication number Publication date
JP2019091361A (ja) 2019-06-13
TW201923625A (zh) 2019-06-16

Similar Documents

Publication Publication Date Title
WO2019098107A1 (ja) 翻訳支援装置、翻訳支援プログラム、および情報処理装置により翻訳を支援する方法
US20140006913A1 (en) Visual template extraction
US20040041818A1 (en) Design system for website text graphics
WO2004031883A2 (en) A method for manipulation of objects within electronic graphic documents
CN111694563B (zh) 针对用户界面模式的可视化设计系统及其方法
JP5404969B1 (ja) 電子マニュアル閲覧装置およびシステム
Bagley et al. Creating reusable well-structured PDF as a sequence of component object graphic (COG) elements
CN113297856A (zh) 文档翻译方法、装置及电子设备
JP2007265011A (ja) 画面プログラムレイアウト変更方法および情報処理装置およびプログラムおよび記録媒体
JP7148804B2 (ja) ソースファイル生成プログラム、ソースファイル生成方法、および情報処理装置
JP2000076226A (ja) 文書データの編集システム
JP7246795B1 (ja) 情報処理装置、方法、プログラム、およびシステム
MacKinnon et al. Designing UML diagrams for technical documentation
Filip et al. Modification and Rendering in Context of a Comprehensive Standards Based L10n Architecture
KR101948114B1 (ko) 컨텐츠 퍼블리싱 장치 및 컨텐츠 퍼블리싱 방법
JPS63109578A (ja) 論理図概要表示処理方式
WO2024018694A1 (ja) 情報処理装置、情報処理プログラム及び情報処理方法
JP2000339307A (ja) 組版装置
JP2018005367A (ja) 編集支援システム、編集支援装置、データ置換装置及び編集支援方法
JP2006277460A (ja) マニュアル作成管理装置
CN114970462A (zh) 一种对数据模块自动标注更改标记的方法和系统
JP3125754U (ja) アプリケーション非依存データ生成システム
JP2008186311A (ja) 複数種類の自然言語でコメントが記述されたソースファイルのファイル変換システム
King Design spaces: The limitations of variability in typeface design
JP2004537793A (ja) コントロール/ディスプレイ・ユニットのページ・ビルダ・ソフトウェア・ツール

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18878952

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205 DATED 18/09/2020)

122 Ep: pct application non-entry in european phase

Ref document number: 18878952

Country of ref document: EP

Kind code of ref document: A1