WikiUp

Google Translate Toolkit (ABCDEFG (provvisorio per test ricerca))

Introduzione

Il servizio di "Google Translate" offre traduzioni totalmente automatiche senza alcuna interazione con un utente. In alcuni casi è però necessario un intervento umano, per rendere più' intellegibile la traduzione e per ovviare ad alcuni limiti della tecnologia attuale. Per questo scopo, Google offre un altro servizio: Google Translate Toolkit.

Google Translate Toolkit ha delle funzionalità aggiuntive che facilitano e aumentano la qualità delle traduzioni e permette anche di creare e definire dei glossari (glossaries) e memorie di traduzione (translating memories) in formato TMX (Translating Memories eXchange).

Le memorie di traduzione (TM) sono dei database di traduzioni e sono utilizzate durante la traduzione automatica per ricercare delle frasi simili a quelle già' tradotte. Questi database possono essere esportati in formato TMX o condivisi con altri utenti di google translate.

Google Translate Toolkit

Per accedere accedere a Google Translate Toolkit è necessario un account di google.

Dal proprio browser digitare: http://translate.google.com/toolkit
e inserire l'utente e la password del proprio account Google.

La lingua di visualizzazione è modificabile cliccando sul link "Impostazioni"

Una volta effettuato il primo login, bisogna creare (o importare) almeno un dizionario di traduzione ed eventualmente importare un glossario.

Per creare (o importare) una memoria di traduzione, cliccare su memorie di traduzione

e poi cliccare sul bottone "Aggiungi", o sul bottone "Choose File" per importare un file

In maniera analoga, è possibile caricare un glossario personalizzato.

Dalla pagina principale si caricano i documenti da tradurre cliccando sul bottone "Carica"

Selezionare le lingue di traduzione (per esempio da Italiano a Inglese) e cliccare il bottone "Choose File" per caricare il documento da tradurre.

Per associare un glossario e una memoria di traduzione al documento si deve cliccare su condivisione e selezionare i database da utilizzare.

A questo punto, Google Translate Toolkit procede con la traduzione che una volta completata viene presentata con il testo originale a fronte.

Le frasi sono automaticamente divise in segmenti, e vi è la possibilità di suddividere manualmente i segmenti (menu "modifica", elemento "Dividi segmento").

La traduzione automatica dei singoli segmenti è modificabile e, come accennato precedentemente, i segmenti sono ulteriormente divisibili in sottosegmenti. Tutte le modifiche sono salvate nelle memorie di traduzione e riutilizzate nelle traduzioni successive. Al completamento della traduzione, si consiglia di cambiare lo stato della traduzione in "traduzione completa" cliccando sul bottone modifica e selezionando "Traduzione Completa".

Infine, per salvare le modifiche, bisogna cliccare su "salva" o "salva e chiudi".

Per procedere all'esportazione del documento tradotto, dalla schermata principale si clicca il bottone "Scarica". Il documento è esportato nello stesso formato del documento originario (per esempio: txt, html, odt)

Vi è anche la possibilità di condividere il testo con altri utenti cliccando il bottone condividi (analogamente, il sistema permette la condivisione di memorie di traduzione.)

Tutti i segmenti inseriti manualmente durante la traduzione sono memorizzati nelle memorie di traduzione e riutilizzati nelle traduzioni successive. Le memorie di traduzione si esportano cliccando "Memorie di traduzione" nella pagina principale, selezionando poi la memoria da esportare, e cliccando il bottone "scarica".

L'immagine qui sotto presenta una memoria di traduzione in formato TMX, generata durante la traduzione della pagina di test.

Ulteriori informazioni sono disponibili nella guida online di Google Translate Toolkit:

Caricamento ed esportazioni: http://translate.google.com/support/toolkit/bin/topic.py?hl=it&topic=22240
Memorie di traduzione e glossari: http://translate.google.com/support/toolkit/bin/topic.py?hl=it&topic=22239
Traduzioni: http://translate.google.com/support/toolkit/bin/topic.py?hl=it&topic=22238
Translation Memory eXchange (TMX): http://en.wikipedia.org/wiki/Translation_Memory_eXchange

Limiti di Google Translate Toolkit

Le memorie di traduzione gestite da Google Translate Toolkit hanno una grandezza massima di 50 MB.

Ad ogni documento è associabile solo una memoria di traduzione.

I glossari possono solo essere importati (contrariamente a quanto descritto nella guida online, la funzionalità di creazione non esiste.

La segmentazione di un testo durante la traduzione automatica tende a selezionare intere righe.

I testi sono solo importabili (ovvero, il copia-e-incolla di Google Translate non esiste in Toolkit).

Traduzioni e glossari hanno una dimensione massima di 1 MB.

La maggior parte di questi limiti sono superabili attraverso l'uso delle Google Translate Toolkit data APIs.

Google Translate Toolkit Data APIs

Google fornisce anche una libreria di interfacce per scaricare, caricare e modificare tutti gli oggetti (documenti, traduzioni, glossari e memorie di traduzione) presenti in Toolkit.

La documentazione è disponibile sulla pagina http://code.google.com/apis/gtt/

TMX ( Translation Memory eXchange)

TMX è uno standard aperto XML per lo scambio di memorie di traduzione. Google Translate Toolkit supporta le TMX sia in upload che download.

Lo standard TMX nel sito di L.I.S.A (Localization Industry Standards Association): http://www.lisa.org/Translation-Memory-e.34.0.html

La pagina di wikipedia che descrive le memorie di traduzione: http://en.wikipedia.org/wiki/Translation_Memory_eXchange

Esempio: <?xml version="1.0" encoding="UTF-8"?> <tmx version="1.4"> <header creationtool="XYZTool" creationtoolversion="1.01-023" datatype="PlainText" segtype="sentence" adminlang="en-us" srclang="it-IT" o-tmf="ABCTransMem"> </header> <body> <tu tuid="BB001VF" datatype="plaintext"> <tuv xml:lang="it-IT"> <seg>Abbandonare</seg> </tuv> <tuv xml:lang="en-US"> <seg>Quit</seg> </tuv> <tuv xml:lang="es-ES"> <seg>Abandona</seg> </tuv> <tuv xml:lang="fr-FR"> <seg>Abandonne</seg> </tuv> <tuv xml:lang="de-DE"> <seg>Aussteigen</seg> </tuv> </tu> </body> </tmx>

Glossari

I glossari sono liste di parole in formato csv. L'header del file contiene le lingue presenti nel glossario (una per colonna) e le righe le parole nelle diverse lingue.

La pagina dei glossari di Google Tranlsate Toolkit: http://translate.google.com/support/toolkit/bin/answer.py?hl=en&answer=147854

Esempio:

it,en,es,fr,de Abbandona,Quit,Abandona,Abandonne,Aussteigen abbandonata,quitted,abandonada,abandonnée,ausgestiegen Abbandono,Quit,Abandono,Abandon,

Add new attachment

Only authorized users are allowed to upload new attachments.
«