Traduction assistite per le computator
Traduction assistite per le computator |
---|
subclasse de: translation[*] |
|
Le traduction assistite per le computator, traduction adjutate per le computator o CAT es un forma de traduction de idioma in le qual le traductor usa software del computator pro supportar e facilitar le processo de traduction.
Le traduction assistite per le computator alicun vices es denominate traduction assistite per le machina, o traduction adjutate per le machina (non confunder con Traduction a machina o Traduction automatic).
Supervista
[modificar | modificar fonte]Le systemas de traduction automatic disponibile hodie non son capabile a producer traductiones de alte qualitate sin ulterior adjuta: lor emissiones debe esser modificate manualmente, pro corriger le errores e meliorar le qualitate del traduction. Le traduction assistite per le computator (CAT) incorpora in le application un stadio de modification manual pro transformar le traduction in un processo interactive inter le traductor e le computator.[1]
Alicun applicationes avantiate de traduction assistite per le computator, include anque le uso de alicun traductor automatic (MT - Machine Translation) externe. Generalmente le modulos de MT, le plus costose, provide un ulterior serie de instrumentos plus complexe, que pote comprender characteristicas de gestion del terminologia e varie altere instrumentos o utilitates linguistic. Le dictionarios accuratemente personalisate, basate sur le terminologia correcte, affina significativemente le precision del MT, e in consequentia le objectivo a accrescer le efficientia de tote le processo de traduction.
Campo del applicationes
[modificar | modificar fonte]Le Traduction assistite per le computator es un ample e imprecise termino que concerne le campo del instrumentos, a partir de illos assatis simple al instrumento le plus complicate. Isto pote includer:
- Le Correctores orthographic, sia includite in le applicationes del processor del parola, sia add-on
- Le Correctores grammatical, novemente o includite in le applicationes de processor del parola, o programmas add-on
- Le Administrator de terminologia, que permitte al traductor de gerer su proprie Banca terminologic in un forma electronic. Iste banca terminologic pote spatiar ab un simple tabella create in un software Processor del parola, o Folio de calculo, a un Banca del datos, create in un programma ad hoc qual FileMaker Pro o, pro solutiones plus robuste (e plus dispendiose), pacchettos software specific pro le terminologia qual SDL MultiTerm, LogiTerm, Termex, etc.
- Dictionarios electronic, sia monolingue que bilingue
- Base de datos terminologic, sia in le computator hospite sia accessibile per Internet, assi como TERMIUM Plus o Grand dictionnaire terminologique per le Office québécois de la langue française
- Application cerca texto (o Creator de indice), que permitte al usator de querer textos ja rendite o altere documentos pro referentia. ISYS Search Software, dtSearch Desktop e Naturel son alicun de tal Creator de indice.
- Le Cercatores de concordantia, que son programmas que recupera instantias de un parola o de un expression e su respective contexto in un corpus monolingue, bilingue o multilingue, assi como un memoria de traduction o bitext
- Le Alineatores bitext: applicationes que alinea un texto fonte e su traduction que pote tunc esser analysate per un Application Cerca Texto o un Cercator de concordantia
- Le Software de gestion de projecto, que permitte al linguistas pro le traduction de projectos con structura complexe de assignar le varie labores a distincte personas, e traciar le progresso de cata de iste labores
- Le Application pro Memorias de traduction (TM - translation memory), consistente de un base de datos de segmentos de texto in lingua fonte e lor traduction in uno o plus linguas de destination.
Conceptos
[modificar | modificar fonte]Software pro memorias de traduction
[modificar | modificar fonte]Le programmas pro Memorias de traduction registra texto fonte previemente rendite e lor textos de destination equivalente in un base de datos e recupera le segmentos pertinente durante le traduction de textos nove.
Tal applicationes finde le texto fonte in unitates conveniente al traduction, denominate Segmentos. Pote esser considerate un Segmento un phrase de texto fonte, un unitate simile a un phrase (testas, titulos o elementos in un lista); le textos pote esser segmentate in unitates plus grande como le paragrapho o unos parve, como le proposition. Dum le traductor opera in un documento, le software monstra a tornos cata segmento fonte e suggere pro le reutilisation traductiones previe, ex su bases de datos, que concorda mesmo si partialmente con le segmento currente. Le programma comocunque permitte al traductor de modificar le campo de destination del segmento o inscriber un traduction ex novo. Postquam le traduction del segmento es complete, le programma registra tal nove traduction in le memoria de traduction currente e move al segmento sequente. In le significato dominante del termino, le Memoria de traduction es un simple base de datos de campos continente le segmento in lingua fonte, le traduction de tal segmento, e altere informationes relative, como data del creation del segmento, ultime accesso, nomine del traductor et cetera. Un altere approche del memoria de traduction non implica le creation de un base de datos, sed in vice conta sur le alineamento del segmentos del documentos de referentia.
Alicun "Programmas pro memoria de traduction" functiona como ambientes de labor independente, dum altere unos functiona como add-on o macro del Processor de parola disponibile commercialmente o de altere programma pro le commercio. Le programmas add-on permitte de tractar le TM in documentos fonte de altere formatos, qual files pro Editor de scriptorio (Desktop Publishing), Folio de calculo, o files in codice HTML.
Motor de recerca linguistic
[modificar | modificar fonte]Nove pro le industria del traduction, le software motor de recerca linguistic es typicamente un systema basate sur Interrete que opera como le motores de recerca Interrete. Tamen, plus tosto que perquirer Interrete, un motor de recerca linguistic cerca in un grande thesauro de Memorias de traduction, pro trovar fragmentos de phrase, phrases, sententias integre o etiam paragraphos complete previemente rendite, que concorda le segmentos del documento fonte.
Le motores de recerca linguistic son designate a fruer del moderne technologia de recerca pro conducer recercas basate sur le parolas fonte in contexto pro assecurar que le resultatos del recerca concorda le significato del segmentos fonte. Como le applicationes TM traditional, le valor de un motor de recerca linguistic appoia essentialmente sur le depositos disponibile de Memoria de traduction.
Gestores del terminologia
[modificar | modificar fonte]Le software Gestor del terminologia provide al traductor un medio de cerca automatic in un base de datos terminologic pro le terminos que appare in un documento, sia per le exposition automatic del terminos il le software del memoria de traduction, sia per le uso de vias breve del claviero pro vider le entrata in le base de datos terminologic. Alicun programmas ha altere vias breve, con combinationes de claves, que permitte durante le traduction de adder al volo, al base de datos terminologic, nove pares terminologic. Alicun del systemas le plus avantiate habilita le traductor a controlar, sia interactivemente o in batch mode, si le correcte combination del termino fonte/destination, esseva usate intra e a transverso le segmentos del memoria de traduction in un projecto date. Alsi existe le Systemas independente de gestion del terminologia, que pote fornir functionalitates de fluxo de labor, taxinomia visual, opera qual un typo de corrector de termino (simile al corrector orthographic, le terminos que non esseva usate correctemente son evidentiate) e pote supportar altere classificationes de facietta de termino multilingue qual picturas, videos, o sono.[2]
Alineatores
[modificar | modificar fonte]Le programmas de alineamento accepta traductiones complete, divide ambe le textos fonte e destination in segmentos, e tenta de determinar qual segmentos pertine conjunctemente a fin de struer con le contento un Memoria de traduction o altere ressource de referentia. Plure programmas de alineamento lassa le traductor a realianear manualmente le segmentos non correspondente. Le alineamento bitext resultante pote deinde esser importate in un programma pro memoria de traduction pro le traductiones futur o usate como un documento de referentia.
Traduction automatic interactive
[modificar | modificar fonte]Le Traduction automatic interactive es un methodo in le qual le systema automatic tenta a predicer le traduction que on va producer, con le suggestion de hypotheses de traduction. Le hypothese pote esser sia le phrase complete, sia un parte del phrase a traducer.
Traduction de turba
[modificar | modificar fonte]Le Traduction assistite per le turba se refere a emplear un grande numero de traductores qui collabora via Social media. Quando Facebook necessitava de traducer un grande corpore de texto existente in lingua anglese a su interfacies graphic del usator, le compania usava le adjuta voluntari de su base del usator bilingue jam existente, organisate per Yishan Wong.
Alicun instrumentos CAT notabile
[modificar | modificar fonte]Le lista sequente include sol alicun del instrumentos disponibile sur le mercato. Illo non es exhaustive e es sol designate quam exemplo, non como un referentia complete. Plure instrumentos relevante son mancante in le lista.
App | Formatos del files supportate | Sys Op | Licentia |
---|---|---|---|
Déjà Vu[3] | Microsoft Office (Word, Excel, Powerpoint, also embedded objects, and Access), Help Contents (CNT), FrameMaker (MIF), PageMaker, QuarkXPress, QuickSilver/Interleaf ASCII, Java Properties (.properties), HTML, HTML Help, XML, RC, C/Java/C++, IBM TM/2, Trados Workbench, Trados BIF (old TagEditor), Trados TagEditor, JavaScript, VBScript, ODBC, TMX, EBU, InDesign (TXT, ITD, INX, IDML), GNU GetText (PO/POT), OpenOffice, OpenDocument SDLX (ITD), ResX, XLIFF (XLF, XLIF, XLIFF, MQXLIFF, unsegmented and segmented SDLXLIFF), Visio (VDX), PDF, Transit NXT PPF, WordFast Pro TXML | Windows | Proprietary |
GlobalSight | Text ANSI / ASCII / Unicode for Windows, Text for Apple Macintosh, HTML, XML (ASP.NET, ASP, JSP, XSL), SGML, MS Word for Windows, MS Excel, MS PowerPoint, RTF, RC, Adobe FrameMaker, Adobe InDesign | Cross-platform (Java) | Apache License 2.0 |
gtranslator | PO | POSIX | GNU GPL |
Lokalize | Gettext PO, Qt ts, XLIFF, TMX | Cross-platform | GNU GPL |
memoQ[4] | .MIF, InDesign formats (.INDD, .INX, .IDML), .XML, .DITA, .XML, .MM, .PO, .HTML, .HMT, .SHT, .properties, .DOC, .RTF, .BAK, .DOT, .DOCX, .XLS, .XML, .XLSX, .XLSM, .XLS, .XLT, .PPT, .PPS, .POT, .PPTX, .PPSX, .POTX, .SLDX, .VDX, .HHC, .HHK, .ODT, .ODF, .TXT, .INF, .INI, .REG, .PDF, .SVG, .SDLPPX, .TTX, .SDLXLIFF, .TMX, .TXML, .RESX, .XLF, .XLIF, .XLIFF, XLIFF:doc | Windows | Proprietary |
MemSource | .doc, .docx, .rtf, .ppt, .pptx, .xls, .xlsx, .htm, .html, .properties, .tmx, .ttx, .xhtm, .xhtml, .xml, .dita, .ditamap, .xliff, .sdlxliff, .txt, .csv, .resx, .idml, .mif | Cross-platform (Java) | Proprietary |
MetaTexis | Microsoft Word, Excel and Powerpoint, all kinds of text formats, XML, HTML, XLIFF, RTF, TRADOS Studio (SDLXLIFF), TagEditor (TTX), POT/PO, Manual Maker, several further formats... | Microsoft Office Word add-in | Proprietary |
OmegaT | Plain text, HTML, XHTML, StarOffice, OpenOffice.org, OpenDocument (ODF), MS Office Open XML, Help & Manual, HTML Help Compiler (HCC), LaTeX, DokuWiki, QuarkXPress CopyFlow Gold, DocBook, Android Resource, Java Properties, Typo3 LocManager, Mozilla DTD, Windows RC, WiX, ResX, INI files, XLIFF, PO, SubRip Subtitles, SVG Images | Cross-platform (Java) | GNU GPL |
Open Language Tools | XLIFF, HTML/XHTML, XML, DocBook SGML, ASCII, StarOffice/OpenOffice/ODF, PO, .properties, .java (ResourceBundle), .msg/.tmsg (catgets) | Cross-platform (Java) | CDDL |
Poedit | PO | Cross-platform | MIT license |
Pootle | PO, XLIFF, OpenOffice GSI files (.sdf), TMX, TBX, Java Properties, DTD, CSV, HTML, XHTML, Plain Text | Cross-platform (Python) | GNU GPL |
SDL Trados | Features four translation environments: dedicated TagEditor, MSWord Interface, SDLX, the integrated interface SDL Trados Studio 2011. Additional filters for translating with TagEditor available: Word, Excel, PowerPoint, OpenOffice, InDesign, QuarkXPress, PageMaker, Interleaf, Framemaker, HTML, SGML, XML, SVG, .... Includes SDL MultiTerm for terminology management and Project Management Dashboard for automating tasks and tracking. | Windows | Proprietary |
Virtaal | XLIFF, PO and MO, TMX, TBX, Wordfast TM, Qt ts Many others via converters in the Translate Toolkit |
Cross-platform (Python) | GNU GPL |
Wordfast PRO | MS Word, Excel, PowerPoint (all versions), PDF, SGML, HTML, XML, InDesign, FrameMaker, tagged documents, XLIFF, etc. | Cross-platform (Java) | Proprietary |
According to a 2006 survey undertaken by Imperial College of 874 translation professionals from 54 countries, primary tool usage was reported as follows: Trados (35%), Wordfast (17%), Déjà Vu (16%), SDL Trados 2006 (15%), SDLX (4%), STAR Transit (3%), OmegaT (3%), others (7%).[5]
Vide etiam
[modificar | modificar fonte]Referentias
[modificar | modificar fonte]- ↑ Barrachina, Sergio; et al (2009). "Statistical Approaches to Computer-Assisted Translation". Computational Linguistics 35 (1): 3–28. ISSN 0891-2017.
- ↑ Archive copy. Archivo del original create le 2012-04-25. Recuperate le 2014-03-18.
- ↑ Lista del typo de file supportate per Déjà Vu X3. Archivo del original create le 2015-09-23. Recuperate le 2014-03-18.
- ↑ Supported file type reference list for memoQ
- ↑ Imperial College London Translation Memories Survey 8, 25–6, figure 25 (2006). Archivo del original create le 2011-05-17. Recuperate le 2014-03-18.()