Inicio | Información técnica | Tarifas e prezos | Área de profesionais | Empresas | Contactar | Probar o traductor |

Información Técnica:

 

CONSIDERACIÓNS XERAIS SOBRE O USO DE TRADUCTORES AUTOMÁTICOS

 

  1. Obxectivos e especificacións internacionais sobre a traducción automática

A traducción automática (MT – Machine Translation ou Traducción Automática, 

a partir de agora TA) é un proceso que inclúe distintas fases, algunhas delas inseridas nos procedementos habituais na elaboración de documentos da empresa (procedementos de edición) e outras que teñen que ver estrictamente co proceso da traducción (procedementos de traducción). 
 
 

Os procedementos de edición refírense a:

  • Pre-edición. Formato e estilo dos documentos da empresa.
  • Post-edición. Revisión e presentación final dos documentos.
Os procedementos de traducción refírense  a:
  • Uso dunha lingüística computacional.
  • Utilización  dun diccionario bilingüe.
  • Unha arquitectura de transformación. 
  • Unha base de datos de coñecementos lingüísticos (LK – Linguistic Knowledge). 
  • Implementación do uso de diccionarios de sublinguaxes. 
Todos estes procesos en conxunto deben proporcionar unha traducción de calidade que se axuste aos requirimentos da empresa:
  •  Facilidade de uso da ferramenta.
  •  Velocidade de traducción.
  •  Corrección da traducción (fiabilidade).
Na medida en que a ferramenta consegue nun grao máis alto estes obxectivos a empresa consegue unha reducción enorme nos tempos de traducción e unha mellora no resultado final debido a que se eliminan os procesos manuais e rutinarios xa que o  técnico pode dedicarse por completo á calidade do texto final . Existe polo tanto unha considerábel reducción dos seus custos de traducción e un incremento na producción de documentación.



  1. Comparativa da traducción automática coa traducción manual
Aínda que habitualmente non se perciba, a traducción manual require dos mesmos procedementos que a TA, é dicir, procedementos de edición e procedementos de traducción. Na traducción automática estes procedementos están explicitamente clasificados mentres que na traducción manual adoitan formar parte dun proceso conxunto. Por exemplo, cando un traductor manual entrega un texto traducido, non o fai sobre papel escrito, porque esixiría duplicar o traballo da empresa pasando ese texto a formato dun editor de textos. Habitualmente o mesmo traductor xa fai o traballo de post-edición escribindo sobre un editor de textos que cumpra os requirimentos da empresa. 
Polo tanto á hora de comparar un mecanismo de TA cun de traducción manual (ou con outros de TA), hai que ter en conta o conxunto dos factores que inciden na traducción, e en concreto a reducción de tempos e custos para obter un mesmo resultado final. Evidentemente o proceso lingüístico de traducción manual será sempre máis perfecto que o procedemento lingüístico da TA, sen embargo a suma total de tempos na TA máis revisión será inferior ao de traducción manual, o que repercutirá nos custos e na productividade ou cantidade de textos traducidos. 
      Para os lingüistas o uso dunha ferramenta de TA suporalles unha descarga do traballo máis repetitivo (fundamentalmente a escritura de todo o texto), o que redundará nunha calidade superior do documento final.



TRADUCTOR AUTOMÁTICO "TRADUZA-g”

3. Características do sistema de TA “Traduza-g”

3.1Características técnicas

Como se viu na sección anterior un punto fundamental para o aforro de custos na traducción é a adecuación da ferramenta ao sistema estándar de edición de textos. Esta ferramenta ofrece:

  • Uso do sistema máis estandarizado de edición: traducción de ficheiros Word para PC con sistema Windows; isto resolve de xeito definitivo os problemas de pre-edición. Tamén se recollen outros tipos de formato para as empresas que os usen (HTML, formato xornalístico ou texto); en calquera caso son formatos estándar.
  • Os documentos en Word, son tratados de xeito que os seus formatos son conservados (imaxes, negriñas, itálicas, táboas, etc..).
  • As páxinas Html permanecen co seu formato sen descolocar ningún elemento (imaxes, táboas, etc..). No caso de páxinas Html con complexos scripts en JavaScript ou VisualScript poderían producirse pequenos cambios non desexados, pero non é o habitual, e serían doadamente detectábeis.
  • Contorno de traballo monoposto, en rede, sistemas de intranet/extranet, envios de traballo vía Internet : dependendo do tipo de contrato e das necesidades o programa pódese executar en modo monoposto (execútase nun só PC baseándose nunha consola de traballo), en rede/intranet/extranet: dende calquera ordenador da empresa, accédese a un directorio de traducción onde o proceso busca automaticamente os ficheiros depositados e deixa os resultados noutro directorio previamente escollido,  preservando polo tanto o sistema habitual de traballo da empresa, ou empregando un sistema de intranet mellorando a eficiencia e eficacia na distribución dos traballos dentro de empresa. No caso de querer traduccións esporadicas temén existe un sistema de recepción de traballos via Internet; deste xeito poderá traducir os seus traballos de xeito comodo e limpo sen necesitar instalar ningún programa no seu ordenador.
  • Diccionario bilingüe de 20.000 palabras (raíces) coas características gramaticais das palabras, en separada do motor para recoller modificacións sen tocar o programa.
  • Regras de formación morfolóxica.
  • Regras para o recoñecemento da sintaxe (top-down: busca nos nodos superiores da árbore sintáctica antes de chegar ao nodo extremo)
  • Regras do LK. 
  • Posibilidade de utilización de sublinguaxes temáticas.
  • Post-edición sobre o mesmo tipo de editor, deixando o mesmo formato orixinal. No caso de ser Word o procesador utilizado permite usar os correctores lingüísticos empregados hoxe en día  (fundamentalmente o Galgo).

3.2  Características lingüísticas

LÉXICO e ORTOGRAFÍA

  • 20.000 palabras raíces.
  • Uso de locucións.
  • Expresións.
  • Modificación da acentuación nos verbos con pronomes.
MORFOLOXÍA
  • Femininos
  • Femininos irregulares
  • Plurais
  • Plurais irregulares
  • Numerais e ordinais
  • Sufixos
  • Verbos regulares e irregulares.
  • Verbos semi-regulares: alternancia vocálica.
  • Transformación de verbos compostos
  • Verbos con pronomes enclíticos.
  • Contraccións.
  • Artigo dos posesivos.
SINTAXE
  •  Detección dos sintagmas.
  • Concordancia de xénero.
  • Recoñecemento de frases negativas.
  • Recoñecemento de frases subordinadas.
  • Recoñecemento de frases coordinadas.
  • Recoñecemento de adverbios que esixen colocación proclítica do pronome.
  • Recolocación dos pronomes.
  • Perífrases verbais.

ESTUDIOS REALIZADOS E ANÁLISE DA PRODUCTIVIDADE

Dimensiona realizou unha serie de estudios e probas para determinar a efectividade e eficacia do producto. Estas probas están realizadas por un grupo de expertos lingüistas e informáticos e nelas obtivéronse as seguintes conclusións:

1.-  Datos básicos do sistema

Os parámetros que  se consideran á hora de avaliar un sistema de TA  están subordinados á estimación do aforro de custos no proceso da traducción. Se por exemplo temos un sistema cunha velocidade altísima pero de intelixibilidade media, o proceso de corrección pode igualar o aforrado coa velocidade, ou un sistema de alta velocidade e alta fiabilidade pode non aforrar custos se necesita dunha edición  moi restrictiva ou elaborada. 

O mellor método para avaliar un sistema de TA é facer unha comparación sobre unha proba real cos métodos utilizados sen usar a TA e usando a TA, isto determinará o tempo total aforrado (pre-edicion + traducción + post-edición) e con base nisto teremos unha estimación dos custos.

Aquí imos dar simplemente unha avaliación estática do sistema. Para isto fixéronse probas con ficheiros baixados aleatoriamente da rede.

1.Intelixibilidade. Achégase ao 100%, non existe practicamente frase ningunha que non se entenda despois do proceso de traducción. Isto implica que en post-edición hai que acudir pouquísimas veces ás frases orixinais.

2.Fiabilidade. 96%. Pasado un corrector despois da traducción non dá atopado só 1 palabra de cada 30.

3.Velocidade.  Tendo en conta que cando falamos dunha páxina Word (Arial), esta páxina  ten un volume medio de 290 palabras. Os tempos medidos sobre un Pentium III a 800Mz con 128Mb de memoria son:
 
 
Traducción dun documento de texto
Traducción de documentos Html, Asp, etc..
Traducción dun documento formato Word
Tempo para un documento de 100 páxinas
30 segundos
45 segundos
1'30 minutos

4.Equipamento. Para o noso sistema non é necesario facer investimento adicional ningún en ordenadores, porque o equipo necesario é un ordenador persoal básico.

5.Análise pormenorizada de productividade

Os resultados das análises desenvoltas despois de diversas probas con expertos lingüistas para determinar a efectividade do producto, medición de tempos e estimacións de aforros utilizando o Traduza-g en comparación cun sistema de traducción manual.
 
DATOS XERAIS DO CALCULO
 
Media de palabras por páxina 
290
Xornada laboral estimada por cada traballador
8h

No cadro que segue observarase a comparativa de tempos obtidos polo programa traductor (Traduza-g) engadíndolle o tempo preciso para a revisión e corrección dun texto en comparación cos tempos obtidos por un experto traductor humano sobre o mesmo texto. 

Os tempos amosados están calculados con base en varias traduccións de diferentes textos, calculando unha media e aplicándolla a traducción por páxina. A continuación faremos os cálculos para 'n' páxinas.
 
Páxinas traducidas
Programa
traductor en minutos máis revisión de texto por experto
Programa traductor en horas máis revisión de texto por experto
Programa traductor en xornadas laborábeis máis revisión de texto por experto
Tempo empregado por un traductor en minutos
Tempo empregado por un traductor en horas
Tempo empregado por un traductor en xornadas laborais
3
4m. 45s.
0h. 4m.
0,01
17
0h. 28m.
0,04
30
45
0h. 44m.
0,09
171
2h. 51m.
0,36
300
445
7h. 25m.
0,93
1705
28h. 25m.
3,55
450
668
11h. 7m.
1,39
2558
42h. 38m.
5,33
600
890
14h. 50m.
1,85
3410
56h. 50m.
7,1
900
1335
22h. 15m.
2,78
5115
85h. 15m.
10,66
1050
1558
25h. 57m.
3,24
5968
99h. 28m.
12,43
1200
1780
29h. 40m. 
3,71
6820
113h. 40m.
14,21
1500
2225
37h. 5m.
4,64
8525
142h. 5m.
17,76
3000
4450
74h. 10m.
9,27
17050
284h. 10m.
35,52

Observamos que a traducción de 3 páxinas completas, arredor de 870 palabras, é  realizada por un traductor humano en 17 minutos, mentres que a mesma traducción feita polo programa traductor engadíndolle o tempo preciso para a súa corrección é de 4 minutos, ou sexa, obtemos unha proporción de 1 a 4.2, dito doutro xeito, mentras unha traducción manual de 3 páxinas pode levar arredor de 17 minutos, neste mesmo temo (17 minutos) se empregamos o sistema de traducción automática Traduza-g e posteriormente repasamos a traducción feita, o técnico podería traducir arredor de 11 páxinas. A diferencia é considerábel. 

Evidentemente os datos que acabamos de mencionar corresponden a poucas páxinas, xa que conforme incrementamos o número de páxinas traducidas os tempos de aforro multiplícanse de maneira importante, sobre todo en grandes volumes de traballo. 

            Imos ver a seguinte gráfica que nos indica como vai aumentando a diferencia en tempos entre a traducción manual de 'n' páxinas dun texto en español e a revisión sobre un texto traducido automaticamente: 

 

É doadamente observábel que a productividade aumenta en proporcións xeométricas canto maior é o volume de páxinas que cómpre traducir. 

As cifras expostas obtéñense realizando cálculos de productividade dos traballadores do 100% todos os días, cousa que poucas veces é posíbel debido ás dinámicas do traballo e aos tempos de espera inherentes a todo posto de traballo (un traductor non empregará toda a súa xornada laboral en procesos de traducción, xa que abrir documentos, copialos, etc.. leva tamén parte do seu tempo). 

Mencionar de xeito salientábel a mellora non só de cantidade senón tamén da calidade do traballo obtido, xa que os procesos mecanizados son menos propensos a erros por factores humanos (cansazo, despistes, etc..). Polo tanto o traballo do persoal técnico lingüístico verase claramente favorecido en comodidade, productividade e calidade.
 
 

TIPOS DE INSTALACIÓNS DISPOÑÍBEIS
 
 

Requirimentos mínimos

  • Ordenador PC Pentium, mínimo 450 Mz
  • Memoria RAM 128 Mb
  • Espacio en disco mínimo 10 Mb
  • Sistema operativo: Mínimo Windows NT Workstation
  • Para traballar con documentos Word, precísase ter instalado o Word 2000

Esquema de producción en rede

Este sistema é idóneo para grandes corporacións que precisan dun sistema de traducción distribuído e automatizado ou requiren o tratamento de grandes volumes de traducción.
O sistema de traballo baséase nun posto composto por un PC con Windows NT, que realizará as funcións de servidor de traducción, e que estará conectado a toda a rede informática empresarial. 
Existirán de cara aos usuarios 2 directorios básicos, o de recepción de documentos de orixe en español e o directorio de resultado, onde se depositarán os documentos traducidos, para que os seus propietarios poidan recollelos.
O sistema recomendábel consiste en ter cando menos un experto en lingua encargado da revisión de textos, que será o administrador do directorio de resultados e que se encargará de enviar os documentos revisados (despois do proceso de traducción) aos seus propietarios, de depositalos noutros directorios diferenciados para cada departamento concreto ou doutro tipo de ordenación e distribución axeitado á empresa ou institución usuaria do traductor. 

O programa traductor encargarase de analizar automaticamente o directorio de orixe e recollerá todos os textos que vaian chegando, lanzando o motor de traducción e depositándoos automaticamente no directorio de resultados. 

O esquema sería como segue: 

Esquema de producción baixo unha Intranet/Extranet

            Este sistema é análogo ao sistema de producción en rede, só que as peticións de traducción por parte de usuarios da rede e a distribución das traduccións estarán xestionados baixo unha aplicación en formato Web (mediante  un navegador estándar) e empregando o correo electrónico da rede interna da organización. Esta aplicación é doadamente adaptábel a calquera intranet existente na empresa/institución. 
Este sistema mellora a facilidade de uso por parte dos membros da organización e a administración do tráfico de documentos, recepción e devolución dos traballos traducidos aos peticionarios.



Esquema de producción nun PC (monoposto)

Este sistema esta pensado para o manexo por parte dunha persoa ou pequenas equipas de traballo que precisen dun sistema de traducción automatizado por pedimento concreto. Por exemplo pequenas empresas de traducción, equipos de normalización lingüística, autónomos, etc.
            O sistema baséase nunha pantalla moi similar a calquera outra aplicación informática para Windows, na que escolleremos o arquivo que queremos traducir e indicaremos onde o queremos gardar.

 

Traballo via Internet:

Idóneo para usuarios finais, pequenas empresas de traducción, ou en xeral calquera usuario que teña necesidades esporádicas de traducir un texto. Poderá enviar o seu texto para traducir vía Internet e seralle facturado o traballo por medio dunha pasarela de comercio electrónico.