|
CONSIDERACIÓNS
XERAIS SOBRE O USO DE TRADUCTORES AUTOMÁTICOS
- Obxectivos
e especificacións internacionais sobre a traducción
automática
A
traducción automática (MT – Machine Translation
ou Traducción Automática,
a
partir de agora TA) é un proceso que inclúe distintas
fases, algunhas delas inseridas nos procedementos habituais na elaboración
de documentos da empresa (procedementos de edición) e outras
que teñen que ver estrictamente co proceso da traducción
(procedementos de traducción).
Os procedementos de
edición refírense a:
- Pre-edición.
Formato e estilo dos documentos da empresa.
- Post-edición.
Revisión e presentación final dos documentos.
Os procedementos de traducción refírense
a:
- Uso
dunha lingüística computacional.
- Utilización
dun diccionario bilingüe.
- Unha
arquitectura de transformación.
- Unha
base de datos de coñecementos lingüísticos
(LK – Linguistic Knowledge).
- Implementación
do uso de diccionarios de sublinguaxes.
Todos
estes procesos en conxunto deben proporcionar unha traducción
de calidade que se axuste aos requirimentos da empresa:
- Facilidade
de uso da ferramenta.
- Velocidade
de traducción.
- Corrección
da traducción (fiabilidade).
Na medida en que a
ferramenta consegue nun grao máis alto estes obxectivos a
empresa consegue unha reducción enorme nos tempos de traducción
e unha mellora no resultado final debido a que se eliminan os procesos
manuais e rutinarios xa que o técnico pode dedicarse
por completo á calidade do texto final . Existe polo tanto
unha considerábel reducción dos seus custos de traducción
e un incremento na producción de documentación.
- Comparativa
da traducción automática coa traducción manual
Aínda que habitualmente
non se perciba, a traducción manual require dos mesmos procedementos
que a TA, é dicir, procedementos de edición e procedementos
de traducción. Na traducción automática estes
procedementos están explicitamente clasificados mentres que
na traducción manual adoitan formar parte dun proceso conxunto.
Por exemplo, cando un traductor manual entrega un texto traducido,
non o fai sobre papel escrito, porque esixiría duplicar o
traballo da empresa pasando ese texto a formato dun editor de textos.
Habitualmente o mesmo traductor xa fai o traballo de post-edición
escribindo sobre un editor de textos que cumpra os requirimentos
da empresa.
Polo tanto á
hora de comparar un mecanismo de TA cun de traducción manual
(ou con outros de TA), hai que ter en conta o conxunto dos factores
que inciden na traducción, e en concreto a reducción
de tempos e custos para obter un mesmo resultado final. Evidentemente
o proceso lingüístico de traducción manual será
sempre máis perfecto que o procedemento lingüístico
da TA, sen embargo a suma total de tempos na TA máis revisión
será inferior ao de traducción manual, o que repercutirá
nos custos e na productividade ou cantidade de textos traducidos.
Para os lingüistas o uso dunha ferramenta de TA suporalles
unha descarga do traballo máis repetitivo (fundamentalmente
a escritura de todo o texto), o que redundará nunha calidade
superior do documento final.
TRADUCTOR AUTOMÁTICO "TRADUZA-g”
3.
Características do sistema de TA “Traduza-g”
3.1Características técnicas
Como
se viu na sección anterior un punto fundamental para o aforro
de custos na traducción é a adecuación da ferramenta
ao sistema estándar de edición de textos. Esta ferramenta
ofrece:
- Uso do sistema máis estandarizado
de edición: traducción de ficheiros Word para PC
con sistema Windows; isto resolve de xeito definitivo os problemas
de pre-edición. Tamén se recollen outros tipos de
formato para as empresas que os usen (HTML, formato xornalístico
ou texto); en calquera caso son formatos estándar.
- Os documentos en Word, son tratados de
xeito que os seus formatos son conservados (imaxes, negriñas,
itálicas, táboas, etc..).
- As páxinas Html permanecen co seu
formato sen descolocar ningún elemento (imaxes, táboas,
etc..). No caso de páxinas Html con complexos scripts en
JavaScript ou VisualScript poderían producirse pequenos
cambios non desexados, pero non é o habitual, e serían
doadamente detectábeis.
- Contorno de traballo monoposto, en rede,
sistemas de intranet/extranet, envios de traballo vía Internet
: dependendo do tipo de contrato e das necesidades o programa
pódese executar en modo monoposto (execútase nun
só PC baseándose nunha consola de traballo), en
rede/intranet/extranet: dende calquera ordenador da empresa, accédese
a un directorio de traducción onde o proceso busca automaticamente
os ficheiros depositados e deixa os resultados noutro directorio
previamente escollido, preservando polo tanto o sistema
habitual de traballo da empresa, ou empregando un sistema de intranet
mellorando a eficiencia e eficacia na distribución dos
traballos dentro de empresa. No caso de querer traduccións
esporadicas temén existe un sistema de recepción
de traballos via Internet; deste xeito poderá traducir
os seus traballos de xeito comodo e limpo sen necesitar instalar
ningún programa no seu ordenador.
- Diccionario bilingüe de 20.000 palabras
(raíces) coas características gramaticais das palabras,
en separada
do motor para recoller modificacións sen tocar
o programa.
- Regras de formación morfolóxica.
- Regras para o recoñecemento da
sintaxe (top-down: busca nos nodos superiores da árbore
sintáctica antes de chegar ao nodo extremo)
- Regras do LK.
- Posibilidade de utilización de
sublinguaxes temáticas.
- Post-edición sobre o mesmo tipo
de editor, deixando o mesmo formato orixinal. No caso de ser Word
o procesador utilizado permite usar os correctores lingüísticos
empregados hoxe en día (fundamentalmente o Galgo).
3.2 Características
lingüísticas
LÉXICO e ORTOGRAFÍA
- 20.000 palabras raíces.
- Uso de locucións.
- Expresións.
- Modificación
da acentuación nos verbos con pronomes.
MORFOLOXÍA
- Femininos
- Femininos irregulares
- Plurais
- Plurais irregulares
- Numerais e ordinais
- Sufixos
- Verbos regulares
e irregulares.
- Verbos semi-regulares:
alternancia vocálica.
- Transformación
de verbos compostos
- Verbos con pronomes
enclíticos.
- Contraccións.
- Artigo dos posesivos.
SINTAXE
- Detección dos sintagmas.
- Concordancia
de xénero.
- Recoñecemento
de frases negativas.
- Recoñecemento
de frases subordinadas.
- Recoñecemento
de frases coordinadas.
- Recoñecemento
de adverbios que esixen colocación proclítica do
pronome.
- Recolocación
dos pronomes.
- Perífrases verbais.
ESTUDIOS
REALIZADOS E ANÁLISE DA PRODUCTIVIDADE
Dimensiona
realizou unha serie de estudios e probas para determinar a efectividade
e eficacia do producto. Estas probas están realizadas por
un grupo de expertos lingüistas e informáticos e nelas
obtivéronse as seguintes conclusións:
1.- Datos
básicos do sistema
Os
parámetros que se consideran á hora de avaliar
un sistema de TA están subordinados á estimación
do aforro de custos no proceso da traducción. Se por exemplo
temos un sistema cunha velocidade altísima pero de intelixibilidade
media, o proceso de corrección pode igualar o aforrado coa
velocidade, ou un sistema de alta velocidade e alta fiabilidade
pode non aforrar custos se necesita dunha edición moi
restrictiva ou elaborada.
O
mellor método para avaliar un sistema de TA é facer
unha comparación sobre unha proba real cos métodos
utilizados sen usar a TA e usando a TA, isto determinará
o tempo total aforrado (pre-edicion + traducción + post-edición)
e con base nisto teremos unha estimación dos custos.
Aquí
imos dar simplemente unha avaliación estática do sistema.
Para isto fixéronse probas con ficheiros baixados aleatoriamente
da rede.
1.Intelixibilidade.
Achégase ao 100%, non existe practicamente frase ningunha
que non se entenda despois do proceso de traducción. Isto
implica que en post-edición hai que acudir pouquísimas
veces ás frases orixinais.
2.Fiabilidade.
96%. Pasado un corrector despois da traducción non dá
atopado só 1 palabra de cada 30.
3.Velocidade.
Tendo en conta que cando falamos dunha páxina Word (Arial),
esta páxina ten un volume medio de 290 palabras. Os
tempos medidos sobre un Pentium III a 800Mz con 128Mb de memoria
son:
| |
Traducción
dun documento de texto
|
Traducción
de documentos Html, Asp, etc..
|
Traducción
dun documento formato Word
|
|
Tempo para un
documento de 100 páxinas
|
30 segundos
|
45 segundos
|
1'30 minutos
|
4.Equipamento.
Para o noso sistema non é necesario facer investimento adicional
ningún en ordenadores, porque o equipo necesario é
un ordenador persoal básico.
5.Análise
pormenorizada de productividade
Os resultados das análises
desenvoltas despois de diversas probas con expertos lingüistas
para determinar a efectividade do producto, medición de tempos
e estimacións de aforros utilizando o Traduza-g
en comparación cun sistema de traducción manual.
|
DATOS XERAIS
DO CALCULO
|
| |
|
Media de palabras
por páxina
|
290
|
|
Xornada laboral
estimada por cada traballador
|
8h
|
No cadro que segue observarase
a comparativa de tempos obtidos polo programa traductor (Traduza-g)
engadíndolle o tempo preciso para a revisión e corrección
dun texto en comparación cos tempos obtidos por un experto
traductor humano sobre o mesmo texto.
Os tempos amosados están
calculados con base en varias traduccións de diferentes textos,
calculando unha media e aplicándolla a traducción
por páxina. A continuación faremos os cálculos
para 'n' páxinas.
|
Páxinas traducidas
|
Programa
traductor en minutos máis revisión de texto
por experto
|
Programa traductor en horas máis revisión de
texto por experto
|
Programa traductor en xornadas laborábeis máis
revisión de texto por experto
|
Tempo empregado por un traductor en minutos
|
Tempo empregado por un traductor en horas
|
Tempo empregado por un traductor en xornadas laborais
|
|
3
|
4m. 45s.
|
0h. 4m.
|
0,01
|
17
|
0h. 28m.
|
0,04
|
|
30
|
45
|
0h. 44m.
|
0,09
|
171
|
2h. 51m.
|
0,36
|
|
300
|
445
|
7h. 25m.
|
0,93
|
1705
|
28h. 25m.
|
3,55
|
|
450
|
668
|
11h. 7m.
|
1,39
|
2558
|
42h. 38m.
|
5,33
|
|
600
|
890
|
14h. 50m.
|
1,85
|
3410
|
56h. 50m.
|
7,1
|
|
900
|
1335
|
22h. 15m.
|
2,78
|
5115
|
85h. 15m.
|
10,66
|
|
1050
|
1558
|
25h. 57m.
|
3,24
|
5968
|
99h. 28m.
|
12,43
|
|
1200
|
1780
|
29h. 40m.
|
3,71
|
6820
|
113h. 40m.
|
14,21
|
|
1500
|
2225
|
37h. 5m.
|
4,64
|
8525
|
142h. 5m.
|
17,76
|
|
3000
|
4450
|
74h. 10m.
|
9,27
|
17050
|
284h. 10m.
|
35,52
|
Observamos que a traducción
de 3 páxinas completas, arredor de 870 palabras, é
realizada por un traductor humano en 17 minutos, mentres que a mesma
traducción feita polo programa traductor engadíndolle
o tempo preciso para a súa corrección é de
4 minutos, ou sexa, obtemos unha proporción de 1 a 4.2, dito
doutro xeito, mentras unha traducción manual de 3 páxinas
pode levar arredor de 17 minutos, neste mesmo temo (17 minutos)
se empregamos o sistema de traducción automática Traduza-g
e posteriormente repasamos a traducción feita, o técnico
podería traducir arredor de 11 páxinas. A diferencia
é considerábel.
Evidentemente os datos
que acabamos de mencionar corresponden a poucas páxinas,
xa que conforme incrementamos o número de páxinas
traducidas os tempos de aforro multiplícanse de maneira importante,
sobre todo en grandes volumes de traballo.
Imos ver a seguinte gráfica que nos indica como vai aumentando
a diferencia en tempos entre a traducción manual de 'n' páxinas
dun texto en español e a revisión sobre un texto traducido
automaticamente:
É doadamente
observábel que a productividade aumenta en proporcións
xeométricas canto maior é o volume de páxinas
que cómpre traducir.
As cifras expostas obtéñense
realizando cálculos de productividade dos traballadores do
100% todos os días, cousa que poucas veces é posíbel
debido ás dinámicas do traballo e aos tempos de espera
inherentes a todo posto de traballo (un traductor non empregará
toda a súa xornada laboral en procesos de traducción,
xa que abrir documentos, copialos, etc.. leva tamén parte
do seu tempo).
Mencionar de xeito salientábel
a mellora non só de cantidade senón tamén da
calidade do traballo obtido, xa que os procesos mecanizados son
menos propensos a erros por factores humanos (cansazo, despistes,
etc..). Polo tanto o traballo do persoal técnico lingüístico
verase claramente favorecido en comodidade, productividade e calidade.
TIPOS
DE INSTALACIÓNS DISPOÑÍBEIS
Requirimentos mínimos
- Ordenador PC Pentium, mínimo 450
Mz
- Memoria RAM 128 Mb
- Espacio en disco mínimo 10 Mb
- Sistema operativo: Mínimo Windows
NT Workstation
- Para traballar
con documentos Word, precísase ter instalado o Word 2000
Esquema de producción en rede
Este sistema é idóneo para grandes corporacións
que precisan dun sistema de traducción distribuído
e automatizado ou requiren o tratamento de grandes volumes de traducción.
O sistema de traballo
baséase nun posto composto por un PC con Windows NT, que
realizará as funcións de servidor de traducción,
e que estará conectado a toda a rede informática empresarial.
Existirán
de cara aos usuarios 2 directorios básicos, o de recepción
de documentos de orixe en español e o directorio de resultado,
onde se depositarán os documentos traducidos, para que os
seus propietarios poidan recollelos.
O sistema recomendábel
consiste en ter cando menos un experto en lingua encargado da revisión
de textos, que será o administrador do directorio de resultados
e que se encargará de enviar os documentos revisados (despois
do proceso de traducción) aos seus propietarios, de depositalos
noutros directorios diferenciados para cada departamento concreto
ou doutro tipo de ordenación e distribución axeitado
á empresa ou institución usuaria do traductor.
O programa traductor
encargarase de analizar automaticamente o directorio de orixe e
recollerá todos os textos que vaian chegando, lanzando o
motor de traducción e depositándoos automaticamente
no directorio de resultados.
O esquema sería
como segue:
Esquema de producción baixo unha Intranet/Extranet
Este sistema é análogo ao sistema de producción
en rede, só que as peticións de traducción
por parte de usuarios da rede e a distribución das traduccións
estarán xestionados baixo unha aplicación en formato
Web (mediante un navegador estándar) e empregando o
correo electrónico da rede interna da organización.
Esta aplicación é doadamente adaptábel a calquera
intranet existente na empresa/institución.
Este sistema mellora a facilidade de uso por parte
dos membros da organización e a administración do
tráfico de documentos, recepción e devolución
dos traballos traducidos aos peticionarios.
Esquema de producción nun PC (monoposto)
Este sistema esta pensado para o manexo por parte dunha
persoa ou pequenas equipas de traballo que precisen dun sistema
de traducción automatizado por pedimento concreto. Por exemplo
pequenas empresas de traducción, equipos de normalización
lingüística, autónomos, etc.
O sistema baséase nunha pantalla moi similar a calquera outra
aplicación informática para Windows, na que escolleremos
o arquivo que queremos traducir e indicaremos onde o queremos gardar.
Traballo via Internet:
Idóneo para usuarios finais, pequenas empresas
de traducción, ou en xeral calquera usuario que teña
necesidades esporádicas de traducir un texto. Poderá
enviar o seu texto para traducir vía Internet e seralle facturado
o traballo por medio dunha pasarela de comercio electrónico.
|