Estas en el proyecto de creación de un Traductor inglés-español Libre. Tus comentarios serán bien recibidos. Los comentarios soeces o salidos de tono serán eliminados.
Estoy en la etapa de recopilar información. Seguiré el estudio del Doctor Juan R. Fernández García “La Traducción en el mundo del Software Libre“, con el fin de tener una guía teórica y para las etapas del proyecto me guiaré por el libro “Ingeniería del Software” de Roger S. Pressman, eje central de la asignatura “Análisis, diseño y mantenimiento del Software” de 4º de Ingeniería Informática.
Como el Procesamiento del Lenguaje Natural (PLN o NLP en inglés) está más orientado a la Inteligencia Artificial( otra asignatura de este mismo curso) he restringido el nivel teórico a la Traducción automática.
En la traducción automática ( en inglés machine translation) se desarrollan diversos esquemas:
- Sistemas con postedición
- Sistemas con preedición
- Sistemas interactivos
Vista la complejidad del Lenguaje Natural, hoy en día se tiende a aprovechar las propiedades de los lenguajes de especialidad( sublenguajes) ya que:
- son precisos y
- están sujetos a la normalización
es por ello por lo que pueden pasar a ser fácilmente lenguajes formales.
Ya que intento evitar los estudios de Inteligencia Artificial en el tema me centraré en el estudio y procesamiento de “corpus“. Utilizaré un método indirecto ( interlingüa — o lenguaje meta) ya que aunque es difícil generar ese lenguaje meta, posteriormente facilita la traducción entre diversas lenguas según el esquema:
Y seguiré con los sistemas basados en conocimiento ( ya que parten del método interlingüa).
Esquema de un típico STABC(sistema de traducción automática basado en conocimiento):
Para esto necesito:
- Lexicones de análisis y generación( dependientes de las lenguas y del dominio)
- Reglas de proyección( dependientes de las lenguas y del dominio)
- Gramáticas de análisis y generación( dependientes de las lenguas y del dominio)
Y dado que en el inglés una misma palabra puede tener diversas funciones dentro de la oración( nombre, verbo, adjetivo) y la casi nula flexión verbal( 3ª persona singular) me apoyaré en TA basada en ejemplos( reutilización de traducciones ya hechas y validadas– almacenadas en base de datos).
Los analizadores sintáctico y léxico en software libre son Yacc y Lex( o Flex). Intentaré partir de ese código para generar las primeras etapas de mi proyecto según las imágenes( anteriormente espuestas).

