La Torre de Babel (continuación)

Junio 18, 2008 by rosgom2000

Comentaba en el anterior artículo (”La Torre de Babel “) que había una necesidad creciente de transmitir ideas e informaciones. La cantidad de textos que en la sociedad actual circulan, vía internet, revistas, periódicos, libros… es cada vez mayor.

El profesor Martin Kay diferencia en los textos dos tipos de lenguaje: uno que él llama lenguaje singular (remarkable language) y otro que denomina lenguaje no singular (unremarkable language). El lenguaje singular es el utilizado en situaciones de habla concreta y donde se utilizan elementos estilísticos. Este tipo de lenguaje es utilizado en textos creativos, en literatura, o por ejemplo, en periódicos y revistas, guiones de cine o tv, …

El lenguaje no singular es el utilizado en lo que en la traducción automática se denomina sublenguajes; textos técnicos, manuales e informes; textos administrativos, disposiciones, legislaciones, teletipos, boletines informativos, etc… Este lenguaje es repetitivo y normalizado.

Martin Kay identifica el ámbito lingüístico donde es más interesante la automatización de la traducción. Para él, los textos no singulares pueden ser traducidos mediante aplicaciones informáticas de una manera casi satisfactoria. Aunque por ahora hace falta el trabajo posterior de un traductor profesional “humano” para depurar el texto proporcionado por la máquina.

Dentro de la producción mundial de documentos, los textos con lenguajes no singulares, los que mejor se prestan a la automatización, son los que más están creciendo, donde más se necesita la traducción. Para estos, la utilización de programas informáticos es una alternativa válida. Para los textos creativos, hoy por hoy, la traducción debe de hacerla un profesional, que ocasionalmente podrá utilizar como apoyo alguna de las herramientas informáticas disponibles.

Bibliografía

http://www.stanford.edu/~mjkay

http://www.linguistics.berkeley.edu

http://liceu.uab.es/~joaquim/publicacions

http://paginaspersonales.deusto.es/abaitua/konzeptu/ta/hxs92.htm

 

La Torre de Babel

Mayo 26, 2008 by rosgom2000

Desde un punto de vista económico vivimos en un mundo globalizado. Países ricos y pobres tienen un lazo común. Este vínculo que les ata, les obliga a una comunicación permanente. Aquí surge un problema, hay múltiples lenguas y los seres humanos sólo somos capaces de entendernos con unos pocos. No existe hoy por hoy, una lengua común.

Con la aparición de la informática, se quiso buscar una solución a este problema comunicacional. Durante décadas se ha trabajado en el tema de la traducción automática. Equipos formados por cantidad de profesionales han dedicado ingentes esfuerzos económicos y de tiempo a este tema, no tan emergente a estas alturas. Pero no parece ser un tema consagrado todavía pues queda mucho camino por recorrer. En su momento, pudo ser toda una revelación, pero de hecho, puede que hoy día se encuentre en un bypass, sin terminar de eclosionar. La realidad es que el fruto de tanto esfuerzo ha sido un tanto raquítico. Ante estos “fracasos”, la traducción automatizada ha sido puesta en entredicho.

Por otro lado, la sociedad actual, cada día más, es una sociedad de la información, de la comunicación. Existe una necesidad real de transmitir conocimiento, ideas, información,… Como ejemplo basta pensar en la Unión Europea y lo que puede suponer la burocracia que genera y la necesidad de que ésta llegue a todos los países miembros en sus idiomas respectivos, ya sean oficiales o no.

Con estas dos realidades, relativo fracaso de la traducción automatizada y necesidad de comunicar, surgen voces que tratan de buscar un camino que beneficie al conjunto de la sociedad. Voces como la de Martin Kay, que trabajan en este tema con clarividencia y son figuras de referencia por consiguiente. Para ellos es una pena que la inversión que se ha realizado en desarrollar aplicaciones se desperdicie. Entienden que los aspectos positivos desarrollados a lo largo de décadas de trabajo han de utilizarse, bien sea directamente en labores para los cuales sean válidos, bien sea como base para desarrollar herramientas más potentes en un futuro.

Bibliografía

Promesses de L’Est

Mayo 22, 2008 by rosgom2000

Je trouve que c’est un excellent thriller. L’histoire est sur la mafia russe à Londres. Les images de Londres sont très quotidiennes mais très impactantes. À mon avis, le personnage de Viggo Mortensen est très semblabe à l’autre qu’il a interpreté à son anterieur film: “Une histoire de violence”. Ce sont des personnes très connectés avec la violence, mais capables de vivre à l’autre côté, avec la société legale. La lutte dans la sauna, où Viggo doit lutter nu contre les gangsters est magnifique.

J’ai aimé aussi les images où Naomi Watts montre ses relations familiales. Sa famille est venue de Russie. Il y a des choses caracteristiques par conséquent. Mais surtout nous pouvons voir la douleur que génére la propre famille.

Je le recommande vivement.

 

Habla que te escucho

Mayo 22, 2008 by rosgom2000

Cuando estaba leyendo un artículo del profesor Llisterri “Lingüística y tecnologías del lenguaje” (2003), donde comenta los complejos pasos que hay en el proceso de conversión de texto en habla y del habla en texto, percibí que hay un intenso trabajo de un montón de gente cuando se diseñan este tipo de herramientas informáticas. Trabajo no sólo de informáticos sino también de profesionales del lenguaje, es necesario equipos multidisciplinares para desarrollar este tipo de tecnologías. Me dí cuenta de la cantidad de variables que había que tener en cuenta. Hasta ahora no me había parado a pensarlo.

Circunstancias de la vida han hecho que estos días tuviera que ponerme en contacto con mi compañía telefónica. Cuando una llama al número de atención al cliente, quien responde no es una persona, es una aplicación informática. Para conseguir hablar con un “ser humano”, previamente hay que ir respondiendo a un cuestionario que la máquina te hace. Cuestionario que es universal para todos los usuarios, pero respuestas que son diferentes en cada caso. Y la aplicación tiene que poder procesarlas todas ellas para conseguir dar un buen servicio. Y la aplicación se enfrenta a todo tipo de léxico, acentos, modulaciones,…Puede haberlos tipo Fraga que se comen la mitad de las sílabas, tipos de Sevilla, no, mejor de “Zevilla”, “mú de Zevilla”, o tipo Rosa (OT) que necesitan subtítulos, y todas sus respuestas tienen que poder ser comprendidas por la aplicación.

Me sugiere que para poder sacar partido a estas tecnologías en un aplicativo un tanto sencillo (las preguntas lo son y las respuestas deberían serlo también en la mayoría de los casos) es necesario que un buen número de profesionales hagan un buen trabajo. Y si para algo que a mí pareciéndome sencillo requiere en realidad gran esfuerzo, en otro tipo de aplicaciones tiene que ser realmente complicado.

Entiendo que para las empresas es muy práctico y el futuro va por ahí, pero cuánto fastidia (por no decir otra palabra) que cuando llamas a un número te responda una máquina. La belleza de la palabra adecuada en el momento adecuado, ¿cómo se traduce?

Bibliografía

Icelandic Björk

Mayo 22, 2008 by rosgom2000

Dear All,

Sorry for not being able to “pop in” when promised.

At the moment I’m on a glacial field trip + am truly impressed with this country - the people are very laid back; the landscape is crazy i.e. flat sand plains + huge glacier-tumbling mountains- but no roads so travelling is eventful e.g. yesterday the minibus got stuck in a meltwater channel - Grab the passports + run!

At the moment the lack of daylight (only 6 hrs per day) is adventageous to the workload.

Hope to see you all soon.

Love,

Tecnologías lingüísticas. Una esperanza real

Mayo 14, 2008 by rosgom2000

“- Hal, it’s high time we talked”

Hablar de informática no es hablar de internet. La informática es una ciencia que viene desarrollándose desde hace bastantes décadas y a la cual se le han dado diferentes usos. Uno de mis primeros recuerdos relacionados con ella es la película “2001, una odisea del espacio” (2001, a Space Odissey, 196 8) de Stanley Kubrick y en ella el muy queridísimo Hal. Hollywood (bless you, …some times these times) nos introduce en ocasiones en mundos desconocidos. Ésta es una ocasión. Hal era un ordenador, ¿tal vez un ente pensante ?, con capacidad de entenderse mediante el habla con los humanos. Comprendía lo que se le decía y a su vez era capaz de expresarse de forma hablada. Sin mencionar lo que sentía que se escapa al tema de este artículo.

¡Ya los guionistas de una película de hace cuarenta años utilizaron estos recursos! Podemos adivinar que se viene trabajando en el terreno de la lingüística aplicada a las nuevas tecnologías basadas en la informática desde casi los comienzos de ésta. Y centrándonos en el presente, como tanto la lingúística como la informática están presentes en todos los ámbitos de la sociedad, podemos decir que el desarrollo de las Tecnologías Lingüísticas (TL o HTL) está contribuyendo a la mejora de la calidad de ésta en el más amplio sentido. Si al azar pensamos en cualquier ámbito seguro que está presente la HLT. Por señalar alguno de los beneficios que estas tecnologías ofrecen, utilizo los que señala el Instituto Cervantes en su página web dedicada a la HLT:

  • Acceder a la información que necesitamos, ahorrando tiempo y evitando sobrecargas de información.
  • Hablar con nuestros ordenadores en casa, en el trabajo, en el coche o en lugares públicos cuando necesitemos información y ayuda.
  • Posibilidad de establecer contactos con otras culturas evitando la barrera del idioma.
  • Intervenir con más eficacia en los negocios, la administración o en el ámbito internacional.

Ah, Hal, para despedirme, y aunque no te consuele, todos tenemos miedo…

Bibliografía:

http://oesi.cervantes.es/oesi/tls.jsp

http://liceu.uab.es/ joaquim/publicacions/TecnoLing_Lynx02.pdf

http://www.mec.es/redele/revista6/HerminiaProvencio.pdf

Tecnologías lingüísticas. Definiciones

Mayo 12, 2008 by rosgom2000

Hoy en día la informática está presente en todas partes. Las aplicaciones son infinitas. La comunicación en la sociedad también es básica.

Con la utilización de ambas en beneficio del desarrollo de la sociedad surge la llamada Tecnología Lingüística (TL), o en inglés, Human Language Technology (HLT).

Dada la importancia alcanzada por la TL, el Instituto Cervantes tiene una web dedicada a ella. En esta página, http://oesi.cervantes.es/oesi/tls.jsp se define la Tecnología Lingüística como la derivada de aplicar los conocimientos sobre la lengua al desarrollo de sistemas informáticos.

Hablando de Aplicaciones de Tecnología Lingüística, Herminia Provencio Garrigós, profesora del Dpto. de Filología Española, Lingüística General y Teoría de la Literatura de la Universidad de Alicante, menciona, en la revista redELE número 6, que a lo que nos referimos al hablar de Aplicaciones de Tecnología Lingüística (ATL) son, siguiendo a Mª A. Martín Antonín y a J. Llisterri, aquellas que intentan “reconocer, comprender, interpretar y generar el lenguaje humano en todas sus formas”.

Dentro de las llamadas Tecnologías Lingüísticas tradicionalmente se distinguen dos tipos: las tecnologías del habla y las tecnologías del texto. Las tecnologías del habla son aquellas que se basan en el tratamiento del lenguaje hablado; las del texto son aquellas que se basan en el tratamiento del lenguaje escrito.

Entre las primeras podemos señalar:

  • a) las de reconocimiento del habla, proceso a través del cual un mensaje hablado se convierte en un texto;
  • b) las de síntesis de habla o conversión texto-voz que permiten generar mensajes hablados a partir de un texto escrito almacenado en formato electrónico;
  • c) las de reconocimiento del hablante con las que se puede identificar o verificar la identidad del que habla de forma automática a partir de la señal de su voz;
  • d) las de generación del habla a partir de plantillas que se completan con grabaciones previamente realizadas o bien concatenando unidades del habla.

Entre las segundas, las de texto, podemos señalar:

  • a) Herramientas de reconocimiento de textos, de dos tipos: de reconocimiento óptico de caracteres, reconociendo fuentes de imprenta e imágenes impresas, y de reconocimiento inteligente de caracteres, reconociendo escritura a mano o fuentes de imprenta de baja calidad.
  • b) Herramientas de recuperación de la información, permiten seleccionar entre un conjunto de documentos, aquellos que contienen la información que interesa.
  • c) Herramientas de creación, comprensión de textos escritos y traducción automática.
  • d) Herramientas que ayudan a la mejora de la escritura en formato electrónico verificando la ortografía, la gramática o el estilo.
  • e) Herramientas que realizan análisis morfológicos, sintácticos o semánticos.

Bibliografía

  1. http://oesi.cervantes.es/oesi/tls.jsp
  2. http://www.mec.es/redele/revista6/HerminiaProvencio.pdf
  3. http://liceu.uab.es/vjoaquim/publicacions/TecnoLing_Lynx02.pdf

Ms “Ra” on the Nile

Mayo 8, 2008 by rosgom2000

Dear All,

Enjoying the change and doing my Egyptology bit with great gusto. Here so far visited the Temples of Edtu, Luxor and Karnak and been to the tombs in the Valley of the Kings & Queens.

Nice temperature during the day, kissing to about 25ºC, but quite chilly in the evenings, after the sun has gone down.

Controlling my food intake is a bit of a problem with three meals a day on board ship, still I expect I will manage.

Best wishes,

La traducción automática

Abril 20, 2008 by rosgom2000

Cuando una observa la cantidad de programas informáticos de traducción existentes, tanto gratuitos como de pago, se da cuenta de que si proliferan tanto es por algo. Todos hemos oído malos comentarios sobre ellos, pero cada vez hay más. Por algo será.

Cabe pues preguntarse cuál es la razón del uso de estas herramientas informáticas. Qué se pretende de ellas, y qué se obtiene de ellas. Analizando estos hechos veríamos si son técnicas útiles para los usuarios.

Cada día la tecnología avanza, con este progreso los informáticos consiguen medios más potentes y más rápidos, pudiendo así diseñar programas más prácticos, más sutiles y más “humanizados” a la hora de enfrentarse al proceso de traducción. ¿Qué necesita un buen sistema de traducción automática? Necesita que el diseño de las tablas léxicas, las reglas sintácticas y la información semántica estén muy bien definidos, del cuidado que se haya tenido dependerá el éxito del programa traductor.

Hoy en día el proceso de traducción automática a través de un programa informático, para que realmente pueda considerarse válido, requiere de un proceso de postedición. Hay que revisar el texto producido por la máquina. Durante este proceso, que lo tiene que realizar una persona, se deben corregir todos los errores léxicos, sintácticos y de interpretación que siempre aparecen por muy bueno que sea el programa.

Como conclusión podría decir que los traductores automáticos son útiles siempre que vaya acompañado su uso por una depuración posterior hecha por alguien que conozca bien los dos idiomas, el original y el idioma meta.

Referencias bibliográficas

- Juan Manuel de la Fuente. Glorias y miserias de la traducción automática. Jornadas “Lengua e Informática”. SIMO, 4 de noviembre de 1999.

- www.rediris.es

Traductor profesional versus Traductor Informático

Abril 19, 2008 by rosgom2000

Cuando llega a nuestras manos un texto que ha sido traducido ocurre que nunca es igual al original. Siempre en el proceso se cambia alguna palabra, alguna expresión, algún significado. Nunca es perfecto. El lector siempre quiere que la traducción sea lo más fidedigna posible. Para que este hecho se dé, debe ocurrir que quien asuma el trabajo comprenda el texto y que lo aborde en todos los aspectos: sintácticos, lexicológicos,…, además debe traducir las ideas, los conceptos, las intenciones que el autor original quiso transmitir.

Si comparamos a día de hoy el trabajo que hace un traductor profesional y el que realiza un programa informático de traducción percibimos al instante que quien consigue mejores resultados, sin discusión posible, es el primero. La traducción informática puede ser una herramienta útil para el profesional de la tracucción. Lógicamente cuanto mejor sea el programa informático, más rendimiento podrá sacar.

Hice una prueba con un texto literario y el resultado para la informática dejó que desear. Pero es muy probable que ocurra como en otros ámbitos de la tecnología, que evolucionen rápidamente, y que salgan al mercado aplicaciones informáticas asequibles a los bolsillos y realmente útiles.

Creo que para nosotros actualmente las herramientas informáticas son útiles para utilizarlas como diccionarios. Para la traducción de textos es mejor usar el trabajo del profesional. Si sólo disponemos de internet, pues ánimo y a echarle imaginación.

-http://www.rediris.es

-Juan Manuel de la Fuente. Glorias y miserias de la traducción automática. Jornadas “Lengua e Informática, SIMO, 4-11-1999.