Saltar al contenido principal
Base de conocimiento
Redactar artículo Qué ha cambiado
< Todos los temas
Imprimir

Añadir regla al procesamiento del contenido incrustado en Excel o Word

1. Introducción

Cuando un archivo Excel o Word contienen contenido incrustado en HTML, la segmentación no se realiza correctamente, o aparece mucho texto html que no está bloqueado/filtrado. Se explica a continuación cómo solucionarlo tanto para Excel como para Word.

2. Excel

A veces podemos encontrarnos con archivos excel que contienen contenido incrustado en HTML, pero cuya segmentación no se realiza por «frases», como suele ser lo habitual en Trados:

Para lograr segmentarlo correctamente, se puede realizar lo siguiente añadiendo una regla al procesamiento del contenido incrustado en Excel:

Al crear el proyecto, en la primera pantalla, al lado de «Identificador de tipo de archivo» se hace click en el engranaje:

Se abre la configuración del proyecto y hay que ir a «Tipos de archivo» -> «Microsoft Excel 2007-2019» -> «Procesamiento de contenido incrustado».

En esa pantalla, se hace click en «Activar procesamiento de contenido incrustado» y «Extraer en todos los párrafos».

Creamos una regla de definición de etiquetas, para que Trados identifique que la etiqueta de apertura «<br>» y de cierre «</p>» son un salto de párrafo; para ello damos a «Agregar» y ponemos lo siguiente:

y damos en «Avanzada»:

damos en «Aceptar» y se queda guardada la regla:

Si hacemos click en «Vista previa de archivo» se puede ver antes de crear el proyecto cómo nos lo va a segmentar Trados, que en el ejemplo inicial sería:

3. Word

A diferencia de Excel, en el que Trados Studio ya incluye una regla predeterminada para bloquear todo el contenido HTML en los archivos XLSX, esa misma regla no está en el filtro para los archivos DOCX, por lo que, aunque se marque la casilla para procesar el contenido incrustado, no va a haber ningún resultado.

En este caso, lo que se puede hacer es copiar y pegar desde el filtro de Excel al de DOCX, aunque se indica aquí debajo la regla para copiar/pegar directamente:

</?[\p{Ll}\p{Lu}]\w*[^<>]*>

Para añadirla al filtro de DOCX, hay que seguir los pasos que se muestran en la siguiente captura:

Si se vuelven a cargar los archivos tras hacer este cambio, el código HTML debería estar bloqueado.

¡Valora este artículo!
4.8 out of 5 stars

2 ratings

5 Estrellas 50%
4 Estrellas 50%
3 Estrellas 0%
2 Estrellas 0%
1 Estrellas 0%
5
¿Cómo podemos mejorar este artículo?
Please submit the reason for your vote so that we can improve the article.
Etiquetas:

Leave a Reply

Tabla de contenidos