Saltar al contenido principal
Base de conocimiento
Redactar artículo Qué ha cambiado
< Todos los temas
Imprimir

Manipular archivos básicos de texto

En ocasiones, recibimos archivos en diferentes formatos que, aunque a primera vista pueden parecer «complejos», son archivos puramente de texto. Para comprobarlo, el primer paso sería abrirlos con cualquier editor de texto, como por ejemplo Notepad++ (botón derecho, Abrir con…).

En función del tipo de archivo, la manipulación podría ser más fácil o más compleja. Este pequeño hack no pretende ser la única forma de poder hacerlo, sino dar simplemente algunos trucos que podrían servir para manipularlos. En cualquier caso, si la complejidad es alta o no se es capaz de realizarlo, o incluso no se logra a pesar de intentarlo, siempre se puede pedir ayuda al equipo técnico.

Veamos un ejemplo práctico:

Tenemos un archivo en el que vemos claramente que lo que hay que traducir es lo que se encuentra después de los dos puntos, por lo que tenemos claramente definido un patrón:

Es importante asegurarse de que el patrón está bien definido a priori. Algunas preguntas que nos podríamos hacer: ¿siempre es así en todo el documento, o hay algunas partes del documento donde el patrón es diferente? ¿puede que haya frases donde los dos puntos formen parte de la frase? En función de las respuestas, podremos actuar consecuentemente.

Con el ejemplo, asumimos que el patrón es correcto, y que todo lo que hay después de los dos puntos hay que traducirlo. Una de las primeras propuestas aquí podría ser separar esto en 2 columnas, una la que no requiere traducción y otra la que sí requiere traducción. Si copiamos el archivo tal cual en un excel, veremos que todo nos lo coloca en la primera columna, por lo que para dividirlo en 2 columnas necesitamos hacer algo previo. Sabemos que Excel pondrá en una segunda columna lo que haya después de un «tabulador», por lo que podríamos separar esta primera parte de la segunda con un tabulador.

Como comentaba antes, si pensamos que los dos puntos podrían estar dentro de una frase traducible, reemplazar los 2 puntos por un tabulador no sería la mejor opción, ya que podríamos encontrarnos errores. En este caso, siempre es mejor pensar en opciones de búsqueda «amplias». Por ejemplo, podríamos reemplazar: «: « por un tabulador, ya que es el patrón existente:

En Notepad++ el modo de búsqueda debe ser el «extendido», y el tabulador está representado por \t (el salto de línea sería \n, etc.). Véase https://www.portalmastips.com/notepad-buscar-remplazar-enters-saltos-linea-en-texto/

Al hacerlo, vemos que se nos queda algo así, que seguramente ya nos serviría para avanzar:

Sin embargo, desde mi punto de vista creo que todavía sería mejorable, y por lo tanto podríamos plantear «deshacer» y hacer otra búsqueda diferente y más óptima, por ejemplo: «: « por «:\t y de este modo, obtendríamos algo así:

Aún así, vemos que todo acaba como «, (y salto de línea después), que nos interesa mejorar, por lo que podemos plantear otra búsqueda, que sería «,\n por \n (me interesa mantener el salto de línea):

Con esto, ya he obtenido lo siguiente:

Ahora, si copio y pego esto en Excel, obtendré lo siguiente:

De esta forma, ya podría procesar el archivo para traducir ocultando la columna que quiero mantener sin mayor problema.

Una vez traducido, tendremos que hacer el paso inverso. Copiamos/reemplazamos el excel traducido en Notepad++, y lo veremos así:

Puesto que nos interesa dejarlo como al principio, plantearíamos hacer la búsqueda y reemplazo inverso, es decir, que todo lo que sea un salto de línea (\n) se convierta en «, seguido de un salto de línea, por lo que esa será la búsqueda que hagamos:

Y ya habremos obtenido el final de esas líneas:

Ahora nos queda modificar el tabulador inicial, para dejarlo como estaba inicialmente, por lo que la búsqueda puede hacerse a la inversa que inicialmente:

Y ya habremos logrado nuestro archivo final:

Varios consejos MUY IMPORTANTES:

  1. Sobre todo para la entrega, es importante verificar el inicio y final de archivo, para que coincida como era el original. En muchas ocasiones, estas búsquedas que realizamos no modifican los inicios/finales de archivo, porque justo al principio o al final falta ese «salto de línea», o porque el patrón no es el mismo justo ahí.
  2. No tengáis miedo de probar cosas, siempre tenéis a vuestro alcance el «Deshacer» si una búsqueda os falla según preveiais.
  3. CLAVE: Es importante que cuando hagáis los pasos de preparación penséis en si el paso inverso cuando tengáis la traducción os va a funcionar o si os podría fallar por algún motivo.
  4. Es importante que las búsquedas de patrones sean lo más amplias posibles, incluyendo en la medida de lo posible saltos de línea, etc.
  5. A veces, podría ser necesario realizar algún paso «intermedio» para lograr el objetivo. Por ejemplo, podría ser necesario reemplazar «algo» por algún tipo de texto que nos sirva para algo posterior. Imaginad que queréis reemplazar los dos puntos por un tabulador, pero no todos los dos puntos sino solo los que aparecen en algún lado en concreto. Quizás haya que hacer una búsqueda «previa» que consista en reemplazar eso que no queréis modificar por otra cosa, como varios asteriscos (y que luego esos varios asteriscos los podréis volver a reemplazar fácilmente por lo que teníais inicialmente.
¡Valora este artículo!
0 out of 5 stars
5 Estrellas 0%
4 Estrellas 0%
3 Estrellas 0%
2 Estrellas 0%
1 Estrellas 0%
5
¿Cómo podemos mejorar este artículo?
Please submit the reason for your vote so that we can improve the article.

Leave a Reply

Tabla de contenidos