Un archivo es un conjunto de
información binaria; es decir, un conjunto que va de 0 a 1. Este archivo puede
almacenarse para mantener un registro de esta información. Un archivo de texto
es un archivo que contiene caracteres almacenados en forma de octetos (o
bytes).
Este archivo se guarda en el disco
duro con la forma: "name_of_file.ext"
(nombre_del_archivo.ext).
".ext" representa la extensión, la cual constituye una manera de
reconocer el tipo de programa que se necesita para abrir el archivo (nota: esto
no ofrece garantías respecto del tipo de archivo, ya que cuando se modifica la
extensión, el tipo de archivo no cambia).
El largo del nombre y de la extensión
puede variar según el sistema operativo:
8 caracteres para el nombre y 3 para
la extensión en DOS y Windows 3.1.
256 caracteres para el nombre y la
extensión en Windows 95, 98 y NT.
256 en sistemas UNIX.
En consecuencia, en DOS o en Windows
3.1, un archivo de Windows 9x tendrá un nombre acortado compuesto por los
primeros 6 caracteres del nombre seguidos de ~x, donde x representa una cifra
que aumentará cada vez que un archivo lleve el mismo nombre. Esto significa que
si un archivo con el nombre "archivo~1" ya existe, el siguiente
llevará el nombre "archivo~2".
Además el archivo tiene un encabezado
en el que se almacena información adicional, como el tipo y, en especial, el
tamaño. También contiene un carácter al final del archivo que indica que la
información que sigue a dicho carácter no pertenece al mismo archivo.
Tal vez usted se pregunte qué sentido
tiene incluir el tamaño del archivo en el encabezado cuando ya se conoce este
dato
A continuación se muestran dos
ejemplos que justifican este fenómeno
Archivos corruptos
Archivos corruptos
Es muy común que al descargar un
archivo de Internet, el navegador se congele o el servidor que aloja al archivo
interrumpa toda comunicación.
Si se trata de un archivo de texto,
sólo se perderá el final del texto, pero si el archivo es binario (por ejemplo,
un programa ejecutable) ejecutarlo puede ser peligroso, ya que faltará
información. Por tanto, el sistema operativo compara el tamaño real con el
tamaño que aparece en el encabezado para verificar la autenticidad del archivo.
Generalmente, se denomina a esto integridad. En realidad, esta verificación se
realiza por medio del uso de un algoritmo más eficaz llamado CRC (verificación
de redundancia cíclica).
Infección de virus
Cuando un archivo se infecta con un
virus, éste último agrega líneas de códigos. En consecuencia, la información
sobre el tamaño del archivo incluida en el encabezado dejará de ser precisa (a
menos que el virus se haya programado para modificar el encabezado) en cuyo
caso podrá ser identificada.
No hay comentarios:
Publicar un comentario