Cómo obtener el tamaño de un archivo o directorio en Linux

Una ventana de terminal de Linux en una computadora portátil estilo Ubuntu.
Fatmawati Achmad Zaenuri / Shutterstock

Cuando usa el ducomando de Linux , obtiene tanto el uso real del disco como el tamaño real de un archivo o directorio. Explicaremos por qué estos valores no son los mismos.

Uso de disco real y tamaño real

El tamaño de un archivo y el espacio que ocupa en su disco duro rara vez son iguales. El espacio en disco se asigna en bloques. Si un archivo es más pequeño que un bloque, todavía se le asigna un bloque completo porque el sistema de archivos no tiene una unidad más pequeña de espacio para usar.

A menos que el tamaño de un archivo sea un múltiplo exacto de bloques, el espacio que usa en el disco duro siempre debe redondearse al siguiente bloque completo. Por ejemplo, si un archivo tiene más de dos bloques pero menos de tres, todavía se necesitan tres bloques de espacio para almacenarlo.

Se utilizan dos medidas en relación con el tamaño del archivo. El primero es el tamaño real del archivo, que es el número de bytes de contenido que componen el archivo. El segundo es el tamaño efectivo del archivo en el disco duro. Este es el número de bloques del sistema de archivos necesarios para almacenar ese archivo.

Un ejemplo

Veamos un ejemplo sencillo. Redirigiremos un solo carácter a un archivo para crear un archivo pequeño:

echo "1"> geek.txt

El comando "echo" 1 "> geek.txt" en una ventana de terminal.

Ahora, usaremos la lista de formato largo  ls, para ver la longitud del archivo:

ls -l geek.txt

El comando "ls -l geek.txt" en una ventana de terminal.

La longitud es el valor numérico que sigue a las dave dave  entradas, que son dos bytes. ¿Por qué son dos bytes cuando solo enviamos un carácter al archivo? Echemos un vistazo a lo que sucede dentro del archivo.

Usaremos el hexdumpcomando, que nos dará un recuento de bytes exacto y nos permitirá «ver» los caracteres que no se imprimen como valores hexadecimales . También usaremos la -Copción (canónica) para forzar que la salida muestre valores hexadecimales en el cuerpo de la salida, así como sus equivalentes de caracteres alfanuméricos:

hexdump -C geek.txt

El comando "hexdump -C geek.txt" en una ventana de terminal.

La salida nos muestra que, comenzando en el desplazamiento 00000000 en el archivo, hay un byte que contiene un valor hexadecimal de 31 y uno que contiene un valor hexadecimal de 0A. La parte derecha de la salida muestra estos valores como caracteres alfanuméricos, siempre que sea posible.

Relacionado:  Cómo usar el comando Echo en Linux

El valor hexadecimal de 31 se utiliza para representar el dígito uno. El valor hexadecimal de 0A se utiliza para representar el carácter de avance de línea, que no se puede mostrar como un carácter alfanumérico, por lo que se muestra como un punto (.). El carácter de avance de línea se agrega mediante echo. De forma predeterminada,  echocomienza una nueva línea después de mostrar el texto que necesita escribir en la ventana de terminal.

Eso ls concuerda con la salida de  y concuerda con la longitud del archivo de dos bytes.

Ahora, usaremos el ducomando para ver el tamaño del archivo:

du geek.txt

El comando "du geek.txt" en una ventana de terminal.

Dice que el tamaño es cuatro, pero ¿cuatro de qué?

Hay bloques y luego hay bloques

Cuando du informa los tamaños de archivo en bloques, el tamaño que utiliza depende de varios factores. Puede especificar qué tamaño de bloque debe usar en la línea de comando. Si no fuerza dua usar un tamaño de bloque en particular, sigue un conjunto de reglas para decidir cuál usar.

Primero, verifica las siguientes  variables de entorno:

  • DU_BLOCK_SIZE
  • TAMAÑO DE BLOQUE
  • TAMAÑO DE BLOQUE

Si alguno de estos existe, se establece el tamaño del bloque y se dudetiene la comprobación. Si no se establece ninguno, el  dutamaño de bloque predeterminado es 1.024 bytes. A menos que, es decir, POSIXLY_CORRECTse establezca una variable de entorno llamada . Si ese es el caso, el dutamaño de bloque predeterminado es de 512 bytes.

Entonces, ¿cómo averiguamos cuál está en uso? Puede verificar cada variable de entorno para resolverlo, pero hay una forma más rápida. Comparemos los resultados con el tamaño de bloque que usa el sistema de archivos.

Para descubrir el tamaño de bloque que usa el sistema de archivos, usaremos el tune2fsprograma. Luego usaremos la opción -l( listar superbloque ), canalizaremos la salida grepy luego  imprimiremos líneas que contienen la palabra «Bloque».

En este ejemplo, veremos el sistema de archivos en la primera partición del primer disco duro sda1, y necesitaremos usar sudo:

sudo tune2fs -l / dev / sda1 | bloque grep

El comando "sudo tune2fs -l / dev / sda1 | grep Block" en una ventana de terminal.

El tamaño del bloque del sistema de archivos es de 4096 bytes. Si dividimos eso por el resultado que obtuvimos de du (cuatro), muestra que el  du tamaño de bloque predeterminado es 1.024 bytes. Ahora sabemos varias cosas importantes.

Relacionado:  Cómo usar el comando ls para enumerar archivos y directorios en Linux

Primero, sabemos que la cantidad más pequeña de espacio en el sistema de archivos que se puede dedicar a almacenar un archivo es de 4096 bytes. Esto significa que incluso nuestro pequeño archivo de dos bytes ocupa 4 KB de espacio en el disco duro.

La segunda cosa a tener en cuenta es aplicaciones dedicadas a informar sobre estadísticas de la unidad y el sistema de archivos de disco duro, tales como du, lstune2fs, puede tener diferentes nociones de lo que significa “bloque”. La tune2fsaplicación informa los tamaños de bloque del sistema de archivos reales, mientras que  lsy duse puede configurar o forzar a utilizar otros tamaños de bloque. Estos tamaños de bloque no están destinados a relacionarse con el tamaño de bloque del sistema de archivos; son solo «fragmentos» que esos comandos usan en su salida.

Finalmente, además de usar diferentes tamaños de bloque, las respuestas de duy tune2fs transmiten el mismo significado. El tune2fsresultado fue un bloque de 4.096 bytes y el duresultado fue cuatro bloques de 1.024 bytes.

Utilizando du

Sin opciones ni parámetros de línea de comando, duenumera el espacio total en disco que utiliza el directorio actual y todos los subdirectorios.

Echemos un vistazo a un ejemplo:

du

El comando "du" en una ventana de terminal.

El tamaño se informa en el tamaño de bloque predeterminado de 1024 bytes por bloque. Se recorre todo el árbol de subdirectorios.

Usar duen un directorio diferente

Si desea  du informar sobre un directorio diferente al actual, puede pasar la ruta al directorio en la línea de comando:

du ~ / .cach / evolution /

El comando "du ~ / .cach / evolution /" en una ventana de terminal.

Usar duen un archivo específico

Si desea  du informar sobre un archivo específico, pase la ruta a ese archivo en la línea de comando. También puede pasar un patrón de shell a seleccionar un grupo de archivos, como *.txt:

du ~ / .bash_aliases

El comando "du ~ / .bash_aliases" en una ventana de terminal.

Informes sobre archivos en directorios

Para tener un duinforme sobre los archivos en el directorio y subdirectorios actuales, use la -aopción (todos los archivos):

du -a

El comando "du -a" en una ventana de terminal.

Para cada directorio, se informa el tamaño de cada archivo, así como el total de cada directorio.

Salida de un comando "du -a" en una ventana de terminal.

Limitar la profundidad del árbol de directorios

Puede indicarle duque enumere el árbol de directorios a cierta profundidad. Para hacerlo, use la -dopción (profundidad máxima) y proporcione un valor de profundidad como parámetro. Tenga en cuenta que todos los subdirectorios se escanean y se utilizan para calcular los totales informados, pero no se enumeran todos. Para establecer una profundidad máxima de directorio de un nivel, use este comando:

du -d 1

El comando "du -d 1" en una ventana de terminal.

La salida enumera el tamaño total de ese subdirectorio en el directorio actual y también proporciona un total para cada uno.

Relacionado:  Cómo usar el comando sed en Linux

Para enumerar directorios un nivel más profundo, use este comando:

du -d 2

El comando "du -d 2" en una ventana de terminal.

Configuración del tamaño del bloque

Puede usar la blockopción para establecer un tamaño de bloque du para la operación actual. Para usar un tamaño de bloque de un byte, use el siguiente comando para obtener los tamaños exactos de los directorios y archivos:

du --block = 1

El comando "du --block = 1" en una ventana de terminal.

Si desea usar un tamaño de bloque de un megabyte, puede usar la -mopción (megabyte), que es lo mismo que --block=1M:

du -m

El comando "du -m" en una ventana de terminal.

Si desea que los tamaños se informen en el tamaño de bloque más apropiado de acuerdo con el espacio en disco utilizado por los directorios y archivos, use la -hopción (legible por humanos):

du -h

El comando "du -h" en una ventana de terminal.

Para ver el tamaño aparente del archivo en lugar de la cantidad de espacio en el disco duro utilizado para almacenar el archivo, use la --apparent-sizeopción:

du - tamaño aparente

El comando "du --apparent-size" en una ventana de terminal.

Puede combinar esto con la -aopción (todos) para ver el tamaño aparente de cada archivo:

du - tamaño-aparente -a

El comando "du --apparent-size -a" en una ventana de terminal.

Cada archivo se muestra junto con su tamaño aparente.

Salida del comando "du --apparent-size -a" en una ventana de terminal.

Visualización solo de totales

Si desea  du informar solo el total del directorio, use la -sopción (resumir). También puede combinar esto con otras opciones, como la -hopción (legible por humanos):

du -h -s

El comando "du -h -s" en una ventana de terminal.

Aquí, lo usaremos con la --apparent-sizeopción:

du --tamaño-aparente -s

El comando "du --apparent-size -s" en una ventana de terminal.

Visualización de tiempos de modificación

Para ver la fecha y hora de creación o última modificación, use la --timeopción:

du --time -d 2

El comando "du --time -d 2" en una ventana de terminal.

¿Resultados extraños?

Si ve resultados extraños du, especialmente cuando hace una referencia cruzada de tamaños a la salida de otros comandos, generalmente se debe a los diferentes tamaños de bloque a los que se pueden configurar diferentes comandos o aquellos a los que están predeterminados. También podría deberse a las diferencias entre los tamaños de archivo reales y el espacio en disco necesario para almacenarlos.

Si necesita hacer coincidir la salida de otros comandos, experimente con la --blockopción en du.