sistemas de archivos La estructura del sistema de archivos. Arquitectura del sistema de archivos FAT Las tablas Fat ntfs sirven para

Este artículo es sobre sistemas de archivos . Al instalar Windows, le solicita que seleccione el sistema de archivos en la partición donde se instalará, y los usuarios de PC deben elegir entre dos opciones GORDO o NTFS.

En la mayoría de los casos, los usuarios están contentos sabiendo que NTFS es "mejor" y elige esta opción.

Sin embargo, a veces se preguntan y que es exactamente mejor?

En este artículo intentaré explicar qué es un sistema de archivos, qué son, en qué se diferencian y cuál se debe usar.

El artículo simplificó algunas de las características técnicas de los sistemas de archivos para una percepción más comprensible del material.

sistema de archivos es una forma de organizar datos en medios de almacenamiento. El sistema de archivos determina dónde y cómo se escribirán los archivos en los medios y proporciona al sistema operativo acceso a esos archivos.

Se imponen requisitos adicionales a los sistemas de archivos modernos: la capacidad de cifrar archivos, control de acceso a archivos y atributos adicionales. Por lo general, el sistema de archivos se escribe al principio del disco duro. ().

Desde el punto de vista del sistema operativo, un disco duro es un conjunto de clústeres.

grupo es un área de un disco de cierto tamaño para almacenar datos. El tamaño mínimo del clúster es de 512 bytes. Dado que se utiliza el sistema numérico binario, los tamaños de los grupos son un múltiplo de una potencia de dos.

El usuario puede imaginar figurativamente un disco duro como un bloc de notas a cuadros. Una celda en la página es un grupo. El sistema de archivos es el contenido del bloc de notas y el archivo es la palabra.

Para los discos duros de una PC, actualmente los más comunes son dos sistemas de archivos: GORDO o NTFS. Apareció por primera vez GORDO (FAT16), entonces FAT32, y luego NTFS.

GORDO(FAT16) – es una abreviatura de Tabla de asignación de archivos(En traducción Tabla de asignación de archivos).

La estructura FAT fue desarrollada por Bill Gates y Mark MacDonald en 1977. Se utilizó como sistema de archivos principal en los sistemas operativos DOS y Microsoft Windows (hasta la versión de Windows ME).

Hay cuatro versiones de FAT: FAT12, FAT16, FAT32 Y exFAT. Se diferencian en el número de bits asignados para almacenar el número de clúster.

FAT12 utilizado principalmente para disquetes, FAT16- para discos pequeños, y el nuevo exFAT principalmente para unidades flash. El tamaño máximo de clúster admitido por FAT es de 64 Kb. ()

FAT16 introducido por primera vez en noviembre de 1987. Índice 16 en el nombre indica que se utilizan 16 bits para el número de clúster. Como resultado, el tamaño máximo de una partición de disco (volumen) que este sistema puede admitir es de 4 GB.

Más tarde, con el desarrollo de la tecnología y la llegada de discos con una capacidad de más de 4 GB, apareció un sistema de archivos. FAT32. Utiliza direccionamiento de clúster de 32 bits y se introdujo con Windows 95 OSR2 en agosto de 1996. FAT32 limitado en tamaño de volumen a 128 GB. Además, este sistema puede admitir nombres de archivo largos. ().

NTFS(abreviatura NuevoTecnologíaArchivoSistema - Sistema de archivos de nueva tecnología) es el sistema de archivos estándar para la familia de sistemas operativos Microsoft Windows NT.

Introducido el 27 de julio de 1993 con Windows NT 3.1. NTFS se basa en el sistema de archivos HPFS (abreviatura altoActuaciónArchivoSistema - Sistema de archivos de alto rendimiento), que fue creado por Microsoft junto con IBM para el sistema operativo OS/2.

Características principales de NTFS: Capacidades integradas para restringir el acceso a los datos para diferentes usuarios y grupos de usuarios, así como asignar cuotas (restricciones sobre la cantidad máxima de espacio en disco ocupado por ciertos usuarios), el uso de un sistema de diario para mejorar la confiabilidad del sistema de archivos .

Las especificaciones del sistema de archivos están cerradas. Por lo general, el tamaño del clúster es de 4 Kb. En la práctica, no se recomienda crear volúmenes de más de 2 TB. Los discos duros acaban de alcanzar este tamaño, quizás en el futuro tengamos un nuevo sistema de archivos. ().

Durante la instalación de Windows XP, se le solicita formatear el disco en el sistema GORDO o NTFS. Esto significa FAT32.

Todos los sistemas de archivos se basan en el principio: un clúster, un archivo. Aquellos. un clúster almacena los datos de un solo archivo.

La principal diferencia para el usuario promedio entre estos sistemas es el tamaño del clúster. “Hace mucho tiempo, cuando los discos eran pequeños y los archivos eran muy pequeños”, se notaba mucho.

Considere el ejemplo de un volumen en un disco de 120 GB y un archivo de 10 Kb.

Para FAT32 el tamaño del clúster será de 32 Kb, y para NTFS- 4Kb.

EN FAT32 dicho archivo ocupará 1 clúster, dejando 32-10=22Kb de espacio sin asignar.

EN NTFS dicho archivo ocupará 3 clústeres, dejando 12-10=2Kb de espacio sin asignar.

Por analogía con un cuaderno, un clúster es una célula. Y habiendo puesto un punto en una celda, lógicamente ya lo ocupamos todo, pero en realidad hay mucho espacio libre.

Así, la transición de FAT32 A NTFS permite un uso más óptimo del disco duro cuando hay una gran cantidad de archivos pequeños en el sistema.

En 2003, tenía un disco de 120 GB dividido en volúmenes de 40 y 80 GB. Cuando cambié de Windows 98 a Windows XP y convertí la unidad de FAT32 V NTFS, obtuve alrededor de 1 GB de espacio libre en disco. En ese momento fue un "aumento" significativo.

Para averiguar qué sistema de archivos se utiliza en los volúmenes del disco duro de su PC, debe abrir la ventana de propiedades del volumen y en la pestaña "Son comunes" lee estos datos.

Volumen- este es un sinónimo de una partición de disco, los usuarios suelen llamar al volumen "unidad C", "unidad D", etc. Un ejemplo se muestra en la siguiente imagen:

Actualmente, los discos con una capacidad de 320 GB o más son ampliamente utilizados. Por lo tanto, recomiendo usar el sistema NTFS para un uso óptimo del espacio en disco.

Además, si hay varios usuarios en una PC, NTFS le permite configurar el acceso a archivos de tal manera que diferentes usuarios no puedan leer y modificar archivos de otros usuarios.

En las organizaciones, cuando se trabaja en una red local, los administradores del sistema utilizan otras funciones de NTFS.

Si está interesado en organizar el acceso a los archivos para varios usuarios en una PC, los siguientes artículos lo describirán en detalle.

Al escribir el artículo, se utilizaron materiales de los sitios en.wikipedia.org

Autor del artículo: maxim telpari
Usuario de PC con 15 años de experiencia. Especialista en soporte del curso de video "Usuario de PC seguro", después de estudiar, aprenderá cómo ensamblar una computadora, instalar Windows XP y controladores, restaurar el sistema, trabajar en programas y mucho más.

¡Gana dinero con este artículo!
Regístrese en un programa de afiliados. Reemplace el enlace del curso en el artículo con su enlace de afiliado. Agregue un artículo a su sitio. Puede obtener una versión reimpresa.

Material para la conferencia de repaso No. 33

para estudiantes de la especialidad

"Software de tecnología de la información"

Profesor Asociado del Departamento de TIC, Ph.D. Livak E.N.

SISTEMAS DE GESTIÓN DE ARCHIVOS

Conceptos básicos, hechos.

Cita. Características de los sistemas de archivosgordo,VFAT,FAT32,hpfs,NTFS. Sistemas de archivos OS UNIX (s5, ufs), OS Linux Ext2FS Áreas del sistema del disco (partición, volumen). Principios de colocación de archivos y almacenamiento de información sobre la ubicación de los archivos. Organización del directorio. Restricción de acceso a archivos y directorios.

Habilidades

Usar el conocimiento sobre la estructura del sistema de archivos para proteger y restaurar la información de la computadora (archivos y directorios). Organización del control de acceso a los archivos.

sistemas de archivos Estructura del sistema de archivos

Los datos se almacenan en el disco como archivos. Un archivo es una parte con nombre de un disco.

Los sistemas de administración de archivos están diseñados para administrar archivos.

El sistema de archivos proporciona la capacidad de manejar datos almacenados en archivos a nivel lógico. Es el sistema de archivos el que determina cómo se organizan los datos en un medio de almacenamiento.

De este modo, sistema de archivos es un conjunto de especificaciones y su software asociado que son responsables de crear, destruir, organizar, leer, escribir, modificar y mover información de archivos, así como controlar el acceso a los archivos y administrar los recursos utilizados por los archivos.

El sistema de gestión de archivos es el subsistema principal en la gran mayoría de los sistemas operativos modernos.

Uso del sistema de gestión de archivos

· todos los programas de procesamiento del sistema están conectados de acuerdo con los datos;

· se resuelven los problemas de distribución centralizada de espacio en disco y gestión de datos;

· el usuario tiene la oportunidad de realizar operaciones en los archivos (crear, etc.), intercambiar datos entre archivos y varios dispositivos, para proteger los archivos del acceso no autorizado.

Algunos sistemas operativos pueden tener varios sistemas de gestión de archivos, lo que les permite trabajar con varios sistemas de archivos.

Intentemos distinguir entre el sistema de archivos y el sistema de gestión de archivos.

El término "sistema de archivos" define los principios para acceder a los datos organizados en archivos.

Término "sistema de gestión de archivos" se refiere a una implementación particular del sistema de archivos, es decir este es un conjunto de módulos de software que proporcionan trabajo con archivos en un sistema operativo específico.

Por lo tanto, para trabajar con archivos organizados de acuerdo con algún sistema de archivos, se debe desarrollar un sistema de gestión de archivos apropiado para cada sistema operativo. Este sistema UV solo funcionará en el sistema operativo para el que fue creado.

Para la familia de sistemas operativos Windows, se utilizan principalmente los sistemas de archivos: VFAT, FAT 32, NTFS.

Considere la estructura de estos sistemas de archivos.

En el sistema de archivos GORDO El espacio en disco de cualquier unidad lógica se divide en dos áreas:

área del sistema y

el área de datos.

área del sistema se crea e inicializa al formatear y, posteriormente, se actualiza al manipular la estructura del archivo.

El área del sistema consta de los siguientes componentes:

Un sector de inicio que contiene un registro de inicio (registro de inicio);

Sectores reservados (pueden no serlo);

tablas de asignación de archivos (FAT, Tabla de Asignación de Archivos);

Directorio raíz (RAÍZ).

Estos componentes se encuentran en el disco uno tras otro.

Área de datos contiene archivos y directorios subordinados a la raíz.

El área de datos se divide en los llamados clústeres. Un clúster es uno o más sectores contiguos de un área de datos. Por otro lado, un clúster es la unidad direccionable más pequeña de espacio en disco asignada a un archivo. Aquellos. un archivo o directorio ocupa un número entero de clústeres. Para crear y escribir un nuevo archivo en el disco, el sistema operativo le asigna varios clústeres de disco libres. Estos clústeres no tienen que seguirse unos a otros. Para cada archivo, se almacena una lista de todos los números de clúster que se proporcionan a este archivo.

Dividir un área de datos en grupos en lugar de usar sectores le permite:

· reducir el tamaño de la tabla FAT;

Reducir la fragmentación de archivos

Reduce la longitud de las cadenas de archivos. Þ acelerar el acceso a los archivos.

Sin embargo, un tamaño de clúster demasiado grande conduce a un uso ineficiente del área de datos, especialmente en el caso de una gran cantidad de archivos pequeños (después de todo, se pierde un promedio de medio clúster por cada archivo).

En los sistemas de archivos modernos (FAT 32, HPFS, NTFS) este problema se resuelve limitando el tamaño del clúster (máximo 4 KB)

El mapa del área de datos es T Tabla de asignación de archivos (Tabla de asignación de archivos - FAT) Cada elemento de la tabla FAT (12, 16 o 32 bits) corresponde a un clúster de disco y caracteriza su estado: libre, ocupado o es un clúster defectuoso.

· Si el grupo se asigna a cualquier archivo (es decir, está ocupado), el elemento FAT correspondiente contiene el número del siguiente grupo de archivos;

· el último grupo del archivo está marcado con un número en el rango FF8h - FFFh (FFF8h - FFFFh);

· si el clúster está libre, contiene el valor cero 000h (0000h);

· Un clúster que no se puede utilizar (fallido) se marca con el número FF7h (FFF7h).

Así, en la tabla FAT, los clústeres que pertenecen a un mismo archivo se vinculan en cadenas.

La tabla de asignación de archivos se almacena inmediatamente después del registro de arranque del disco lógico, su ubicación exacta se describe en un campo especial en el sector de arranque.

Se almacena en dos copias idénticas que se suceden. Cuando se destruye la primera copia de la tabla, se utiliza la segunda.

Debido al hecho de que FAT se usa mucho cuando se accede a un disco, generalmente se carga en la RAM (en el búfer de E / S o en el caché) y permanece allí el mayor tiempo posible.

La principal desventaja de FAT es el manejo lento de archivos. Al crear un archivo, la regla funciona: se selecciona el primer clúster libre. Esto conduce a la fragmentación del disco y cadenas de archivos complejas. De ahí la ralentización en el trabajo con archivos.

Para ver y editar la tabla FAT, puede usar utilidaddiscoEditor.

La información detallada sobre el archivo en sí se almacena en otra estructura llamada directorio raíz. Cada disco lógico tiene su propio directorio raíz (RAÍZ, inglés - raíz).

Directorio raíz describe archivos y otros directorios. El elemento de directorio es un descriptor de archivo (descriptor).

El descriptor de cada archivo y directorio lo incluye

· Nombre

· extensión

fecha de creación o última modificación

hora de creación o última modificación

atributos (archivo, atributo de directorio, atributo de volumen, sistema, oculto, solo lectura)

longitud del archivo (para un directorio - 0)

un campo reservado que no se utiliza

· el número del primer grupo en la cadena de grupos asignados al archivo o directorio; habiendo recibido este número, el sistema operativo, refiriéndose a la tabla FAT, también encontrará todos los demás números de grupos de archivos.

Entonces, el usuario inicia el archivo para su ejecución. El sistema operativo busca un archivo con el nombre deseado mirando las descripciones de archivo en el directorio actual. Cuando el elemento requerido se encuentra en el directorio actual, el sistema operativo lee el número del primer grupo de este archivo y luego determina los números de grupo restantes de la tabla FAT. Los datos de estos grupos se leen en la RAM y se combinan en una sección continua. El sistema operativo transfiere el control al archivo y el programa comienza a ejecutarse.

Para ver y editar el directorio ROOT, también puede usar utilidaddiscoEditor.

sistema de archivos VFAT

El sistema de archivos VFAT (virtual FAT) apareció por primera vez en Windows for Workgroups 3.11 y fue diseñado para E/S de archivos en modo protegido.

Este sistema de archivos se utiliza en Windows 95.

También es compatible con Windows NT 4.

VFAT es el sistema de archivos de 32 bits "nativo" de Windows 95. Está controlado por el controlador VFAT .VXD.

VFAT usa código de 32 bits para todas las operaciones con archivos y puede usar controladores de modo protegido de 32 bits.

PERO, las entradas de la tabla de asignación de archivos siguen siendo de 12 o 16 bits, por lo que se utiliza la misma estructura de datos (FAT) en el disco. Aquellos. F formato de tablaVFAT es lo mismo, al igual que el formato FAT.

VFAT junto con nombres "8.3" admite nombres de archivo largos. (A menudo se dice que VFAT es FAT con soporte para nombres largos).

La principal desventaja de VFAT son las grandes pérdidas por agrupamiento con grandes tamaños de disco lógico y restricciones en el tamaño del propio disco lógico.

sistema de archivos GRASA 32

Esta es una nueva implementación de la idea de usar la tabla FAT.

FAT 32 es un sistema de archivos de 32 bits completamente independiente.

Utilizado por primera vez en Windows OSR 2 (OEM Service Release 2).

FAT 32 se usa actualmente en Windows 98 y Windows ME.

Contiene numerosas mejoras y adiciones sobre implementaciones FAT anteriores.

1. Uso mucho más eficiente del espacio en disco debido a que utiliza clústeres más pequeños (4 KB) - se estima que ahorra hasta un 15%.

2. Tiene un registro de arranque extendido que le permite crear copias de estructuras de datos críticas Þ aumenta la resistencia del disco a las violaciones de las estructuras del disco

3. Puede usar una copia de seguridad FAT en lugar de una estándar.

4. Puede mover el directorio raíz, en otras palabras, el directorio raíz puede estar en una ubicación arbitraria Þ elimina el límite en el tamaño del directorio raíz (512 elementos, ya que se suponía que ROOT ocuparía un clúster).

5. Estructura de directorio raíz mejorada

Aparecieron campos adicionales, por ejemplo, hora de creación, fecha de creación, última fecha de acceso, suma de verificación

Todavía hay múltiples descriptores para un nombre de archivo largo.

sistema de archivos HPFS

HPFS (Sistema de archivos de alto rendimiento) es un sistema de archivos de alto rendimiento.

HPFS apareció por primera vez en OS/2 1.2 y LAN Manager.

Hagamos una lista Características principales de HPFS.

· La principal diferencia son los principios básicos de colocar archivos en un disco y los principios de almacenar información sobre la ubicación de los archivos. Gracias a estos principios, HPFS ha alto rendimiento y tolerancia a fallas, es confiable sistema de archivos

El espacio en disco en HPFS no lo asignan los clústeres (como en FAT), sino bloques En la implementación moderna, el tamaño del bloque se toma igual a un sector, pero en principio podría ser de un tamaño diferente. (De hecho, un bloque es un clúster, solo un clúster siempre es igual a un sector). La organización de archivos en bloques tan pequeños permite usar el espacio en disco de manera más eficiente, ya que la sobrecarga de espacio libre promedia solo (medio sector) 256 bytes por archivo. Recuerde que cuanto mayor sea el tamaño del clúster, más espacio en disco se desperdiciará.

El sistema HPFS busca ordenar el archivo en bloques contiguos o, si esto no es posible, colocarlo en el disco de tal manera que extensiones(fragmentos) del archivo estaban físicamente lo más cerca posible entre sí. Este enfoque es fundamental reduce el tiempo de posicionamiento de los cabezales de lectura/escritura unidad de disco duro y latencia (retraso entre la posición del cabezal de lectura/escritura en la pista correcta). Recuerde que en un archivo FAT, simplemente se asigna el primer clúster libre.

extensiones(extensión): fragmentos de archivo ubicados en sectores de disco adyacentes. Un archivo tiene al menos una extensión si no está fragmentado y más de una extensión en caso contrario.

Usado métodoárboles binarios equilibrados para almacenar y buscar información sobre la ubicación de los archivos (los directorios se almacenan en el centro del disco, además, se proporciona una clasificación automática de directorios), que es esencial mejora el rendimiento HPFS (frente a FAT).

HPFS proporciona atributos especiales de archivos extendidos que permiten gestionar el acceso a archivos y directorios.

Atributos extendidos (atributos extendidos, EA ) le permiten almacenar información adicional sobre el archivo. Por ejemplo, cada archivo se puede asociar con su imagen gráfica única (icono), descripción del archivo, comentario, información sobre el propietario del archivo, etc.

Estructura de partición C HPFS

Al comienzo de la partición con HPFS instalado, hay tres bloque de control:

bloque de arranque (bloque de arranque),

bloque adicional (super bloque) y

Bloque de repuesto (copia de seguridad) (bloque de repuesto).

Ocupan 18 sectores.

Todo el resto del espacio en disco en HPFS se divide en partes de sectores adyacentes: rayas(banda - tira, cinta). Cada franja ocupa 8 MB en el disco.

Cada carril y tiene su propio mapa de bits de asignación de sectores.El mapa de bits muestra qué sectores de una banda dada están ocupados y cuáles están libres. Cada sector de la tira de datos corresponde a un bit en su mapa de bits. Si bit = 1, entonces el sector está ocupado, si es 0, libre.

Los mapas de bits de las dos bandas se encuentran uno al lado del otro en el disco, al igual que las propias bandas. Es decir, la secuencia de franjas y cartas se ve como en la Fig.

Comparar conGORDO. Solo hay un "mapa de bits" para todo el disco (tabla FAT). Y para trabajar con él, debe mover los cabezales de lectura/escritura en promedio a través de la mitad del disco.

Es para reducir el tiempo de posicionamiento de los cabezales de lectura/escritura del disco duro que el disco HPFS se divide en franjas.

Considerar bloques de control.

bloque de arranque (botabloquear)

Contiene el nombre del volumen, su número de serie, el bloque de configuración del BIOS y el programa de inicio.

Bootstrap encuentra el archivo Sistema operativo 2 LDR , lo lee en la memoria y transfiere el control a este programa de arranque del sistema operativo, que a su vez carga el núcleo OS/2 del disco a la memoria: SO 2 KRNL. Y ya OS 2 KRIML usar información de un archivo CONFIG. SISTEMA carga todos los demás módulos de programa y bloques de datos necesarios en la memoria.

El bloque de arranque se encuentra en los sectores 0 a 15.

SúperBloquear(súper bloque)

Contiene

Un puntero a una lista de mapas de bits (lista de bloques de mapas de bits). Esta lista enumera todos los bloques en el disco que contienen los mapas de bits utilizados para detectar sectores libres;

puntero a la lista de bloques defectuosos (bad block list). Cuando el sistema detecta un bloque dañado, se agrega a esta lista y ya no se utiliza para el almacenamiento de información;

un puntero a un grupo de directorios (banda de directorio),

puntero al nodo de archivo (F -node) del directorio raíz,

· la fecha de la última comprobación de la partición por el programa CHKDSK;

información sobre el tamaño de la franja (en la implementación actual de HPFS - 8 MB).

Super bloque se coloca en el sector 16.

Repuestobloquear(bloque de repuesto)

Contiene

puntero al mapa de reemplazo de emergencia (mapa de revisión o áreas de revisión);

· puntero a la lista de bloques de repuesto libres (lista de bloques libres de emergencia del directorio);

una serie de indicadores y descriptores del sistema.

Este bloque se encuentra en el sector 17 del disco.

El bloque de repuesto proporciona una alta tolerancia a fallas del sistema de archivos HPFS y le permite recuperar datos dañados en el disco.

El principio de colocación de archivos.

extensiones(extensión): fragmentos de archivo ubicados en sectores de disco adyacentes. Un archivo tiene al menos una extensión si no está fragmentado y más de una extensión en caso contrario.

Para reducir el tiempo de posicionamiento de las cabezas de lectura/escritura del disco duro, el sistema HPFS busca

1) coloque el archivo en bloques adyacentes;

2) si esto no es posible, coloque las extensiones del archivo fragmentado lo más cerca posible entre sí,

Para hacer esto, HPFS usa estadísticas y también intenta reservar condicionalmente al menos 4 kilobytes de espacio al final de los archivos que crecen.

Principios de almacenamiento de información sobre la ubicación de los archivos.

Cada archivo y directorio en el disco tiene su propio Nodo de archivo F-Node. Esta es una estructura que contiene información sobre la ubicación del archivo y sus atributos extendidos.

Cada nodo F ocupa un sector y siempre se encuentra cerca de su archivo o directorio (generalmente justo antes del archivo o directorio). El nodo F contiene

longitud,

los primeros 15 caracteres del nombre del archivo,

Información de servicio especial

Estadísticas de acceso a archivos

Atributos de archivo extendidos

una lista de derechos de acceso (o solo una parte de esta lista, si es muy grande); si los atributos extendidos son demasiado grandes para el nodo de archivo, se escribe un puntero a ellos.

información asociativa sobre la ubicación y subordinación del archivo, etc.

Si el archivo es continuo, su ubicación en el disco se describe mediante dos números de 32 bits. El primer número es un puntero al primer bloque del archivo y el segundo es la longitud de la extensión (el número de bloques consecutivos que pertenecen al archivo).

Si el archivo está fragmentado, la ubicación de sus extensiones se describe en el nodo del archivo con pares adicionales de números de 32 bits.

Un nodo de archivo puede contener información sobre hasta ocho extensiones de un archivo. Si un archivo tiene más extensiones, se escribe un puntero a un bloque de asignación en su nodo de archivo, que puede contener hasta 40 punteros a extensiones o, por analogía con un bloque de árbol de directorios, a otros bloques de asignación.

Estructura y colocación de directorios

Se utiliza para almacenar directorios. raya en el centro del disco.

Esta tira se llama directoriobanda.

Si está lleno, HPFS comienza a colocar directorios de archivos en otros carriles.

La ubicación de esta estructura de información en el medio del disco reduce significativamente el tiempo promedio de posicionamiento de las cabezas de lectura/escritura.

Sin embargo, una contribución significativamente mayor (en comparación con la ubicación de la banda de directorio en el medio de un disco lógico) al rendimiento de HPFS proviene del uso de métodoárboles binarios equilibrados para almacenar y recuperar información sobre la ubicación de los archivos.

Recuerde que en el sistema de archivos GORDO el directorio tiene una estructura lineal, no especialmente ordenada, por lo que al buscar un archivo, debe buscarlo secuencialmente desde el principio.

En HPFS, la estructura de directorios es un árbol balanceado con entradas en orden alfabético.

Cada entrada en el árbol contiene

atributos de archivo,

un puntero al nodo de archivo correspondiente,

información sobre la hora y fecha de creación del fichero, la hora y fecha de la última actualización y acceso,

longitud de los datos que contienen atributos extendidos,

contador de acceso a archivos

La longitud del nombre del archivo.

el nombre mismo

y otra información.

Al buscar un archivo en un directorio, el sistema de archivos HPFS solo busca las ramas necesarias del árbol binario. Este método es muchas veces más eficiente que la lectura secuencial de todas las entradas del directorio, que es el caso del sistema FAT.

El tamaño de cada uno de los bloques en función de qué directorios se asignan en la implementación actual de HPFS es de 2 KB. El tamaño de un registro que describe un archivo depende del tamaño del nombre del archivo. Si el nombre es de 13 bytes (para el formato 8.3), un bloque de 2K puede contener hasta 40 descriptores de archivo. Los bloques están vinculados entre sí por medio de una lista.

Problemas

Al cambiar el nombre de los archivos, puede ocurrir el llamado reequilibrio del árbol. Crear un archivo, renombrarlo o borrarlo puede resultar en bloques de directorio en cascada. De hecho, el cambio de nombre puede fallar debido a la falta de espacio en disco, incluso si el archivo en sí no ha aumentado de tamaño. Para evitar este desastre, HPFS mantiene un pequeño grupo de bloques libres que se pueden utilizar en caso de desastre. Esta operación puede requerir la asignación de bloques adicionales en un disco completo. Un puntero a este grupo de bloques libres se almacena en un SpareBlock,

Cómo se colocan los archivos y directorios en el discoHPFS:

· la información sobre la ubicación de los archivos está dispersa por todo el disco, mientras que los registros de cada archivo específico se colocan (si es posible) en sectores adyacentes y cerca de los datos sobre su ubicación;

los directorios se colocan en medio del espacio del disco;

· Los directorios se almacenan como un árbol binario equilibrado con entradas dispuestas en orden alfabético.

Confiabilidad del almacenamiento de datos en HPFS

Cualquier sistema de archivos debe tener los medios para corregir los errores que ocurren cuando la información se escribe en el disco. El sistema HPFS utiliza mecanismo de reemplazo de emergencia ( revisión).

Si el sistema de archivos HPFS encuentra un problema al escribir datos en el disco, muestra un mensaje de error apropiado. HPFS luego almacena la información que debería haberse escrito en el sector defectuoso en uno de los sectores de repuesto reservados de antemano para este caso. La lista de bloques de repuesto libres se almacena en el bloque de repuesto HPFS. Si se detecta un error al escribir datos en un bloque normal, HPFS selecciona uno de los bloques de repuesto libres y almacena los datos en él. A continuación, el sistema de archivos se actualiza tarjeta de reposición de emergencia en la unidad de reserva.

Este mapa es simplemente pares de palabras dobles, cada una de las cuales es un número de sector de 32 bits.

El primer número indica el sector defectuoso y el segundo, el sector entre los sectores de repuesto disponibles, que se eligió para reemplazarlo.

Después de reemplazar el sector defectuoso por uno de repuesto, la tarjeta de reemplazo se escribe en el disco y aparece una ventana emergente en la pantalla que informa al usuario que se ha producido un error de escritura en el disco. Cada vez que el sistema escribe o lee un sector del disco, mira el mapa de repuesto dinámico y reemplaza todos los números de sector defectuosos con números de sector de repuesto con los datos correspondientes.

Cabe señalar que esta traducción de números no afecta significativamente el rendimiento del sistema, ya que se realiza solo cuando se accede físicamente al disco, pero no cuando se leen datos del caché del disco.

sistema de archivos NTFS

El sistema de archivos NTFS (Sistema de archivos de nueva tecnología) contiene una serie de mejoras y cambios significativos que lo distinguen significativamente de otros sistemas de archivos.

Tenga en cuenta que, con raras excepciones, Solo se puede acceder a las particiones NTFS directamente desdeventanasNUEVO TESTAMENTO, aunque existen implementaciones correspondientes de sistemas de administración de archivos para varios sistemas operativos para leer archivos de volúmenes NTFS.

Sin embargo, todavía no existen implementaciones completas para trabajar con NTFS fuera de Windows NT.

NTFS no es compatible con los sistemas operativos Windows 98 y Windows Millennium Edition, ampliamente utilizados.

Características claveNTFS

el trabajo en discos grandes es eficiente (mucho más eficiente que en FAT);

Existen herramientas para restringir el acceso a archivos y directorios Þ Las particiones NTFS brindan seguridad local tanto para archivos como para directorios;

Se ha introducido un mecanismo de transacción, en el que Inicio sesión operaciones de archivo Þ aumento significativo de la fiabilidad;

· se han eliminado muchas restricciones sobre el número máximo de sectores de disco y/o clústeres;

· un nombre de archivo en NTFS, a diferencia de los sistemas de archivos FAT y HPFS, puede contener cualquier carácter, incluido el conjunto completo de alfabetos nacionales, ya que los datos se presentan en Unicode, una representación de 16 bits que proporciona 65535 caracteres diferentes. La longitud máxima de un nombre de archivo en NTFS es de 255 caracteres.

· NTFS también tiene herramientas de compresión integradas que puedes aplicar a archivos individuales, directorios completos e incluso volúmenes (y posteriormente cancelarlos o asignarlos a tu discreción).

Estructura de volumen con sistema de archivos NTFS

Una partición NTFS se denomina volumen. Los tamaños de volumen máximos posibles (y tamaños de archivo) son 16 Ebytes (2 exabytes**64).

Al igual que otros sistemas, NTFS divide el espacio en disco de un volumen en grupos, bloques de datos que se tratan como unidades de datos. NTFS admite tamaños de clúster de 512 bytes a 64 KB; el estándar es un clúster de 2 o 4 KB.

Todo el espacio en disco en NTFS se divide en dos partes desiguales.

El primer 12% del disco está reservado para la llamada zona MFT, el espacio que puede ser ocupado, aumentando de tamaño, por el servicio principal. metarchivo MFT.

No es posible escribir ningún dato en esta área. La zona MFT siempre se mantiene vacía; esto se hace para que el archivo MFT, si es posible, no se fragmente a medida que crece.

El 88% restante del volumen es espacio de almacenamiento de archivos ordinario.

TMF (maestroarchivomesa- tabla general de archivos) es esencialmente un directorio de todos los demás archivos en el disco, incluido él mismo. Está diseñado para determinar la ubicación de los archivos.

La MFT consta de registros de tamaño fijo. El tamaño de la entrada MFT (mínimo 1 KB y máximo 4 KB) se determina durante el formateo del volumen.

Cada entrada corresponde a un archivo.

Las primeras 16 entradas son de naturaleza de servicio y no están disponibles para el sistema operativo; se denominan metarchivos, y el primer metarchivo es el propio MFT.

Estos primeros 16 elementos MFT son la única parte del disco que tiene una posición estrictamente fija. Una copia de los mismos 16 registros se guarda en medio del volumen por seguridad.

Las partes restantes del archivo MFT se pueden ubicar, como cualquier otro archivo, en lugares arbitrarios del disco.

Los metarchivos son servicios por naturaleza; cada uno de ellos es responsable de algún aspecto del sistema. Los metarchivos se encuentran en el directorio raíz de un volumen NTFS. Todos comienzan con el carácter de nombre "$", aunque es difícil obtener información sobre ellos utilizando herramientas estándar. En mesa. se dan los metarchivos principales y su finalidad.

Nombre de metarchivo	Finalidad del metarchivo
$ MFT	La tabla maestra de archivos en sí
$MFTespejo	Una copia de los primeros 16 registros MFT colocados en medio del volumen
$archivo de registro	Archivo de soporte de registro
$Volumen	Información de servicio: etiqueta de volumen, versión del sistema de archivos, etc.
$AttrDef	Lista de atributos de archivo estándar en un volumen
		Directorio raíz
$mapa de bits		Mapa de espacio libre de volumen
$arranque		Sector de arranque (si la partición es de arranque)
$cuota		Un archivo que registra los derechos de los usuarios para usar el espacio en disco (este archivo solo comenzó a funcionar en Windows 2000 con NTFS 5.0)
$ en mayúsculas		Archivo: una tabla de correspondencia entre letras mayúsculas y minúsculas en nombres de archivos. En NTFS, los nombres de archivo se escriben en Unicode (que son 65 mil caracteres diferentes) y buscar equivalentes grandes y pequeños en este caso es una tarea no trivial

El registro MFT correspondiente almacena toda la información sobre el archivo:

· Nombre del archivo,

· tamaño;

atributos de archivo

posición en el disco de fragmentos individuales, etc.

Si falta un registro MFT para la información, se utilizan varios registros, y no necesariamente en una fila.

Si el archivo no es muy grande, los datos del archivo se almacenan directamente en la MFT, en el espacio restante de los datos principales, dentro de un registro de la MFT.

Un archivo en un volumen NTFS se identifica mediante el denominado enlace de archivo(Referencia de archivo), que se representa como un número de 64 bits.

el número de expediente que corresponde al número de registro en la MFT,

y números de secuencia. Este número se incrementa cada vez que el número dado se reutiliza en la MFT, lo que permite que el sistema de archivos NTFS realice comprobaciones de integridad internas.

Cada archivo en NTFS está representado por fluye(streams), es decir, no tiene “solo datos” como tal, sino que hay streams.

Uno de los flujos son los datos del archivo.

La mayoría de los atributos de archivo también son flujos.

Por lo tanto, resulta que el archivo tiene solo una entidad básica: el número en la MFT y todo lo demás, incluidas sus transmisiones, es opcional.

Este enfoque se puede usar de manera efectiva; por ejemplo, se puede "pegar" otra secuencia a un archivo escribiendo cualquier dato en él.

Los atributos estándar para archivos y directorios en un volumen NTFS tienen nombres fijos y códigos de tipo.

Catalogar NTFS es un archivo especial que almacena enlaces a otros archivos y directorios.

El archivo de catálogo se divide en bloques, cada uno de los cuales contiene

· Nombre del archivo,

atributos básicos y

El directorio raíz de un disco no es diferente de los directorios ordinarios, excepto por un enlace especial desde el principio del metarchivo MFT.

La estructura del directorio interno es un árbol binario como en HPFS.

El número de archivos en los directorios raíz y no raíz es ilimitado.

El sistema de archivos NTFS es compatible con el modelo de objetos de seguridad de NT: NTFS trata los directorios y los archivos como objetos heterogéneos y mantiene listas de permisos separadas (aunque superpuestas) para cada tipo.

NTFS proporciona seguridad a nivel de archivos; esto significa que los derechos de acceso a volúmenes, directorios y archivos pueden depender de la cuenta de usuario y los grupos a los que pertenece el usuario. Cada vez que un usuario accede a un objeto del sistema de archivos, sus permisos se comparan con la lista de permisos del objeto. Si el usuario tiene un nivel suficiente de derechos, se concede su solicitud; de lo contrario, la solicitud es rechazada. Este modelo de seguridad se aplica tanto al inicio de sesión de usuarios locales en máquinas NT como a solicitudes de red remotas.

NTFS también tiene algunas funciones de recuperación automática. NTFS admite varios mecanismos para verificar la integridad del sistema, incluido el registro de transacciones, que le permite reproducir operaciones de escritura de archivos en un registro especial del sistema.

En diario operaciones de archivos, el sistema de gestión de archivos registra los cambios que tienen lugar en un archivo de servicio especial. Al comienzo de la operación asociada con el cambio de la estructura del archivo, se realiza la marca correspondiente. Si ocurre alguna falla durante las operaciones en los archivos, entonces la marca de inicio de la operación mencionada permanece indicada como incompleta. Si realiza una verificación de integridad del sistema de archivos después de reiniciar la máquina, estas operaciones pendientes se desharán y los archivos se restaurarán a su estado original. Si la operación de cambio de datos en archivos se completa normalmente, entonces la operación se marca como completada en este mismo archivo de servicio de soporte de registro.

La principal desventaja del sistema de archivos.NTFS- los datos de servicio ocupan mucho espacio (por ejemplo, cada elemento del directorio ocupa 2 KB) - para particiones pequeñas, los datos de servicio pueden ocupar hasta el 25% del volumen de medios.

Þ NTFS no se puede utilizar para formatear disquetes. No lo use para formatear particiones de menos de 100 MB.

sistema de archivos del sistema operativo UNIX

En el mundo UNIX, existen varios tipos diferentes de sistemas de archivos con su propia estructura de memoria externa. Los más conocidos son el sistema de archivos tradicional UNIX System V (s5) y el sistema de archivos de la familia UNIX BSD (ufs).

Considere s 5.

Un archivo UNIX es un conjunto de caracteres de acceso aleatorio.

El archivo tiene una estructura que el usuario le impone.

El sistema de archivos Unix es un sistema de archivos jerárquico y multiusuario.

El sistema de archivos tiene una estructura de árbol. Los vértices (nodos intermedios) del árbol son directorios con enlaces a otros directorios o archivos. Las hojas del árbol corresponden a archivos o directorios vacíos.

Comentario. De hecho, el sistema de archivos de Unix no es un árbol. El caso es que el sistema tiene la posibilidad de romper la jerarquía en forma de árbol, ya que es posible asociar múltiples nombres con el mismo contenido de archivo.

Estructura del disco

El disco está dividido en bloques. El tamaño del bloque de datos se determina cuando el sistema de archivos se formatea con el comando mkfs y se puede establecer en 512, 1024, 2048, 4096 u 8192 bytes.

Contamos por 512 bytes (tamaño de sector).

El espacio en disco se divide en las siguientes áreas (ver figura):

bloque de carga;

supermanzana de control;

matriz de i-nodos;

área para almacenar el contenido (datos) de los archivos;

un conjunto de bloques libres (enlazados en una lista);

Bloque de arranque

supermanzana

yo - nodo

. . .

yo - nodo

Comentario. Para el sistema de archivos UFS: todo esto se repite para un grupo de cilindros (excepto el bloque de arranque) + se asigna un área especial para describir un grupo de cilindros

Bloque de arranque

El bloque está ubicado en el bloque #0. (Recuerde que la ubicación de este bloque en el bloque cero del dispositivo del sistema está determinada por el hardware, ya que el cargador de hardware siempre se refiere al bloque cero del dispositivo del sistema. Este es el último componente del sistema de archivos que depende del hardware).

El bloque de inicio contiene un programa giratorio que se utiliza para iniciar inicialmente el sistema operativo UNIX. En los sistemas de archivos s 5, solo se utiliza el bloque de arranque del sistema de archivos raíz. En los sistemas de archivos secundarios, esta área está presente pero no se utiliza.

supermanzana

Contiene información operativa sobre el estado del sistema de archivos, así como datos sobre la configuración del sistema de archivos.

En concreto, la supermanzana contiene la siguiente información

el número de i-nodos (descriptores de índice);

¿¿¿tamaño de la partición???;

lista de bloques libres;

lista de i-nodos libres;

· y otra.

¡Prestemos atención! El espacio libre en disco es lista enlazada de bloques libres. Esta lista se almacena en la supermanzana.

Los elementos de la lista son matrices de 50 elementos (si bloque = 512 bytes, entonces elemento = 16 bits):

· Los elementos de la matriz Nos. 1-48 contienen los números de bloques libres del espacio de bloques de archivo del 2 al 49.

el elemento #0 contiene un puntero a la continuación de la lista, y

· el último elemento (#49) contiene un puntero a un elemento libre en la matriz.

Si algún proceso necesita un bloque libre para la extensión del archivo, entonces el sistema selecciona un elemento de la matriz mediante el puntero (al elemento libre), y el bloque con el número almacenado en este elemento se proporciona al archivo. Si se reduce el archivo, los números liberados se agregan a la matriz de bloques libres y se ajusta el puntero al elemento libre.

Dado que el tamaño de la matriz es de 50 elementos, son posibles dos situaciones críticas:

1. Cuando liberamos bloques de archivos, pero no caben en esta matriz. En este caso, se selecciona un bloque libre del sistema de archivos y la matriz completa de bloques libres se copia en este bloque, después de lo cual el valor del puntero al elemento libre se establece en cero, y en el elemento cero del arreglo, que está en el superbloque, se escribe el número del bloque que el sistema ha elegido para copiar el contenido del arreglo. En este punto, se crea un nuevo elemento de la lista de bloques libres (cada uno con 50 elementos).

2. Cuando se agota el contenido de los elementos de la matriz de bloques libres (en este caso, el elemento cero de la matriz es igual a cero) Si este elemento no es igual a cero, esto significa que hay una continuación de la matriz . Esta continuación se lee en una copia del superbloque en RAM.

Lista de gratisi-nodos. Este es un búfer que consta de 100 elementos. Contiene información sobre 100 números de i-nodes que están libres en este momento.

Superblock siempre está en RAM

Þ todas las operaciones (liberación y ocupación de bloques e i-nodes ocurren en RAM Þ minimizando los intercambios de discos.

¡Pero! Si el contenido del superbloque no se escribe en el disco y se apaga la alimentación, surgirán problemas (una discrepancia entre el estado real del sistema de archivos y el contenido del superbloque). Pero esto ya es un requisito para la confiabilidad del equipo del sistema.

Comentario. Los sistemas de archivos UFS admiten varias copias del superbloque (una copia por grupo de cilindros) para aumentar la resiliencia

área de inodo

Esta es una matriz de descripciones de archivos llamada i-nodos (i-nodo).(¿64 bytes?)

Cada descriptor de índice (i-node) de un archivo contiene:

Tipo de archivo (archivo/directorio/archivo especial/fifo/socket)

Atributos (permisos) - 10

ID del propietario del archivo

El ID del grupo propietario del archivo.

Hora de creación del archivo

Hora de modificación del archivo

La última vez que se accedió al archivo

Longitud del archivo

El número de enlaces al i-nodo dado desde diferentes directorios

Direcciones de bloques de archivos

!nota. No hay nombre de archivo aquí

Echemos un vistazo más de cerca a cómo está organizado. direccionamiento de bloques, que contiene el archivo. Entonces, en el campo con direcciones están los números de los primeros 10 bloques del archivo.

Si el archivo supera los diez bloques, el siguiente mecanismo comienza a funcionar: el elemento 11 del campo contiene el número de bloque, que contiene 128 (256) enlaces a los bloques del archivo dado. En el caso de que el archivo sea aún más grande, se usa el elemento 12 del campo: contiene el número de bloque, que contiene 128 (256) números de bloque, donde cada bloque contiene 128 (256) números de bloque del sistema de archivos. Y si el archivo es aún más grande, entonces se usa el elemento 13, donde la profundidad de anidamiento de la lista aumenta en uno más.

Así, podemos obtener un archivo de tamaño (10+128+128 2 +128 3)*512.

Esto se puede representar de la siguiente forma:

Dirección del primer bloque de archivos

Dirección del segundo bloque de archivos

Dirección del décimo bloque de archivos

Dirección de bloque indirecta (bloque con 256 direcciones de bloque)

Dirección de bloque del segundo direccionamiento indirecto (bloque con 256 bloques de direcciones con direcciones)

Dirección de bloque del 3er direccionamiento indirecto (bloque con direcciones de bloque con direcciones de bloque con direcciones)

Protección de archivos

Ahora veamos los ID de propietario y de grupo y los bits de seguridad.

El sistema operativo Unix utiliza jerarquía de tres niveles de usuarios:

El primer nivel es todos los usuarios.

El segundo nivel son los grupos de usuarios. (Todos los usuarios se dividen en grupos.

El tercer nivel es un usuario específico (los grupos están formados por usuarios reales). Debido a esta organización de usuarios en tres niveles, cada archivo tiene tres atributos:

1) El titular del fichero. Este atributo está asociado a un usuario en particular, a quien el sistema asigna automáticamente como propietario del archivo. Puede convertirse en el propietario predeterminado creando un archivo, y también hay un comando que le permite cambiar el propietario de un archivo.

2) Protección de acceso a archivos. El acceso a cada archivo está restringido en tres categorías:

derechos del propietario (lo que el propietario puede hacer con este archivo, en el caso general, no necesariamente cualquier cosa);

los derechos del grupo al que pertenece el propietario del fichero. El propietario no está incluido aquí (por ejemplo, se puede bloquear la lectura de un archivo para el propietario, y todos los demás miembros del grupo pueden leer libremente desde este archivo;

todos los demás usuarios del sistema;

De acuerdo con estas tres categorías, se regulan tres acciones: leer de un archivo, escribir en un archivo y ejecutar un archivo (en el sistema mnemotécnico R, W, X, respectivamente). En cada archivo, estas tres categorías definen qué usuario puede leer, cuál escribir y quién puede ejecutarlo como un proceso.

Organización del catálogo

El directorio desde el punto de vista del sistema operativo es un archivo normal que contiene datos sobre todos los archivos que pertenecen al directorio.

El elemento de directorio consta de dos campos:

1) el número del i-nodo (número de serie en la matriz de i-nodos) y

2) nombre de archivo:

Cada directorio contiene dos nombres especiales: '.' - el propio directorio; '..' es el directorio principal.

(Para el directorio raíz, el padre se refiere a sí mismo).

En general, un directorio puede tener entradas que hagan referencia al mismo i-nodo más de una vez, pero un directorio no puede tener entradas con el mismo nombre. Es decir, se puede asociar un número arbitrario de nombres con el contenido de un archivo. Se llama vinculante. Una entrada de directorio que se refiere a un solo archivo se llama comunicación.

Los archivos existen independientemente de las entradas del directorio, y los enlaces de directorio en realidad apuntan a archivos físicos. Un archivo "desaparece" cuando se elimina el último enlace que apunta a él.

Entonces, para acceder a un archivo por su nombre, Sistema operativo

1. encuentra este nombre en el directorio que contiene el archivo,

2. obtiene el número de i-nodo del archivo,

3. por número encuentra i-node en el área de i-nodes,

4. del i-node recibe las direcciones de los bloques en los que se encuentran los datos del archivo,

5. lee bloques del área de datos por direcciones de bloque.

Estructura de partición de disco en EXT2 FS

Todo el espacio de partición se divide en bloques. Un bloque puede tener un tamaño de 1, 2 o 4 kilobytes. Un bloque es una unidad direccionable de espacio en disco.

Los bloques en su área se combinan en grupos de bloques. Los grupos de bloques en un sistema de archivos y los bloques dentro de un grupo se numeran secuencialmente comenzando desde 1. El primer bloque en un disco se numera 1 y pertenece al grupo número 1. El número total de bloques en un disco (en una partición de disco) es un divisor del tamaño del disco expresado en sectores. Y el número de grupos de bloques no tiene que dividir el número de bloques, porque el último grupo de bloques puede no estar completo. El comienzo de cada grupo de bloques tiene una dirección, que se puede obtener como ((número de grupo - 1)* (número de bloques en el grupo)).

Cada grupo de bloques tiene la misma estructura. Su estructura se presenta en la tabla.

El primer elemento de esta estructura (supermanzana) es el mismo para todos los grupos, y todos los demás son individuales para cada grupo. El superbloque se almacena en el primer bloque de cada grupo de bloques (con la excepción del grupo 1, que tiene un registro de arranque en el primer bloque). supermanzana es el punto de partida del sistema de archivos. Tiene un tamaño de 1024 bytes y siempre se encuentra en el desplazamiento de 1024 bytes desde el principio del sistema de archivos. La presencia de varias copias del superbloque se explica por la extrema importancia de este elemento del sistema de archivos. Los duplicados de superbloque se utilizan al recuperar un sistema de archivos después de fallas.

La información almacenada en el superbloque se utiliza para organizar el acceso al resto de datos del disco. El superbloque determina el tamaño del sistema de archivos, la cantidad máxima de archivos en la partición, la cantidad de espacio libre y contiene información sobre dónde buscar áreas no asignadas. Cuando se inicia el sistema operativo, el superbloque se lee en la memoria y todos los cambios en el sistema de archivos se reflejan primero en la copia del superbloque ubicado en el sistema operativo y se escriben en el disco solo periódicamente. Esto mejora el rendimiento del sistema porque muchos usuarios y procesos actualizan constantemente los archivos. Por otro lado, cuando apaga el sistema, el superbloque debe escribirse en el disco, lo que no le permite apagar la computadora simplemente apagando la alimentación. De lo contrario, en el próximo arranque, la información escrita en el superbloque no se corresponderá con el estado real del sistema de archivos.

A continuación del superbloque se encuentra la descripción del grupo de bloques (Group Descriptors). Esta descripción contiene:

La dirección del bloque que contiene el mapa de bits del bloque del grupo dado;

Dirección del bloque que contiene el mapa de bits del inodo del grupo dado;

La dirección del bloque que contiene la tabla de inodos de este grupo;

Contador del número de bloques libres en este grupo;

El número de inodos libres en este grupo;

Número de inodos en este grupo que son directorios

y otros datos.

La información almacenada en la descripción del grupo se usa para encontrar los mapas de bits de bloque e inodo y la tabla de inodos.

sistema de archivos Ext. 2 se caracteriza por:

estructura jerarquica,
procesamiento coordinado de matrices de datos,
extensión de archivo dinámico,
protección de la información en archivos,
tratar los periféricos (como terminales y unidades de cinta) como archivos.

Representación interna de expedientes

Cada archivo en un sistema Ext 2 tiene un índice único. El índice contiene la información que cualquier proceso necesita para acceder al archivo. Los procesos acceden a los archivos mediante un conjunto bien definido de llamadas al sistema e identifican el archivo con una cadena de caracteres que actúa como el nombre de ruta del archivo. Cada nombre compuesto identifica de forma única un archivo, por lo que el kernel del sistema convierte este nombre en un índice de archivo.El índice incluye una tabla de direcciones donde se encuentra la información del archivo en el disco. Dado que cada bloque en el disco está direccionado por su número, esta tabla almacena una colección de números de bloque de disco. Para aumentar la flexibilidad, el kernel agrega un bloque a la vez a un archivo, lo que permite que la información del archivo se disperse por todo el sistema de archivos. Pero tal diseño complica la tarea de encontrar datos. La tabla de direcciones contiene una lista de números de bloque que contienen información perteneciente al archivo.

Inodos de archivo

Cada archivo en el disco tiene un inodo de archivo correspondiente, que se identifica por su número ordinal: el índice del archivo. Esto significa que la cantidad de archivos que se pueden crear en el sistema de archivos está limitada por la cantidad de inodos, que se establece explícitamente cuando se crea el sistema de archivos o se calcula a partir del tamaño físico de la partición del disco. Los inodos existen en forma estática en el disco y el núcleo los lee en la memoria antes de trabajar con ellos.

El archivo inode contiene la siguiente información:

- El tipo y los permisos de este archivo.

ID del propietario del archivo (Uid del propietario).

Tamaño del archivo en bytes.

La hora del último acceso al archivo (Hora de acceso).

Hora de creación del archivo.

La hora en que se modificó el archivo por última vez.

Tiempo de eliminación de archivos.

Identificación de grupo (GID).

Los enlaces cuentan.

El número de bloques ocupados por el archivo.

Banderas de archivo

Reservado para SO

Punteros a bloques en los que se escriben datos de archivo (un ejemplo de direccionamiento directo e indirecto en la Fig. 1)

Versión del archivo (para NFS)

Archivo ACL

directorio ACL

Fragmento de dirección

Número de fragmento

Tamaño del fragmento

Catálogos

Los directorios son archivos.

El kernel almacena datos en un directorio tal como lo hace en un tipo de archivo regular, utilizando una estructura de índice y bloques con niveles de dirección directos e indirectos. Los procesos pueden leer datos de directorios de la misma manera que leen archivos normales, sin embargo, el kernel reserva el acceso de escritura exclusivo al directorio para garantizar que la estructura del directorio sea correcta).

Cuando un proceso usa una ruta de archivo, el núcleo busca en los directorios el número de inodo correspondiente. Una vez que el nombre del archivo se ha convertido en un número de inodo, ese inodo se coloca en la memoria y luego se usa en solicitudes posteriores.

Características adicionales de EXT2 FS

Además de las funciones estándar de Unix, EXT2fs proporciona algunas funciones adicionales que normalmente no son compatibles con los sistemas de archivos de Unix.

Los atributos de archivo le permiten cambiar la forma en que reacciona el kernel cuando trabaja con conjuntos de archivos. Puede establecer atributos en un archivo o directorio. En el segundo caso, los archivos creados en este directorio heredarán estos atributos.

Durante el montaje del sistema, se pueden configurar algunas características relacionadas con los atributos de archivo. La opción de montaje permite al administrador elegir cómo se crean los archivos. En un sistema de archivos específico de BSD, los archivos se crean con el mismo ID de grupo que el directorio principal. Las características de System V son algo más complejas. Si se establece el bit setgid de un directorio, los archivos creados heredan el ID de grupo del directorio y los subdirectorios heredan el ID de grupo y el bit setgid. De lo contrario, los archivos y directorios se crean con el ID de grupo principal del proceso de llamada.

El sistema EXT2fs puede usar la modificación de datos síncrona similar al sistema BSD. La opción de montaje le permite al administrador especificar que todos los datos (descriptores de índice, bloques de bits, bloques indirectos y bloques de directorio) se escriban en el disco de forma síncrona cuando se modifican. Esto se puede usar para lograr un alto rendimiento de escritura, pero también da como resultado un rendimiento deficiente. De hecho, esta función no se suele utilizar, porque además de degradar el rendimiento, puede provocar la pérdida de datos del usuario que no se marcan al comprobar el sistema de archivos.

EXT2fs le permite elegir el tamaño del bloque lógico al crear un sistema de archivos. Puede tener un tamaño de 1024, 2048 o 4096 bytes. El uso de bloques grandes conduce a operaciones de E/S más rápidas (porque se reduce el número de solicitudes al disco) y, en consecuencia, a un menor movimiento de cabezales. Por otro lado, el uso de bloques grandes conduce a una pérdida de espacio en disco. Por lo general, el último bloque de un archivo no se usa por completo para almacenar información, por lo que con un aumento en el tamaño del bloque, aumenta la cantidad de espacio en disco desperdiciado.

EXT2fs le permite utilizar enlaces simbólicos acelerados. Cuando se utilizan dichos enlaces, no se utilizan bloques de datos del sistema de archivos. El nombre del archivo de destino no se almacena en el bloque de datos, sino en el propio inodo. Esta estructura le permite ahorrar espacio en disco y acelerar el procesamiento de enlaces simbólicos. Por supuesto, el espacio reservado para el identificador es limitado, por lo que no todos los enlaces se pueden representar como enlaces acelerados. La longitud máxima de un nombre de archivo en un enlace acelerado es de 60 caracteres. En un futuro próximo, se planea expandir este esquema para archivos pequeños.

EXT2fs monitorea el estado del sistema de archivos. El kernel usa un campo separado en el superbloque para indicar el estado del sistema de archivos. Si el sistema de archivos está montado en modo de lectura/escritura, su estado se establece en "No limpio". Si se desmonta o se vuelve a montar en modo de solo lectura, su estado se establece en "Limpiar". Durante el inicio del sistema y las comprobaciones de estado del sistema de archivos, esta información se utiliza para determinar si se necesita una comprobación del sistema de archivos. El núcleo también coloca algunos errores en este campo. Cuando el kernel detecta una inconsistencia, el sistema de archivos se marca como "Erroroso". El verificador del sistema de archivos prueba esta información para verificar el sistema, incluso si su estado es realmente "Limpio".

Ignorar las pruebas del sistema de archivos durante mucho tiempo a veces puede generar algunas dificultades, por lo que EXT2fs incluye dos métodos para verificar regularmente el sistema. El superbloque contiene un contador de montaje del sistema. Este contador se incrementa cada vez que el sistema se monta en modo lectura/escritura. Si su valor alcanza el valor máximo (también se almacena en el superbloque), la rutina de prueba del sistema de archivos ejecuta una verificación del sistema de archivos, incluso si su estado es "Limpio". La última hora de control y el intervalo máximo entre controles también se almacenan en el superbloque. Cuando se alcanza el intervalo máximo entre comprobaciones, se ignora el estado del sistema de archivos y se inicia su comprobación.

Optimización del rendimiento

El sistema EXT2fs contiene muchas funciones que optimizan su rendimiento, lo que conduce a un aumento en la velocidad de intercambio de información al leer y escribir archivos.

EXT2fs hace un uso intensivo del búfer del disco. Cuando se necesita leer un bloque, el kernel emite una solicitud de E/S a varios bloques contiguos. Por lo tanto, el kernel intenta asegurarse de que el siguiente bloque que se va a leer ya se haya cargado en el búfer del disco. Tales operaciones generalmente se realizan cuando se leen archivos secuencialmente.

El sistema EXT2fs también contiene una gran cantidad de optimizaciones de diseño de información. Los grupos de bloques se utilizan para agrupar los inodos y bloques de datos correspondientes. El núcleo siempre intenta colocar los bloques de datos de un archivo en el mismo grupo, así como su descriptor. Esto tiene como objetivo reducir el movimiento de los cabezales de la unidad al leer el descriptor y sus bloques de datos correspondientes.

Al escribir datos en un archivo, EXT2fs preasigna hasta 8 bloques contiguos al colocar un nuevo bloque. Este método le permite lograr un alto rendimiento con una gran carga del sistema. También permite asignar bloques contiguos de archivos, lo que agiliza su posterior lectura.

Sistemas de archivos FAT

FAT16

El sistema de archivos FAT16 es anterior a MS-DOS y es compatible con todos los sistemas operativos de Microsoft por motivos de compatibilidad. Su nombre File Allocation Table (tabla de ubicación de archivos) refleja perfectamente la organización física del sistema de archivos, cuyas características principales incluyen el hecho de que el tamaño máximo de un volumen admitido (disco duro o partición en un disco duro) no supera los 4095 MEGABYTE. En los días de MS-DOS, los discos duros de 4 GB parecían un sueño imposible (los discos de 20-40 MB eran un lujo), por lo que tal reserva estaba bastante justificada.

Un volumen formateado para usar FAT16 se divide en clústeres. El tamaño de clúster predeterminado depende del tamaño del volumen y puede oscilar entre 512 bytes y 64 KB. En mesa. La figura 2 muestra cómo el tamaño del clúster depende del tamaño del volumen. Tenga en cuenta que el tamaño del clúster puede diferir del valor predeterminado, pero debe tener uno de los valores especificados en la Tabla 1. 2.

No se recomienda usar el sistema de archivos FAT16 en volúmenes mayores de 511 MB, ya que el espacio en disco se usará de manera extremadamente ineficiente para archivos relativamente pequeños (un archivo de 1 byte ocupará 64 KB). Independientemente del tamaño del clúster, el sistema de archivos FAT16 no es compatible con volúmenes de más de 4 GB.

FAT32

A partir de Microsoft Windows 95 OEM Service Release 2 (OSR2), Windows introdujo soporte para FAT de 32 bits. Para los sistemas basados en Windows NT, este sistema de archivos se admitió por primera vez en Microsoft Windows 2000. Mientras que FAT16 puede admitir volúmenes de hasta 4 GB, FAT32 puede admitir volúmenes de hasta 2 TB. El tamaño del clúster en FAT32 puede variar de 1 (512 bytes) a 64 sectores (32 KB). Los valores del clúster FAT32 requieren 4 bytes para almacenar (32 bits, no 16 como en FAT16). Esto significa, en particular, que algunas utilidades de archivos diseñadas para FAT16 no pueden funcionar con FAT32.

La principal diferencia entre FAT32 y FAT16 es que el tamaño de la partición lógica del disco ha cambiado. FAT32 admite volúmenes de hasta 127 GB. Al mismo tiempo, si al usar FAT16 con discos de 2 GB, se requería un clúster de 32 KB, entonces en FAT32 un clúster de 4 KB es adecuado para discos de 512 MB a 8 GB (Tabla 4).

En consecuencia, esto significa un uso más eficiente del espacio en disco: cuanto más pequeño es el clúster, menos espacio se requiere para almacenar el archivo y, como resultado, el disco se fragmenta menos.

Cuando se usa FAT32, el tamaño máximo de archivo puede ser de hasta 4 GB menos 2 bytes. Si al usar FAT16 el número máximo de entradas en el directorio raíz estaba limitado a 512, entonces FAT32 le permite aumentar este número a 65 535.

FAT32 impone restricciones sobre el tamaño mínimo del volumen: debe ser de al menos 65 527 clústeres. Al mismo tiempo, el tamaño del clúster no puede ser tal que la FAT ocupe más de 16 MB - 64 KB / 4 o 4 millones de clústeres.

Cuando se utilizan nombres de archivo largos, los datos necesarios para acceder desde FAT16 y FAT32 no se superponen. Cuando se crea un archivo con un nombre de archivo largo, Windows crea el nombre de formato 8.3 correspondiente y una o más entradas de directorio para almacenar el nombre largo (13 caracteres del nombre de archivo largo por entrada). Cada aparición posterior almacena la parte correspondiente del nombre de archivo en formato Unicode. Tales entradas tienen los atributos "id de volumen", "solo lectura", "sistema" y "oculto", un conjunto que MS-DOS ignora; en este sistema operativo, se accede a un archivo por su "alias" en formato 8.3.

sistema de archivos NTFS

Microsoft Windows 2000 incluye soporte para una nueva versión del sistema de archivos NTFS que, en particular, permite trabajar con servicios de directorio de Active Directory, puntos de análisis, herramientas de seguridad de la información, control de acceso y otras características.

Al igual que con FAT, la unidad básica de información en NTFS es el clúster. En mesa. La figura 5 muestra los tamaños de clúster predeterminados para volúmenes de varios tamaños.

Cuando crea un sistema de archivos NTFS, el formateador crea un archivo de tabla maestra de archivos (MTF) y otras áreas para almacenar metadatos. NTFS utiliza metadatos para implementar la estructura de archivos. Las primeras 16 entradas de la MFT están reservadas por el propio NTFS. La ubicación de los archivos de metadatos $Mft y $MftMirr se registra en el sector de arranque del disco. Si la primera entrada de la MFT está dañada, NTFS lee la segunda entrada para encontrar una copia de la primera. Una copia completa del sector de arranque se encuentra al final del volumen. En mesa. 6 enumera los principales metadatos almacenados en la MFT.

Las entradas restantes de MFT contienen entradas para cada archivo y directorio ubicado en el volumen.

Por lo general, un archivo usa una entrada en la MFT, pero si el archivo tiene un gran conjunto de atributos o se fragmenta demasiado, es posible que se requieran entradas adicionales para almacenar información sobre él. En este caso, el primer registro sobre el archivo, denominado registro base, almacena la ubicación de los demás registros. Los datos sobre archivos y directorios de pequeño tamaño (hasta 1500 bytes) están completamente contenidos en la primera entrada.

Atributos de archivo en NTFS

Cada sector ocupado en un volumen NTFS pertenece a un archivo en particular. Incluso los metadatos del sistema de archivos son parte del archivo. NTFS trata cada archivo (o directorio) como un conjunto de atributos de archivo. Elementos como el nombre del archivo, su información de protección e incluso los datos que contiene son atributos del archivo. Cada atributo se identifica mediante un código de tipo específico y, opcionalmente, mediante un nombre de atributo.

Si los atributos de un archivo caben dentro de un registro de archivo, se denominan atributos residentes. Estos atributos son siempre el nombre del archivo y la fecha en que se creó. En los casos en que la información sobre un archivo es demasiado grande para caber en un solo registro MFT, algunos de los atributos del archivo se vuelven no residentes. Los atributos residentes se almacenan en uno o más grupos y representan un flujo de datos alternativos para el volumen actual (más información a continuación). Para describir la ubicación de los atributos residentes y no residentes, NTFS crea un atributo Lista de atributos.

En mesa. 7 muestra los principales atributos de archivo definidos en NTFS. Esta lista puede ampliarse en el futuro.

sistema de archivos CDFS

Windows 2000 brinda soporte para el sistema de archivos CDFS, que cumple con el estándar ISO'9660, que describe la ubicación de la información en un CD-ROM. Se admiten nombres de archivo largos de acuerdo con ISO'9660 Nivel 2.

Al crear un CD-ROM para usar con Windows 2000, tenga en cuenta lo siguiente:

todos los nombres de directorios y archivos deben tener menos de 32 caracteres;
todos los nombres de directorios y archivos deben contener solo caracteres en mayúsculas;
la profundidad de los directorios no debe exceder los 8 niveles desde la raíz;
el uso de extensiones de nombre de archivo es opcional.

Comparación de sistemas de archivos

En Microsoft Windows 2000, se pueden utilizar FAT16, FAT32, NTFS o combinaciones de estos sistemas de archivos. La elección del sistema operativo depende de los siguientes criterios:

cómo se usa la computadora;
plataforma de hardware;
tamaño y número de discos duros;
seguridad de información

Sistemas de archivos FAT

Como habrá notado, los números en los nombres de los sistemas de archivos (FAT16 y FAT32) indican la cantidad de bits necesarios para almacenar información sobre los números de clúster utilizados por el archivo. Entonces, FAT16 usa direccionamiento de 16 bits y, en consecuencia, es posible usar hasta 216 direcciones. En Windows 2000, los primeros cuatro bits de la tabla de ubicación de archivos FAT32 son necesarios para uso interno, por lo que FAT32 alcanza las 228 direcciones.

En mesa. 8 muestra los tamaños de clúster para los sistemas de archivos FAT16 y FAT32.

Además de las diferencias significativas en el tamaño del clúster, FAT32 también permite expandir el directorio raíz (en FAT16, la cantidad de entradas está limitada a 512 y puede ser incluso menor cuando se usan nombres de archivo largos).

Beneficios de FAT16

Entre las ventajas de FAT16 se encuentran las siguientes:

el sistema de archivos es compatible con MS-DOS, Windows 95, Windows 98, Windows NT, Windows 2000 y algunos sistemas operativos UNIX;
existe una gran cantidad de programas que te permiten corregir errores en este sistema de archivos y recuperar datos;
si hay problemas con el inicio desde el disco duro, el sistema puede iniciarse desde el disquete;
este sistema de archivos es bastante eficiente para volúmenes menores de 256 MB.

Desventajas de FAT16

Las principales desventajas de FAT16 incluyen:

el directorio raíz no puede contener más de 512 elementos. El uso de nombres de archivo largos reduce en gran medida el número de estos elementos;
FAT16 admite un máximo de 65 536 clústeres y, dado que el sistema operativo reserva algunos clústeres, la cantidad de clústeres disponibles es 65 524. Cada clúster tiene un tamaño fijo para un LUN determinado. Cuando se alcanza el número máximo de clústeres en su tamaño máximo (32 KB), el volumen máximo admitido se limita a 4 GB (en Windows 2000). Para mantener la compatibilidad con MS-DOS, Windows 95 y Windows 98, el tamaño de un volumen FAT16 no debe exceder los 2 GB;
FAT16 no es compatible con la protección y compresión de archivos integrada;
en discos grandes, se desperdicia mucho espacio debido al hecho de que se usa el tamaño máximo de clúster. El espacio para el archivo se asigna en función del tamaño del clúster, no del archivo.

Beneficios de FAT32

Entre las ventajas de FAT32 se encuentran las siguientes:

la asignación de espacio en disco se realiza de manera más eficiente, especialmente para discos grandes;
el directorio raíz en FAT32 es una cadena normal de clústeres y se puede ubicar en cualquier parte del disco. Debido a esto, FAT32 no impone ninguna restricción sobre la cantidad de elementos en el directorio raíz;
debido al uso de clústeres más pequeños (4 KB en discos de hasta 8 GB), el espacio en disco ocupado suele ser un 10-15 % menor que con FAT16;
FAT32 es el sistema de archivos más seguro. En particular, admite la capacidad de mover el directorio raíz y usar una copia de seguridad FAT. Además, el registro de arranque contiene una serie de datos críticos para el sistema de archivos.

Desventajas de FAT32

Las principales desventajas de FAT32:

el tamaño del volumen cuando se usa FAT32 bajo Windows 2000 está limitado a 32 GB;
Los volúmenes FAT32 no están disponibles desde otros sistemas operativos, solo desde Windows 95 OSR2 y Windows 98;
la copia de seguridad del sector de arranque no es compatible;
FAT32 no es compatible con la protección y compresión de archivos integrada.

sistema de archivos NTFS

Cuando utilice Windows 2000, Microsoft recomienda que formatee todas las particiones del disco duro a NTFS, excepto en las configuraciones en las que se utilicen varios sistemas operativos (excepto Windows 2000 y Windows NT). El uso de NTFS en lugar de FAT le permite utilizar las funciones disponibles en NTFS. Estos incluyen, en particular:

la posibilidad de recuperación. Esta función está "integrada" en el sistema de archivos. NTFS garantiza la seguridad de los datos debido a que utiliza un protocolo y unos algoritmos de recuperación de información. En caso de falla del sistema, NTFS usa el protocolo y la información adicional para restaurar automáticamente la integridad del sistema de archivos;
compresión de información. Para volúmenes NTFS, Windows 2000 admite la compresión de un solo archivo. Dichos archivos comprimidos pueden ser utilizados por aplicaciones de Windows sin descompresión previa, lo que ocurre automáticamente al leer el archivo. Al cerrar y guardar el archivo se vuelve a empaquetar;
Además, se pueden distinguir las siguientes ventajas de NTFS:

Algunas características del sistema operativo requieren NTFS;

La velocidad de acceso es mucho más rápida: NTFS minimiza la cantidad de accesos al disco necesarios para encontrar un archivo;

Protección de archivos y directorios. Solo en volúmenes NTFS es posible establecer atributos de acceso a archivos y carpetas;

Al usar NTFS, Windows 2000 admite volúmenes de hasta 2 TB;

El sistema de archivos mantiene una copia de seguridad del sector de arranque: se encuentra al final del volumen;

NTFS es compatible con el sistema de cifrado del Sistema de archivos cifrados (EFS), que brinda protección contra el acceso no autorizado al contenido de los archivos;

Al utilizar cuotas, puede limitar la cantidad de espacio en disco utilizado por los usuarios.

Desventajas de NTFS

Hablando de las deficiencias del sistema de archivos NTFS, cabe señalar que:

Los volúmenes NTFS no están disponibles en MS-DOS, Windows 95 y Windows 98. Además, varias funciones que están disponibles en NTFS bajo Windows 2000 no están disponibles en Windows 4.0 y versiones anteriores;
Los volúmenes pequeños que contienen muchos archivos pequeños pueden experimentar una degradación del rendimiento en comparación con FAT.

Sistema de archivos y velocidad

Como ya hemos descubierto, para volúmenes pequeños, FAT16 o FAT32 proporciona un acceso a archivos más rápido en comparación con NTFS, ya que:

FAT tiene una estructura más simple;
los directorios son más pequeños;
FAT no admite la protección de archivos contra el acceso no autorizado: el sistema no necesita verificar los permisos de los archivos.

NTFS minimiza la cantidad de accesos al disco y el tiempo que lleva encontrar un archivo. Además, si el tamaño del directorio es lo suficientemente pequeño como para caber en una sola entrada de MFT, la entrada completa se lee de una sola vez.

Una entrada en FAT contiene el número de clúster para el primer clúster en el directorio. Ver un archivo FAT requiere buscar en toda la estructura del archivo.

Al comparar la velocidad de las operaciones realizadas para directorios que contienen nombres de archivo cortos y largos, debe tenerse en cuenta que la velocidad de las operaciones para FAT depende de la operación en sí y del tamaño del directorio. Si FAT busca un archivo que no existe, busca en todo el directorio, una operación que lleva más tiempo que buscar en la estructura de árbol B utilizada por NTFS. El tiempo medio que se tarda en encontrar un archivo en FAT se expresa en función de N/2, en NTFS se expresa como log N, donde N es el número de archivos.

Varios de los siguientes factores afectan la velocidad de lectura y escritura de archivos en Windows 2000:

fragmentación de archivos. Si el archivo está muy fragmentado, NTFS generalmente requiere menos accesos al disco que FAT para encontrar todos los fragmentos;
tamaño de cluster. Para ambos sistemas de archivos, el tamaño de clúster predeterminado depende del tamaño del volumen y siempre se expresa como una potencia de 2. Las direcciones en FAT16 son de 16 bits, en FAT32 son de 32 bits, en NTFS son de 64 bits;
el tamaño de clúster predeterminado en FAT se basa en el hecho de que la tabla de ubicación de archivos no puede tener más de 65 535 entradas: el tamaño de clúster es una función del tamaño del volumen dividido por 65 535. Por lo tanto, el tamaño de clúster predeterminado para un volumen FAT siempre es mayor que el tamaño del clúster para un volumen NTFS del mismo tamaño. Tenga en cuenta que un tamaño de clúster más grande para los volúmenes FAT significa que los volúmenes FAT pueden estar menos fragmentados;
ubicación de archivos pequeños. Cuando se usa NTFS, los archivos pequeños están contenidos en un registro MFT. El tamaño de un archivo que cabe en un solo registro MFT depende de la cantidad de atributos en ese archivo.

Tamaño máximo de volúmenes NTFS

Teóricamente, NTFS admite volúmenes con hasta 232 clústeres. Sin embargo, además de la falta de discos duros de este tamaño, existen otras restricciones sobre el tamaño máximo del volumen.

Una de esas limitaciones es la tabla de particiones. Los estándares de la industria limitan el tamaño de la tabla de particiones de 2 a 32 sectores. Otra limitación es el tamaño del sector, que normalmente es de 512 bytes. Dado que el tamaño del sector puede cambiar en el futuro, el tamaño actual limita el tamaño de un solo volumen a 2 TB (2 32 x 512 bytes = 2 41). Por lo tanto, 2 TB es el límite práctico para los volúmenes físicos y lógicos de NTFS.

En mesa. La Figura 11 muestra las principales limitaciones de NTFS.

Administrar el acceso a archivos y directorios

Al usar volúmenes NTFS, puede establecer permisos de archivos y directorios. Estos derechos de acceso especifican qué usuarios y grupos tienen acceso a ellos y qué nivel de acceso está permitido. Dichos derechos de acceso se aplican tanto a los usuarios que trabajan en la computadora en la que se encuentran los archivos como a los usuarios que acceden a los archivos a través de la red cuando el archivo se encuentra en un directorio abierto para acceso remoto.

En NTFS, también puede establecer permisos de acceso remoto combinados con permisos de archivos y directorios. Además, los atributos del archivo (solo lectura, oculto, sistema) también restringen el acceso al archivo.

Bajo FAT16 y FAT32, también es posible establecer atributos de archivo, pero no proporcionan permisos de archivo.

La versión de NTFS utilizada en Windows 2000 introdujo un nuevo tipo de permiso de acceso denominado permisos heredados. La pestaña Seguridad contiene la opción Permita que los permisos heredables de los padres se propaguen a este objeto de archivo, que está activo por defecto. Esta opción reduce significativamente el tiempo necesario para cambiar los permisos de archivos y subdirectorios. Por ejemplo, para cambiar los permisos de un árbol que contiene cientos de subdirectorios y archivos, basta con habilitar esta opción; en Windows NT 4, debe cambiar los atributos de cada archivo y subdirectorio individual.

En la fig. La Figura 5 muestra el cuadro de diálogo Propiedades y la pestaña Seguridad (sección Avanzado) que enumera los permisos de archivo extendidos.

Recuerde que para los volúmenes FAT, el acceso solo se puede controlar a nivel de volumen, y dicho control solo es posible con acceso remoto.

Comprimir archivos y directorios

Windows 2000 admite la compresión de archivos y directorios ubicados en volúmenes NTFS. Los archivos comprimidos son legibles y escribibles por cualquier aplicación de Windows. Para esto, no es necesario su desembalaje preliminar. El algoritmo de compresión utilizado es similar al utilizado en DoubleSpace (MS-DOS 6.0) y DriveSpace (MS-DOS 6.22), pero tiene una diferencia significativa: en MS-DOS, se comprime una partición primaria completa o un dispositivo lógico, mientras que en NTFS puede empaquetar archivos y directorios individuales.

El algoritmo de compresión en NTFS está diseñado para admitir clústeres de hasta 4 KB de tamaño. Si el tamaño del clúster es superior a 4 KB, las funciones de compresión NTFS no estarán disponibles.

NTFS autorreparable

El sistema de archivos NTFS se repara automáticamente y puede mantener su integridad mediante el uso de un registro de las acciones realizadas y una serie de otros mecanismos.

NTFS trata cada operación que modifica los archivos del sistema en volúmenes NTFS como una transacción y almacena información sobre dicha transacción en un registro. Una transacción iniciada puede completarse por completo (confirmar) o revertirse (rollback). En este último caso, el volumen NTFS vuelve al estado anterior al inicio de la transacción. Para administrar las transacciones, NTFS escribe todas las operaciones involucradas en una transacción en un archivo de registro antes de que se escriba en el disco. Una vez completada la transacción, se realizan todas las operaciones. Por lo tanto, bajo la gestión de NTFS, no puede haber operaciones pendientes. En caso de fallas en el disco, las operaciones pendientes simplemente se cancelan.

Bajo el control de NTFS, también se realizan operaciones que le permiten identificar clústeres defectuosos sobre la marcha y asignar nuevos clústeres para operaciones con archivos. Este mecanismo se denomina reasignación de clústeres.

En esta revisión, examinamos los diversos sistemas de archivos compatibles con Microsoft Windows 2000, discutimos el diseño de cada uno de ellos y señalamos sus ventajas y desventajas. El más prometedor es el sistema de archivos NTFS, que tiene un gran conjunto de características que no están disponibles en otros sistemas de archivos. La nueva versión de NTFS compatible con Microsoft Windows 2000 tiene aún más funciones y, por lo tanto, se recomienda su uso al instalar el sistema operativo Win 2000.

ComputerPress 7"2000

Muchos usuarios se enfrentan a un malentendido de los conceptos básicos de cómo funcionan los sistemas de archivos de Windows. Parecería, ¿por qué una teoría innecesaria? De hecho, es el conocimiento del funcionamiento profundo de varios sistemas de archivos lo que le permite elegir correctamente uno u otro sistema de archivos para uno u otro medio de almacenamiento. En ocasiones, un error en la elección puede volverse crítico más tarde a la hora de solucionar el problema de recuperación de la información o el desgaste prematuro de los soportes.

El sistema de archivos consta de un sistema de administración de archivos y una colección de archivos en un determinado tipo de medio (CD, DVD, FDD, HDD, Flash, etc.). Un sistema de administración de archivos brinda a los usuarios y aplicaciones la capacidad de acceder a los archivos, almacenarlos y mantener la integridad de su contenido. El medio de almacenamiento a largo plazo más común en los sistemas informáticos modernos es el disco duro - "Winchester". Este término se aplica a cualquier disco sellado con cabezas de lectura magnéticas diseñadas aerodinámicamente.

Los sistemas de archivos de los sistemas operativos modernos se instalan en particiones del disco duro.

FAT 32. Simplicidad y fiabilidad.

Hay tres sistemas de archivos FAT: FAT12 (para disquetes FDD), FAT16, FAT32. Se diferencian en el número de bits (12, 16, 32) para indicar el número de clúster en el sistema de gestión de archivos. En los sistemas de archivos FAT, el espacio de disco lógico de cualquier unidad lógica se divide en un área de sistema y un área de datos. BR - registro de arranque Registro de arranque; RS - sectores reservados; FAT1, FAT2: tablas 1 y 2 de asignación de archivos; RDir (Directorio raíz, RAÍZ) – directorio raíz. El área de datos se divide en grupos, que son 1 o más sectores contiguos. En la tabla FAT, los clústeres que pertenecen al mismo archivo están vinculados en una cadena. El mapa del área de datos es, de hecho, la tabla de asignación de archivos (FAT). Cada elemento de la tabla FAT (12, 16 o 32 bits) corresponde a un clúster de disco y caracteriza su estado: libre, ocupado o es un clúster defectuoso. (malo grupo) . El sistema de gestión de archivos FAT16 utiliza una palabra de 16 bits para indicar el número de clúster y se pueden direccionar 65536 clústeres.

Un clúster es la unidad mínima direccionable de espacio en disco asignada para un archivo. Un archivo o directorio ocupa un número entero de clústeres. Dividir un área de datos en clústeres en lugar de usar sectores le permite: reducir el tamaño de la tabla FAT, reducir la fragmentación de archivos, reducir la longitud de las cadenas de archivos, acelerar el acceso a los archivos. Es posible que el último clúster no se utilice por completo, lo que resulta en una pérdida notable de espacio en disco si el tamaño del clúster es grande. En un disquete, un clúster ocupa 1 o 2 sectores. En el disco duro - 4, 8, 16, 32, 64 - sectores en un clúster. Cada elemento tiene la siguiente estructura: nombre de archivo, atributo de archivo, campo de respaldo, hora de creación, fecha de creación, fecha de último acceso, respaldo, fecha de última modificación, hora de última modificación, número de clúster Fat inicial, tamaño de archivo.

En este ejemplo, el archivo denominado MyFile.txt se coloca a partir del octavo clúster y abarca 12 clústeres. La cadena de grupos para este caso: 8,9,A,B,15,16,17,19,1A,1B,1C,1D. El grupo número 18 está marcado como malo por el código F7. No se puede utilizar para alojar datos. Este código lo establecen las utilidades de formateo y verificación del disco. El grupo 1D está marcado con el código FF como el último que pertenece a este archivo. Los clústeres libres se marcan con el código 0. Cuando se asigna un nuevo clúster para escribir en un archivo, se toma el primer clúster libre. Dado que los archivos en el disco se modifican, eliminan, mueven, amplían y reducen, esta regla de ubicación conduce a la fragmentación, es decir, los datos de un archivo no están ubicados en grupos adyacentes y, a veces, están muy alejados entre sí. Se forma una cadena compleja. Esto da como resultado un manejo de archivos más lento. Dado que Fat se usa de manera muy intensiva al acceder al disco, se carga en la RAM. Fat32 es mucho más eficiente en cuanto al espacio en disco porque utiliza clústeres más pequeños que las versiones anteriores de Fat. Comparado con Fat16, esto da un ahorro del 10-16%.

Un elemento de directorio en un campo de atributo puede almacenar los siguientes valores:

1) archivo (instalado cuando un archivo es cambiado y eliminado por un programa que hace una copia de seguridad de los archivos en otro medio);

2) directorio;

3) etiqueta de volumen;

4) sistémico;

5) escondido;

6) de sólo lectura.

Los nombres largos en FAT32 se imponen mediante varias entradas de directorio: para un solo archivo (una entrada es una entrada para el nombre 8.3 y 24 entradas para el nombre más largo, que puede tener hasta 256 caracteres. Por lo tanto, los nombres largos no son recomendado.

Básicamente, el sistema de archivos FAT es algo que debe evitarse hoy. Por lo tanto, es vital elegir el correcto que le permita evitar este sistema de archivos.

NTFS: conveniencia y alta velocidad.

Uno de los conceptos básicos utilizados cuando se trabaja con NTFS es el concepto de volumen. Es posible crear un volumen tolerante a fallas que ocupe varias particiones, es decir, el uso de la tecnología RAID. NTFS divide todo el espacio de disco utilizable de un volumen en clústeres: bloques de datos direccionados como unidades de datos. NTFS admite tamaños de clúster de 512 bytes a 64 KB; Se asignan 2 o 4 KB del disco para la zona MFT, el espacio que puede ocupar el metarchivo principal del servicio MFT, aumentando de tamaño. No es posible escribir datos en esta área. La zona MFT está vacía para que el archivo de servicio (MFT) no se fragmente tanto como sea posible a medida que crece.

MFT (tabla general de archivos): un directorio centralizado de todos los demás archivos de disco, incluido él mismo. La MFT se divide en registros de 1 KB de tamaño fijo, cada registro corresponde a un archivo. Los primeros 16 archivos son de naturaleza de servicio y son inaccesibles para el sistema operativo; se denominan metarchivos y el primer metarchivo es la propia MFT. Estos primeros 16 elementos MFT son la única parte del disco que tiene una posición estrictamente fija. Una copia de estas mismas 16 entradas se guarda en medio del volumen por seguridad, ya que son muy importantes. Las partes restantes del archivo MFT se pueden ubicar en lugares arbitrarios en el disco; puede restaurar su posición usándose a sí mismo, "enganchando" sobre la base, en el primer elemento de la MFT. Cada archivo en NTFS está representado por flujos, no tiene datos, sino "flujos". Uno de los flujos es el archivo de datos. Puede definir varios flujos de datos para un solo archivo.

Características principales de NTFS:

El trabajo en discos grandes es eficiente (mucho más eficiente que en FAT);

Hay medios para restringir el acceso a archivos y directorios;

Las particiones NTFS brindan seguridad local tanto para archivos como para directorios;

Se ha introducido un mecanismo de transacción, en el que se registran las operaciones de archivo;

Aumento significativo de la fiabilidad;

Se eliminaron muchas restricciones sobre la cantidad máxima de sectores de disco y/o clústeres;

Un nombre de archivo en NTFS, a diferencia de los sistemas de archivos FAT y HPFS, puede contener cualquier carácter, incluido el conjunto completo de alfabetos nacionales, ya que los datos se presentan en Unicode, una representación de 16 bits que proporciona 65535 caracteres diferentes. La longitud máxima de un nombre de archivo en NTFS es de 255 caracteres.

NTFS también tiene una compresión incorporada que puede aplicar a archivos individuales, directorios completos e incluso volúmenes (y luego anularlos o reasignarlos como mejor le parezca). Un directorio en NTFS es un archivo especial que almacena enlaces a otros archivos y directorios.

El principal inconveniente del sistema de archivos NTFS es que los datos de servicio ocupan mucho espacio (por ejemplo, cada elemento del directorio ocupa 2 KB); para particiones pequeñas, los datos de servicio pueden ocupar hasta el 25 % del volumen de medios.

Así, al elegir un tipo de sistema de archivos, no elegimos alguna acción abstracta, tomamos un conjunto de decisiones que afectan a todo el sistema en su conjunto. ¿Por qué necesita conocer todos los entresijos del sistema de archivos con tanto detalle? Esto es necesario para su posible recuperación, de lo que hablaremos en uno de los siguientes artículos =)

Además de todas las demás tareas, cumple su objetivo principal: organiza el trabajo con datos de acuerdo con una determinada estructura. Para estos fines, se utiliza el sistema de archivos. A continuación se presentará qué es un FS y qué puede ser, así como otra información al respecto.

descripción general

El sistema de archivos es una parte del sistema operativo que es responsable de colocar, almacenar y eliminar información en los medios, proporcionar esta información a los usuarios y aplicaciones y garantizar su uso seguro. Además, es ella quien ayuda en la recuperación de datos en caso de falla de hardware o software. Por eso es tan importante el sistema de archivos. ¿Qué es FS y qué puede ser? Hay varios tipos:

Para discos duros, es decir, dispositivos con acceso aleatorio;

Para cintas magnéticas, es decir, dispositivos con acceso serial;

para medios ópticos;

Sistemas virtuales;

Sistemas de red.5

La unidad lógica de almacenamiento de datos en el sistema de archivos es un archivo, es decir, una colección ordenada de datos que tiene un nombre específico. Todos los datos utilizados por el sistema operativo se presentan en forma de archivos: programas, imágenes, textos, música, videos, así como controladores, bibliotecas, etc. Cada uno de estos elementos tiene un nombre, tipo, extensión, atributos y tamaño. Entonces, ahora que lo sabe, el sistema de archivos es una colección de dichos elementos, así como formas de trabajar con ellos. Según la forma en que se utilice y los principios que se le apliquen, se pueden distinguir varios tipos principales de servicios financieros.

Enfoque del programa

Entonces, si se considera un sistema de archivos (qué es y cómo trabajar con él), debe tenerse en cuenta que se trata de una estructura de varios niveles, en su nivel superior hay un interruptor de sistema de archivos que proporciona una interfaz entre el sistema y una aplicación específica. Convierte las solicitudes de archivos a un formato aceptado por el siguiente nivel: los controladores. Ellos, a su vez, se refieren a controladores de dispositivos específicos que almacenan la información necesaria.

Para las aplicaciones cliente-servidor, los requisitos de rendimiento del sistema de archivos son bastante altos. Los sistemas modernos están diseñados para brindar acceso eficiente, soporte para grandes volúmenes de medios, protección de datos contra accesos no autorizados y mantenimiento de la integridad de la información.

sistema de archivos FAT

Este tipo fue desarrollado en 1977 por Bill Gates y Mark McDonald. Originalmente se usó en OS 86-DOS. Si hablamos de qué es el sistema de archivos FAT, vale la pena señalar que inicialmente no era compatible con discos duros, pero solo funcionaba con medios flexibles de hasta 1 megabyte. Ahora, esta restricción ya no es relevante, y Microsoft utilizó este FS para MS-DOS 1.0 y versiones posteriores. FAT usa ciertas convenciones de nomenclatura de archivos:

El nombre debe comenzar con una letra o número, y puede contener cualquier carácter ASCII, además de espacios y elementos especiales;

La longitud del nombre no debe tener más de 8 caracteres, después se coloca un punto y luego se indica la extensión, que consta de tres letras;

Los nombres de archivo pueden utilizar cualquier mayúscula y minúscula y no se distinguen ni conservan.

Dado que FAT se diseñó originalmente para el sistema operativo DOS de un solo usuario, no preveía el almacenamiento de datos sobre el propietario o los derechos de acceso. Por el momento, este sistema de archivos es el más extendido, la mayoría lo soporta en mayor o menor medida, su versatilidad hace posible su uso en volúmenes que están siendo trabajados por diferentes sistemas operativos. Este es un FS simple que no puede evitar la corrupción de archivos debido al apagado incorrecto de la computadora. Como parte de los sistemas operativos basados en él, existen utilidades especiales que verifican la estructura y corrigen las inconsistencias de los archivos.

sistema de archivos NTFS

Este FS es el más preferido para trabajar con Windows NT, ya que fue desarrollado específicamente para él. El sistema operativo incluye la utilidad de conversión, que convierte volúmenes con FAT y HPFS a volúmenes NTFS. Si hablamos de lo que es el sistema de archivos NTFS, vale la pena señalar que ha ampliado significativamente la capacidad de controlar el acceso a ciertos directorios y archivos, introdujo muchos atributos, implementó herramientas dinámicas de compresión de archivos, tolerancia a fallas y admite los requisitos de la estándar POSIX. En este FS, puede usar nombres de hasta 255 caracteres, mientras que un nombre corto se genera de la misma manera que en VFAT. Al comprender qué es el sistema de archivos NTFS, vale la pena señalar que, en caso de falla del sistema operativo, puede recuperarse, por lo que el volumen del disco permanecerá disponible y la estructura del directorio no sufrirá.

Características de NTFS

En un volumen NTFS, cada archivo está representado por una entrada en la tabla MFT. Las primeras 16 entradas de la tabla están reservadas por el propio sistema de archivos para almacenar información especial. La primera entrada describe la tabla de archivos en sí. Cuando se destruye el primer registro, se lee el segundo para encontrar el archivo MFT espejo, donde el primer registro es idéntico a la tabla principal. El centro lógico del disco contiene una copia del archivo de arranque. La tercera entrada de la tabla contiene el archivo de registro, que se utiliza para la recuperación de datos. La decimoséptima y posteriores entradas de la tabla de archivos contienen información sobre los archivos y directorios que se encuentran en el disco duro.

El registro de transacciones contiene un conjunto completo de operaciones que cambian la estructura del volumen, incluidas las operaciones para crear archivos, así como cualquier comando que afecte la estructura del directorio. El registro de transacciones está diseñado para recuperar NTFS de un bloqueo del sistema. La entrada del directorio raíz contiene una lista de los directorios y archivos que se encuentran en el directorio raíz.

Características de EFS

El Sistema de cifrado de archivos (EFS) es una característica de Windows que puede almacenar información en un disco duro en un formato cifrado. El cifrado se ha convertido en la protección más sólida que puede ofrecer este sistema operativo. En este caso, el cifrado para el usuario es una acción bastante sencilla, para ello solo es necesario marcar la casilla en las propiedades de la carpeta o archivo. Puede especificar quién puede leer dichos archivos. Los archivos se cifran cuando se cierran y, cuando se abren, están automáticamente listos para su uso.

Características de RAW

Los dispositivos diseñados para el almacenamiento de datos son los componentes más vulnerables, que con mayor frecuencia están sujetos a daños no solo físicos, sino también lógicos. Ciertos problemas de hardware pueden ser fatales, mientras que otros tienen soluciones. A veces los usuarios tienen una pregunta: "¿Qué es el sistema de archivos RAW?"

Como sabe, para escribir cualquier información en un disco duro o en una unidad flash, la unidad debe tener un sistema de archivos. Los más comunes son FAT y NTFS. Y RAW ni siquiera es el sistema de archivos en el que solemos pensar. De hecho, este es un error lógico de un sistema ya instalado, es decir, su ausencia real para Windows. Muy a menudo, RAW se asocia con la destrucción de la estructura del sistema de archivos. Después de eso, el sistema operativo no solo accede a los datos, sino que tampoco muestra información técnica sobre el equipo.

Características de UDF

El formato de disco universal (UDF) está diseñado para reemplazar CDFS y agregar soporte para dispositivos de DVD-ROM. Si hablamos de lo que es, entonces esta es una nueva implementación de la versión anterior para la cual cumple con los requisitos Se caracteriza por ciertas características:

Los nombres de archivo pueden tener hasta 255 caracteres;

El nombre puede estar en mayúsculas o minúsculas;

La longitud máxima de la ruta es de 1023 caracteres.

A partir de Windows XP, este sistema de archivos es de lectura/escritura.

Este FS se usa para unidades flash que se supone que se usan cuando se trabaja con diferentes computadoras que ejecutan diferentes sistemas operativos, en particular Windows y Linux. Fue EXFAT el que se convirtió en el "puente" entre ellos, ya que puede trabajar con los datos recibidos del sistema operativo, cada uno de los cuales tiene su propio sistema de archivos. Qué es y cómo funciona quedará claro en la práctica.

conclusiones

Como queda claro de lo anterior, cada sistema operativo utiliza ciertos sistemas de archivos. Están destinados a almacenar estructuras de datos ordenadas en medios físicos. Si de repente, cuando usa una computadora, tiene una pregunta sobre cuál es el sistema de archivos final, entonces es muy posible que cuando intentó copiar un determinado archivo a los medios, recibió un mensaje sobre el tamaño excedido permitido. Por eso es necesario saber en qué sistema de archivos qué tamaño de archivo se considera aceptable para que no encuentres problemas a la hora de transferir información.

Materiales temáticos: