Las unidades de información se utilizan para medir varias características asociadas con la información.
Muy a menudo, la medición de la información se refiere a la medición de la capacidad de la memoria de la computadora ( dispositivos de almacenamiento ) y la medición de la cantidad de datos transmitidos a través de los canales de comunicación digital . Menos comúnmente medido es la cantidad de información .
Una gran cantidad de datos puede contener muy poca información. Es decir, la cantidad de datos y la cantidad de información son características diferentes utilizadas en diferentes áreas relacionadas con la información, pero históricamente se usó el nombre “ cantidad de información ” en el sentido de “cantidad de datos”, y los nombres “ entropía de la información ”. ” y “valor de la información” se utilizaron para medir la cantidad de información”.
Se utilizan para medir la capacidad de los medios de almacenamiento: dispositivos de almacenamiento y para medir volúmenes de datos .
Se utilizan para medir la cantidad de información en un volumen de datos . entropía de la información
La característica principal de la cantidad de datos es el número de estados posibles .
La unidad principal de medida del volumen de datos es 1 estado posible (valor, código).
La característica secundaria de la cantidad de datos es el bit .
La capacidad (volumen) de un dígito puede ser diferente y depende de la base del sistema de codificación aplicado.
Capacidades de un dígito en sistemas de codificación binarios, ternarios y decimales:
Un dígito binario ( bit ) tiene 2 estados posibles mutuamente excluyentes (valores, códigos).
Un dígito ternario ( trit ) tiene 3 estados posibles mutuamente excluyentes (valores, códigos).
…
Un lugar decimal (decite) tiene 10 estados posibles mutuamente excluyentes (valores, códigos).
…
Las características terciarias de la cantidad de datos son diferentes conjuntos de bits .
La capacidad del conjunto de bits es igual al número de estados posibles de este conjunto de bits , que se determina en combinatoria , es igual al número de ubicaciones con repeticiones y se calcula mediante la fórmula:
estados posibles (códigos, valores)dónde
- el número de estados posibles de un bit (la base del sistema de codificación seleccionado), es el número de dígitos en el conjunto de dígitos .Es decir, la capacidad del conjunto de bits es una función exponencial del número de bits con base igual al número de estados posibles de un bit .
Ejemplo:
1 byte consta de 8 ( ) dígitos binarios ( ) y puede tomar:
posibles estados (valores, códigos).
Cuando algunas cantidades, incluida la cantidad de datos, son funciones exponenciales , entonces, en muchos casos, es más conveniente usar no las cantidades en sí, sino los logaritmos de estas cantidades.
La cantidad de datos también se puede representar logarítmicamente, como el logaritmo del número de estados posibles [1] .
Cantidad de información (cantidad de datos): se puede medir logarítmicamente. [2] Esto significa que cuando se tratan varios objetos como uno solo, se multiplica el número de estados posibles y se suma la cantidad de información . No importa si estamos hablando de variables aleatorias en matemáticas, registros de memoria digital en tecnología o sistemas cuánticos en física.
Para volúmenes de datos binarios, es más conveniente utilizar logaritmos binarios.
estados posibles , dígito binario = 1 bit estados posibles , bits = 1 byte ( octeto ) estados posibles , bits = 1 KiloByte (KiloOctet) estados posibles , bits = 1 Megabyte (MegaOctet) estados posibles , bits = 1 Gigabyte (GigaOctet) estados posibles , bits = 1 TeraByte (TeraOctet)El entero más pequeño cuyo logaritmo binario es un entero positivo es 2. Su unidad correspondiente, el bit , es la base para calcular información en tecnología digital.
Para volúmenes de datos ternarios, es más conveniente utilizar logaritmos ternarios.
estados posibles , dígito ternario ( trit) estados posibles , dígitos ternarios ( trit s) = 1 Rasgo .La unidad correspondiente al número 3, trit es igual a log 2 3≈1.585 bits.
Una unidad como nat (nat), correspondiente al logaritmo natural , se utiliza en cálculos científicos y de ingeniería. En tecnología informática, prácticamente no se usa, ya que la base de los logaritmos naturales no es un número entero.
Para volúmenes de datos decimales, es más conveniente utilizar logaritmos decimales.
estados posibles , lugar decimal = 1 dec estados posibles , decimales = 1 kilodecite . estados posibles , decimales = 1 megadecite . estados posibles , decimales = 1 gigadecita .La unidad correspondiente al número 10, decit es igual a log 2 10≈3.322 bits.
En tecnología de comunicación por cable (telégrafo y teléfono) y radio, históricamente, por primera vez, una unidad de información recibió la designación baudio .
En números enteros de dígitos binarios (bits) , el número de estados posibles es igual a potencias de dos.
Cuatro dígitos binarios (4 bits) tienen un nombre especial: tétrada , medio byte , nibble , que contienen la cantidad de información contenida en un dígito hexadecimal .
Medidas en bytes | ||||||||
---|---|---|---|---|---|---|---|---|
GOST 8.417-2002 | prefijos SI | prefijos IEC | ||||||
Nombre | Designacion | La licenciatura | Nombre | La licenciatura | Nombre | Designacion | La licenciatura | |
byte | B | 10 0 | — | 10 0 | byte | B | B | 20 _ |
kilobyte | KB | 10 3 | kilo- | 10 3 | kibibyte | KiB | KiB | 2 10 |
megabyte | MEGABYTE | 10 6 | mega- | 10 6 | mebibyte | MIB | MIB | 2 20 |
gigabyte | ES | 10 9 | giga- | 10 9 | gibibyte | Gibraltar | Gibraltar | 2 30 |
terabyte | tuberculosis | 10 12 | tera- | 10 12 | tebibyte | TiB | tibetano | 2 40 |
petabyte | pb | 10 15 | peta- | 10 15 | pebibyte | PiB | P&B | 2 50 |
exabyte | Ebyte | 10 18 | exa- | 10 18 | exbibyte | EiB | BEI | 2 60 |
zettabyte | Zbyte | 10 21 | zetta- | 10 21 | zebibyte | ZiB | ZiB | 2 70 |
yottabyte | Ibyte | 10 24 | yotta- | 10 24 | yobibyte | YiB | Y&B | 2 80 |
La siguiente unidad popular de información en orden es 8 bits o bytes (las sutilezas terminológicas se describen a continuación ). Es a un byte (y no a un bit) que se dan directamente todas las grandes cantidades de información calculada en tecnología informática.
Valores como una palabra de máquina , etc., que componen varios bytes, casi nunca se utilizan como unidades de medida .
Para medir grandes capacidades de dispositivos de almacenamiento y grandes cantidades de información que tienen una gran cantidad de bytes, se utilizan las unidades “kilobyte” = [1000] bytes y “Kbytes” [3] ( kibibyte , kibibyte) = 1024 bytes (alrededor del confusión de unidades y términos decimales y binarios ver más abajo ). Este orden de magnitud es, por ejemplo:
La cantidad de información que se obtiene leyendo un disquete de alta densidad "3.5" es de 1440 KB (exactamente) ; otros formatos también se calculan en número entero de KB.
Las unidades "megabyte" = 1000 kilobytes = [1 000 000] bytes y "mebibyte" [3] (mebibyte) = 1024 kbytes = 1 048 576 bytes se utilizan para medir el volumen de los medios de almacenamiento.
El espacio de direcciones del procesador Intel 8086 era de 1 MB.
La capacidad de RAM y CD-ROM se mide en unidades binarias (mebibytes, aunque no se les suele llamar así), pero para la capacidad del disco duro, los megabytes decimales eran más populares.
Los discos duros modernos tienen volúmenes expresados en estas unidades como números de al menos seis dígitos, por lo que se utilizan gigabytes para ellos.
Las unidades "gigabyte" = 1000 megabytes = [1,000,000] kilobytes = [1,000,000,000] bytes y "GB" [3] ( gibibyte , gibibyte) = 1024 MB = 230 bytes miden el tamaño de medios de almacenamiento grandes, como discos duros . La diferencia entre unidades binarias y decimales ya supera el 7%.
El tamaño de un espacio de direcciones de 32 bits es de 4 GB ≈ 4,295 MB. El mismo orden de magnitud tiene el tamaño del DVD-ROM y los medios modernos en la memoria flash . Los tamaños de los discos duros ya alcanzan los cientos y miles de gigabytes.
Para calcular cantidades de información aún mayores, existen unidades de terabytes y tebibytes (10 12 y 2 40 bytes, respectivamente), petabytes y pebibytes (10 15 y 2 50 bytes, respectivamente), etc.
En principio, un byte se define para una computadora en particular como el paso mínimo de dirección de memoria , que en las máquinas más antiguas no era necesariamente igual a 8 bits (y la memoria no está necesariamente compuesta de bits; consulte, por ejemplo: computadora ternaria ). En la tradición moderna, un byte a menudo se considera igual a ocho bits .
En designaciones como byte (ruso) o B (inglés), byte (B) significa exactamente 8 bits, aunque el término "byte" en sí no es del todo correcto desde el punto de vista de la teoría.
En francés, los símbolos o , Ko , Mo , etc. (de la palabra octeto) se utilizan para enfatizar que estamos hablando de 8 bits.
Durante mucho tiempo se trató de no darle mucha importancia a la diferencia entre los factores 1000 y 1024. Para evitar malentendidos, la distinción entre:
estas unidades son, por definición , 10 3 , 10 6 , 10 9 bytes, respectivamente, y así sucesivamente.
El IEC sugiere "kibibyte", "mebibyte", "gibibyte", etc. como términos para "KB", "MB", "GB", etc., sin embargo, estos términos son criticados por ser impronunciables y no se encuentran en el lenguaje hablado. discurso
En diferentes áreas de la informática, las preferencias en el uso de unidades decimales y binarias también son diferentes. Además, aunque han pasado varios años desde la estandarización de la terminología y las denominaciones, lejos de todas partes se busca aclarar el significado exacto de las unidades utilizadas.
En inglés, para "kibi" \u003d 1024 \u003d 2 10 , a veces se usa una letra mayúscula K , para enfatizar la diferencia con el prefijo indicado por la letra minúscula SI kilo . Sin embargo, tal designación no se basa en un estándar autorizado, en contraste con el GOST ruso con respecto a "Kbytes".
Unidades de información | |
---|---|
Unidades base | |
Unidades relacionadas | |
Unidades de bits tradicionales | |
Unidades de bytes tradicionales | |
Unidades de bit IEC |
|
Unidades de bytes IEC |