Finestre.  Virus.  I Quaderni.  Internet.  ufficio.  Utilità.  Autisti

L'approccio alfabetico viene utilizzato per misurare quantità di informazioni in un testo rappresentato come una sequenza di caratteri di qualche alfabeto. Questo approccio non è correlato al contenuto del testo. Viene chiamata la quantità di informazioni in questo caso volume di informazioni del testo, che è proporzionale alla dimensione del testo - il numero di caratteri che compongono il testo. A volte questo approccio alla misurazione delle informazioni è chiamato approccio volumetrico.

Ogni carattere del testo contiene una certa quantità di informazioni. Egli è chiamato simbolo informazioni peso. Pertanto, il volume informativo del testo è pari alla somma dei pesi informativi di tutti i caratteri che compongono il testo.

Qui si presume che il testo sia una stringa consecutiva di caratteri numerati. Nella formula (1) io 1 denota il peso informativo del primo carattere del testo, io 2 - il peso informativo del secondo carattere del testo, ecc.; K- dimensione del testo, ad es. il numero totale di caratteri nel testo.

Tutti i tanti caratteri diversi usati per scrivere i testi, è chiamato in ordine alfabetico. La dimensione dell'alfabeto è un intero chiamato il potere dell'alfabeto. Va tenuto presente che l'alfabeto comprende non solo le lettere di una determinata lingua, ma tutti gli altri caratteri che possono essere utilizzati nel testo: numeri, segni di punteggiatura, parentesi varie, spazi, ecc.

La determinazione dei pesi delle informazioni dei simboli può avvenire in due approssimazioni:

1) nell'ipotesi di uguale probabilità (stessa frequenza di occorrenza) di qualsiasi carattere del testo;

2) tenendo conto della diversa probabilità (diversa frequenza di occorrenza) dei vari caratteri del testo.

Approssimazione dell'uguale probabilità dei caratteri in un testo

Se assumiamo che tutti i caratteri dell'alfabeto in qualsiasi testo appaiano con la stessa frequenza, il peso informativo di tutti i caratteri sarà lo stesso. Permettere N- potere dell'alfabeto. Quindi la proporzione di qualsiasi carattere nel testo è 1/ N esima parte del testo. Secondo la definizione di probabilità (cfr. ) questo valore è pari alla probabilità di occorrenza di un carattere in ciascuna posizione del testo:

P = 1/N

Secondo la formula di K. Shannon (vedi. “Misurazione delle informazioni. Approccio al contenuto”), la quantità di informazioni trasportate da un simbolo è calcolata come segue:

io = log2(1/ P) = log2 N(morso) (2)

Pertanto, il peso informativo del simbolo ( io) e la cardinalità dell'alfabeto ( N) sono interconnessi dalla formula di Hartley (vedi “ Misurazione delle informazioni. Approccio al contenuto” )

2 io = N.

Conoscere il peso informativo di un carattere ( io) e la dimensione del testo, espressa come numero di caratteri ( K), puoi calcolare il volume di informazioni del testo usando la formula:

io= K · io (3)

Questa formula è una versione particolare della formula (1), nel caso in cui tutti i simboli abbiano lo stesso peso informativo.

Dalla formula (2) segue che a N= 2 (alfabeto binario) il peso informativo di un carattere è 1 bit.

Dal punto di vista dell'approccio alfabetico alla misurazione delle informazioni1 po' -è il peso informativo di un carattere dell'alfabeto binario.

Un'unità di informazioni più grande è byte.

1 byte -è il peso informativo di un carattere di un alfabeto con una potenza di 256.

Da 256 \u003d 2 8, la connessione tra un bit e un byte segue dalla formula di Hartley:

2 io = 256 = 2 8

Da qui: io= 8 bit = 1 byte

Per rappresentare i testi memorizzati ed elaborati in un computer, viene spesso utilizzato un alfabeto con una capacità di 256 caratteri. Quindi,
1 carattere di tale testo "pesa" 1 byte.

Oltre al bit e al byte, vengono utilizzate anche unità più grandi per misurare le informazioni:

1 KB (kilobyte) = 2 10 byte = 1024 byte,

1 MB (megabyte) = 2 10 KB = 1024 KB,

1 GB (gigabyte) = 2 10 MB = 1024 MB.

Approssimazione delle diverse probabilità di occorrenza dei caratteri nel testo

Questa approssimazione tiene conto del fatto che in un testo reale compaiono caratteri diversi con frequenze diverse. Ne consegue che le probabilità della comparsa di caratteri diversi in una certa posizione del testo sono diverse e, quindi, i loro pesi informativi sono diversi.

L'analisi statistica dei testi russi mostra che la frequenza della lettera "o" è 0,09. Ciò significa che per ogni 100 caratteri, la lettera "o" ricorre in media 9 volte. Lo stesso numero indica la probabilità che la lettera “o” appaia in una certa posizione del testo: P o = 0,09. Ne consegue che il peso informativo della lettera "o" nel testo russo è pari a:

La lettera più rara nei testi è la lettera "f". La sua frequenza è 0,002. Da qui:

Ne consegue una conclusione qualitativa: il peso informativo delle lettere rare è maggiore del peso delle lettere frequenti.

Come calcolare il volume delle informazioni del testo, tenendo conto dei diversi pesi delle informazioni dei simboli dell'alfabeto? Questo viene fatto secondo la seguente formula:

Qui N- dimensione (potenza) dell'alfabeto; nj- numero di ripetizioni del numero del carattere J nel testo; io j- peso delle informazioni del numero del simbolo J.

Approccio alfabetico nel corso di informatica alla fondazione della scuola

Nel corso di informatica della scuola primaria, la conoscenza da parte degli studenti dell'approccio alfabetico alla misurazione delle informazioni avviene più spesso nel contesto della rappresentazione informatica delle informazioni. L'affermazione principale è questa:

La quantità di informazioni è misurata dalla dimensione del codice binario con cui queste informazioni sono rappresentate.

Poiché qualsiasi tipo di informazione è rappresentata nella memoria del computer sotto forma di codice binario, questa definizione è universale. È valido per informazioni simboliche, numeriche, grafiche e sonore.

Un carattere ( scarico)codice binario trasporta 1po' di informazione.

Quando si spiega il metodo di misurazione del volume di informazioni di un testo nel corso di informatica di base, questo problema viene rivelato attraverso la seguente sequenza di concetti: alfabeto-dimensione del codice binario dei caratteri-volume di informazioni del testo.

La logica del ragionamento si dispiega da esempi particolari per ottenere una regola generale. Lascia che ci siano solo 4 caratteri nell'alfabeto di una lingua. Indichiamoli:, , , . Questi caratteri possono essere codificati utilizzando quattro codici binari a due bit: - 00, - 01, - 10, - 11. Qui vengono utilizzate tutte le opzioni di posizionamento di due caratteri per due, il cui numero è 2 2 = 4. A L'alfabeto di 4 caratteri equivale a due bit.

Il prossimo caso speciale è un alfabeto di 8 caratteri, ogni carattere del quale può essere codificato con un codice binario a 3 bit, poiché il numero di posizionamenti di due caratteri in gruppi di 3 è 2 3 = 8. Pertanto, il peso dell'informazione di un carattere di un alfabeto di 8 caratteri è di 3 bit. Eccetera.

Generalizzando esempi particolari, otteniamo regola generale: usando B- codice binario bit, è possibile codificare un alfabeto composto da N = 2 B- simboli.

Esempio 1 Per scrivere il testo si usano solo lettere minuscole dell'alfabeto russo e uno “spazio” per separare le parole. Qual è il volume informativo di un testo composto da 2000 caratteri (una pagina stampata)?

Soluzione. Ci sono 33 lettere nell'alfabeto russo. Riducendolo di due lettere (ad esempio, "ё" e "й") e inserendo un carattere spazio, otteniamo un numero di caratteri molto conveniente - 32. Usando l'approssimazione dell'uguale probabilità di caratteri, scriviamo la formula di Hartley:

2io= 32 = 2 5

Da qui: io= 5 bit - peso informativo di ciascun carattere dell'alfabeto russo. Quindi il volume delle informazioni dell'intero testo è pari a:

IO= 2000 5 = 10.000 morso

Esempio 2 Calcola il volume di informazioni di un testo con una dimensione di 2000 caratteri, nel record di cui viene utilizzato l'alfabeto di una rappresentazione informatica di testi con una capacità di 256.

Soluzione. In questo alfabeto, il peso informativo di ciascun carattere è di 1 byte (8 bit). Pertanto, il volume di informazioni del testo è di 2000 byte.

Nelle attività pratiche su questo argomento, è importante sviluppare le capacità degli studenti nel convertire la quantità di informazioni in diverse unità: bit - byte - kilobyte - megabyte - gigabyte. Se ricalcoliamo il volume di informazioni del testo dell'esempio 2 in kilobyte, otteniamo:

2000 byte = 2000/1024 1,9531 KB

Esempio 3 Il volume del messaggio contenente 2048 caratteri era 1/512 di megabyte. Qual è la dimensione dell'alfabeto con cui è scritto il messaggio?

Soluzione. Traduciamo il volume di informazioni del messaggio da megabyte a bit. Per fare ciò, moltiplichiamo questo valore due volte per 1024 (otteniamo byte) e una volta per 8:

IO= 1/512 1024 1024 8 = 16.384 bit.

Poiché questa quantità di informazioni è trasportata da 1024 caratteri ( A), quindi un carattere rappresenta:

io = IO/K= 16 384/1024 = 16 bit.

Ne consegue che la dimensione (potenza) dell'alfabeto utilizzato è di 2 16 = 65 536 caratteri.

Approccio volumetrico nel corso di informatica alle superiori

Studiando informatica nelle classi 10-11 a livello di istruzione generale di base, gli studenti possono lasciare la loro conoscenza dell'approccio volumetrico alla misurazione delle informazioni allo stesso livello descritto sopra, ad es. nel contesto della quantità di codice informatico binario.

Quando si studia l'informatica a livello di profilo, l'approccio volumetrico dovrebbe essere considerato da posizioni matematiche più generali, utilizzando idee sulla frequenza dei caratteri in un testo, sulle probabilità e sulla relazione delle probabilità con i pesi informativi dei simboli.

La conoscenza di questi problemi è importante per una comprensione più profonda della differenza nell'uso della codifica binaria uniforme e non uniforme (cfr. "Codifica delle informazioni"), per comprendere alcune tecniche di compressione dei dati (cfr. "Compressione dati") e algoritmi crittografici (cfr "Crittografia" ).

Esempio 4 Nell'alfabeto della tribù MUMU ci sono solo 4 lettere (A, U, M, K), un segno di punteggiatura (punto) e uno spazio è usato per separare le parole. È stato calcolato che il popolare romanzo "Mumuka" contiene solo 10.000 caratteri, di cui: lettere A - 4000, lettere U - 1000, lettere M - 2000, lettere K - 1500, punti - 500, spazi - 1000. Quante informazioni contiene libro?

Soluzione. Poiché il volume del libro è piuttosto ampio, si può presumere che la frequenza di occorrenza nel testo di ciascuno dei simboli dell'alfabeto calcolati da esso sia tipica di qualsiasi testo nella lingua MUMU. Calcoliamo la frequenza di occorrenza di ogni carattere nell'intero testo del libro (cioè la probabilità) e il peso informativo dei caratteri

La quantità totale di informazioni nel libro è calcolata come la somma dei prodotti del peso delle informazioni di ciascun simbolo e il numero di ripetizioni di questo simbolo nel libro:

Per misurare la lunghezza, ci sono unità come millimetro, centimetro, metro, chilometro. È noto che la massa si misura in grammi, chilogrammi, centesimi e tonnellate. Il tempo che scorre è espresso in secondi, minuti, ore, giorni, mesi, anni, secoli. Il computer lavora con le informazioni e ci sono anche opportune unità di misura per misurarne il volume.

Sappiamo già che un computer percepisce tutte le informazioni.

Morso- è l'unità minima di misura dell'informazione, corrispondente ad una cifra binaria ("0" o "1").

Byteè composto da otto bit. Usando un byte, puoi codificare un carattere tra i 256 possibili (256 = 2 8). Pertanto, un byte equivale a un carattere, ovvero 8 bit:

1 carattere = 8 bit = 1 byte.

Lettera, numero, segno di punteggiatura sono simboli. Una lettera, un simbolo. Un numero è anche un carattere. Un segno di punteggiatura (un punto, o una virgola, o un punto interrogativo, ecc.) è di nuovo un carattere. Uno spazio è anche un carattere.

Lo studio dell'alfabetizzazione informatica implica la considerazione di altre unità di misura dell'informazione più ampie.

Tabella dei byte:

1 byte = 8 bit

1KB (1 Kilobyte) = 2 10 byte = 2*2*2*2*2*2*2*2*2*2 byte =
= 1024 byte (circa 1 mila byte - 10 3 byte)

1 Mb (1 megabyte) = 2 20 byte = 1024 kilobyte (circa 1 milione di byte - 10 6 byte)

1gb (1 gigabyte) = 2 30 byte = 1024 megabyte (circa 1 miliardo di byte - 10 9 byte)

1TB (1 Terabyte) = 240 byte = 1024 gigabyte (circa 1012 byte). Terabyte è talvolta chiamato tonnellata.

1 pb (1 Petabyte) = 2 50 byte = 1024 terabyte (circa 10 15 byte).

1 esabyte= 260 byte = 1024 petabyte (circa 1018 byte).

1 Zettabyte= 270 byte = 1024 exabyte (circa 1021 byte).

1 Yottabyte= 2 80 byte = 1024 zettabyte (circa 10 24 byte).

Nella tabella sopra, le potenze di due (2 10 , 2 20 , 2 30 , ecc.) sono i valori esatti di kilobyte, megabyte, gigabyte. Ma le potenze del numero 10 (più precisamente, 10 3 , 10 6 , 10 9 , ecc.) saranno già valori approssimativi, arrotondati per difetto. Pertanto, 2 10 = 1024 byte rappresenta il valore esatto di un kilobyte e 10 3 = 1000 byte è il valore approssimativo di un kilobyte.

Tale approssimazione (o arrotondamento) è abbastanza accettabile e generalmente accettata.

Quella che segue è una tabella di byte con abbreviazioni inglesi (nella colonna di sinistra):

1 Kb ~ 10 3 b = 10*10*10 b= 1000 b – kilobyte

1 Mb ~ 10 6 b = 10*10*10*10*10*10 b = 1 000 000 b - megabyte

1 GB ~ 10 9 b - gigabyte

1 Tb ~ 10 12 b - terabyte

1 Pb ~ 10 15 b - petabyte

1 Mi bem ~ 10 18 b - esabyte

1 Zb ~ 10 21 b - zettabyte

1 Yb ~ 10 24 b - yottabyte

In alto nella colonna di destra ci sono i cosiddetti "prefissi decimali", che vengono utilizzati non solo con i byte, ma anche in altre aree dell'attività umana. Ad esempio, il prefisso "kilo" nella parola "kilobyte" significa mille byte, proprio come nel caso di un chilometro corrisponde a mille metri, e nell'esempio di un chilogrammo è uguale a mille grammi.

Continua…

La domanda sorge spontanea: la tabella dei byte ha una continuazione? In matematica esiste il concetto di infinito, che è indicato come un otto invertito: ∞.

È chiaro che nella tabella dei byte si possono continuare ad aggiungere zeri, o meglio, potenze al numero 10 in questo modo: 10 27 , 10 30 , 10 33 e così via all'infinito. Ma perché è necessario? In linea di principio, mentre terabyte e petabyte sono sufficienti. In futuro forse non basterà nemmeno uno yottabyte.

Infine, un paio di esempi su dispositivi in ​​grado di memorizzare terabyte e gigabyte di informazioni.

C'è un comodo "terabyte" - esterno HDD che si collega tramite porta USB al computer. Può memorizzare un terabyte di informazioni. Particolarmente conveniente per i laptop (dove il cambiamento disco rigido può essere problematico) e Prenota copia informazione. È meglio farlo in anticipo. backup informazioni, non dopo che tutto è andato.

Le unità flash sono disponibili in 1 GB, 2 GB, 4 GB, 8 GB, 16 GB, 32 GB, 64 GB e persino 1 terabyte.

Volume informativo del testo e unità di misura dell'informazione


Un computer moderno può elaborare informazioni numeriche, testuali, grafiche, audio e video. Tutti questi tipi di informazioni in un computer sono presentati in codice binario, ovvero vengono utilizzati solo due simboli 0 e 1. Ciò è dovuto al fatto che è conveniente rappresentare le informazioni sotto forma di una sequenza di impulsi elettrici: lì non c'è impulso (0), c'è un impulso (1).

Tale codifica è solitamente chiamata binaria e le sequenze logiche di zeri e unità stesse sono chiamate linguaggio macchina.

Quanto deve essere lungo un codice binario per poter codificare i caratteri della tastiera del tuo computer?

Così, il peso informativo di un carattere di un alfabeto sufficiente è 1 byte.

Per misurare grandi volumi di informazioni, vengono utilizzate unità di informazioni più grandi:

Unità per misurare la quantità di informazioni:

1 byte = 8 bit

1 kilobyte = 1 KB = 1024 byte

1 megabyte = 1 MB = 1024 KB

1 gigabyte = 1 GB = 1024 GB

Volume informativo del testo

1. Numero di personaggi nel libro:

60 * 40 * 150 = 360.000 caratteri.

2. Perché 1 carattere pesa 1 byte, il volume di informazioni del libro è

360.000 byte.

3. Converti byte in unità più grandi:

360.000 / 1024 = 351,56 KB

351,56/1024 = 0,34MB

Risposta: Il volume informativo del testo è di 0,34 Mb.

Compito:

Il volume informativo del testo preparato con l'ausilio di un computer è di 3,5 Kb. Quanti caratteri contiene questo testo?

1. Convertiamo il volume da MB a byte:

3,5 MB * 1024 = 3584 KB

3584 KB * 1024 = 3.670.016 byte

2. Perché 1 carattere pesa 1 byte, il numero di caratteri nel testo è

Quantità di informazioni

La quantità di informazioni come misura per ridurre l'incertezza della conoscenza.
(Approccio significativo per determinare la quantità di informazioni)

Il processo di cognizione del mondo circostante porta all'accumulo di informazioni sotto forma di conoscenza (fatti, teorie scientifiche, ecc.). L'acquisizione di nuove informazioni porta ad un aumento della conoscenza o, come talvolta si dice, ad una diminuzione dell'incertezza della conoscenza. Se un certo messaggio porta a una diminuzione dell'incertezza della nostra conoscenza, allora possiamo dire che tale messaggio contiene informazioni.

Ad esempio, dopo aver superato un test o aver completato un test, sei tormentato dall'incertezza, non sai che voto hai ricevuto. Alla fine, l'insegnante annuncia i risultati e tu ottieni uno dei due messaggi informativi: "superato" o "fallito", e dopo il test uno dei quattro messaggi informativi: "2", "3", "4" o "5".

Un messaggio informativo su una valutazione per un credito porta a una doppia diminuzione dell'incertezza della tua conoscenza, poiché è stato ricevuto uno dei due possibili messaggi informativi. Messaggio informativo sulla valutazione per test porta a quadruplicare l'incertezza della tua conoscenza, poiché viene ricevuto uno dei quattro possibili messaggi informativi.

È chiaro che più incerta è la situazione iniziale (maggiore è il numero di messaggi informativi possibili), più nuove informazioni riceveremo al ricevimento del messaggio informativo (maggiore sarà il numero di volte in cui l'incertezza della conoscenza diminuirà).

Quantità di informazioni può essere considerato come una misura per ridurre l'incertezza della conoscenza quando si ricevono messaggi informativi.

L'approccio discusso sopra all'informazione come misura per ridurre l'incertezza della conoscenza rende possibile misurare le informazioni quantitativamente. Esiste una formula che mette in relazione il numero di possibili messaggi informativi N e la quantità di informazioni I che trasporta il messaggio ricevuto:

N = 2i (1.1)

Morso. Per quantificare qualsiasi quantità, devi prima determinare l'unità di misura. Quindi, per misurare la lunghezza, viene scelto un metro come unità, per misurare la massa - un chilogrammo, ecc. Allo stesso modo, per determinare la quantità di informazioni, è necessario inserire un'unità di misura.

Dietro unità di informazione viene ricevuta la quantità di informazioni contenute nel messaggio informativo, il che riduce della metà l'incertezza della conoscenza. Questa unità è chiamata morso.

Se torniamo alla ricezione di un messaggio informativo sui risultati dell'offset sopra considerato, allora qui l'incertezza è appena dimezzata e, quindi, la quantità di informazione che il messaggio trasporta è pari a 1 bit.

Unità derivate per misurare la quantità di informazioni. L'unità minima per misurare la quantità di informazioni è un bit, e l'unità successiva più grande è un byte, e:

1 byte = 8 bit = 2 3 bit.

Nell'informatica, il sistema di istruzione di più unità di misura è in qualche modo diverso da quelli accettati nella maggior parte delle scienze. I sistemi metrici tradizionali di unità, come il Sistema internazionale di unità SI, utilizzano un fattore di 10 n come multipli di unità multiple, dove n \u003d 3, 6, 9, ecc., Che corrisponde ai prefissi decimali "Kilo" ( 10 3), "Mega" (10 6), "Giga" (10 9), ecc.

In un computer, le informazioni vengono codificate utilizzando un sistema di segni binari e, pertanto, in più unità di misurazione della quantità di informazioni, viene utilizzato il coefficiente 2 n

Quindi, le unità di misura della quantità di informazioni che sono multipli di un byte vengono inserite come segue:

1 kilobyte (KB) = 2 10 byte = 1024 byte;

1 megabyte (MB) = 2 10 KB = 1024 KB;

1 gigabyte (GB) = 2 10 MB = 1024 MB.

Domande di controllo

    1. Fornisci esempi di messaggi informativi che portano a una diminuzione dell'incertezza della conoscenza.
    2. Fornisci esempi di messaggi informativi che contengono 1 bit di informazione.

Determinare la quantità di informazioni

Determinazione del numero di messaggi informativi. Secondo la formula (1.1), si può facilmente determinare il numero di possibili messaggi informativi se si conosce la quantità di informazioni. Ad esempio, in un esame, prendi un biglietto per l'esame e l'insegnante riferisce che il messaggio informativo visivo sul suo numero contiene 5 bit di informazioni. Se si desidera determinare il numero di biglietti d'esame, è sufficiente determinare il numero di possibili messaggi informativi sui loro numeri utilizzando la formula (1.1):

Pertanto, il numero di biglietti d'esame è 32.

Determinare la quantità di informazioni. Al contrario, se il numero possibile di messaggi informativi N è noto, allora per determinare la quantità di informazioni che il messaggio trasporta, è necessario risolvere l'equazione per I.

Immagina di controllare il movimento del robot e di poter impostare la direzione del suo movimento utilizzando i messaggi informativi: "nord", "nordest", "est", "sudest", "sud", "sudovest", "ovest" e "nord-ovest" (figura 1.11). Quante informazioni riceverà il robot dopo ogni messaggio?

Ci sono 8 possibili messaggi informativi in ​​totale, quindi la formula (1.1) assume la forma di un'equazione per I:

Scomponiamo il numero 8 sul lato sinistro dell'equazione in fattori e lo rappresentiamo in una forma di potenza:

8 = 2 × 2 × 2 = 2 3 .

La nostra equazione:

L'uguaglianza delle parti sinistra e destra dell'equazione è vera se gli esponenti del numero 2 sono uguali, quindi I = 3 bit, ovvero la quantità di informazioni che ogni messaggio informativo porta al robot è di 3 bit.

Approccio alfabetico per determinare la quantità di informazioni

Con un approccio alfabetico per determinare la quantità di informazioni, si astrae dal contenuto delle informazioni e si considera un messaggio informativo come una sequenza di segni di un certo sistema di segni.

Capacità informativa del segno. Immagina che sia necessario trasmettere un messaggio informativo su un canale di trasmissione di informazioni dal mittente al destinatario. Lascia che il messaggio sia codificato utilizzando un sistema di segni, il cui alfabeto è composto da N caratteri (1, ..., N). Nel caso più semplice, quando la lunghezza del codice del messaggio è di un carattere, il mittente può inviare uno degli N possibili messaggi "1", "2", ..., "N", che conterrà la quantità di informazioni I ( Figura 1.5).

Riso. 1.5. Trasferimento di informazioni

La formula (1.1) collega il numero di possibili messaggi informativi N e la quantità di informazioni I che trasporta il messaggio ricevuto. Quindi nella situazione in esame, N è il numero di caratteri nell'alfabeto del sistema di segni, e I è la quantità di informazioni che ogni carattere porta:

Usando questa formula, puoi, ad esempio, determinare la quantità di informazioni che un segno porta in un sistema di segni binari:

N = 2 => 2 = 2 I => 2 1 = 2 I => I=1 bit.

Pertanto, in un sistema di segni binari, un segno trasporta 1 bit di informazione. È interessante che l'unità stessa di misura della quantità di informazioni "bit" (bit) abbia preso il nome dalla frase inglese "Binary digiT" - "binary digit".

La capacità informativa di un segno di un sistema di segni binari è 1 po'

Più caratteri contiene l'alfabeto del sistema dei segni, più informazioni trasporta un carattere. Ad esempio, determiniamo la quantità di informazioni che trasporta una lettera dell'alfabeto russo. L'alfabeto russo comprende 33 lettere, ma in pratica vengono spesso utilizzate solo 32 lettere per inviare messaggi (la lettera "ё" è esclusa).

Usando la formula (1.1), determiniamo la quantità di informazioni che trasporta una lettera dell'alfabeto russo:

N = 32 => 32 = 2 I => 2 5 = 2 I => I=5 bit.

Pertanto, una lettera dell'alfabeto russo contiene 5 bit di informazioni (con un approccio alfabetico per misurare la quantità di informazioni).

La quantità di informazioni che un segno trasporta dipende dalla probabilità di riceverlo. Se il destinatario conosce in anticipo esattamente quale carattere arriverà, allora la quantità di informazioni ricevute sarà pari a 0. Viceversa, minore è la probabilità di ricezione del carattere, maggiore è la sua capacità informativa.

Nel discorso scritto russo, la frequenza di utilizzo delle lettere nel testo è diversa, quindi in media ci sono 200 lettere "a" per 1000 caratteri di un testo significativo e cento volte meno lettere "f" (solo 2). Pertanto, dal punto di vista della teoria dell'informazione, la capacità informativa dei segni dell'alfabeto russo è diversa (la lettera "a" ha la più piccola e la lettera "f" ha la più grande).

La quantità di informazioni nel messaggio. Il messaggio è costituito da una sequenza di caratteri, ognuno dei quali porta una certa quantità di informazioni.

Se i caratteri portano la stessa quantità di informazioni, allora la quantità di informazioni Ic nel messaggio può essere calcolata moltiplicando la quantità di informazioni Ic che un carattere porta per la lunghezza del codice (il numero di caratteri nel messaggio) K:

io c \u003d io s × K

Quindi, ogni cifra di un codice informatico binario contiene informazioni in 1 bit. Pertanto, due cifre portano informazioni in 2 bit, tre cifre in 3 bit, ecc. La quantità di informazioni in bit è uguale al numero di cifre in un codice informatico binario (Tabella 1.1).

Tabella 1.1. La quantità di informazioni trasportate da un codice informatico binario

E molti altri concetti hanno le connessioni più dirette tra loro. Pochissimi utenti oggi sono sufficientemente esperti in queste materie. Proviamo a chiarire qual è il potere dell'alfabeto, come calcolarlo e applicarlo nella pratica. In futuro, questo, senza dubbio, può essere utile nella pratica.

Come si misurano le informazioni

Prima di procedere allo studio della questione di quale sia il potere dell'alfabeto, e in generale, di cosa si tratta, dovremmo partire, per così dire, dalle basi.

Sicuramente tutti sanno che oggi esistono sistemi speciali per misurare qualsiasi quantità basata su valori di riferimento. Ad esempio, per distanze e quantità simili, si tratta di metri, per massa e peso - chilogrammi, per intervalli di tempo - secondi, ecc.

Ma come misurare le informazioni in termini di volume del testo? Fu per questo che fu introdotto il concetto di cardinalità di un alfabeto.

Qual è il potere dell'alfabeto: il concetto iniziale

Quindi, se seguiamo la regola generalmente accettata secondo cui il valore finale di una quantità è un parametro che determina quante volte l'unità di riferimento viene inserita nel valore misurato, possiamo concludere che la potenza dell'alfabeto è il numero totale di simboli utilizzati per una determinata lingua.

Per renderlo più chiaro, per ora lasciamo da parte la questione di come trovare il potere dell'alfabeto e prestiamo attenzione ai simboli stessi, ovviamente, dal punto di vista Tecnologie informatiche. In parole povere, l'elenco completo dei simboli utilizzati contiene lettere, numeri, tutti i tipi di parentesi, Simboli speciali, segni di punteggiatura, ecc. Tuttavia, se ci avviciniamo alla domanda su quale sia esattamente il potere dell'alfabeto per computer, questo dovrebbe includere anche uno spazio (un singolo spazio tra parole o altri caratteri).

Prendiamo come esempio la lingua russa, o meglio, il layout della tastiera. Sulla base di quanto precede, l'elenco completo contiene 33 lettere, 10 numeri e 11 caratteri speciali. Pertanto, la potenza totale dell'alfabeto è 54.

Peso delle informazioni sui simboli

Tuttavia concetto generale il potere dell'alfabeto non determina l'essenza del calcolo dei volumi informativi del testo contenente lettere, numeri e simboli. Ciò richiede un approccio speciale.

In linea di principio, pensaci, beh, ecco quale può essere il set minimo dal punto di vista di sistema informatico quanti caratteri può contenere? Risposta: due. Ed ecco perché. Il fatto è che ogni carattere, sia esso una lettera o un numero, ha un proprio peso informativo, grazie al quale la macchina riconosce ciò che gli sta davanti. Ma il computer comprende solo la rappresentazione sotto forma di uno e zero, su cui, di fatto, si basa tutta l'informatica.

Pertanto, qualsiasi carattere può essere rappresentato come sequenze contenenti i numeri 1 e 0, ovvero la sequenza minima che denota una lettera, un numero o un simbolo è costituita da due componenti.

Il peso dell'informazione stesso, preso come standard unità informativa la misura è chiamata bit (1 bit). Di conseguenza, 8 bit costituiscono 1 byte.

Rappresentazione di caratteri in codice binario

Quindi, qual è il potere dell'alfabeto, penso, è già un po 'chiaro. Vediamo ora un altro aspetto, in particolare la rappresentazione pratica del potere usando Per semplicità, prendiamo come esempio un alfabeto contenente solo 4 caratteri.

In un codice binario a due cifre, la sequenza e la loro rappresentazione informativa possono essere descritte come segue:

Numero di serie

codice binario

Quindi - la conclusione più semplice: con la potenza dell'alfabeto N=4, il peso di un singolo carattere è di 2 bit.

Se si utilizza un codice binario a tre cifre per l'alfabeto, ad esempio con 8 caratteri, il numero di combinazioni sarebbe:

Numero di serie

codice binario

In altre parole, con la capacità dell'alfabeto N=8, il peso di un carattere per un codice binario a tre cifre sarà pari a 3 bit.

alfabeto e usarlo in un'espressione del computer

Ora proviamo a guardare la dipendenza, che esprime il numero di caratteri nel codice e la potenza dell'alfabeto. La formula, dove N è la potenza alfabetica dell'alfabeto e b è il numero di caratteri nel codice binario, sarà simile a questa:

Cioè, 2 1 = 2, 2 2 = 4, 2 3 = 8, 2 4 = 16, ecc. In parole povere, il numero desiderato di caratteri del codice binario stesso è il peso del carattere. In termini di informazioni, si presenta così:

Misurazione del volume di informazioni

Tuttavia, questi erano solo gli esempi più semplici, per così dire, per una prima comprensione di cosa sia il potere dell'alfabeto. Andiamo direttamente alla pratica.

In questa fase dello sviluppo della tecnologia informatica per la digitazione, tenendo conto delle lettere maiuscole, maiuscole e cirilliche e latine, segni di punteggiatura, parentesi, segni aritmetici, ecc. Vengono utilizzati 256 caratteri. Sulla base del fatto che 256 è 2 8 , è facile intuire che il peso di ciascun carattere in un tale alfabeto è 8, ovvero 8 bit o 1 byte.

Sulla base di tutti i parametri noti, possiamo facilmente ottenere il valore del volume di informazioni di qualsiasi testo di cui abbiamo bisogno. Ad esempio, abbiamo un testo informatico contenente 30 pagine. Una pagina contiene 50 righe di 60 caratteri o simboli qualsiasi, inclusi gli spazi.

Pertanto, una pagina conterrà 50 x 60 = 3.000 byte di informazioni e l'intero testo conterrà 3.000 x 50 = 150.000 byte. Come puoi vedere, anche i testi piccoli sono scomodi da misurare in byte. E intere biblioteche?

IN questo casoè meglio convertire il volume in valori più potenti: kilobyte, megabyte, gigabyte, ecc. Sulla base del fatto che, ad esempio, 1 kilobyte è uguale a 1024 byte (2 10) e un megabyte è 2 10 kilobyte (1024 kilobyte), è facile calcolare che la quantità di testo nell'espressione matematica delle informazioni per il nostro esempio sarà 150000/1024=146, 484375 kilobyte o circa 0,14305 megabyte.

Invece di una postfazione

In generale, questo è in breve e tutto ciò che riguarda la considerazione della domanda, qual è il potere dell'alfabeto. Resta da aggiungere che in questa descrizione è stato utilizzato un approccio puramente matematico. Inutile dire che il carico semantico del testo in questo caso non viene preso in considerazione.

Ma, se affrontiamo le questioni della considerazione da una posizione che dà a una persona qualcosa da comprendere, un insieme di combinazioni o sequenze di caratteri prive di significato a questo proposito avrà un carico di informazioni pari a zero, sebbene, dal punto di vista del concetto di informazione volume, il risultato può ancora essere calcolato.

In generale, la conoscenza del potere dell'alfabeto e dei concetti correlati non è così difficile da comprendere e può essere semplicemente applicata nel senso di azioni pratiche. Allo stesso tempo, qualsiasi utente lo affronta quasi ogni giorno. Basti citare il popolare editor di parole o qualsiasi altro dello stesso livello che utilizza tale sistema. Ma non confonderlo con il solito Blocco note. Qui, la potenza dell'alfabeto è inferiore, poiché, ad esempio, le lettere maiuscole non vengono utilizzate durante la digitazione.

Se noti un errore, seleziona una parte di testo e premi Ctrl + Invio
CONDIVIDERE: