A méréshez alfabetikus megközelítést alkalmazunk információ mennyiségét valamely ábécé karaktersorozataként ábrázolt szövegben. Ez a megközelítés nem kapcsolódik a szöveg tartalmához. Az információ mennyiségét ebben az esetben ún a szöveg információs mennyisége, amely arányos a szöveg méretével – a szöveget alkotó karakterek számával. Néha ezt az információmérési megközelítést volumetrikus megközelítésnek nevezik.

A szöveg minden karaktere bizonyos mennyiségű információt hordoz. Neveztetik szimbólum információ súlya. Ezért a szöveg információmennyisége megegyezik a szöveget alkotó összes karakter információs súlyának összegével.

Itt azt feltételezzük, hogy a szöveg egy egymást követő számozott karaktersorozat. Az (1) képletben én 1 a szöveg első karakterének információs súlyát jelöli, én 2 - a szöveg második karakterének információs súlya stb.; K- szövegméret, pl. a szöveg teljes karakterszáma.

A szövegek írásához használt sokféle karakter, nak, nek hívják betűrendben. Az ábécé mérete egy egész szám, az úgynevezett az ábécé ereje. Nem szabad megfeledkezni arról, hogy az ábécé nem csak egy bizonyos nyelv betűit tartalmazza, hanem minden más, a szövegben használható karaktert: számokat, írásjeleket, különféle zárójeleket, szóközöket stb.

A szimbólumok információs súlyának meghatározása két közelítéssel történhet:

1) a szöveg bármely karakterének azonos valószínűségének (azonos előfordulási gyakoriságának) feltételezésével;

2) figyelembe véve a különböző karakterek eltérő valószínűségét (eltérő előfordulási gyakoriságát) a szövegben.

A karakterek egyenlő valószínűségének közelítése egy szövegben

Ha feltételezzük, hogy bármely szövegben az ábécé összes karaktere azonos gyakorisággal jelenik meg, akkor az összes karakter információs súlya azonos lesz. Hadd N- az ábécé ereje. Ekkor bármely karakter aránya a szövegben 1/ N szövegrész. A valószínűség definíciója szerint (vö. ) ez az érték egyenlő egy karakter előfordulásának valószínűségével a szöveg minden pozíciójában:

p = 1/N

K. Shannon képlete szerint (lásd. „Az információ mérése. Tartalmi megközelítés”), a szimbólum által hordozott információ mennyiségét a következőképpen számítjuk ki:

i = log2(1/ p) = log2 N(bit) (2)

Ezért a szimbólum információs súlya ( én) és az ábécé kardinalitása ( N) a Hartley-formulával kapcsolódnak egymáshoz (lásd Információ mérése. Tartalmi megközelítés” )

2 én = N.

Egy karakter információs súlyának ismeretében ( én) és a szöveg mérete, karakterek számában kifejezve ( K), a következő képlet segítségével számíthatja ki a szöveg információmennyiségét:

I= K · én (3)

Ez a képlet az (1) képlet egy speciális változata, abban az esetben, ha minden szimbólumnak azonos az információs súlya.

A (2) képletből következik, hogy at N= 2 (bináris ábécé) egy karakter információs súlya 1 bit.

Az információmérés alfabetikus megközelítése szempontjából1 bit -a bináris ábécé egy karakterének információs súlya.

Az információ nagyobb egysége az byte.

1 bájt -egy 256 hatványú ábécé karakterének információs súlya.

Mivel 256 \u003d 2 8, akkor a bit és a bájt közötti kapcsolat a Hartley-képletből következik:

2 én = 256 = 2 8

Innen: én= 8 bit = 1 bájt

A számítógépen tárolt és feldolgozott szövegek ábrázolására leggyakrabban 256 karakteres ábécét használnak. Ennélfogva,
Az ilyen szöveg 1 karaktere 1 bájtot "súlyoz".

A biten és bájton kívül nagyobb mértékegységeket is használnak az információ mérésére:

1 KB (kilobyte) = 2 10 bájt = 1024 bájt,

1 MB (megabyte) = 2 10 KB = 1024 KB,

1 GB (gigabájt) = 2 10 MB = 1024 MB.

A karakterek szövegbeli előfordulási valószínűségének közelítése

Ez a közelítés figyelembe veszi, hogy egy valós szövegben különböző karakterek eltérő gyakorisággal fordulnak elő. Ebből következik, hogy a különböző karakterek megjelenésének valószínűsége a szöveg egy bizonyos helyén eltérő, és ezért eltérő az információs súlyuk is.

Az orosz szövegek statisztikai elemzése azt mutatja, hogy az „o” betű gyakorisága 0,09. Ez azt jelenti, hogy 100 karakterenként átlagosan 9 alkalommal fordul elő az „o” betű. Ugyanez a szám jelzi annak valószínűségét, hogy az „o” betű megjelenjen a szöveg bizonyos helyén: p o = 0,09. Ebből következik, hogy az „o” betű információs súlya az orosz szövegben egyenlő:

A szövegekben a legritkább betű az „f” betű. Frekvenciája 0,002. Innen:

Ebből kvalitatív következtetés következik: a ritka betűk információs súlya nagyobb, mint a gyakran előforduló betűké.

Hogyan számítható ki a szöveg információmennyisége, figyelembe véve az ábécé szimbólumainak eltérő információs súlyát? Ez a következő képlet szerint történik:

Itt N- az ábécé mérete (ereje); nj- a karakterszám ismétlődéseinek száma j a szövegben; i j- a szimbólumszám információs súlya j.

ABC-szemléletű megközelítés az iskolaalapítás informatika kurzusában

Az általános iskola informatika szakán az információmérés alfabetikus megközelítésével való megismerkedés a tanulók körében leggyakrabban az információ számítógépes reprezentációja keretében történik. A fő állítás így hangzik:

Az információ mennyiségét annak a bináris kódnak a méretével mérjük, amellyel ezt az információt reprezentálják.

Mivel a számítógép memóriájában bármilyen információ bináris kód formájában jelenik meg, ez a meghatározás univerzális. Szimbolikus, numerikus, grafikus és hangos információkra érvényes.

Egy karakter ( kisülés)bináris kód hordozza 1egy kis információ.

Az informatikai alaptanfolyamon a szöveg információmennyiségének mérési módszerének ismertetésekor ez a kérdés a következő fogalomsoron keresztül derül ki: ábécé-karakter bináris kód mérete-a szöveg információs mennyisége.

Az érvelés logikája a konkrét példáktól az általános szabály megszerzéséig bontakozik ki. Legyen csak 4 karakter valamelyik nyelv ábécéjében. Jelöljük őket:, , , . Ezek a karakterek négy kétjegyű bináris kóddal kódolhatók: - 00, - 01, - 10, - 11. Itt minden 2 2 = 4 karakterből álló elhelyezési lehetőség használatos, amelyek száma 2 2 = 4. A 4 karakterből álló ábécé két bitnek felel meg.

A következő speciális eset egy 8 karakterből álló ábécé, amelynek minden karaktere 3 bites bináris kóddal kódolható, hiszen két karakter elhelyezésének száma 3-as csoportokban 2 3 = 8. Ezért az információs súly egy 8 karakteres ábécé karaktere 3 bites. Stb.

Konkrét példákat általánosítva azt kapjuk, hogy Általános szabály: használva b- bites bináris kóddal kódolhat egy ábécét, amelyből áll N = 2 b- szimbólumok.

1. példa A szöveg írásához csak az orosz ábécé kisbetűit használjuk, és egy „szóközt” használnak a szavak elválasztására. Mekkora egy 2000 karakterből álló szöveg (egy nyomtatott oldal) terjedelme?

Megoldás. Az orosz ábécé 33 betűt tartalmaz. Két betűvel csökkentve (például „ё” és „й”), és beírva egy szóköz karaktert, nagyon kényelmes számú karaktert kapunk - 32. A karakterek egyenlő valószínűségének közelítésével felírjuk a Hartley-képletet:

2én= 32 = 2 5

Innen: én= 5 bit - az orosz ábécé egyes karaktereinek információs súlya. Ekkor a teljes szöveg információmennyisége egyenlő:

én= 2000 5 = 10 000 bit

2. példa Számítsa ki egy 2000 karakteres szöveg információmennyiségét, amelynek rekordjában a 256 karakteres szövegek számítógépes megjelenítésének ábécéjét használjuk!

Megoldás. Ebben az ábécében az egyes karakterek információs súlya 1 bájt (8 bit). Ezért a szöveg információs térfogata 2000 bájt.

A témával kapcsolatos gyakorlati feladatok során fontos a tanulók készségeinek fejlesztése az információmennyiség átkonvertálásában különböző egységek: bitek - bájtok - kilobájtok - megabájtok - gigabájtok. Ha átszámoljuk a 2. példa szövegének információmennyiségét kilobájtokra, a következőt kapjuk:

2000 bájt = 2000/1024 1,9531 KB

3. példa A 2048 karaktert tartalmazó üzenet térfogata 1/512 megabájt volt. Mekkora az ábécé, amellyel az üzenetet írják?

Megoldás. Fordítsuk le az üzenet információmennyiségét megabájtokról bitekre. Ehhez ezt az értéket kétszer megszorozzuk 1024-gyel (bájtokat kapunk), egyszer pedig 8-cal:

én= 1/512 1024 1024 8 = 16 384 bit.

Mivel ezt az információmennyiséget 1024 karakter hordozza ( NAK NEK), akkor egy karakter a következőket jelenti:

én = én/K= 16 384/1024 = 16 bit.

Ebből következik, hogy a használt ábécé mérete (hatékonysága) 2 16 = 65 536 karakter.

Volumetrikus megközelítés középiskolai számítástechnika tantárgy keretében

A 10–11. évfolyamon az informatika alapfokú általános műveltségi szintjén tanuló tanulók az információmérés volumetrikus megközelítésével kapcsolatos ismereteiket a fent leírtakkal azonos szinten hagyhatják, i. a bináris számítógépes kód mennyiségével összefüggésben.

A számítástechnika profilszintű tanulmányozása során a volumetrikus megközelítést általánosabb matematikai pozíciókból kell megfontolni, felhasználva a szövegben szereplő karakterek gyakoriságára, a valószínűségekre, valamint a valószínűségek és a szimbólumok információs súlyaira vonatkozó elképzelésekre.

E kérdések ismerete fontos az egységes és a nem egységes bináris kódolás használatában mutatkozó különbségek mélyebb megértéséhez (lásd. „Információs kódolás”), hogy megértsen néhány adattömörítési technikát (lásd. "Adattömörítés") és kriptográfiai algoritmusok (lásd "kriptográfia" ).

4. példa A MUMU törzs ábécéjében csak 4 betű (A, U, M, K), egy írásjel (pont) és egy szóköz használatos a szavak elválasztására. Kiszámítások szerint a népszerű "Mumuka" regény mindössze 10 000 karaktert tartalmaz, ebből: A betűk - 4000, U betűk - 1000, M betűk - 2000, K betűk - 1500, pontok - 500, szóközök - 1000. Mennyi információt tartalmaz könyv?

Megoldás. Mivel a könyv terjedelme meglehetősen nagy, feltételezhető, hogy az ábécé egyes szimbólumainak az abból számított előfordulási gyakorisága a szövegben jellemző bármely MUMU nyelvű szövegre. Számítsuk ki az egyes karakterek előfordulási gyakoriságát a könyv teljes szövegében (azaz a valószínűséget) és a karakterek információs súlyát

A könyvben lévő információ teljes mennyiségét az egyes szimbólumok információs súlyának és a szimbólumnak a könyvben történő ismétlődéseinek szorzataként számítják ki:

A hossz mérésére olyan mértékegységek vannak, mint a milliméter, centiméter, méter, kilométer. Ismeretes, hogy a tömeget grammban, kilogrammban, centnerben és tonnában mérik. Az időfutást másodpercekben, percekben, órákban, napokban, hónapokban, években, évszázadokban fejezik ki. A számítógép információval dolgozik, és megfelelő mértékegységek is vannak a térfogatának mérésére.

Azt már tudjuk, hogy a számítógép minden információt észlel.

Bit- ez az információ minimális mértékegysége, amely egy bináris számjegynek ("0" vagy "1") felel meg.

Byte nyolc bitből áll. Egy bájt használatával a 256 lehetséges karakterből egy karaktert kódolhat (256 = 2 8). Így egy bájt egyenlő egy karakterrel, azaz 8 bittel:

1 karakter = 8 bit = 1 bájt.

A betűk, számok, írásjelek szimbólumok. Egy betű, egy szimbólum. Egy szám is egy karakter. Egy írásjel (akár pont, akár vessző, akár kérdőjel stb.) ismét egy karakter. Egy szóköz is egy karakter.

A számítógépes műveltség vizsgálata más, nagyobb információmérési egységek figyelembe vételével jár.

Bájttábla:

1 bájt = 8 bit

1 Kb (1 Kilobájt) = 2 10 bájt = 2*2*2*2*2*2*2*2*2*2 bájt =
= 1024 bájt (körülbelül 1 ezer bájt - 10 3 bájt)

1 MB (1 Megabájt) = 2 20 bájt = 1024 kilobájt (körülbelül 1 millió bájt - 10 6 bájt)

1 GB (1 gigabájt) = 2 30 bájt = 1024 megabájt (körülbelül 1 milliárd bájt - 10 9 bájt)

1 TB (1 Terabyte) = 240 bájt = 1024 gigabájt (körülbelül 1012 bájt). A terabyte-ot néha úgy hívják tonna.

1 Pb (1 Petabájt) = 2 50 bájt = 1024 terabájt (körülbelül 10 15 bájt).

1 exabyte= 260 bájt = 1024 petabájt (körülbelül 1018 bájt).

1 Zettabyte= 270 bájt = 1024 exabájt (körülbelül 1021 bájt).

1 Yottabyte= 2 80 bájt = 1024 zettabájt (körülbelül 10 24 bájt).

A fenti táblázatban a kettő hatványai (2 10 , 2 20 , 2 30 stb.) a kilobyte, megabyte, gigabyte pontos értékei. De a 10-es szám hatványai (pontosabban 10 3, 10 6, 10 9 stb.) már közelítő értékek lesznek, lefelé kerekítve. Így 2 10 = 1024 bájt egy kilobájt pontos értékét jelenti, 10 3 = 1000 bájt pedig egy kilobyte hozzávetőleges értékét.

Egy ilyen közelítés (vagy kerekítés) teljesen elfogadható és általánosan elfogadott.

Az alábbi egy bájttáblázat angol rövidítésekkel (a bal oldali oszlopban):

1 Kb ~ 10 3 b = 10*10*10 b= 1000 b – kilobájt

1 Mb ~ 10 6 b = 10*10*10*10*10*10 b = 1 000 000 b - megabájt

1 Gb ~ 10 9 b - gigabájt

1 Tb ~ 10 12 b - terabájt

1 Pb ~ 10 15 b - petabájt

1 Eb ~ 10 18 b - exabyte

1 Zb ~ 10 21 b - zettabyte

1 Yb ~ 10 24 b - yottabyte

Fent, a jobb oldali oszlopban találhatók az úgynevezett "tizedes előtagok", amelyeket nem csak a bájtoknál használnak, hanem az emberi tevékenység más területein is. Például a "kilo" előtag a "kilobyte" szóban ezer bájtot jelent, mint ahogy egy kilométer esetében ezer méternek, a kilogramm példájában pedig ezer grammnak felel meg.

Folytatjuk…

Felmerül a kérdés: van-e folytatása a bájttáblázatnak? A matematikában létezik a végtelen fogalma, amelyet fordított nyolcként jelölnek: ∞.

Nyilvánvaló, hogy a bájttáblázatban továbbra is hozzáadhat nullákat, vagy inkább hatványokat a 10-hez a következő módon: 10 27 , 10 30 , 10 33 és így tovább a végtelenségig. De miért van erre szükség? Elvileg, míg a terabájt és a petabájt elég. A jövőben talán még egy yottabyte sem lesz elég.

Végül néhány példa azokról az eszközökről, amelyek terabájt és gigabájtnyi információt tárolhatnak.

Van egy kényelmes "terabyte" - külső HDD amely keresztül kapcsolódik USB csatlakozó a számítógéphez. Egy terabájtnyi információt képes tárolni. Különösen kényelmes laptopokhoz (ahol a változás merevlemez problémás lehet) és Tartalékmásolat információ. Jobb előre megtenni. biztonsági mentések információ, nem azután, hogy minden eltűnt.

A flash meghajtók 1 GB, 2 GB, 4 GB, 8 GB, 16 GB, 32 GB, 64 GB és még 1 terabájtos méretben is kaphatók.

A szöveg információs mennyisége és az információ mértékegységei

Egy modern számítógép képes feldolgozni numerikus, szöveges, grafikus, hang- és videoinformációkat. A számítógépben az összes ilyen típusú információ bináris kódban jelenik meg, azaz csak két 0 és 1 szimbólumot használnak. Ez annak köszönhető, hogy kényelmes az információt elektromos impulzusok sorozata formájában ábrázolni: ott nincs impulzus (0), van impulzus (1).

Az ilyen kódolást általában binárisnak nevezik, magukat a nullák és egyesek logikai sorozatait pedig gépi nyelvnek.

Milyen hosszúnak kell lennie egy bináris kódnak ahhoz, hogy képes legyen kódolni a számítógép billentyűzetének karaktereit?

És így, az elegendő ábécé egy karakterének információs súlya 1 bájt.

Nagy mennyiségű információ mérésére nagyobb információegységeket használnak:

Az információ mennyiségének mértékegységei:

1 bájt = 8 bit

1 kilobyte = 1 KB = 1024 bájt

1 megabájt = 1 MB = 1024 KB

1 gigabájt = 1 GB = 1024 GB

A szöveg információs kötete

1. A könyv szereplőinek száma:

60 * 40 * 150 = 360 000 karakter.

2. Mert 1 karakter súlya 1 bájt, a könyv információs mennyisége

360 000 bájt.

3. Bájtok konvertálása nagyobb egységekre:

360 000 / 1024 = 351,56 KB

351,56 / 1024 = 0,34 MB

Válasz: A szöveg információs mennyisége 0,34 Mb.

Feladat:

A számítógép segítségével elkészített szöveg információs térfogata 3,5 Kb. Hány karaktert tartalmaz ez a szöveg?

1. Átalakítsuk a kötetet MB-ról bájtra:

3,5 MB * 1024 = 3584 KB

3584 KB * 1024 = 3 670 016 bájt

2. Mert 1 karakter súlya 1 bájt, a karakterek száma a szövegben

Információ mennyisége

Az információ mennyisége, mint a tudás bizonytalanságának csökkentésének mértéke.
(Értelmes megközelítés az információ mennyiségének meghatározásához)

A környező világ megismerési folyamata az információk tudás formájában történő felhalmozódásához vezet (tények, tudományos elméletek stb.). Az új információk megszerzése a tudás növekedéséhez, vagy ahogy néha mondják, a tudás bizonytalanságának csökkenéséhez vezet. Ha egy bizonyos üzenet tudásunk bizonytalanságának csökkenéséhez vezet, akkor azt mondhatjuk, hogy egy ilyen üzenet információt tartalmaz.

Például egy teszt sikeres teljesítése vagy egy teszt teljesítése után bizonytalanság gyötör, nem tudod, milyen osztályzatot kaptál. Végül a tanár kihirdeti az eredményeket, és a kettő közül egyet kapsz információs üzenetek: "megfelelt" vagy "nem sikerült", és a teszt után a négy tájékoztató üzenet egyike: "2", "3", "4" vagy "5".

A kredit elbírálásáról szóló tájékoztató üzenet az ismeretei bizonytalanságának kétszeres csökkenéséhez vezet, mivel két lehetséges tájékoztató üzenet egyike érkezett. Tájékoztató üzenet a(z) értékelésről teszt négyszeresére csökkenti tudásának bizonytalanságát, mivel a négy lehetséges információs üzenet egyike érkezik.

Nyilvánvaló, hogy minél bizonytalanabb a kezdeti helyzet (minél több információs üzenet lehetséges), annál több új információt kapunk az információs üzenet kézhezvételekor (annál többször csökken a tudás bizonytalansága).

Az információ mennyisége az információs üzenetek fogadásakor a tudás bizonytalanságát csökkentő intézkedésnek tekinthető.

Az információnak, mint a tudás bizonytalanságának csökkentésének mérőszámának fentebb tárgyalt megközelítése lehetővé teszi az információ mennyiségi mérését. Van egy képlet, amely összekapcsolja a lehetséges N információs üzenetek számát és az I információ mennyiségét, amelyet a fogadott üzenet hordoz:

N = 2 i

(1.1)

Bit. Bármely mennyiség számszerűsítéséhez először meg kell határoznia a mértékegységet. Tehát a hossz méréséhez egy métert választanak egységként, a tömeg mérésére - egy kilogrammot stb. Hasonlóképpen, az információ mennyiségének meghatározásához meg kell adni egy mértékegységet.

Mögött információs egység az információs üzenetben foglalt információmennyiség érkezik, ami a felére csökkenti a tudás bizonytalanságát. Ezt az egységet hívják bit.

Ha visszatérünk egy információs üzenet fogadásához a fent vizsgált eltolás eredményéről, akkor itt a bizonytalanság csak a felére csökken, és így az üzenet által hordozott információ mennyisége 1 bit.

Származtatott mértékegységek az információ mennyiségének mérésére. Az információmennyiség mérésének minimális mértékegysége a bit, a következő legnagyobb mértékegység pedig a bájt, és:

1 bájt = 8 bit = 2 3 bit.

A számítástechnikában a több mértékegység oktatásának rendszere némileg eltér a legtöbb tudományban elfogadotttól. A hagyományos metrikus mértékegységrendszerek, mint például a Nemzetközi Mértékegységrendszer SI, 10 n-es tényezőt használnak a többszörös mértékegységek többszöröseként, ahol n = 3, 6, 9 stb., ami a "Kilo" decimális előtagoknak felel meg ( 10 3), "Mega" (10 6), "Giga" (10 9) stb.

A számítógépben az információ kódolása bináris előjelrendszerrel történik, ezért az információmennyiség mérésének több egységében a 2 n együtthatót használják.

Tehát az információ mennyiségének mértékegységeit, amelyek egy bájt többszörösei, a következőképpen kell megadni:

1 kilobyte (KB) = 2 10 bájt = 1024 bájt;

1 megabájt (MB) = 2 10 KB = 1024 KB;

1 gigabájt (GB) = 2 10 MB = 1024 MB.

Ellenőrző kérdések

Az információ mennyiségének meghatározása

Az információs üzenetek számának meghatározása. Az (1.1) képlet alapján könnyen meghatározható a lehetséges információs üzenetek száma, ha az információ mennyisége ismert. Például egy vizsgán vesz egy vizsgajegyet, és a tanár jelenti, hogy a számáról szóló vizuális információs üzenet 5 bitnyi információt hordoz. Ha meg akarja határozni a vizsgajegyek számát, akkor elegendő az (1.1) képlet segítségével meghatározni a számukra vonatkozó lehetséges tájékoztató üzenetek számát:

Így a vizsgajegyek száma 32 db.

Az információ mennyiségének meghatározása. Ellenkezőleg, ha ismert az információs üzenetek lehetséges száma N, akkor az üzenet által hordozott információ mennyiségének meghatározásához meg kell oldani az I egyenletet.

Képzelje el, hogy Ön irányítja a robot mozgását, és beállíthatja mozgásának irányát információs üzenetekkel: "észak", "északkelet", "kelet", "délkelet", "dél", "délnyugat", "nyugat" és „északnyugat” (1.11. ábra). Mennyi információt kap a robot minden üzenet után?

Összesen 8 lehetséges információs üzenet van, így az (1.1) képlet I egyenlet alakját veszi fel:

Az egyenlet bal oldalán található 8-as számot faktorokra bontjuk, és hatványalakban ábrázoljuk:

8 = 2 × 2 × 2 = 2 3 .

A mi egyenletünk:

Az egyenlet bal és jobb részének egyenlősége akkor igaz, ha a 2-es szám kitevői egyenlőek, így I = 3 bit, azaz az információ mennyisége, amelyet minden információs üzenet a robothoz visz, 3 bit.

Az információmennyiség meghatározásának alfabetikus megközelítése

Az információmennyiség meghatározásának alfabetikus megközelítésével az ember elvonatkoztat az információ tartalmától, és egy információs üzenetet egy bizonyos jelrendszer jeleinek sorozatának tekint.

A jel információs kapacitása. Képzeljük el, hogy információs üzenetet kell továbbítani egy információátviteli csatornán a feladótól a címzetthez. Legyen az üzenet kódolása olyan jelrendszerrel, amelynek ábécéje N karakterből áll (1, ..., N). A legegyszerűbb esetben, ha az üzenet kódjának hossza egy karakter, a feladó N lehetséges üzenet egyikét küldheti "1", "2", ..., "N", amely az I ( 1.5. ábra).

Rizs. 1.5. Információ átadása

Az (1.1) képlet összekapcsolja a lehetséges N információs üzenetek számát és az I információ mennyiségét, amelyet a fogadott üzenet hordoz. Ekkor a vizsgált helyzetben N a jelrendszer ábécéjének karaktereinek száma, I pedig az egyes karakterek által hordozott információ mennyisége:

Ezzel a képlettel például meghatározhatja az információ mennyiségét, amelyet egy jel hordoz egy bináris jelrendszerben:

N = 2 => 2 = 2 I => 2 1 = 2 I => I = 1 bit.

Így egy bináris jelrendszerben egy jel 1 bit információt hordoz. Érdekes, hogy maga az információmennyiség mértékegysége a "bit" (bit) az angol "Binary digiT" - "bináris számjegy" kifejezésből kapta a nevét.

A kettõs jelrendszer jelének információs kapacitása az 1 bit

Minél több karaktert tartalmaz a jelrendszer ábécéje, annál több információt hordoz egy karakter. Példaként határozzuk meg, hogy az orosz ábécé egy betűje mennyi információt hordoz. Az orosz ábécé 33 betűt tartalmaz, de a gyakorlatban gyakran csak 32 betűt használnak üzenetek küldésére (a "ё" betű kizárva).

Az (1.1) képlet segítségével meghatározzuk az orosz ábécé egy betűje által hordozott információ mennyiségét:

N = 32 => 32 = 2 I => 2 5 = 2 I => I = 5 bit.

Így az orosz ábécé egy betűje 5 bit információt hordoz (az információ mennyiségének ábécé szerinti megközelítésével).

A jel által hordozott információ mennyisége az átvétel valószínűségétől függ. Ha a címzett előre tudja, hogy pontosan melyik karakter érkezik, akkor a kapott információ mennyisége 0 lesz. Ezzel szemben minél kisebb valószínűséggel érkezik a karakter, annál nagyobb az információs kapacitása.

Az orosz írott beszédben a betűk szövegbeli használatának gyakorisága eltérő, így átlagosan 200 "a" betű jut egy értelmes szöveg 1000 karakterére, és százszor kevesebb "f" betű (csak 2). Így információelméleti szempontból az orosz ábécé jeleinek információs kapacitása eltérő (az "a" betű a legkisebb, az "f" betű a legnagyobb).

Az üzenetben található információ mennyisége. Az üzenet karakterek sorozatából áll, amelyek mindegyike bizonyos mennyiségű információt hordoz.

Ha a karakterek azonos mennyiségű információt hordoznak, akkor az üzenetben lévő I c információ mennyiségét úgy számíthatjuk ki, hogy az egy karakter által hordozott I c információ mennyiségét megszorozzuk a kód hosszával (az üzenetben lévő karakterek számával) K:

I c \u003d I s × K

Tehát egy bináris számítógépes kód minden számjegye 1 bitben hordoz információt. Ezért két számjegy 2 bitben, három számjegy 3 bitben stb. hordoz információt. A bitekben lévő információ mennyisége megegyezik egy bináris számítógépes kód számjegyeinek számával (1.1. táblázat).

1.1. táblázat. Egy bináris számítógépes kód által hordozott információ mennyisége

És sok más fogalom a legközvetlenebb kapcsolatban áll egymással. Manapság nagyon kevés felhasználó van kellően jártas ezekben a kérdésekben. Próbáljuk meg tisztázni, mi az ábécé ereje, hogyan kell kiszámítani és a gyakorlatban alkalmazni. A jövőben ez kétségtelenül hasznos lehet a gyakorlatban.

Hogyan történik az információ mérése

Mielőtt folytatnánk annak a kérdésnek a tanulmányozását, hogy mi az ábécé ereje, és általában mi is az, úgymond az alapoktól kell kiindulnunk.

Bizonyára mindenki tudja, hogy ma már speciális rendszerek léteznek bármilyen referenciaértéken alapuló mennyiség mérésére. Például távolságok és hasonló mennyiségek esetén ezek méterek, tömeg és súly - kilogramm, időintervallumok - másodpercek stb.

De hogyan mérjük az információt a szöveg mennyiségével? Erre vezették be az ábécé számosságának fogalmát.

Mi az ábécé ereje: a kezdeti koncepció

Tehát, ha követjük azt az általánosan elfogadott szabályt, hogy egy mennyiség végső értéke olyan paraméter, amely meghatározza, hogy a referenciaegység hányszor kerüljön a mért értékbe, akkor arra a következtetésre juthatunk, hogy az ábécé hatványa a felhasznált szimbólumok teljes száma. egy adott nyelvhez.

Az egyértelműség kedvéért egyelőre hagyjuk félre az ábécé erejének megtalálásának kérdését, és figyeljünk magukra a szimbólumokra, természetesen a szemszögből. információs technológiák. Nagyjából elmondható, hogy a használt szimbólumok teljes listája betűket, számokat, mindenféle zárójeleket, Különleges szimbólumok, írásjelek stb. Ha azonban megközelítjük azt a kérdést, hogy mi is pontosan az ábécé ereje számítógéppel, ennek tartalmaznia kell egy szóközt is (egyetlen hézag a szavak vagy más karakterek között).

Vegyük például az orosz nyelvet, vagy inkább a billentyűzetkiosztást. A fentiek alapján a teljes lista 33 betűt, 10 számot és 11 speciális karaktert tartalmaz. Így az ábécé teljes hatványa 54.

Szimbólum információ súlya

azonban általános koncepció Az ábécé ereje nem határozza meg a betűket, számokat és szimbólumokat tartalmazó szöveg információmennyiségének kiszámításának lényegét. Ez speciális megközelítést igényel.

Elvileg gondolj bele, nos, itt mennyi lehet a minimumkészlet abból a szempontból számítógépes rendszer hány karaktert tartalmazhat? Válasz: kettő. És ezért. Az tény, hogy minden karakternek, legyen az betű vagy szám, megvan a maga információs súlya, ami alapján a gép felismeri, mi van előtte. De a számítógép csak az egyesek és nullák formájában történő ábrázolást érti, amelyre valójában az egész számítástechnika alapszik.

Így bármely karakter ábrázolható 1-et és 0-t tartalmazó sorozatként, vagyis a betűt, számot vagy szimbólumot jelölő minimális sorozat két összetevőből áll.

Maga az információsúly, szabványnak tekintve információs egység a mérést bitnek (1 bit) nevezzük. Ennek megfelelően 8 bit alkot 1 bájtot.

Karakterek ábrázolása bináris kódban

Szóval, azt hiszem, hogy mi az ábécé ereje, az már egy kicsit világos. Most nézzünk egy másik szempontot, különösen a hatalom gyakorlati ábrázolását az egyszerűség kedvéért vegyünk példának egy mindössze 4 karakterből álló ábécét.

Egy kétjegyű bináris kódban a sorozat és információs megjelenítésük a következőképpen írható le:

Sorozatszám
bináris kód

Ezért - a legegyszerűbb következtetés: az N=4 ábécé hatványa mellett egyetlen karakter súlya 2 bit.

Ha háromjegyű bináris kódot használ az ábécéhez, például 8 karakterből, a kombinációk száma a következő lenne:

Sorozatszám
bináris kód

Más szóval, ha az ábécé kapacitása N=8, egy karakter súlya egy háromjegyű bináris kódban 3 bit lesz.

ábécé, és használja számítógépes kifejezésben

Most próbáljuk meg megnézni a függőséget, amely a kód karaktereinek számát és az ábécé hatványát fejezi ki. A képlet, ahol N az ábécé alfabetikus hatványa, b pedig a bináris kód karaktereinek száma, így fog kinézni:

Vagyis 2 1 =2, 2 2 =4, 2 3 =8, 2 4 =16 stb. Nagyjából a bináris kód kívánt karakterszáma a karakter súlya. Információkat tekintve ez így néz ki:

Információmennyiség mérése

Ezek azonban csak a legegyszerűbb példák voltak, hogy úgy mondjam, hogy először megértsük, mi az ábécé ereje. Menjünk közvetlenül a gyakorlathoz.

A gépelés számítástechnika fejlesztésének ebben a szakaszában, figyelembe véve a nagybetűket, a nagybetűket és a cirill és latin betűket, az írásjeleket, a zárójeleket, a számtani jeleket stb. 256 karakter van felhasználva. Abból a tényből kiindulva, hogy a 256 az 2 8, könnyen kitalálható, hogy egy ilyen ábécé minden karakterének súlya 8, azaz 8 bit vagy 1 bájt.

Minden ismert paraméter alapján könnyen megkaphatjuk bármely szöveg információmennyiségének értékét, amelyre szükségünk van. Például van egy számítógépes szövegünk, amely 30 oldalt tartalmaz. Egy oldal 50 sort tartalmaz 60 karakterből vagy szimbólumból, beleértve a szóközöket.

Így egy oldal 50 x 60 = 3000 bájt információt tartalmaz, a teljes szöveg pedig 3000 x 50 = 150 000 bájtot. Mint látható, még a kis szövegeket is kényelmetlen bájtban mérni. Mi a helyzet az egész könyvtárakkal?

BAN BEN ez az eset jobb a hangerőt erősebb értékekké konvertálni - kilobájt, megabájt, gigabájt stb. Annak alapján, hogy például 1 kilobyte egyenlő 1024 bájttal (2 10), egy megabájt pedig 2 10 kilobájttal (1024 kilobájt), könnyen kiszámítható, hogy az információs-matematikai kifejezésben szereplő szöveg mennyisége a példánk a következő lesz: 150000/1024=146, 484375 kilobájt vagy körülbelül 0,14305 megabájt.

Utószó helyett

Nagyjából ez röviden, és minden, ami annak a kérdésnek a mérlegelésére vonatkozik, hogy mi az ábécé ereje. Hozzá kell tenni, hogy ez a leírás tisztán matematikai megközelítést alkalmaz. Magától értetődik, hogy a szöveg szemantikai terhelését ebben az esetben nem veszik figyelembe.

De ha olyan pozícióból közelítjük meg a mérlegelés kérdéseit, amely az embernek megérteni valót ad, akkor ebben a tekintetben értelmetlen kombinációk vagy karaktersorozatok halmaza nulla információterheléssel bír, bár az információ fogalma szempontjából. kötet, az eredmény még kiszámítható.

Általánosságban elmondható, hogy az ábécé erejével és a kapcsolódó fogalmakkal kapcsolatos ismereteket nem olyan nehéz megérteni, és egyszerűen alkalmazhatók gyakorlati cselekvések értelmében. Ugyanakkor minden felhasználó szinte minden nap szembesül ezzel. Elég csak a népszerűt idézni szószerkesztő vagy bármely más azonos szintű, amely ilyen rendszert használ. De ne keverje össze a szokásos Jegyzettömbbel. Itt kisebb az ábécé ereje, hiszen mondjuk a nagybetűket nem használjuk gépeléskor.

Tematikus anyagok: