Neurális hálózatok statisztikai példában. STATISTICA Automatizált neurális hálózatok Automatizált neurális hálózatok. Ipari statisztika. Minőségellenőrzés, folyamatelemzés, kísérlettervezés a STATISTICA csomagban

Szerkesztette: V.P. Borovikov

2. kiadás, átdolgozva. és további

2008 G.

Példányszám 1000 példány.

Formátum 70x100/16 (170x240 mm)

Változat: puhakötésű

ISBN 978-5-9912-0015-8

BBC 32.973

UDC 004.8.032.26

annotáció

Bemutatjuk a STATISTICA Neural Networks csomag (StatSoft gyártó) használatán alapuló, teljes mértékben az orosz felhasználók számára adaptált neurális hálózati módszereket adatelemzéshez. A neurális hálózatok elméletének alapjai adottak; nagy figyelmet fordítanak a gyakorlati problémák megoldására, átfogóan átgondolják a STATISTICA Neural Networks csomag segítségével végzett kutatások módszertanát és technológiáját, amely egy hatékony adatelemzési és előrejelzési eszköz. széles körű alkalmazások az üzleti életben, az iparban, a menedzsmentben, a pénzügyekben. A könyv számos példát tartalmaz adatelemzésre, gyakorlati ajánlásokat az elemzéshez, előrejelzéshez, osztályozáshoz, mintázatfelismeréshez, gyártási folyamatok irányításához neurális hálózatok segítségével.

A bankszektor, az ipar, a közgazdaságtan, az üzleti élet, a feltárás, a menedzsment, a közlekedés és más területeken kutatással foglalkozó olvasók széles körének.

Előszó a második kiadáshoz

Bevezetés. Meghívás a neurális hálózatokhoz

1. fejezet AZ ADATELEMZÉS ALAPVETŐ FOGALMAI

2. fejezet BEVEZETÉS A VALÓSZÍNŰSÉG-ELMÉLETBE

3. fejezet BEVEZETÉS A NEURÁLIS HÁLÓZATOK ELMÉLETÉBE

4. fejezet A NEURÁLIS HÁLÓZATOK ÁTTEKINTÉSE
Párhuzamok a biológiából
Alapvető mesterséges modell
Neurális hálózatok alkalmazása
Elő- és utófeldolgozás
Többrétegű perceptron
Sugárirányú alapfüggvény
Valószínűségi neurális hálózat
Általános regressziós neurális hálózat
Vonalhálózat
Kohonen hálózat
Osztályozási feladatok
Regressziós feladatok
Idősoros előrejelzés
Változók kiválasztása és méretcsökkentés

5. fejezet AZ ELSŐ LÉPÉSEK A STATISTIKA NEURÁLIS HÁLÓZATÁBAN
Elkezdeni
Hozzon létre egy adatkészletet
Hozzon létre egy új hálózatot
Hozzon létre egy adatkészletet és hálózatot
Hálózati képzés
Neurális hálózat futtatása
Osztályozás elvégzése

6. fejezet A NEURÁLIS HÁLÓZATOK TOVÁBBI KÉPESSÉGEI
Klasszikus példa: Fisher íriszek
Keresztellenőrző képzés
Leállási feltételek
Regressziós feladatok megoldása
Radiális bázisfüggvények
Lineáris modellek
Kohonen hálózatok
Valószínűségi és általánosított regressziós hálózatok
Hálózatépítő
Genetikai algoritmus a bemeneti adatok kiválasztásához
Idősorok

7. fejezet
Adatábrázolás
Hasznos bemeneti változók kinyerése.
Lekicsinyítés
A hálózati architektúra megválasztása
Egyedi hálózati architektúrák
Idősorok

8. fejezet ESETTANULMÁNYOK
1. példa Leépítés egy geológiai intézetben
2. példa: Mintafelismerés
3. példa Kétdimenziós halmazok nemlineáris osztályozása
4. példa Különféle tüzelőanyag-minták szegmentálása laboratóriumi adatok szerint
5. példa: Viselkedési pontozási modell felépítése
6. példa Függvények közelítése
7. példa: Az olajértékesítés előrejelzése
8. példa: Monitoring és előrejelzés
hőmérsékleti feltételek a telepítésnél
9. példa Digitális aláírás érvényességének meghatározása

9. fejezet GYORS ÚTMUTATÓ
Adat
hálózatok
Hálózati képzés
Más típusú hálózatok
Hálózatépítés
Eredmények küldése a STATISTICA részére

10. fejezet: KLASSZIKUS MÓDSZEREK A NEURÁLIS HÁLÓZATOK ALTERNATÍVÁJA
Klasszikus diszkriminanciaanalízis a STATISTICA-ban
Osztályozás
logit regresszió
Faktorelemzés a STATISTICA-ban

11. fejezet ADATBÁNYÁSZAT A STATISTIKÁBAN

1. függelék Kódgenerátor

2. melléklet A STATISTICA integrálása ERP rendszerekkel

Bibliográfia

Tárgymutató

Megjegyzés: Neurális hálózatok és statisztikák. Neurális hálózatok és fuzzy logika. Neurális hálózatok és szakértői rendszerek. Neurális hálózatok és statisztikai fizika.

Az állatokat a következőkre osztják:

a császáré

bebalzsamozott

megszelídített,

balekok,

szirénák,

mesés,

egyéni kutyák,

szerepel ebben az osztályozásban

rohan, mint az őrült

számtalan,

a legfinomabb teveszőrkefével rajzolva,

mások,

virágvázát törni

legyekre emlékeztető távolságból.

H. L. Borges: John Wilkins elemző nyelve

A neurocomputing számos érintkezési ponttal rendelkezik más tudományágakkal és azok módszereivel. Különösen a neurális hálózatok elmélete használja a statisztikai mechanika és az optimalizációs elmélet apparátusát. A neurocomputing alkalmazási területei olykor erősen keresztezik vagy szinte egybeesnek a matematikai statisztika, a fuzzy halmazelmélet és a szakértői rendszerek alkalmazási területeivel. A neurocomputing összefüggései és párhuzamai rendkívül sokrétűek, és egyetemességéről tanúskodnak. Ebben a kiegészítőnek tekinthető előadásban, mivel egy kicsit több matematikai alapismeretet igényel, ezek közül csak a legfontosabbakról lesz szó.

Neurális hálózatok és statisztikák

Mivel a neurális hálózatokat ma már sikeresen használják adatelemzésre, célszerű összehasonlítani őket régi, jól kidolgozott statisztikai módszerekkel. A statisztikával foglalkozó irodalomban olykor találkozhatunk azzal az állítással, hogy a leggyakrabban használt neurális hálózati megközelítések nem mások, mint nem hatékony regressziós és diszkrimináns modellek. Ezt már korábban megjegyeztük többrétegű neurális hálózatok valóban képes megoldani az olyan problémákat, mint a regresszió és az osztályozás. Azonban először is a neurális hálózatok által végzett adatfeldolgozás sokkal változatosabb – ne feledjük például a Hopfield hálózatok vagy a Kohonen jellemzőtérképek általi aktív osztályozást, amelyeknek nincs statisztikai analógja. Másodszor, a neurális hálózatok pénzügyekben és üzleti életben való felhasználásával kapcsolatos számos tanulmány feltárta előnyeiket a korábban kifejlesztett statisztikai módszerekkel szemben. Tekintsük részletesebben a neurális hálózatok és a matematikai statisztika módszereinek összehasonlításának eredményeit.

A neurális hálózatok leíró nyelv?

Mint már említettük, egyes statisztikusok azzal érvelnek, hogy az adatfeldolgozás neurális hálózati megközelítéseit egyszerűen újra felfedezik és újrafogalmazzák, de jól ismert statisztikai elemzési módszerek. Más szavakkal, a neurocomputing egyszerűen egy új nyelvet használ a régi tudás leírására. Példaként álljon itt egy idézet Warren Searle-től:

Sok neurális hálózatkutató mérnök, fizikus, neurofiziológus, pszichológus vagy informatikus, akik keveset tudnak a statisztikákról és a nemlineáris optimalizálásról. A neurális hálózatok kutatói folyamatosan újra felfedezik azokat a módszereket, amelyek évtizedek, évszázadok óta ismertek a matematikai és statisztikai irodalomban, de gyakran nem értik, hogyan működnek.

Ez a nézőpont első pillantásra ésszerűnek tűnhet. A neurális hálózatok formalizmusa valóban képes egy univerzális nyelv szerepét kivívni. Nem véletlen, hogy már McCulloch és Pitts úttörő munkájában kimutatták, hogy a neurális hálózat leírása egyenértékű a propozíciós logika leírásával.

Tulajdonképpen azt tapasztaltam, hogy az általam 1961-ben kifejlesztett technikával (...) könnyedén meg tudtam válaszolni mindazokat a kérdéseket, amelyeket agyszakértők (...) vagy informatikusok tesznek fel nekem. Fizikusként azonban jól tudtam, hogy egy mindent megmagyarázó elmélet valójában nem magyaráz meg semmit: a legjobb esetben is egy nyelv. Eduardo Caianello

Ezért nem meglepő, hogy a statisztikusok gyakran úgy találják, hogy az általuk megszokott fogalmaknak megvannak megfelelőik a neurális hálózatok elméletében. Warren Searle összeállított egy kis szószedetet az e két területen használt kifejezésekről.

11.1. táblázat. Hasonló kifejezések szószedete

Neurális hálózatok	Statisztikai módszerek.
jelek	változók
bemenetek	független változók
kilép	előrejelzett értékek
célértékek	függő változók
hiba	eltérés
tanulás, alkalmazkodás, önszerveződés	fokozat
hibafüggvény, Ljapunov függvény	értékelési kritérium
edzés képek (párok)	megfigyelések
hálózati paraméterek: súlyok, küszöbök.	Becsült paraméterek
magas rendű neuronok	interakciók
funkcionális kapcsolatok	átalakítás
felügyelt tanulás vagy heteroasszociáció	regressziós és diszkriminanciaanalízis
felügyelet nélküli tanulás vagy auto-asszociáció	adattömörítés
versenyképes tanulás, adaptív vektorkvantálás	klaszteranalízis
általánosítás	interpoláció és extrapoláció

Mi a különbség a neurális hálózatok és a statisztika között?

Milyen hasonlóságok és különbségek vannak a neurocomputing és a statisztika nyelvei között az adatelemzésben? Nézzük a legegyszerűbb példát.

Tegyük fel, hogy megfigyeléseket végeztünk és kísérletileg megmértünk N olyan pontpárt, amelyek a funkcionális függést reprezentálják. Ha ezeken a pontokon keresztül próbáljuk meghúzni a legjobb egyenest, ami a statisztika nyelvén azt jelentené, hogy lineáris modellt használunk az ismeretlen függés leírására , (ahol a megfigyelés közbeni zajt jelöli), akkor a megfelelő lineáris regressziós probléma megoldása. a paraméterek becsült értékének megtalálására csökken, minimalizálva a négyzetes maradékok összegét.

Ha a és a paraméterek megtalálhatók, akkor meg lehet becsülni y értékét bármely x értékre, azaz interpolálni és extrapolálni az adatokat.

Ugyanez a probléma megoldható a használatával egyrétegű hálózat egyetlen bemenettel és egyetlen lineáris kimeneti neuronnal. Az a csatlakozási súly és a b küszöbérték ugyanazon maradványérték minimalizálásával (amely a ez az esetátlagos négyzetes hibának nevezzük) a hálózati betanítás során, például a backpropagation módszerrel. A neurális hálózat általánosító tulajdonságát ezután a rendszer a kimeneti érték előrejelzésére használja a bemeneti értékből.

Rizs. 11.1.

E két megközelítés összehasonlításakor rögtön szembeötlő, hogy módszereik leírásánál a statisztika képletekre és egyenletekre, a neurocomputing pedig a neurális architektúrák grafikus leírására utal.

Ha felidézzük, hogy a bal agyfélteke képletekkel és egyenletekkel, a jobb félteke pedig grafikus képekkel operál, akkor megérthetjük, hogy a statisztikával összehasonlítva ismét megjelenik a neurális hálózatos megközelítés "jobb féltekéje".

További lényeges különbség, hogy a statisztikai módszereknél nem mindegy, hogyan minimalizálják az eltérést - mindenesetre a modell változatlan marad, míg a neurocomputing esetében a betanítási módszeré a főszerep. Más szavakkal, a neurális háló megközelítéssel ellentétben a statisztikai módszerek modellparamétereinek becslése nem függ minimalizálási módszer. Ugyanakkor a statisztikusok figyelembe veszik a reziduum formájában bekövetkezett változtatásokat, mondjuk az által

A modell alapvető változásaként.

Ellentétben a neurális hálózatos megközelítéssel, amelyben a fő időt a hálózatok betanítása veszi el, a statisztikai megközelítéssel ez az idő a probléma alapos elemzésére telik. Ugyanakkor a statisztikusok tapasztalatait felhasználva az adott területre jellemző adatok, információk elemzése alapján választanak ki modellt. A neurális hálózatok - ezek az univerzális közelítők - használata általában előzetes tudás nélkül történik, bár bizonyos esetekben nagyon hasznos. Például a vizsgált lineáris modell esetében a négyzetes közép hiba használata a paraméterek optimális becsléséhez vezet, ha a zajérték normális eloszlású, és minden tanítási pár esetében azonos szórással. Ugyanakkor, ha ismert, hogy ezek az eltérések eltérőek, akkor a súlyozott hibafüggvényt kell használni

Lényegesen jobb paraméterértékeket tud adni.

Amellett, hogy figyelembe a legegyszerűbb modell példákat lehet hozni más, bizonyos értelemben egyenértékű statisztikai és neurális hálózati paradigmákra

A Hopfield hálózatnak nyilvánvaló kapcsolata van az adatklaszterezéssel és a faktoranalízissel.

Faktoranalízis az adatstruktúra vizsgálatára szolgál. Fő előfeltétele az ilyen jelek létezésének feltételezése - olyan tényezők, amelyek közvetlenül nem figyelhetők meg, de több megfigyelhető elsődleges jelből megbecsülhetők. Így például az olyan jellemzők, mint a termelés volumene és az állóeszközök költsége meghatározhatnak olyan tényezőt, mint a termelés mértéke. A képzést igénylő neurális hálózatokkal ellentétben a faktoranalízis csak bizonyos számú megfigyeléssel működik. Bár elvileg az ilyen megfigyelések számának csak eggyel többnek kellene lennie, mint a változók számának, ajánlatos legalább háromszor annyi értéket használni. Ez még mindig kisebbnek tekinthető, mint a neurális hálózat képzési halmazának mérete. Ezért a statisztikusok rámutatnak a faktoranalízis azon előnyére, hogy kevesebb adatot használnak fel, és ezáltal gyorsabb modellgenerálást eredményeznek. Ez ráadásul azt is jelenti, hogy a faktorelemzési módszerek megvalósítása kisebb teljesítményű számítási eszközöket igényel. A faktoranalízis másik előnye, hogy fehérdobozos módszer, i.e. teljesen nyitott és érthető - a felhasználó könnyen megértheti, hogy a modell miért ad egy adott eredményt. A faktoranalízis kapcsolata a Hopfield-modellel jól látható a vektorok emlékezetében minimális alapon megfigyelések sorozatához (memóriaképek – lásd 5. előadás). Ezek a vektorok analógjai azoknak a tényezőknek, amelyek egyesítik a memóriavektorok különböző összetevőit - az elsődleges jellemzőket.

Méret: px

Megjelenítés indítása oldalról:

átirat

2 UDC BBK N45 N45 Neurális hálózatok. STATISTICA Neurális hálózatok: A modern adatelemzés módszertana és technológiái / Szerk.: V. P. Borovikov. 2. kiadás, átdolgozva. és további M.: Forródrót Telecom, s, ill. ISBN A STATISTICA Neural Networks (StatSoft gyártó) csomag használatán alapuló, az orosz felhasználók számára teljes mértékben adaptált neurális hálózati adatelemzési módszereket vázoljuk. A neurális hálózatok elméletének alapjai adottak; Nagy figyelmet fordítanak a gyakorlati problémák megoldására, átfogóan átgondolják a STATISTICA Neural Networks csomag segítségével végzett kutatások módszertanát és technológiáját, amely egy hatékony adatelemzési és előrejelzési eszköz, amely széleskörű alkalmazási területet jelent az üzleti életben, az iparban, a menedzsmentben és a pénzügyekben. A könyv számos példát tartalmaz adatelemzésre, gyakorlati ajánlásokat az elemzéshez, előrejelzéshez, osztályozáshoz, mintázatfelismeréshez, gyártási folyamatok irányításához neurális hálózatok segítségével. A bankszektor, az ipar, a közgazdaságtan, az üzleti élet, a feltárás, a menedzsment, a közlekedés és más területeken kutatással foglalkozó olvasók széles körének. A kiadó címe az interneten. Mikhin Az eredeti elrendezés elkészítése E.V. Kormakova Borító: művész V.G. Sitnikov Nyomtatásra aláírva Formátum70 100/16. Konv. szerk. l. 32.5. Kiadja a "Hot Line Telecom" Tudományos és Műszaki Kiadó Nyomtatva a "Til-2004" nyomdában. Rendelés 05 ISBN STATISTICA Neurális hálózatok (SNN), 2008 V. P. Borovikov, 2008 Tervezés a "Hot Line Telecom" kiadótól, 2008

3 Előszó a második kiadáshoz Az elismert könyv második kiadását jelentősen bővítették és átdolgozták. Új fejezetek születtek az adatelemzés, a valószínűségszámítás és a neurális hálózatelmélet bevezetéséről. Az ezekben a fejezetekben található anyagok lehetővé teszik a neurális hálózatok használatának módszertanának mély megértését. Jelenleg a neurális hálózatokat intenzíven használják a bankszektorban, az iparban, a marketingben, a közgazdaságtanban, az orvostudományban és más területeken, ahol előrejelzésre és az adatok mélyreható megértésére van szükség. Általánosan elfogadott, hogy a neurális hálózatok természetes kiegészítői a klasszikus elemzési módszereknek, és ott használják, ahol a standard eljárások nem adják meg a kívánt hatást. A STATISTICA Neural Networks az egyetlen szoftvertermék a világon a neurális hálózatok kutatására, teljes mértékben orosz nyelvre lefordítva. Ez azt jelenti, hogy a teljes felület (több tucat párbeszédpanel és kutatási forgatókönyv) és a STATIST1CA Neural Networks súgórendszere le van fordítva oroszra, és egyetlen környezetben érhető el a felhasználó számára. A klasszikus elemzési módszerekről egy további fejezetet is beépítettünk a könyvbe, amely lehetővé teszi az olvasó számára a különböző megközelítések összehasonlítását. A könyv külön fejezetet szentel az adatbányászati módszereknek, a klasszikus és neurális hálózati modelleket ötvöző modern adatelemzési technológiáknak. A StatSoft Oroszország alkalmazottai részt vettek a könyv kidolgozásában: B.C. Pactunkov, A.K. Petrov, V.A. Panov. Mindannyiuknak őszinte köszönetünket fejezzük ki. Külön köszönet illeti Ljudmila Ekatovát a kézirat publikálásra való előkészítésében végzett kemény és fáradságos munkájáért. A StatSoft Oroszország tudományos igazgatója V.P. Borovikov

4 Bevezetés Meghívás a neurális hálózatokhoz Az elmúlt néhány évben jelentősen megnőtt az érdeklődés a neurális hálózatok iránt: a pénzügyekben, az üzleti életben, az orvostudományban, az iparban, a mérnöki munkában, a kutatásban és más területeken használják őket. A neurális hálózatokat mindenhol használják, ahol előrejelzési, osztályozási vagy szabályozási problémákra van szükség, mivel szinte minden olyan helyzetben alkalmazhatók, ahol kapcsolat van a prediktor változók (bemeneti változók) és az előrejelzett változók (kimeneti változók) között, még akkor is, ha ez a kapcsolat összetett jellegű. és nehéz konvencionális kifejezésekkel kifejezni a csoportok közötti összefüggéseket vagy különbségeket. A neurális hálózati módszerek önállóan is használhatók, vagy nagyszerű kiegészítésként szolgálhatnak hagyományos módszerek adatelemzés. A legtöbb statisztikai módszer bizonyos feltételezéseken és elméleti következtetéseken alapuló modellek felépítéséhez kapcsolódik (például abból a feltételezésből, hogy a kívánt kapcsolat lineáris, vagy a változók normális eloszlásúak). A neurális háló megközelítés mentes a modellkényszerektől, egyformán alkalmas lineáris és összetett nemlineáris kapcsolatokra, és különösen hatékony a feltáró adatelemzésben, amikor azt kell kideríteni, hogy a változók között egyáltalán van-e kapcsolat. A neurális hálózatok ereje az öntanulási képességükben rejlik. Az edzési eljárás a szinaptikus súlyok beállításából áll a veszteségfüggvény minimalizálása érdekében. Ez a könyv a STATISTICA Neural Networks csomagot használja neurális hálózatok felépítéséhez, amely kényelmes felülettel rendelkezik, és lehetővé teszi a kutatás interaktív módban történő elvégzését. Minden párbeszédpanel és prompt, beleértve az elektronikust is súgórendszer, teljesen lefordítva oroszra és elérhető a felhasználók számára. Neurális hálózatok A STATISTICA az egyetlen a világon szoftver neurális hálózatok kutatásához, teljesen lefordítva oroszra. A STATISTICA Neurális Hálózatok jelentős előnye, hogy természetesen beépül a STATISTICA elemzőeszközeinek hatékony arzenáljába. A klasszikus és a neurális hálózati módszerek kombinációja adja a kívánt hatást. Ez a könyv tizenegy fejezetből áll. Az első fejezetben az adatelemzés alapfogalmait ismertetjük, a másodikban pedig a valószínűségszámításba adunk bevezetést. A harmadik fejezet a neurális hálózatok elméleti bevezetését tartalmazza. Vegyük észre, hogy a valószínűség-elmélet a neurális hálózatok alapja. Ez a fejezet szükséges a neurális hálózatok módszereinek és alapelveinek mélyreható megértéséhez. Benne

5 ismertetjük a híres Bayes-képletet és az optimális Bayes-féle osztályozás szabályát. A negyedik fejezet tartalmazza általános áttekintés A STATISTICA Neural Networks-ben megvalósított neurális hálózatok bemutatják az olvasót a program felületével, opcióival, és segít megérteni az elemzés főbb területeit. Az 5. fejezet megtanítja az olvasót, hogyan tegyék meg az első lépéseket a STATISTICA neurális hálózatokban. A hatodik fejezet a neurális hálózatok további lehetőségeit ismerteti. Részletesen megvizsgáljuk a radiális bázisfüggvényeken alapuló hálózatokat, ismertetjük a többrétegű perceptronokat, önszerveződő térképeket, valószínűségi és általánosított valószínűségi modelleket. Leírja, hogyan építsünk hálózatot a Megoldás varázsló segítségével, amely egy praktikus neurális hálózatelemző eszköz kezdőknek; ötletet adunk a méretcsökkentés genetikai algoritmusairól. A hetedik fejezet gyakorlati tanácsokat ad a neurális hálózatok segítségével történő problémák megoldásához. A nyolcadik fejezet konkrét problémák megoldásait tartalmazza (esettanulmányok). Ez a fejezet különösen érdekes olvasók széles körét, mivel bemutatja a neurális hálózati technológiát működés közben. A példák az alkalmazások széles skáláját fedik le, a geológiától és az ipartól a pénzügyekig; az osztályozás, a mintafelismerés, az előrejelzés, a gyártási folyamat szabályozásának problémáit veszik figyelembe. A kilencedik fejezetben az olvasó megtalálja Gyors útmutató a STATISTICA Neural Networks neurális hálózati csomag használatáról. A tizedik fejezetet a neurális hálózatok alternatívájaként szolgáló statisztikai módszereknek szenteljük. A diszkriminanciaanalízis, a faktoranalízis és a logisztikus regressziós módszerek leírása itt található. Nyilvánvaló, hogy a felhasználónak képesnek kell lennie a módszerek összehasonlítására és a legmegfelelőbbek kiválasztására. A tizenegyedik fejezetben röviden ismertetjük a modern adatbányászati technológiákat, amelyek ötvözik a neurális hálózati módszereket a klasszikus elemzési módszerekkel. Mondjunk tipikus példákat a neurális hálózatok használatára. Az iparban a termelési folyamatok irányításának feladata (gyártási telepítés) releváns. Például a gáziparban beállíthat egy neurális hálózatot, és automatikusan módosíthatja a paramétereket a kimeneti termék minőségének szabályozásához. Hasonló problémák merülnek fel az olajfinomításban is. Lehetőség van a benzin minőségének spektrális jellemzői alapján történő szabályozására, a spektrum mérésével, hogy az előállított terméket egy bizonyos osztályhoz rendeljük. Mivel a függőségek nem lineárisak, a neurális hálózatok alkalmasak az osztályozásra. A pénzügyi szektorban a fogyasztói hitelezés sürgető feladat. Az elmúlt években a fogyasztási hitelezés gyorsan fejlődött, és a banki üzletág egyik leggyorsabban növekvő ágazatává vált. Növekszik a hitelre árukat és szolgáltatásokat nyújtó pénzintézetek száma

6 napról napra. Ezen intézmények kockázata attól függ, hogy mennyire tudják megkülönböztetni a „jó” hiteligénylőket a „rossz” kérelmezőktől. A hitelfelvevő hiteltörténetének elemzésével megjósolhatja, hogyan fog cselekedni, és eldöntheti, hogy kölcsönt nyújt-e vagy visszautasít-e. Érdekes probléma a megkülönböztetés Elektronikus aláírás, hangfelismerés, geológiai feltárással kapcsolatos különféle feladatok. Ezeknek a problémáknak a megoldására a neurális hálózatok használhatók. Ezután bemutatunk egy párbeszédpanel-láncot a STATISTICA neurális hálózatok csomagban, és megmutatjuk, hogyan szerveződik a rendszer felhasználójával folytatott párbeszéd. Ügyeljünk a felhasználóbarát felületre, valamint a Decision Wizard és Network Builder eszközök elérhetőségére, amelyek segítségével a felhasználók saját maguk tervezhetik meg hálózataikat és választhatják ki a legjobbakat. Tehát először is futtassuk a STATISTICA Neural Networks csomagot. 1. lépés Kezdjük az indítóállvánnyal (1. ábra). Rizs. 1. Indítóállás neurális hálózatok Ezen a panelen különböző típusú elemzéseket választhatunk ki: regresszió, osztályozás, idősor előrejelzés, klaszteranalízis. Válassza ki például az idősorokat, ha előrejelzést szeretne készíteni. Ezután válasszon egy megoldási eszközt az Eszköz részben. Kezdő felhasználók számára javasolt a Megoldásvarázsló, haladóknak pedig a Network Builder használata. Mi

7 válassza a Döntésvarázslót. 2. lépés: Kattintson az Adatok gombra az adatfájl megnyitásához. Ha a fájl már nyitva van, ezt a gombot nem szabad megnyomni. Ha a Speciális gombra kattint, megjelenik egy ablak, ahol további eszközök állnak rendelkezésre, különösen a méretcsökkentési eljárások, a kódgenerátor stb. (2. ábra). Rizs. 2. STATISTICA Neurális hálózatok indítópultja 3. lépés. Innen fájl megnyitása válasszon változókat az elemzéshez. A változók lehetnek folyamatosak és kategorikusak; emellett a megfigyelések különböző mintákhoz tartozhatnak (3. ábra).

8 Fig. 3. ábra: Változó kiválasztási ablak 4. lépés: Állítsa be az elemzés időtartamát a tesztelt hálózatok számának vagy a megoldási időnek a megadásával (4. ábra). Rizs. 4. Döntésvarázsló Quick Step fül 5. Válassza ki a program által kínált hálózatok típusát, amellyel dolgozni fogunk: lineáris hálózat, valószínűségi hálózat, radiális bázisfüggvényeken alapuló hálózat, többrétegű perceptron. Bármilyen típusú hálózatot vagy kombinációt választhat (5. ábra).

9 Fig. 5. ábra Döntésvarázsló Hálózattípus lap 6. lépés: Állítsa be a végeredmény bemutatásának formátumát (6. ábra). Rizs. 6. Döntésvarázsló lap Visszacsatolás 7. lépés Az OK gomb megnyomásával kezdjük el a neurális hálózatok betanítását (7. ábra).

10 Fig. 7. A tanulási folyamat megjelenítése 8. lépés Az eredmény ablakban elemezheti a kapott megoldásokat. A program kiválasztja a legjobb hálózatokat, és megmutatja a megoldás minőségét (8. ábra). Rizs. 8. ábra: Eredményablak lap Gyors lépés 9. Válasszon ki egy adott hálózatot (9. ábra).

11 Fig. 9. ábra: Modellválasztási párbeszédpanel 10. lépés. Az ellenőrzés egyik módja a megfigyelt értékek és a várható eredmények összehasonlítása. A kiválasztott hálózat megfigyelt és előrejelzett értékeinek összehasonlítása az ábrán látható. 10.

12. kép 10. ábra: Megfigyelt és előrejelzett értékek táblázata 11. lépés. Mentse el a legjobb hálózatokat további használatra, például automatikus előrejelzéshez (11. és 12. ábra). Rizs. 11. Az indítópulton válassza ki és mentse el a hálózatokat/együtteseket

13 Fig. 12. Normál ablak hálózati fájl mentéséhez Ez egy tipikus kutatási forgatókönyv a STATISTICA neurális hálózatok csomagban. A könyv további fejezetei egy szisztematikusabb bemutatást tartalmaznak.

14 9. fejezet GYORS ÚTMUTATÓ Ebben a fejezetben egy gyors útmutatót talál a STATISTICA Neural Networks rendszerrel való munkához. A STATISTICA Neural Networks csomag a gyakorlati problémák megoldására jelenleg használt neurális hálózatok minden típusát megvalósítja, valamint a legfejlettebb algoritmusokat a gyors tanuláshoz, az automatikus felépítéshez és a jelentős előrejelzők kiválasztásához. ADATOK Bevezetés Emlékezzünk vissza még egyszer, hogy a neurális hálózatok tanulnak a példákból, és modellt építenek a betanítási adatokból. A betanítási adat bizonyos számú megfigyelés (minta), amelyek mindegyikéhez több változó értéke van feltüntetve. A legtöbb ilyen változó bemenetként lesz beállítva, és a hálózat megtanulja megtalálni az egyezést a bemeneti és a kimeneti változók értékei között (leggyakrabban egy kimeneti változó van), ehhez felhasználva a betanítási adatokban található információkat. . A hálózat betanítása után felhasználható az ismeretlen kimeneti értékek előrejelzésére adott bemeneti értékekkel. Így a neurális hálózattal való munka első szakasza egy adathalmaz kialakításához kapcsolódik. A STATISTICA (Neural Networks) csomagban a Fájl menü Új parancsával (vagy az eszköztár megfelelő gombjával) készíthetünk adattáblát, megadva a változók és a megfigyelések számát. Az így létrejövő új adatfájl kezdetben csak üres cellákat tartalmaz, és a benne lévő összes változó értéke hiányzóra lesz állítva (9.1. ábra).

15 Fig. 9.1 A bemeneti/kimeneti változók, valamint a változók felosztásának halmazai a Neurális hálózatok modulon belül (de az adattábla elkészítése után) történnek. Ez azonban általában nem történik meg: az adatfájl importálása más csomagból történik a Megnyitás paranccsal (meg kell adni az adatformátumot) vagy a Fájl menü Külső adatok parancsával, amellyel összetett lekérdezéseket hozhat létre különféle adatbázisok (9.2. és 9.3. ábra).

16 Fig. 9.2 ábra. 9.3 A Neurális hálózatok modulban lehetőség van a STATISTICA rendszer adatfájljainak közvetlen olvasására, miközben a névleges változók automatikusan kerülnek meghatározásra (azaz olyan változók, amelyek több megadott szöveges érték közül egyet vehetnek fel, pl. Gender = (Férfi, Nő) ), és az olyan adattípusokat, mint a dátumok és időpontok, numerikus ábrázolássá alakítják (bemenet

A 17. ábra szerint csak numerikus adatok táplálhatók be a neurális hálózatba). Ha más programban (például táblázatokban) kap adatokat, akkor először is importálnia kell az adatokat a STATISTICA rendszer segítségével. Az importálási funkción kívül a STATISTICA egyéb lehetőségeket is biztosít a külső információforrások elérésére: a Windows vágólapjának használata (a STATISTICA megérti az olyan alkalmazásokban használt vágólap adatformátumokat, mint az Excel és a Lotus); különböző adatbázisokhoz való hozzáférés a STATISTICA Query lekérdezésépítő eszköz segítségével. A tabulátorral tagolt vagy vesszővel tagolt szöveges fájlok közvetlenül importálhatók a STATISTICA csomagba. Ebben az esetben kívánság szerint a fájl első sora a változónevekre, az első oszlop pedig a megfigyelések nevére hagyható (9.4. ábra). Rizs. 9.4 Ha egy adatfájlt megnyitott vagy újonnan hoztak létre, a tartalma szerkeszthető, mint egy normál táblázat a STATISTICA környezetben. A STATISTICA alapvető adatműveleteket valósít meg a táblázatkezelő processzorokra jellemzően, beleértve: szerkesztést, cellablokk kijelölését,

18 átvitel vágólapra stb. Ezen kívül vannak speciális műveletek a változók és megfigyelések típusának és nevének beállítására, hozzáadására, törlésére, áthelyezésére és másolására. Változótípusok és megfigyelések A STATISTICA Neurális Hálózatok programban az adatfájlból származó összes megfigyelés négy csoportra (halmazra) van felosztva: betanítás, vezérlés, teszt és nem elszámolt. Az oktatókészlet a neurális hálózat képzésére szolgál, a vezérlőkészlet a tanulási előrehaladás független értékelésére, a tesztkészlet a kísérletsorozat befejezése utáni végső értékelésre szolgál. A figyelmen kívül hagyott halmazt egyáltalán nem használják (szükség lehet rá, ha az adatok egy része sérült, megbízhatatlan, vagy egyszerűen túl sok van belőlük). Hasonlóképpen minden változót bemenetre, outputra, bemenetre/kimenetre (például idősorelemzésben) és nem figyelembe vett változókra osztanak fel (ez utóbbiak általában „jelöltek a bemeneti változók szerepére”, amelyek hasznossága az előrejelzés készítéséhez nem világos előre, és ezért a kísérletezés során néhányuk kikapcsol). A változók és megfigyelések típusa a Neurális hálózatok modulban állítható be. A bemeneti és kimeneti változók száma, valamint a betanítási, vezérlési és tesztesetek száma a STATISTICA Neural Networks kezdőablakának tetején található megfelelő mezőkben jelenik meg. A típusok közötti arányok a mezők beállításainak szerkesztésével módosíthatók. Ez nem ad hozzá újakat vagy nem távolít el meglévő megfigyeléseket vagy változókat: csak a meglévő megfigyelések vagy változók típusa változik meg. Hasonló műveletet használnak egy elfogulatlan ellenőrzési halmaz létrehozására. Először meg kell adni ennek a halmaznak a méretét (általában a teljes adatkészlet fele hozzá van rendelve, a másik fele pedig a betanítókészlethez; ha tesztkészletre is szüksége van, akkor a fájlt három részre kell osztani) . Ezután a Véletlenszerű kiválasztási lehetőség használatával az összes elérhető megfigyelést véletlenszerűen elosztja a rendszer különböző típusok. Amikor először olvas egy adatfájlt a STATISTICA Neural Networksben, meg kell határoznia, hogy a változók közül melyik legyen bemeneti és melyik kimenet; ugyanígy a megfigyeléseknél be kell állítani a betanításhoz, ellenőrzéshez és teszteléshez szükséges minták paramétereit. A Neurális Hálózatok modul indítóablakán a változókkal kapcsolatos beállításokat, az elemzési paraméterek beállítására szolgáló párbeszédpanel Selections eszközével (a start ablak után lépünk rá) pedig a megfigyelésekkel kapcsolatos beállításokat kell elvégezni. Vegye figyelembe azonban, hogy ha be van állítva egy mintaazonosító változó, akkor azt a start ablakban kell beállítani a bemeneti/kimeneti változók beállításakor. Változó- és megfigyelési nevek Lehetőség van neveket rendelni az egyes változókhoz és/vagy

19 megfigyelés. Ez az Adatok menü Változó specifikációi parancsával, Minden változó specifikációja, Megfigyelésnév-kezelő parancsával történik. Alternatív megoldásként egyszerűen kattintson duplán a névre a sor vagy oszlop fejlécében, és a név közvetlenül beírható a táblázatba. A STATISTICA Neural Networks programban nem kötelező nevet adni a megfigyeléseknek vagy a változóknak. Ha a név nincs megadva, akkor a táblázat a feltételes nevet jeleníti meg, amely alapértelmezés szerint elfogadott. Változódefiníció (névleges értékek) STATISTICA A neurális hálózatok speciális funkciókkal rendelkeznek a kategorikus (névleges) változókkal való munkavégzéshez. A névleges változók esetében speciális módszerek vannak az értékek konvertálására, és a kimeneti változók típusa lehetővé teszi az osztályozási problémák (ahol nominális változókat használnak) megkülönböztetését a regressziós problémáktól (ahol numerikus változókat használnak). Egy változó lehet numerikus vagy névleges, de nem mindkettő. Egy névleges változó definiálásához a STATISTICA Neural Networks csomagban ezt a változót kategorikusként kell kiválasztania (vagy a Gyors lapon a Változók gombra kattintva, vagy lépjen a Speciális fülre, és kattintson a Változó típusa gombra). Tabulátorral vagy vesszővel határolt fájlok importálásakor, ha azok névleges értékeket tartalmaznak (szövegsorokkal ábrázolva), a STATISTICA Neural Networks program automatikusan felismeri őket, és maga határozza meg a szükséges névleges értékeket. Esetek és változók hozzáadása és eltávolítása Eseteket és változókat adhat hozzá, törölhet, másolhat és helyezhet át az Adatok menüben vagy közvetlenül a táblázatban. Különféle parancsok Az Adatváltozók és az Adatmegfigyelések menük segítik a nagyobb hatékonyság elérését, a közvetlen táblázatkezelő eszközök pedig kényelmesebben használhatók. Kétféleképpen adhat hozzá új megfigyeléseket: 1. Válasszon ki egy megfigyelést. Kattintson a bal egérgombbal a megfigyelés címére, és válassza a Megfigyelések hozzáadása lehetőséget. Ezt is megteheti: lépjen a Megfigyelési adatok hozzáadása menübe. 2. A megfigyelések a vágólapról is beilleszthetők. Ehhez kattintson a bal gombbal annak a megfigyelésnek vagy változónak a nevére, amelybe adatokat szeretnénk beszúrni. Egy megfigyelés vagy megfigyeléscsoport törléséhez ki kell jelölnie azokat a szokásos módon a sorfejléceken keresztül, majd nyomja meg a Ctrl + X billentyűkombinációt. Ez ténylegesen a vágólapra helyezi a megfigyeléseket, tehát ha mozgatja a kurzort

20 másik helyre, és nyomja meg a Ctrl+V billentyűkombinációt, a megfigyelések a kurzor pozíciójába kerülnek, és a Ctrl+C és Ctrl+V billentyűparancsok segítségével a megfigyelések másolhatók és beilleszthetők. A változók mozgatása és másolása hasonló módon történik. Hiányzó adatok A STATISTICA Neural Networks modul speciális eszközökkel rendelkezik a hiányzó adatok feldolgozására, amelyek hasonlóak a többi STAT1STICA modulban használthoz. Annak ellenére, hogy a STATISTICA Neural Networks program hiányzó adatokkal is tud működni, helyette ésszerű becsléseket pótol, mindazonáltal mind a hálózat betanításakor, mind a működése során nem javasolt a hiányzó értékek használata, ha lehetséges. Bár előfordul, hogy túl kicsi a rendelkezésre álló képzési megfigyelések mennyisége, és kénytelenek vagyunk minden rendelkezésre álló megfigyelést felhasználni. A STATISTICA Neurális Hálózatok minden hiányzó adatot tartalmazó változót vagy megfigyelést automatikusan el nem számoltként jelölhetnek meg (hogy azokat ne használják fel az elemzésben). A felhasználó döntése határozza meg, hogy pontosan mit nyilvánítanak el nem vett megfigyelések vagy változók miatt. Ha valamelyik változóból túl sok érték hiányzik, akkor talán ki kell zárni a számításból. Ha a változóból csak néhány érték hiányzik, akkor érdemes a megfelelő megfigyeléseket figyelmen kívül hagyottnak nyilvánítani. A következő műveletsort javasolhatjuk: először deklarálja a változót, hogy nincs elszámolva, és nézze meg, hány érték hiányzik valójában. Ha kevés ilyen sor van, akkor ismét adja meg a bemeneti változót, és nyilvánítsa a megfigyeléseket figyelmen kívül hagyottnak. A tabulátorral vagy vesszővel tagolt importfájlban a hiányzó adatok hiányosságot jelezhetnek. HÁLÓZATOK Bevezetés Az adatkészlet létrehozása vagy importálása után megkezdheti a neurális hálózatok építését és betanítását. A STAT1STICA Neural Networks csomag hálózata tartalmazhat elő- és utófeldolgozásra szánt rétegeket, amelyekben a forrásadatok a hálózati bemenet betáplálására alkalmas formára, a kimeneti adatok pedig az értelmezés szempontjából kényelmes formára konvertálódnak. Ebben az esetben a névleges értékeket numerikus formává alakítják, a számértékeket megfelelő tartományba skálázzák, a hiányzó értékeket behelyettesítik, és idősorokkal kapcsolatos problémák esetén egymást követő megfigyelések blokkjai jönnek létre. Az elő- és utófeldolgozási adatok tartalmazzák a bemeneti és kimeneti változókat, amelyek mindegyikéhez meg van adva annak neve és típusa, mint az eredeti adatkészletben.

21 Megjegyzés a bemeneti és kimeneti változókhoz A STATISTICA Neural Networks csomag bemeneti és kimeneti változóinak halmaza az adatfájltól különállóan létezik. A hálózatépítési folyamat leegyszerűsítése érdekében a STATISTICA Neural Networks program automatikusan átmásolja a változók neveit és definícióit az adatkészletből a létrehozandó hálózatba, majd elválasztja egymástól a hálózatot és az adatokat. Ez lehetővé teszi, hogy a hálózatot új adatok elemzésére használhassák anélkül, hogy hozzáférnének az eredeti fájlhoz (mivel a hálózat megjegyzi a változók nevét és típusát, tudni fogja, mit kell tennie). Hálózat építése Új hálózat létrehozásához használja a Megoldásvarázslót vagy a Network Buildert. A Solution Wizard és a Network Builder párbeszédpaneleinek sora kínál eszközöket az elő- és utófeldolgozási változók beállításához és szerkesztéséhez. Először természetesen meg kell határozni a változókat, és ki kell választani a számukra megfelelő átalakítási módot, valamint a hálózati architektúrát. Az elemzési paraméterek beállítására szolgáló párbeszédpanel megnyitásához nyomja meg az OK gombot a start ablakban. Attól függően, hogy melyik eszközt használjuk, a hálózat típusának kiválasztására a Hálózat típusa lapon (a Megoldás varázsló esetén) vagy a Gyors fülön (Network Builder) nyílik lehetőség. Ha az idősoros modellezés feladatát megoldják, akkor bármely eszköz használatakor elérhető lesz az Idősor fül. A Döntési varázslóban ez a lap határozza meg az előrejelzési ablak határait (azaz az egy megfigyelés előrejelzésére használt megfigyelések számát). A Network Builderben ezen a lapon lehet megadni az előrejelzési ablak pontos értékét és a lépések számának paraméterét. A nem idősorokhoz kapcsolódó feladatokban ezek a lehetőségek nem állnak rendelkezésre. Az idősorelemzés problémáiban az előrelépések száma 1 vagy több (leggyakrabban 1, ami az egy lépéssel előrejelzésnek felel meg), az időablak pedig a sorozat korábbi értékeinek száma. , amely alapján megjósolható a következő érték. Ezen túlmenően az idősorelemzési feladatoknál a megfelelő eszköz futtatása előtt ki kell választani egy olyan változót, amely az idősor értékeit tartalmazza egyszerre bemenetként és kimenetként, mivel a következő értékeket fogja megjósolni. a változó korábbi értékeiből. Ha többrétegű perceptron épül, akkor a hálózat rétegeinek száma módosítható; más típusú hálózatoknál ez a paraméter nem módosítható (egy kivétellel: egy valószínűségi hálózat három vagy négy rétegből állhat, attól függően, hogy veszteségmátrixot tartalmaz-e). A Szerkesztés opció (amely a Network Builder eszközhöz elérhető a Hálózati paraméterek párbeszédpanelen) információkat nyújt a feldolgozás előtti és utáni változókról, beleértve a nevüket és definícióikat, valamint a függvényt.

22 transzformáció, amely az adatok előkészítésére szolgál a neurális hálózatba történő bevitelhez. Módosíthatja a hiányzó értékek pótlásának módját és az átalakítás vezérlőparamétereit. Általános szabály, hogy a javasolt alapértelmezett értékek meglehetősen megfelelőek. Ugyanez a párbeszédablak mutatja az aktuális hálózati architektúra paramétereit: az egyes rétegek elemeinek számát és (ha jobbra görgeti a táblázatot) a rétegek szélességét. A bemeneti és kimeneti változók száma általában mereven összefügg az elő- és utófeldolgozás bemeneti és kimeneti változóinak számával, a transzformációs függvényrel és (idősorelemzési problémák esetén) az időablak méretével. A STATISTICA Neural networks program maga határozza meg a megfelelő paramétereket és adja ki azokat szürke színben, jelezve, hogy nem szerkeszthetők. A közbenső rétegek száma tetszőlegesen módosítható, de általában a program heurisztikusan meghatározott ésszerű alapértelmezett értékeket kínál hozzájuk. A rétegszélességnek nincs funkcionális jelentése, kivéve a Kohonen hálózat kimeneti rétegét, és általában figyelmen kívül hagyják. Hálózat létrehozásához, miután már betöltött egy edzési adatkészletet, általában elegendő: 1) A kezdő ablakban beállítani a változók típusát (Input vagy Output). 2) Válassza ki a hálózat típusát és az idősort. 3) Állítsa be az Időablak és az Előrejelzés paraméterek értékeit (csak az idősorelemzés problémáinál). 4) Állítsa be a rétegek számát (csak többrétegű perceptronoknál). 5) Állítsa be a rejtett elemek számát (ha a Network Buildert használja). 6) Állítsa be az elemek számát és a kimeneti réteg szélességét (csak Kohonen hálózatoknál). 7) Kattintson az OK gombra. Hálózatok szerkesztése A hálózat kiépítése után a Modellszerkesztő eszközzel módosítható annak kialakítása. Ebben az esetben megváltoztathatja a felépítésében használt összes paramétert, valamint számos további jellemzőt. Az eszköz lehetővé teszi a bemeneti és kimeneti változók nevének és definícióinak, azok funkcióinak és konverziós paramétereinek, valamint a hiányzó értékek pótlásának módszereinek módosítását is. Lehetőség van új változók hozzáadására és meglévő változók törlésére, valamint az idősorok paramétereinek módosítására (Időablak és Előrejelzés). Ezeket a lehetőségeket ritkán használják ki. Emellett az elő- és utófeldolgozó szerkesztő lehetővé teszi a hálózat kiépítésénél be nem állított besorolási paraméterek megváltoztatását, míg működés közben ezek módosítására is szükség lehet. Az osztályozási paraméterek értékeit csak osztályozási problémák megoldásakor használjuk, pl. ha a kimeneti változók közül legalább az egyik névleges. Amikor a hálózat fut, a STATISTICA Neural Networks osztályozási döntést hoz ezen kimeneti változók értékei alapján. Így, ha van egy névleges kimeneti változó három lehetséges

23 érték és az N-ből 1 kódolás alkalmazása esetén a programnak el kell döntenie, hogy például a kimeneti vektort (0,03; 0,98; 0,02) a második osztályba tartozóként értelmezi-e (9.5. ábra). Rizs. 9.5 Ezt a problémát az elfogadási és elutasítási küszöbök beállításával oldják meg. N-ből 1 kódolás esetén a besorolási döntés akkor történik, ha az N kimeneti érték egyike meghaladja az elfogadási küszöböt, a többi pedig az elutasítási küszöb alá esik; ha ez a feltétel nem teljesül, akkor az eredmény definiálatlannak minősül (és hiányzó értékként ad vissza). A programban beállított alapértelmezett elfogadási küszöb (0,95) és elutasítási küszöb (0,05) esetén a fenti példa valóban a második osztályhoz lesz rendelve. A kevésbé szigorú küszöbértékek kiválasztása hatékonyabb osztályozást eredményez, de magasabb hibaarányt eredményezhet. Az Elfogadás és az Elutasítás paraméterek értékeinek értelmezése a hálózat típusától függ. Egyes hálózattípusoknál (például Kohonen hálózatoknál) a nagy értékek nagy hibákhoz vezetnek, és a besorolási döntés akkor születik, ha kimeneti érték elfogadási küszöb alatt volt (9.6. és 9.7. ábra).

24 Fig. 9.6

25 Fig. 9.7 A hálózati szerkesztő lehetővé teszi néhány egyéb hálózati paraméter módosítását. Tehát megváltoztathatja a hálózat betanításához és a munka minőségének értékeléséhez használt hibafüggvény típusát. Kiválaszthatja a hálózat meghatározott rétegeit, és módosíthatja az aktiválási funkciókat és a posztszinaptikus potenciál (PSP) függvényeket. Lehetőség van hálózati elemek hozzáadására vagy eltávolítására is. Ez jellemzően csak közbülső rétegekkel valósítható meg, mivel a bemeneti és kimeneti elemek feldolgozás előtti és utófeldolgozási változókhoz vannak kötve (változók hozzáadásakor vagy eltávolításakor a megfelelő elemek hozzáadódnak vagy eltávolításra kerülnek). Távolítsa el a Kohonen hálózatokat, ahol hozzáadhat és eltávolíthat kimeneti elemeket. Rejtett elemek hozzáadásához vagy eltávolításához lépjen a Rétegek lapra, és törölje a rejtett réteg elemeit. Az eszközökkel a Súlyok fülön szerkeszthető súlytáblázat oszlopait is kivághatjuk, másolhatjuk és beilleszthetjük. Mindez lehetővé teszi, hogy különböző hálózati architektúrákkal kísérletezzen anélkül, hogy minden alkalommal új hálózatot hozna létre. Egy egész réteget eltávolíthat a hálózatból. Erre ritka esetekben van szükség, például az automatikus asszociációs hálózat előfeldolgozó felének szétválasztásához a dimenziócsökkentés során. A súlytáblázat megjeleníti az összes súlyt és küszöbértéket akár egy kiválasztott rétegre, akár a teljes hálózatra vonatkozóan. Kívánt esetben a súlyok és küszöbértékek közvetlenül szerkeszthetők, de ez nagyon ritka (a súlyértékeket tanulási algoritmusok állítják be). Ezek az adatok elsősorban azért kerülnek kiadásra, hogy a súlyértékeket el lehessen küldeni egy másik programnak további elemzés céljából. A HÁLÓZATOK KÉPZÉSE Amint a hálózat kiépült, a rendelkezésre álló adatok alapján ki kell képezni. A STATISTICA Neural Networks csomag minden típushoz speciális algoritmusokat tartalmaz a képzési hálózatokhoz, típus szerint csoportosítva a Training menüben (ezek a lehetőségek csak a Network Builder használatakor érhetők el). Többrétegű perceptron A STATISTICA Neural Networks csomag többrétegű perceptronjainak betanításához öt különböző tanulási algoritmust valósítanak meg. Ezek a jól ismert visszaterjesztési algoritmusok, a gyors másodrendű konjugált gradiens süllyedés és a Levenberg Markar módszerek, valamint a gyors terjedési módszerek és a delta delta sávval (amelyek a visszaterjesztés bizonyos esetekben gyorsabb változatai). Mindezek a módszerek iteratívak, és alkalmazásuk módszerei nagymértékben hasonlóak. A legtöbb helyzetben a konjugált gradiens módszerre kell összpontosítania, mivel itt a tanulás sokkal gyorsabb (néha

26 nagyságrend), mint a visszaszaporítás. Ez utóbbit csak akkor érdemes előnyben részesíteni, ha egy nagyon összetett problémában gyorsan kell kielégítő megoldást találni, vagy ha sok adat áll rendelkezésre (több tízezres nagyságrendű megfigyelés), és még többlet is ismert. tőlük. A Levenberg-Markar módszer bizonyos típusú problémák esetén sokkal hatékonyabb lehet, mint a konjugált gradiens módszer, de csak egyetlen kimenettel, effektív hibafüggvénnyel rendelkező hálózatokban használható, és nem nagyon egy nagy szám súlyokat, így valójában hatóköre kis regressziós problémákra korlátozódik. Iteratív tanulás Az iteratív tanulási algoritmus szekvenciálisan megy keresztül úgynevezett epochok sorozatán, amelyek mindegyikénél a teljes betanítási adathalmaz a hálózati bemenetre kerül, kiszámítja a hibákat, és ezek szerint beállítja a hálózati súlyokat. Az ebbe az osztályba tartozó algoritmusok ki vannak téve a túlillesztés nemkívánatos jelenségének (amikor a hálózat jól megtanulja ugyanazokat a kimeneti értékeket produkálni, mint a betanító készletben, de nem tudja általánosítani a mintát új adatokra). Ezért a hálózat minőségét minden korszakban ellenőrizni kell egy speciális vezérlőkészlet segítségével (keresztellenőrzés). Az edzés előrehaladását a Training Error Graph ablakban lehet nyomon követni, ahol a grafikon az edzéskészlet átlagos négyzetes hibáját mutatja egy adott korszakban. Ha a keresztellenőrzés engedélyezett, a vezérlőkészlet standard hibája is megjelenik. A diagram alatt található kezelőszervekkel módosíthatjuk a kép léptékét, és ha a diagram nem fér el teljesen az ablakban, akkor alatta görgetősávok jelennek meg (9.8. ábra).

27 Fig. 9.8 Ha össze akarja hasonlítani a különböző edzési futások eredményeit, akkor kattintson a Tovább gombra az edzésablakban, majd ismét kattintson a Train gombra (ha ismét rákattint a Képzés inicializálás nélkül gombra, akkor a hálózati edzést egyszerűen onnan folytatja megszakadt). Az edzés végén a mező felett található gombok segítségével szimbólumok, a grafikon elküldhető a STATISTICA rendszerbe (gomb). Fontos, hogy a túlillesztés hatása jól látható legyen a grafikonon. Kezdetben a betanítási hiba és a vezérlési hiba is csökken. Az átképzés kezdetével a tanulási hiba tovább csökken, míg a kontrollhiba növekedni kezd. Az érvényesítési hiba növekedése a túlillesztés kezdetét jelzi, és azt jelzi, hogy a tanulási algoritmus kezd destruktívvá válni (és ezzel egyidejűleg egy kisebb hálózat alkalmasabb lehet). Ha túledzést észlel, akkor az edzési folyamat megszakítható az edzésablakban a Stop gomb megnyomásával vagy az Esc billentyű megnyomásával. Azt is beállíthatja, hogy a STATISTICA neurális hálózatok automatikusan leállítsák a leállítási feltételeket. A leállási feltételek az azonos nevű ablakban vannak beállítva, amely a Training End of elemzés menün keresztül érhető el. Az edzéshez megengedett maximális időszakok számán túl (amely a Gyors fülön van beállítva), itt megkövetelheti, hogy az edzés leálljon egy bizonyos hibaszint elérésekor, vagy amikor a hiba bizonyos mértékig csökken. A célérték és a minimális csökkentés külön beállítható a betanítási hibához és a vezérlési hibához. A legtöbb a legjobb orvosság túlillesztés elleni kérdezz nulla szint minimális javulás (azaz ne engedje meg a legkisebb romlást). Mivel azonban az edzés során zaj van, általában nem ajánlott abbahagyni az edzést csak azért, mert a hiba egy egymást követő időszakban súlyosbodott. Ezért a rendszer bevezetett egy speciális javítási paramétert, a Window-t, amely megadja, hogy hány korszakban kell megfigyelni a romlást, és csak ezután áll le a képzés. A legtöbb esetben az 5-ös érték megfelelő ehhez a paraméterhez. Ebben az esetben visszaállíthatja legjobb konfiguráció a legjobb hálózati paranccsal (Training Advanced menü) a betanítási folyamat során szerzett összes hálózatból (9.9. ábra).

28 Fig. 9.9 Ha a Legjobb hálózat opció engedélyezve van, a STATISTICA Neural Networks automatikusan elmenti a képzés során elért legjobb hálózatot (a vezérlési hiba szempontjából). Ez figyelembe veszi az összes edzést. Így a STATISTICA Neural Networks program automatikusan tárolja az összes kísérlet legjobb eredményét. Beállíthat egy egységbüntetést is, amely összehasonlításkor bünteti a sok elemet tartalmazó hálózatokat (a legjobb hálózat általában a teszt minősége és a hálózat mérete közötti kompromisszum). Visszaterjesztés A visszaszaporítási algoritmus alkalmazása előtt be kell állítani számos szabályozási paraméter értékét. A legfontosabb szabályozási paraméterek a tanulási sebesség, a tehetetlenség és a megfigyelések keveredése a tanulási folyamat során (itt vegyük figyelembe, hogy a konjugált gradiens módszer előnye nem csak a sebességben rejlik, hanem a kis számú szabályozási paraméterben is) 9.10).

29. ábra P paraméter A tanulási sebesség beállítja a lépések méretét a súlyok megváltoztatásakor: ha a sebesség nem elegendő, akkor az algoritmus lassan konvergál, ha pedig túl gyors, akkor instabil és oszcillációra hajlamos. Sajnos az érték legjobb sebesség attól függ konkrét feladat; gyors és durva tanuláshoz a 0,1 és 0,6 közötti értékek megfelelőek; sokkal kisebb értékek szükségesek a pontos konvergencia eléréséhez (például 0,01 vagy akár 0,001, ha sok ezer korszak van). Néha hasznos lehet csökkenteni a tanulási folyamat sebességét. A STATISTICA Neural Networks programban beállíthatja a kezdeti és végső sebességértékeket, ebben az esetben a képzés előrehaladtával interpoláció történik közöttük. A kezdősebesség a bal oldali mezőben, a végsebesség a jobb oldali mezőben van beállítva (9.11. ábra).

30. ábra A tehetetlenségi együttható (Moment) segít abban, hogy az algoritmus ne akadjon el a síkvidékeken és a lokális minimumokban. Ennek az együtthatónak értéke nullától egyig terjedhet. Egyes szerzők azt javasolják, hogy a tanulási folyamat során változtassák meg. Sajnos itt is a "helyes" érték a feladattól függ, és csak empirikusan lehet megtalálni. A visszaszaporítás alkalmazásakor általában javasolt a megfigyelések sorrendjének korszakonkénti változtatása, mivel ez csökkenti annak az esélyét, hogy az algoritmus elakadjon egy lokális minimumban, és csökkenti a túlillesztés hatását is. Ennek a funkciónak a kihasználásához állítsa a módot Megfigyelések véletlenszerű lejátszására. A hálózati teljesítmény minőségének felmérése A hálózat betanítása után érdemes ellenőrizni, hogy mennyire jól teljesít. Az effektív hiba, amely a Training Error Plot ablakban jelenik meg, csak a teljesítmény hozzávetőleges mértéke. További hasznos szolgáltatások jelennek meg az Osztályozási statisztikák és a Regressziós statisztika ablakokban (mindkettő az Elemzési eredmények ablakon keresztül érhető el). Az Osztályozási statisztika ablak a névleges kimeneti változókra érvényes. Ez információt ad arról, hogy az egyes osztályok adatállomány-megfigyelései közül (melyek mindegyike egy névértéknek felel meg) hány volt helyesen besorolva, hány hibásan és hány nem volt besorolva, valamint részleteket az osztályozási hibákról. A hálózat betanítása után csak meg kell nyitnia a Leíró statisztika ablakot (9.12. ábra).

31. ábra Statisztikák külön-külön beszerezhetők az oktató-, vezérlő- és tesztkészletekre vonatkozóan. A táblázat felső részében összefoglaló statisztikák láthatók (a megfigyelések száma az egyes osztályokban, a helyesen besorolt, hibásan besorolt és besorolatlanok száma), az alján pedig a keresztbesorolási eredmények (hány megfigyelés adott oszlop ehhez a sorhoz volt hozzárendelve) (9.13. ábra). ábra Ha sok válasz van ebben a táblázatban Ismeretlen, de kevés vagy nincs válasz Helytelen, akkor valószínűleg lazítani kell az elfogadási és elutasítási küszöböt (Edit PrelPost Processing menü) (9.14. ábra).

32 ábra A Regression Statistics ablakot numerikus kimeneti változók esetén használjuk. Összefoglalja a regressziós becslések pontosságát. A legfontosabb statisztika a szórási arány (S.D. ratio), amely a táblázat alján látható. Ez az előrejelzési hiba szórásának és az eredeti adatok szórásának aránya. Ha egyáltalán nem lennének bemenő adatok, akkor a legjobb, amit a kimeneti változóra előrejelzésnek vehetnénk, annak a rendelkezésre álló mintához viszonyított átlagértéke, és egy ilyen előrejelzés hibája megegyezne a minta szórásával. Ha egy neurális hálózat jól teljesít, akkor arra számíthatunk, hogy az elérhető megfigyelések átlagos hibája közel nulla lesz, és ennek a hibának a szórása kisebb lesz, mint a mintaértékek szórása (egyébként a hálózat az eredmény nem jobb az egyszerű találgatásnál). Így az egynél lényegesen kisebb szórások aránya a hálózat hatékonyságát jelzi. Az eggyel egyenlő érték mínusz a szórások aránya megegyezik a magyarázott modellvariancia töredékével. Kohonen hálózatok A Kohonen hálózatok tanulási algoritmusa bizonyos tekintetben hasonló a többrétegű perceptronok tanulási algoritmusaihoz: iteratív és korszakokon keresztül hajtják végre, és az átlagos négyzetes tanulási hiba ábrázolható a grafikonon (bár valójában ez az átlag teljesen más hibamérték négyzete, mint a többrétegű perceptronokban). Kohonen algoritmusának azonban számos jellemzője van. Közülük a legjelentősebb, hogy itt a tanulás irányítatlan, i.e. az adatok egyáltalán nem tartalmazhatnak kimeneti értékeket, és ha vannak, akkor figyelmen kívül hagyják azokat. Az algoritmus működését két paraméter határozza meg: a tanulási sebesség és a szomszédság. A tanulás a következőképpen zajlik: a következő megfigyelést a hálózat bemenetére tápláljuk, az feldolgozza, kiválasztjuk a győztes (legaktívabb) radiális elemet (azaz a hálózat második rétegének elemét), majd azt és a hozzá tartozó elemet. a legközelebbi szomszédokat kijavítják, hogy jobban reprodukálják az edzés megfigyelését. A tanulási sebesség szabályozza az alkalmazkodás mértékét, és a szomszédság határozza meg

33 a javítandó elemek száma. Általában a Kohonen-algoritmus munkája két szakaszra oszlik: rendelés és finomhangolás, amelyek mindegyikén a tanulási arány és a környék mérete fokozatosan változik a kezdeti értékről a végső értékre. A STATISTICA neurális hálózatokban beállíthatja a tanulási sebesség és a környék méretének kezdő és végértékét. A környék mérete határozza meg a nyertes elem középpontjában álló négyzetet; a nulla "méret" egy nyerő elemnek felel meg; "1-es méret" egy 3 3-as négyzetre, amelynek középpontja a nyertes elem; "2-es méret" 5 5-ös négyzetben stb. Ha a nyertes elem a széléhez közel található, akkor a környék le van vágva (ahelyett, hogy az ellenkezőjére fordítanák). Bár természeténél fogva egy ilyen paraméter egy egész szám, beállíthatja valós formában, hogy pontosabban vezérelje, amikor az algoritmus elkezdi csökkenteni a környék méretét. Ebben az esetben a STATISTICA Neural Networks először ezt a számot javítja, majd a legközelebbi egész számra kerekíti. A Kohonen tanulási algoritmus befejezése után meg kell jelölni a radiális elemeket a hozzájuk tartozó osztályok ikonjaival (lásd a Topológiai térkép részt). EGYÉB HÁLÓZATI TÍPUSOK Más típusú hálózatokat meglehetősen könnyű betanítani; minden esetben csak néhány edzési paraméter állítható be, és mindegyiket az alábbiakban ismertetjük. Radial Basis Functions (RBF) A képzés három szakaszból áll: a radiális elemek középpontjainak elhelyezése, eltéréseik kiválasztása és a lineáris kimeneti réteg optimalizálása. Az elsõ két szakaszban az algoritmus mûveletének több változata létezik, amelyek kiválasztása a Radial basic function ablakban történik (ez a Képzés menün keresztül érhetõ el); a legnépszerűbb kombináció a K jelentése módszer az első szakaszban, és a K legközelebbi szomszéd módszer a második szakaszban. A lineáris kimeneti réteget a klasszikus pszeudo-inverz mátrix algoritmussal (szinguláris érték dekompozíció) optimalizáltuk. A STATISTICA Neural Networks program lehetővé teszi hibrid RBF hálózatok építését is úgy, hogy a kimeneti réteghez más aktiválási funkciókat (például logisztikai) választ, és ebben az esetben ennek a rétegnek a betanításához használhatja a többrétegű perceptronokhoz használható tanulási algoritmusok bármelyikét. például a konjugált gradiens módszer. Lineáris hálózatok Itt a kétrétegű hálózat leple alatt a szokásos lineáris modell, amelyet a pszeudoinverz mátrix algoritmussal optimalizálunk a Radial basic function ablakban.

34 A lineáris hálózatot főkomponens-elemzéshez is használhatjuk, hogy megpróbáljuk csökkenteni a változók számát, mielőtt az adatokat egy másik típusú hálózat feldolgozná. Valószínűségi és generalizált regressziós neurális hálózatok A PNN/GRNN valószínűségi (PNN) és általános regressziós neurális hálózatok (GRNN) a valószínűségi sűrűség kernelbecslésének statisztikai módszerein alapulnak, és osztályozási, illetve regressziós problémákra szolgálnak. Egyszerű és gyors tanulási algoritmusok jellemzik őket, de az így létrejövő neurális hálózati modellek nagyok és viszonylag lassúak. Automated Network Builder A megfelelő hálózattípus és architektúra kiválasztásának folyamata hosszú és eredménytelen lehet, mivel sok próbálkozással és hibával jár. Sőt, mivel zaj van a képzésben, és az algoritmus elakadhat a helyi minimumokban, ezért minden kísérletet többször meg kell ismételni. Ez a fárasztó munka minimalizálható a STATISTICA Neural Networks csomagban megvalósított automatikus hálózattervezési lehetőségekkel, míg a meglehetősen bonyolult optimalizáló algoritmusok segítségével nagy kísérletsorozatokat hajtanak végre, és kiválasztják a legjobb hálózati architektúrát és méretet. Az automatikus hálózattervezési funkciók a Döntési varázsló eszköz kiválasztásakor kerülnek meghívásra. Itt csak meg kell adni a figyelembe veendő architektúrák típusait, be kell állítani az iterációk számát (vagy az elemzési időt), ami meghatározza a keresés időtartamát (mivel az algoritmus sokáig tarthat, érdemes először beállítani egy kis számú iteráció, hogy megbecsülje, mennyi időbe telhet a teljes keresés), és válassza ki a megtartott hálózat kiválasztásának kritériumait, amely büntetni fogja az indokolatlanul sok elemet tartalmazó hálózatot. Az algoritmus elvégzi a szükséges kísérletsorozatokat, és jelzi a legjobb hálózatokat. Ha ezt az algoritmust használjuk az idősorelemzés problémájában, akkor az Időablak paraméter értékét is be kell állítani. Genetikai algoritmus a bemenet kiválasztásához Az egyik legnehezebben megválaszolható kérdés neurális hálózatok használatakor, hogy mely bemeneti változókat érdemes használni (ritkán lehet tudni előre, hogy ezek közül melyek fontosak a probléma megoldásához és melyek nem). A Dimension Down eszközzel

35 A Start menü Speciális lapjáról elérhető automatikus üzemmód találjon megfelelő bemeneti változókészletet. Nagyszámú PNN- vagy GRNN-hálózat felépítésével és tesztelésével (osztályozási vagy regressziós problémákhoz) különböző bemeneti változókkal, a genetikai algoritmus (valamint a be- és kizárásos algoritmusok) kiválasztja a bemeneti kombinációkat, és megkeresi a legjobbat. tőlük. Az automatikus hálózattervezőhöz hasonlóan ez az eljárás is időigényes lehet, de ennek ellenére gyakran ez az egyetlen módja a probléma megoldásának. A működés során a genetikai algoritmus nagyszámú tesztbit-sztringet generál (számukat a Population paraméter állítja be), és mesterségesen „keresztezi” azokat adott számú generáción keresztül, a mutáció és a keresztezés mesterséges szelekciós műveleteivel, melynek intenzitása szabályozható. A PNN vagy GRNN hálózat betanítva van paraméter beállítása simítás (a megfelelő simítási tényező meghatározásához célszerű néhány tesztet kihagyni a genetikai algoritmus alkalmazása előtt), és a bemeneti változók kis halmazainak előnyben részesítése érdekében beállíthatja a Büntetés elemenként paramétert. Az algoritmus megvizsgálja az adatkészletben elérhető összes bemeneti változót. Az algoritmus elindításához kattintson az OK gombra. Amikor a munkája véget ért, az ablak alján lévő táblázatban a hasznos változókkal szemben az Igen szó, a haszontalanok mellett egy kötőjel jelenik meg. Az algoritmus eredményeinek használatához először ki kell választania a Hálózatépítő futtatása a kiválasztott változókhoz vagy a Döntési varázsló futtatása a kiválasztott változókhoz lehetőséget az Elemzés vége lap Dimenziócsökkentések menüjéből. MŰKÖDÉS A HÁLÓZATTAL Kimeneti értékek lekérése A hálózat betanítása után felhasználható adatelemzésre: futtassa a hálózatot az aktuális adatkészletből származó egyes megfigyeléseken, a teljes adatkészleten vagy tetszőleges, felhasználó által megadott megfigyeléseken. A hálózat bármely más olyan kompatibilis adatkészletet is fel tud dolgozni, amelynek a bemeneti változói ugyanazokkal a nevekkel és definíciókkal rendelkeznek, mint a hálózatban. Ez azt jelenti, hogy a hálózat kiépítése után már nem vagyunk kötve a képzési készlethez. Ha olyan adatkészletet elemeznek, amely a bemeneteken kívül kompatibilis kimeneti értékekkel rendelkezik, akkor a STATISTICA Neural Networks program kiszámítja a hibaértékeket. Amikor megnyit egy hálózatot vagy adatkészletet, a STATISTICA Neural Networks ellenőrzi, hogy vannak-e az adatkészletben olyan változók, amelyek kompatibilisek a hálózat bemeneti változóival. Ha vannak, akkor a típusuk az adatkészletben automatikusan szükség szerint beáll, és az összes többi változót figyelmen kívül hagyja. Így lehetséges, hogy több hálózattal (fájlok formájában) működjön együtt

10. FEJEZET Bővítmények Egyes Excel segédprogramok csak bővítmények hozzáadása után válnak elérhetővé. Mindenekelőtt a Megoldás keresése kiegészítőkre és az Elemző csomagra koncentráljunk. Mutassuk meg, mit

Laboratóriumi munka 105. Klaszterezési algoritmus alkalmazása: önszerveződő Kohonen térképek Fő cél Az "Önszervező Kohonen térképek" adatfeldolgozási módszer használatának elsajátítása. elméleti

Lab 3. Deductor Analytical Platform (adatimportálás és adattisztítás) (ez a munka a termék demó verzióját használja) A Deductor öt összetevőből áll: egy elemző alkalmazás

TARTALOM 13. fejezet: TÖBB ALKATRÉSZ ELHELYEZÉSE

ADATBÁZISRENDSZERBIZTONSÁG 10. témakör 10. előadás Makrók használata az Accessben A makró egy vagy több parancsból álló halmaz, amely bizonyos, gyakran használt műveleteket hajt végre, például megnyitást.

Lek 6 Összevont 1 TANFOLYAM ISE 1 ELŐADÁS 8. téma: Feldolgozás technológiája és módszerei gazdasági információk konszolidált és pivot táblák használata Terv 1. A konszolidált tábla fogalma. konszolidációs módszerek.

LABORATÓRIUMI MUNKÁK 14 A politikával kapcsolatos cikkek automatikus osztályozása Ez a példa a lenta.ru weboldal által közzétett "standard" hírdokumentumokon alapul. Erről az oldalról

Elektronikus tudományos folyóirat "RESEARCHED IN RUSSIA" 270 http://zhurnalaperelarnru/articles/2006/36pdf Neurális hálózatok alkalmazása előrejelzési problémák megoldására Soldatova OP, Semenov VV ( [e-mail védett])

Laboratóriumi munka 2 Témakör: Analitikus modellezés technológiája DSS-ben. Trendekre épülő elemzési és előrejelzési technológiák Cél: az univerzális lehetőségek tanulmányozása, használatának képességének fejlesztése.

11. előadás SZÁMÍTÁSOK A BESZÉDFELDOLGOZÓBAN MS EXCEL 2010 Az előadás célja. Az Ms Excel 2010 táblázatban képletekkel végzett számítások elvégzésének sajátosságainak tanulmányozása. Előadáskérdések: 1. Képletek

MUNKAIDŐ: 2 óra. 1. Tanórán kívüli felkészítés Címlap kiadása. Lásd: 1. FÜGGELÉK 2. Laboratóriumi munka Alapok Amint a Word elindul, automatikusan létrehoz egy új dokumentumot.

Utasítások a "Neurosimulator" programmal való munkához (a szorzótábla szimuláció példáján) A "Neuroszimulátor" program lehetővé teszi perceptron típusú neurális hálózatok létrehozását és alkalmazását. Rizs. 1. Dolgozik

1. fejezet Diagramozás alapjai A táblázatban lévő adatok sorok és oszlopok formájában jelennek meg. Diagram hozzáadásakor ezeknek az adatoknak az értéke növelhető olyan kapcsolatok és trendek kiemelésével, amelyek nem

7. előadás 1. kurzus DSS 1 2012.12.15. 9. TÉMA: Információs technológiák döntéstámogató rendszerek létrehozásához és előrejelzési módszerek Terv: 1. Előrejelzési módszerek MS táblázatokban

Tartalom 1. Költségösszefoglaló, KS-3 nyomtatvány... 2 1.1. Dokumentumkészítés, általános leírás... 2 1.2. Adatok hozzáadása egy dokumentumhoz... 5 1.2.1. Összes értékek szinkronizálása egy sorban... 6 1.2.2. Hozzáadott típusok

Neurális hálózatok betanítása A munkafolyamat során a neurális hálózat valamilyen adattranszformációt valósít meg, amely általában sok változó függvényével írható le Y = f (X), ahol = x x,...,

8. fejezet Nézetek testreszabása Mik azok a nézetek Mik azok a nézetek A nézet az információ megjelenítésének (vagy más szóval bemutatásának) módja a felhasználónak a tárolt adatok alapján

9. munka Űrlapok az Accessben A munka célja: az űrlapok létrehozásának és szerkesztésének megtanulása automatikus űrlapokkal és űrlapvarázsló módban Munka tartalma 1 Űrlaptípusok 2 Űrlapok létrehozása 1 Űrlaptípusok Adatok bevitele és megtekintése

A teszt létrehozásához szüksége van: HOL KEZDJEN? 1. lépés: Adjon hozzá kérdéseket (tesztekhez) a kérdések bankjához. Kétféleképpen adhat hozzá: importálás jegyzettömbből (jegyzettömb fájl létrehozása (.txt formátum), kérdések hozzáadása,

Munka táblázattal Microsoft Excel Rövid elméleti információk Windows alkalmazás Az Excel lehetővé teszi táblázatos formában bemutatott dokumentumok létrehozását és nyomtatását, számítások elvégzését

1. Bevezetés Laboratóriumi munka 3 Paraméterek kiválasztása Különböző feladatok megoldása során gyakran meg kell küzdeni azzal a problémával, hogy egy értéket egy másik változtatással kell kiválasztani. Erre a célra nagyon hatékonyan használják

Általános tudnivalók A 2007-es Microsoft Office rendszer kiadásának tervezésekor a fejlesztők feladata az volt, hogy a Microsoft Office alapalkalmazásait tegyék könnyebben használhatóvá. Ennek eredményeként egy szokás

Fő célkitűzés Lab 104. Logisztikai regresszió és ROC elemzés Megtanulják, hogyan kell adatokat feldolgozni és előre jelezni az eseményeket a logisztikus regresszió és a ROC elemzés segítségével. elméleti

ARGUMENTUSOK CSOPORTOS MÓDSZERE A csoportos adatkezelési módszer (GMDH) az optimális komplexitású regressziós modellek generálására és kiválasztására szolgáló módszer. A Modell összetettsége alatt

1. lecke: Az Excel kezelőfelülete * 2010-es verzió * 1.0 Bevezetés Az Excelben az adatok "cellákba" vannak rendezve, amelyek viszont oszlopokat és sorokat alkotnak. Ez segít nekünk az adatok jobb észlelésében, és lehetővé teszi számunkra

Bináris válaszmodellek Az előző részben regressziós elemzést végeztünk azzal a feltételezéssel, hogy a Teszt válaszváltozó egy folytonos, normális eloszlású valószínűségi változó. Tovább

Az Access bemutatása Az Access egy adatbázis-alkalmazás vagy adatbázis-kezelő rendszer (DBMS). A számítógépes adatbázisokat szinte minden tevékenységi területen használják. Ügyesség

Útmutató a Kulturológiai és Szociológiai Tanszék oldalának kitöltéséhez (2. rész "oldal tartalomszerkesztője") 1 Tartalomjegyzék 1 Szerkesztő felület... 3 2 Szerkesztő átméretezése... 4 3 Eszköztár...

17. fejezet Információ keresése, rendezése és megjelenítése adatbázisban EBBEN A FEJEZETBEN...» Adatok keresése és szűrése» Adatbázis rendezése» Lekérdezések létrehozása és alkalmazása

6 Frekvenciák 97 Számítási algoritmusok lépésről lépésre 102 Eredmények bemutatása 105 Az elemzés befejezése és a programból való kilépés Ez a fejezet a frekvenciákat, azok grafikus ábrázolását (sáv és kör) tárgyalja.

GYAKORLATI MUNKA 5. TÉMAKÖR: Az MS Word szolgáltatásainak átfogó használata nagyméretű dokumentumok létrehozásához MUNKA CÉL: Megtanulni, hogyan lehet átfogóan használni az MS Word szolgáltatásait nagy dokumentumok létrehozásához

MOU "Lyceum 43" Saransk Módszerfejlesztés "A HOZZÁFÉRÉSI DBMS-EK KUTATÁSA ADATBÁZIS LÉTREHOZÁSÁBAN ÉS SZERKESZTÉSÉBEN" Szerző informatika tanár Zhebanov A. A. Saransk 2014 RESEARCH OF ACCESS DBMS IN

1. FEJEZET Felkészülés az Excel használatára Sok olvasó többé-kevésbé ismeri az elektronikát Excel táblázatok. Meg kell azonban határozni a leggyakrabban előforduló kifejezéseket

Gyakorlati lecke 3 Beszámolási dokumentáció elkészítése. Az adatok összekapcsolása és konszolidálása. Pivot táblák A munka célja: megtanulni, hogyan lehet adatokat táblákban konszolidálni, pivot táblákat létrehozni és alkalmazni

Praktikus munka 3 Űrlap létrehozása Az űrlap egy adatbázis-objektum, amely táblákból vagy lekérdezésekből adatok bevitelére, módosítására vagy megjelenítésére használható. Az űrlapok kezelhetők

ITV Group ArpEdit segédprogram kézikönyv 1.4-es verzió, Moszkva, 2014 Tartalom TARTALOM... 2 1 BEVEZETÉS... 4 1.1 A dokumentum célja... 4 1.2 Az ArpEdit segédprogram célja... 4 2 ÁLTALÁNOS

Munka szabványos dokumentumsablonokkal Felhasználói útmutató a kognitív technológiákhoz Moszkva, 2015 2 ÖSSZEFOGLALÁS Ez a dokumentum az E1 Euphrates szoftvercsomagban való használatról nyújt információkat

JÓVÁHAGYOM az SBEI DPO TsPKS SPb „Az oktatás minőségét értékelő regionális központja és információs technológiák» E.V. Mikhailov CÉLKITŰZÉS „Bekezdés” az oktatási intézmények számára Szolgáltatás ÚJ LISTA Menedzsment

6. labor Kimutatások Elméleti szakasz A kimutatástáblák értelmezése Az Excel úgynevezett pivot táblákat használ a nagy táblák adatainak átfogó és hatékony elemzésére.

Az OpenOffice.org Az Impress egy OpenOffice.org program, amely diavetítésekkel (prezentációkkal) foglalkozik. Létrehozhat olyan diákat, amelyek sok különböző elemet tartalmaznak, beleértve a szöveget is, felsorolva

Az ACCESS bemutatása Először is, az Access egy adatbázis-kezelő rendszer (DBMS). A kategória többi termékéhez hasonlóan az Access is a prezentációs adatok kényelmes formában történő tárolására és lekérésére szolgál.

Elektronikus platform FINTENDER.RU STAR rendszer NMC igazolási szolgáltatás Moszkva 2017

Elhelyezésszerkesztő alrendszer Szakasz. Elhelyezés szerkesztő alrendszer Ablak Cellák elhelyezése...-1 Elrendezési mód...-2 Elhelyezési mód...-2 Link hossza...-2 Aktív aláramkör...-2 Táblázat

A felhasználó STO MI-je "Jelentések beállítása az 1C: Enterprise-ban" Leírás A felhasználói kézikönyv leírja, hogyan kell dolgozni a jelentésekkel az 1C: Enterprise programban. Ez az utasítás lehetővé teszi testreszabási készségek megszerzését

Az Oldalbeállítás párbeszédpanel Margók lapján a felső, az alsó, a bal és a jobb margó az oldalak szélétől a táblázatig tartó behúzásra van beállítva. A behúzások mérete határozza meg a táblázat mezőjének magasságát és szélességét,

90 5. fejezet Felirat Ez a fül olyan objektumokhoz érhető el, amelyekbe szöveget írt be. Ezzel beállíthatja a belső margókat, és megadhatja, hogy változzon-e az objektum mérete, ha nem fér el a szöveg.

1. Szúrjon be és hozzon létre táblázatokat a Word 2007-ben Word táblázatok az oldal tartalmának szerkezetére szolgálnak. Ezenkívül táblázatokat használnak a számításokhoz. A Word beszúrás és létrehozás technológiát használ

Munka a jegyzetekkel kapcsolatos megjegyzésekkel A megjegyzés olyan információ (adat), amely egy cellához kapcsolódik, és a cella tartalmától függetlenül tárolódik. Ez lehet némi magyarázó információ,

Az okmányvédelem szervezése eszközökkel Microsoft csomag Office 2010 A munka célja a szöveges dokumentumok védelmének megszervezésének, a táblázatok védelmének, az adatbázisok védelmének megismerése. Miután elvégezte ezt a munkát,

Adatok keresése és cseréje Adatok keresése Adatokat kereshet a teljes lapon vagy a lap egy kiválasztott területén, például csak egyes oszlopokban vagy sorokban, vagy egyszerre a teljes munkafüzetben. 1. Csoportban

1. Szövegszerkesztő OpenOffice.org Writer. Szöveg bevitele és formázása Általános információ A Writer szövegszerkesztő messze a legismertebb OpenOffice.org alkalmazás. Mint a szöveg

"Forgalmi menetrend vezérlés" modul. Rövid információ...3 Első beállítások...3 A "Forgalmi menetrend ellenőrzése" modul vezérlőpultja...4 Munka az útvonalszerkesztővel...4 A szerkesztő tartalma...4 Pontok

LABORATÓRIUMI MUNKA TÖBBRÉTEGŰ SZIGMOIDÁLIS HÁLÓZATOK bemeneti jelekátalakítani őket

A konfigurációs kiadások frissítése KÉSZÍTS AZ ADATBÁZISÁRÓL BIZTONSÁGI MENTET. Mielőtt bármilyen változtatást végrehajtana, készítsen egy archív másolatot az információs bázisról a merevlemezen,

GYAKORLAT A Deductor Studio 5.2 programban való munkavégzés alapkészségei 7. lecke. Szkriptek használata Bevezetés A szkripteket arra tervezték, hogy automatizálják az azonos típusú feldolgozási ágak szkripthez való hozzáadásának folyamatát.

A rendszerintegrációs modul anyagértékelése és a CAD TP VERTICAL felhasználói kézikönyv ez a dokumentum, előzetes értesítés nélkül változhatnak. Egyik sem

2. feladat Táblázatok készítése, szerkesztése. Munka adatsémával A feladat célja: A létrehozás megtanulása új alap adatokat, létrehozhat és szerkeszthet táblák szerkezetét, és segítségével kapcsolatokat hozhat létre közöttük

és mutasd meg, hogyan szerveződik a párbeszéd a rendszer felhasználójával.

Ügyeljen a felhasználóbarát felületre és az eszközök elérhetőségére , És Több részmintavételi módszer, amely lehetővé teszi a felhasználók számára, hogy megtervezzék saját hálózataikat, és kiválaszthassák a legjobbakat.

Tehát először is futtassuk a neurális hálózatokat.

1. lépés. Az indítópultról indul (lásd az 1. ábrát).

Ezen a panelen választhatja ki az elvégzendő elemzések különböző típusait: regresszió, osztályozás, idősor előrejelzés (folyamatos és kategorikus függő változóval), klaszterelemzés.

Rizs. 1. Indítópult STATISTICA automatizált neurális hálózatok (SANN)

Válassz például Idősor (regresszió) ha jóslatot szeretne tenni, ill Osztályozás, ha az osztályozási probléma megoldása folyamatban van.

Egy gomb megnyomása rendben, lépjen az adatkiválasztó párbeszédpanelre.

Rizs. 2. Párbeszédpanel Neurális hálózatok - Adatválasztás - Gyors fül

2. lépés A lapon Gyors ki kell választani az elemzéshez szükséges változókat. A változók lehetnek folyamatosak és kategorikusak, függőek és függetlenek; emellett a megfigyelések különböző mintákhoz tartozhatnak.

Rizs. 3. Változó kiválasztó ablak

Kezdő felhasználóknak ajánlatos stratégiát választani Haladó felhasználó könnyen használhat bármilyen elérhető stratégiát: Automatizált Neurális Hálózat (ANN), Egyéni neurális hálózat (PNN)És Mi fogunk választani Automatizált Neurális Hálózat (ANN).

Rizs. 4. Párbeszédpanel Neurális hálózatok - Adatválasztás - Gyors fül

A lapon Alminták (PNS és ANS) meg kell adnia az adatok kívánt particionálását részmintákra: betanítás, vezérlés és teszt. A partíció véletlenszerűen beállítható, vagy egy további kódváltozó segítségével rögzíthető.

Ebben az esetben véletlenszerű partíciót fogunk használni.

Rizs. 5. Párbeszédpanel Neurális hálózatok - Adatválasztás - Részminták lap (ANS és PNS)

lapon Alminták (PNS és ANS) az első két stratégiához tervezték: Automatizált neurális hálózat (ANN)És Egyéni neurális hálózat (PNN); és a fület Hozzon létre részmintákat az utolsó stratégiához használt: Több részmintavételi módszer.

Kattintson rendbenés folytassa az architektúra paramétereinek beállításával.

3. lépés A lapon Gyors párbeszédablak Automatizált neurális hálózatok meg kell adni a hálózat típusát, a rejtett neuronok számát, a betanítandó és tárolandó hálózatok számát, valamint az alkalmazott hibafüggvények típusát.

A program a következő típusú hálózatokat kínálja: többrétegű perceptronok és radiális bázisfüggvények hálózatai.

Rizs. 6. Párbeszédpanel Automatizált neurális hálózatok – Gyors fül

Rizs. 7. Párbeszédpanel Automatizált neurális hálózatok – fül Aktiválási funkciók MLP-hez

A lapon csillapítás engedélyezheti a súlyszabályozás opciót, amely beállítja a betanított hálózatok összetettségét. Ez akkor hasznos, ha a problémának nagyszámú bemeneti változója van, és nagyszámú neuron van megadva a rejtett rétegben.

De a mi esetünkben nem fogjuk használni.

Rizs. 8. Automatizált neurális hálózatok párbeszédpanel – Csillapítás lap

Most továbbléphetünk a neurális hálózat képzési lépésére.

4. lépés Futtassa le a neurális hálózati betanítási eljárást a gombra kattintva rendben.

ábrán látható párbeszédablakban. A 9. ábrán megjelenik néhány információ a jelenleg betanított neurális hálózatról. Elemezhetjük a hálózat architektúráját, figyelhetjük az algoritmus iterációinak menetét, és javíthatjuk a modellhibákat. A regresszióhoz a négyzetgyökér-hibát, az osztályozáshoz a megfigyelések helyes osztályozásának százalékos arányát használjuk (mint esetünkben).

Rizs. 9. Neurális hálózatok képzése párbeszédpanel

A program automatikusan a következő lépésre lép.

5. lépés Az eredmények elemzése. Az eredmény ablakban elemezheti a kapott megoldásokat. A program kiválasztja a legjobb hálózatokat, és megmutatja a megoldás minőségét.

Rizs. 10. Párbeszédpanel Neurális hálózatok - Eredmények - Predicted fül

A gombbal kiválaszthat egy, véleményünk szerint legjobb hálózatot Hálózatok kiválasztása/eltávolítása.

Rizs. 11. Párbeszédpanel Aktiválja a modellt

Például a tesztelés egyik módja a megfigyelt értékek és a várható eredmények összehasonlítása. A kiválasztott hálózat megfigyelt és előrejelzett értékeinek összehasonlítása, például képzési és tesztkészletekhez.

Rizs. 12. A megfigyelt és előrejelzett értékek táblázata

Vagy nézze meg az osztályozási hibamátrixot a tesztmintán:

Rizs. 13. Osztályozási mátrix

6. lépés Mentse el a legjobb hálózatokat jövőbeli használatra, például az automatikus előrejelzéshez.

A további indításhoz a hálózatok PMML formátumban kerülnek mentésre.

Rizs. 14. Párbeszédpanel Neurális hálózatok - Eredmények - Hálózatok mentése

Rizs. 15. Szabványos hálózati fájlmentési ablak

7. lépés Futtassa a mentett modelleket új adatokon. Tehát új adatokat töltünk be, de úgy, hogy a változók megegyezzenek a modellekben lévő változókkal.

A modell új adatokon történő futtatásához az indítópulton kiválaszthatja a lehetőséget (1. ábra) Modellek betöltése korábbi elemzésekbőlés nyomja meg a gombot Hálózatok letöltése.

Rizs. 16. Szabványos hálózati fájlválasztó ablak

Kapunk:

Rizs. 17. STATISTICA Automated Neural Networks (SANN) Launchpad

A kívánt fájl kiválasztása után minden beállítás automatikusan meghatározásra kerül, így azonnal az eredmény ablakba léphet (a gombra duplán kattintva rendben), és elemezze az eredményeket.

Ez a tipikus kutatási forgatókönyv a csomagban.

A STATISTICA csomagban a folyamatos előrejelzés problémája regressziós problémaként jelenik meg. A feladattal összefüggésben a neurális hálózatot nemlineáris függvénynek tekintjük, melynek komplexitását "félparametrikusan" szabályozzuk - a hálózat elemeinek száma befolyásolja a megoldás összetettségét, de természetesen az elemző nem látja a regressziós függvény explicit formáját.

Szükséges egy neurális hálózat kiépítése, amely az elhaladó járművek számától és típusától függően kiszámítja az ólom légkörbe jutását. Az adatokat a lead.xls fájl tárolja.

Nyissa meg a Lead.xls fájlt a Statistica csomagban. Megjelenik a "Fájl megnyitása" ablak.

Rizs. 4. 33. Importálás ablak.

Ki kell választani a "Kiválasztott lap importálása" opciót, és ki kell választani az adatlap nevét:

Rizs. 4. 34. A Statistica csomagba importálandó Excel munkalap kiválasztása.

A következő ablakban meg kell adni a valós adatparamétereket, amelyek általában automatikusan kerülnek meghatározásra és megjelenítésre (kivéve az utolsó három jelölőnégyzetet).

Rizs. 4. 35. Importálási terület beállítása.

Ezt követően az importált adatok megjelennek az ablakban.

Rizs. 4. 36. Eredmények importálása.

Futtassa az elemzőcsomagot neurális hálózatok segítségével. Ehhez válassza az "Elemzés" menü "Neurális hálózatok" menüpontját.

Rizs. 4. 37. Az adatfeldolgozási módszer megválasztása - "neurális hálózat".

ezután megjelenik a STATISTICA Neural Networks csomagablak:

Rizs. 4. 38. A "neurális hálózatok" elemzés kezdő ablaka.

Lépjen a "Gyors" fülre, ahol be kell állítania a feladat típusát - Regression, és az eszközt - Network Builder.

Rizs. 4. 39. Neurális hálózatok konstruktorának indítása.

Továbbá az "OK" gomb megnyomásával átvált a kimeneti (függő) és bemeneti (független) változók kiválasztásának módjára. Elsőként a „Lead”-et választjuk, utolsóként pedig az összes kategória autóinak számát. A „#” és „Utcák” oszlopok kihasználatlanul maradnak.

Rizs. 4. 40. Bemeneti és kimeneti adatok kiválasztása a neurális hálózathoz.

Az "OK" gombra kattintva ismét visszatér a "Gyors" fülre. Ezután az "OK" gombra ismételt kattintással a neurális hálózat kialakítása ablakba kerül. A "Gyors" lapon ki kell választania a hálózat típusát - többrétegű perceptron,

Rizs. 4. 41. Neurális hálózat típusának megválasztása.

az "Elemek" fülön pedig megadhatja a rétegek szükséges számát, az egyes neuronok számát, valamint az aktiválási funkció típusát:

Rizs. 4. 42. A neuronok rétegszámának és típusának beállítása.

Rizs. 4. 43. Neurális hálózat betanítási módszerének kiválasztása.

Itt a „Kiválasztások” gombra kattintva állíthatja be a képzési, ellenőrzési és tesztesetek számát. Ha nullára állítja a teszt- és ellenőrzési esetek számát, akkor a hálózat minden példára betanításra kerül:

Rizs. 4. 44. A képzési és tesztelési adatok meghatározása.

Visszatérve a fő tanulási ablakhoz, a „Felhasználó” gombra kattintva és az „Interaktív” fülre lépve kérheti, hogy a tanulási folyamat grafikonon jelenjen meg:

Rizs. 4. 45. A tanulási folyamat bemutatására szolgáló grafikon típusának beállítása.

Végül az "OK" gombra kattintva elindítja a tanulási folyamatot, melynek eredménye megjelenik a grafikonon:

Rizs. 4. 46. Neurális háló tréning.

Az "OK" gombra kattintva a találati ablakba jut, ahol az ablak fülein keresztül tanulmányozhatja a létrehozott hálózat különféle jellemzőit:

Rizs. 4. 47. Neurális hálózatok modellezésének eredményei.

Tehát például a "Speciális" lapon van egy "Hálózati architektúra" gomb, amelyre kattintva megtekintheti a felépített hálózat topológiáját:

Rizs. 4. 48. A felépített neurális hálózat képe.

valamint a "Felhasználói megfigyelések" gomb, ahol beállíthatja a hálózatot új kezdeti adatokkal és megkaphatja a már betanított hálózat válaszát.

Tematikus anyagok:

Jelentkezzen be a Yandex lemez bejelentkezési jelszavába

Danil Fimushkin Adobe animációban dolgozik

Hogyan irányítsuk az egeret a billentyűzetről

Mi az a skype protokoll?

módosítsa a témát Windows 10-re

Program hozzáadása a víruskereső kizárásokhoz Kizárások hozzáadása a Norton Securityhez

Hogyan telepítsünk ingyenes Yandex böngészőt a számítógépre

A GPT lemezekkel kapcsolatos probléma megoldása a Windows telepítésekor

Frissítve: 2021.09.09

103583

Ha hibát észlel, jelöljön ki egy szövegrészt, és nyomja meg a Ctrl + Enter billentyűket

OSSZA MEG: