Okna.  Wirusy.  Laptopy.  Internet.  Biuro.  Narzędzia.  Kierowcy

Zacznijmy od razu od głównego kodu skryptu:

#!/usr/bin/perl

# skrypt Which-forum.pl
# (c) 2010 Alexandr A Alexeev, http://site/

użyj ścisłego;

# skomentowane linie - dla rygorystyczności
# jeśli zadaniem jest zbieranie statystyk silnika, zostaw to tak, jak jest
# jeśli tworzysz listę forów - odkomentuj

moje $dane;
$data .= $_while (<> ) ;

# sprawdź ile kosztowało Powered by phpBB bez linku w stopce
wydrukuj „phpbb \N"
jeśli ($dane =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?"[^>]*>phpBB/i Lub
# $data =~ /viewforum\.php\?[^""]*f=\d+/i lub
$data =~ /phpBB\-SEO/i lub
$dane =~ /) ;
wydrukuj „ipb \N"
jeśli ($dane =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i Lub
$dane =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?"[^>]*>Invision Power Board/i Lub
$dane =~ /

/I Lub
$dane =~ /index\.php\?[^""]*showforum=\d+/i) ;
wydrukuj „vbiuletyn \N"
jeśli ($dane =~ /Powered by:?[^<]+vBulletin[^<]+(?:Version)?/i Lub
$dane =~ /) ;
wydrukuj „smf \N"
jeśli ($dane =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?"[^>]*>Obsługiwane przez SMF/i Lub
$dane =~ /index\.php\?[^""]*board=\d+\.0/i) ;
wydrukuj „punbb \N"
jeśli ($dane =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i) ;
#Lub
# $data =~ /viewforum\.php\?[^""]*id=\d+/i); \N"
wydrukuj „fluxbb
# if($data =~ /viewtopic\.php\?id=\d+/i lub /jeśli ( $dane =~) ;
]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i \N"
jeśli ($dane =~ /wydrukuj „exbb]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?"[^>]*>ExBB/i
) ;
# Lub \N"
jeśli ($dane =~ /# $data =~ /forums\.php\?[^""]*forum=\d+/i); Lub
wydrukuj „yabb
]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?"[^>]*>YaBB/i \N"
jeśli ($dane =~ $data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;<\/title>/I Lub
$dane =~ /wydrukuj „dleforum<\/a>/I) ;
/\(Obsługiwane przez forum DLE\) \N"
jeśli ($dane =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">Forum DLE Lub
$dane =~ /]*>Ikonboard/i \N"
jeśli ($dane =~ /]*>ExBB/i
$data =~ /ikonboard\.cgi/i ) ;
wydrukuj „bbpress
# $data =~ /topic\.php\?id=\d+/i lub \N"
# $data =~ /forum\.php\?id=\d+/i);
wydrukuj „flashbb
jeśli ($dane =~ /# if($data =~ /forums\.php\?fid=\d+/i lub) ;
# $data =~ /topic\.php\?fid=\d+/i lub \N"
# if($data =~ /forum\.php\?f=\d+/i lub
jeśli ($dane =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i) ;
wydrukuj „podium \N"
# if($data =~ /topic\.php\?t=\d+/i lub
jeśli ($dane =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>Podium/i) ;
wydrukuj „usebb \N"
# if($data =~ /forum\.php\?id=\d+/i lub
jeśli ($dane =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>UseBB/i) ;
wydrukuj „wrforum \N"
# if($data =~ /index\.php\?fid=\d+/i lub
jeśli ($dane =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-Forum/i) ;
wydrukuj „yetaotherforumnet \N"
if ($data =~ /Jeszcze inne forum\.net/i lub
$dane =~ /default\.aspx\?g=posts&t=\d+/i) ;

Ten i inne skrypty wspomniane w poście znajdziesz w tym archiwum.

Scenariusz które-forum.pl sprawdza kod strony HTML, czy zawiera sygnatury silnika forum. Użyliśmy podobnej techniki podczas definiowania WordPressa i Joomli, ale jest kilka różnic. Po pierwsze, sam skrypt nie ładuje kodu strony, ale czyta go ze standardowego wejścia lub pliku przekazanego jako argument. Dzięki temu można raz pobrać stronę, na przykład za pomocą wget, a następnie przepuścić ją przez kilka analizatorów, jeśli mamy więcej niż jeden. Po drugie, w tym skrypcie obecność sygnatury jest w 100% oznaką silnika. Ostatnim razem obecność podpisu tylko dodała wagę odpowiedniemu silnikowi, a silnik o największej masie „wygrał”. Uznałem, że w tym przypadku takie podejście tylko niepotrzebnie skomplikowałoby kod.

Aby przetestować skrypt, przeprowadziłem pewne badania. Stworzyłem listę kilku tysięcy forów i każde z nich przepuściłem w swoim skrypcie, ustalając w ten sposób procent odpowiedzi programu i popularność poszczególnych silników.

Aby uzyskać listę forów, użyłem mojego parsera Google. Zapytania takie jak to były wysyłane do wyszukiwarki

strona:forum.*.ru
strona:dyskusja.*.ru
strona:board.*.ru
strona:smf.*.ru
strona:phpbb.*.ru
....

i tak dalej. Pełny kod generatora zapytań znajdziesz w pliku gen-forumsearch-urls.pl. Oprócz Zone.ru używano również .su .ua .kz i .by. Ostatnim razem przeprowadzenie takiego badania było trudne, ponieważ witryny WordPress i Joomla nie mają takich podpisów w adresie URL. Katalogi takie jak cmsmagazine.ru/catalogue/ nie zapewniają wystarczającej wielkości próby. Co to jest 600 witryn Drupal?

Muszę przyznać, że wyniki eksperymentu mnie rozczarowały. Spośród 12 590 zbadanych lokalizacji silnik został pomyślnie zidentyfikowany jedynie w 7 083, czyli tylko w 56% przypadków. Może nie wziąłem pod uwagę jakiegoś silnika? Czy to prawda, że ​​na połowie forów zainstalowano Bitrix? A może powinienem był poświęcić więcej czasu na szukanie podpisów? Ogólnie rzecz biorąc, wymagane są tutaj dodatkowe badania.

Wśród 56% pomyślnie zidentyfikowanych silników, jak można było się spodziewać, najpopularniejsze były IPB (31%), phpBB (26,6%) i vBulletin (26,5%)

Za nimi, z dużym opóźnieniem, plasują się SMF (5,8%) i DLEForum (5,3%). Mój ulubiony punBB znalazł się dopiero na 6. miejscu (1,64%). Nie radziłbym zbytnio wierzyć tym liczbom (podają, że co trzecie forum w RuNet działa na IPB), ale pewne wnioski można oczywiście wyciągnąć.

Przykładowo, jeśli zamierzasz stworzyć witrynę na silniku forum i planujesz modyfikować forum, powiedzmy raz w tygodniu płacić użytkownikom 0,01 $ za każdą wiadomość z automatycznym pobieraniem środków, to powinieneś wybrać jeden z trzech najpopularniejszych silników. Im popularniejsze forum, tym większa szansa na znalezienie programisty, który jest w nim dobrze zorientowany.

Jeśli w silniku nie przewiduje się znaczących zmian, wówczas sensownym może okazać się wybranie mniej popularnego silnika, np. SMF lub punBB. Zmniejszy to liczbę ataków hakerów na Twoje forum i ilość spamu automatycznie wysyłanego na nie.

Skrypty do wyszukiwania/identyfikacji forów również mogą znaleźć wiele praktycznych zastosowań. Pierwszą rzeczą, która przyszła mi do głowy, było posortowanie zidentyfikowanych forów według TIC i umieszczenie w pierwszych stu postach linków do jednej z moich stron. Jednak setki linków dofollow na forum nie wpłynęło w żaden sposób na TCI (minęły 2 aktualizacje), więc lepiej nie tracić tutaj czasu, chyba że nie interesują Cię przejścia.

Oczywiste jest, że wspomniane użycie skryptów nie jest jedyne. Myślę, że bez problemu dowiesz się, jak jeszcze możesz je wykorzystać.

Obecnie bardzo modne jest „reanimowanie” wszystkiego, a mądrzy ludzie wymyślają w Internecie „metody reanimacji”, zarówno te zupełnie głupie, jak i wręcz szkodliwe, jak gorące prysznice oraz moczenie się w nawozach i używkach. Natomiast nieszczęśliwe rośliny najczęściej są po prostu niezdrowe i trzeba je leczyć, a nie zajmować się bzdurami! Poza tym rośliny rzekomo „wymagające reanimacji” są najczęściej dotknięte różnymi infekcjami, w tym ukrytymi, i w przypadku takich roślin zastosowanie dzikich metod „reanimacji” z prysznicami, nawozami i stymulacją będzie jak śmierć, a jedynie pogorszyć ich stan :exclaim:

Przyjrzyjmy się historii fału, który wziąłem za „zmartwychwstanie”.
Prehistoria jest następująca, zwyczajna i banalna: zwykły falik, „uprawiany” przez trzy lata w ramach „zwykłej kultury falik” (no cóż, jak wszędzie w zwyczaju, niestety). Przez wszystkie trzy lata „wszystko było w porządku”, a sokół nawet okresowo kwitł przez cały ten czas. A potem - jak zawsze, „nagle” zaczęła powoli tracić turgor, żółknąć i stopniowo gubić liście. Wcześniej przez co najmniej rok nie wyrastały w ogóle nowe korzenie z łodygi. Zrozumieli to, gdy fał zwiotczał pomimo aktywnego podlewania i był już całkowicie wyłysiony.
Czy potrzebujesz „reanimacji”? Tymczasem roślina ta źle się czuje tylko dlatego, że została doprowadzona do poważnej infekcji łodygi, straszliwej choroby, która pojawia się całkiem niewidocznie.

Tak wyszło po trzech latach „udanej hodowli na mokro” w podłożu intensywnie wilgotnym z pogłębieniem podłoża
a następnie wyjaśnienia: co się z nim dzieje, dlaczego tak się dzieje, jak sobie z tym poradzić i co najważniejsze, jak do tego nie dopuścić. I wiele innych ciekawych rzeczy.

Co się działo przez te trzy lata STOPNIOWO - aż „wszystko było w porządku”?
Ale po prostu - nic nie było naprawdę dobre. Fał długo przebywał w „mokrym podłożu”, a szyja miała z nim stały kontakt. Oznacza to, że przewlekłe podlewanie następowało metodycznie, co doprowadziło do pojawienia się i rozwoju tracheomykozy łodygi.
Stare korzenie, które widzicie na górnym zdjęciu - pomimo swojej twardości - zesztywniały od ciągłej wilgoci i przestały normalnie funkcjonować. Teraz nie wytwarzają już nawet młodych gałęzi, takich jak zdrowe, stare korzenie. Oznacza to, że wszystko tam jest już martwe i zniszczone, chociaż gęstość korzeni została zachowana.

Ale najważniejsze, że infekcja grzybicza stopniowo wnikała w łodygę, coraz wyżej, a fał zaczął po drodze tracić liście (i to wcale nie z „starzenia się”, zapewniam :-)) Jakoś się samo -pewny siebie chłopak napisał do mnie i przysłał zdjęcie fału, z którego łodygi odpadły już dosłownie wszystkie listki i tylko wyrósł tylko młody, odrośnięty wierzchołek. A to wszystko leżało w mokrym torfowcu, jak „rosnące korzenie” :-))) Chłopiec zapytał - kiedy wyrosną korzenie i może powinien to coś przykryć mchem pokrywką dla dodatkowej wilgoci? (twarde!) Kiedy powiedziałam chłopakowi, że drań ma nieskrywaną grzybicę, z jakiegoś powodu nie uwierzył (no cóż, było mu obce to słowo! Na forach o tym nie mówili :-)) i zaczął mi udowadniać, że fał się tak łuszczy, bo jak się regeneruje bez korzeni, to roślina zużywa zapasy starych liści, a jaki ja jestem głupi, że nie umiem takich prostych rzeczy :-)))))) Tak, to „samo siebie zjada” tak bardzo, kochanie, że potem w końcu nie zostaje z niego już nic… a na koniec okazuje się, że nie ma już czego „odnawiać”....

Dlatego przypominam jeszcze raz – kiedy części zamienne rośliny aktywnie i masowo „niszczą się”, zwłaszcza, że ​​wszystko wysycha/żółknie/brązowieje/opada, to „orchia zjada” nie ma z tym nic wspólnego! To jest CHOROBA, którą należy leczyć. Zdrowa cebula – z której „czerpiemy” zapasy składników odżywczych i wody – może bardzo mocno się pomarszczyć – ale pozostanie idealnie zielona. Podobnie liść. Jedynymi wyjątkami są gatunki prawdziwie „liściaste”, których jest wiele wśród gatunków i mieszańców międzygatunkowych fałów typu filadelfijskiego.

Skoro więc już ustaliliśmy ważny „szczegół”, wróćmy jeszcze raz do naszych baranów, a konkretnie do orhy ze zdjęciem. Ogólnie rzecz biorąc, podmokłość i choroby stopniowo doprowadziły ją do tego, że biedna roślina została dosłownie sparaliżowana „od pasa w dół”, jej „nogi zostały sparaliżowane” i całkowicie przestała odczuwać wilgoć - poprzez podlewanie starych korzeni. Dlatego zaczęła powoli, ale systematycznie więdnąć w swojej zielonej i rosnącej części.
Kiedy obrałam pozostałe liście, które zaczęły gnić, zobaczyłam typowy obraz, którego właściciele oczywiście nie widzą i nie zauważają pod liśćmi. Widziałem to - liliowo-różową pigmentację na jeszcze świeżych tkankach - jeden z „wskaźników” fusarium (przypominam, że zmiany tracheomykozowe to nie tylko fusarium, ale także verticillium. A przy wertycylozie często nic nie jest widoczne, ani wewnątrz lub na zewnątrz - z tą różnicą, że „wszystko wysycha” - i to wszystko)
(Przykro nam, ale nie masz dostępu do galerii)
(Przykro nam, ale nie masz dostępu do galerii)
Wyjaśniam, że z JUŻ USZKODZONEJ części łodygi (a także kłączy w sympoidalnych) - nie ma sensu czekać na korzenie. STĄD nic dobrego nie wyrośnie. Albo całkowicie, albo pojawią się „pryszcze”, które nigdy się nie rozwiną, albo wraz z resztką sił wyjdą bardzo krótkie korzenie, które albo natychmiast się przepoczwarzają, albo pozostaną krótkie i wystające, nie mając siły dalej rosnąć. Możliwe jest także ich późniejsze nagłe wyschnięcie.

Dlatego też, gdy zobaczysz taki obraz z korzeniami DOWOLNEJ storczyki, wiedz: nie jest to kwestia zewnętrznych „nieodpowiednich warunków”. Jest to GŁĘBOKI WEWNĘTRZNY problem rośliny.

Zdrowy i dobry rozwój korzeni jest możliwy TYLKO z idealnie zdrowej wewnętrznej części storczyka. I nic więcej.

Wróćmy do zdjęcia na górze. Zauważmy, że wzrost korzeni nastąpił dokładnie tam, gdzie powiedziałem. Wszystko poniżej pozostało martwe i nieżywotne, ponieważ zostało dobrze „zjedzone” przez infekcję.

Tracheomykozę wyleczono poprzez wielokrotne powlekanie fundazolem nie tylko chorych części rośliny, ale przede wszystkim zdrowych, górnych części! Nie zapominaj, że powlekając tylko dotknięte części, zol podkładowy nie może rozprzestrzenić się po całej roślinie i leczyć go! Aby zwiększyć skuteczność leczenia, konieczne jest rozmazanie zdrowych tkanek.

Sprawa była trudna, mówię wam. Ponieważ wzrost korzeni rozpoczął się dopiero teraz - 4 miesiące (!!!) od rozpoczęcia leczenia.
Przez cały ten okres fał był suchy. Gdzie to miało być „wypełnione”? „Dół” był sparaliżowany i nie wyczuwał wody, a „góra” była niebezpiecznie zakażona, więc można było go bez ryzyka spryskać.
Jednak nawet po takim okresie - widać na nowym górnym zdjęciu - roślina nie łysieje już ani nie pożółknie, a wszystkie liście, które były na początku zabiegu pozostały na swoim miejscu, a nawet pozostały zielone, chociaż bardzo straciły na turgorze (dolne są mocniejsze od górnych, górne są nawet dość elastyczne, choć dalekie od ideału)

Tak POWINNO być. Kiedy roślina nie jest jeszcze śmiertelnie dotknięta. Kiedy leczenie wyraźnie przynosi rezultaty. Tak właśnie powinno być. Nawet jeśli roślina następnie zregeneruje się i to nie szybko - ale w zasadzie - nadal jest do tego zdolna.

W przypadku niemal natychmiastowej utraty turgoru, stan rośliny szybko się pogarsza, z każdym dniem, pomimo leczenia... Takie zachowanie często wskazuje, że ten moment JUŻ minął, roślina doznała zbyt dużych uszkodzeń (nieważne, w jaki sposób) jednocześnie wyglądało to tak, jakby ZEWNĄTRZ - WEWNĘTRZNE problemy w końcu go wykończyły)
Nie zapominaj, że tracheomykoza na storczykach jest niewidoczna i podstępna.
Nie daj się zwieść pozorom i nie pozwól, aby wydarzyły się nawet „dziwne” momenty w zachowaniu storczyka.
Bo wtedy... wtedy może być już za późno na wypicie Borjomi.

PS: jak można nigdy nie pozwolić roślinie dojść do tego punktu?
Dokładnie studiujemy materiały na tematy „przesadzanie storczyków” i „podlewanie storczyków”

PPS: na wypadek, gdyby ktoś jeszcze nie zrozumiał.
Nie myślcie, że ten post dotyczy tylko fałów hybrydowych holenderskich i fałów w ogóle :-)) Nie myślcie, że jeśli macie gatunek egzo-o-o-tika, to nigdy nie zachoruje na te „choroby plebejskie” wszelkiego rodzaju hybrydy :-)) Wszystkie storczyki cierpią na to, mogą zachorować. I wszystko, co zostało powiedziane, dotyczy każdej orchidei, bez wyjątku, w oparciu o podobieństwo objawów - to samo.
© Inna Liapin

Historia tego nieszczęsnego upadku jeszcze się nie skończyła. Zwykle takie historie trwają wiele, wiele miesięcy...
Żyje, walczy, choć po pewnym czasie niewiele po nim zostało ze względu na poważną chorobę.
Ciąg dalszy. Tutaj i poniżej

Organizowane przez Botmaster Labs, nieplanowane. Nie mam czasu, filmik jest potrzebny na konkurs, jako nowy trend, chociaż wszystko da się łatwiej wytłumaczyć dobrymi screenami (moje IMHO), a nie bardzo chce mi się cokolwiek kręcić. Tych dochodowych zostało już bardzo mało, głupi spam już w ogóle nie rządzi, trzeba tu pomyśleć i nikt nie będzie zakładał tematów, chyba że przestarzałe spróbujesz zapakować w piękne opakowanie i trochę je pudrować. :) Ale tu nie chodzi o nas. Ogólnie rzecz biorąc, te 3 „nie”, myślę, że w zasadzie stały się barierami w udziale w konkursie dla większości potencjalnych uczestników. To jak naprawiać samochód z trzech: tanio, wysokiej jakości, szybko – usługa może spełnić tylko 2 warunki jednocześnie. usiądź i wybierz to, co jest Ci bliżej. :) Podobnie jest z konkursem: mam czas, umiem nakręcić film, ale nie ma tematu, albo umiem nakręcić film, jest temat, ale nie mam czasu na wszystko, albo mam trochę wolnego czasu i jest mały temat, ale film jest straszny. Ale jest to dobre, jeśli spełnione są jednocześnie 2 warunki. No dobrze, odrzućmy teksty. Będę dalej dla siebie. Nie planowałem, czyli wziąłem udział w konkursie, nawet wybrałem, na który artykuł oddam głos. Cokolwiek powiesz, Doz zna oprogramowanie bardzo dobrze i wie, jak z niego korzystać bardzo inteligentnie. Ale dzisiaj dowiedziałam się, że w konkursie pojawiła się intryga. Okazuje się, że nie będę mógł głosować, a będą mogli to zrobić tylko nowicjusze, którzy zakupili oprogramowanie w 2011 roku i dla nich konkurs jest przeznaczony. Trochę się zdziwiłem, ale właściciel to gentleman. Konkurs jest kampanią reklamową i Alexander wie lepiej, jak ją przeprowadzić. Ogólnie rzecz biorąc, postanowiłem opublikować artykuł; nieco łatwiej jest pisać, gdy jest jasne, dla kogo, w rzeczywistości dla całego kołchozu, nie jest to możliwe.
Długie wprowadzenie już za nami, teraz do rzeczy.
Czego potrzebuje początkujący, gdy nabył taki superkombajn, jakim jest kompleks Xrumer + Hrefer? Zgadza się, naucz się nad tym pracować i pozbądź się złudzeń, że możesz zarabiać pieniądze, zaczynając od spamowania arkuszy. Jeśli tak uważasz, lepiej od razu przekaż swoje pieniądze na cele charytatywne. Musisz nauczyć się korzystać z narzędzi kompleksu, najlepiej ostrząc je dla siebie. Czasy „bierz więcej – rzuć dalej” minęły. Ilość ustępuje jakości. Oznacza to, że sami zbudujemy bazę; jeśli nie nauczysz się, jak to zrobić, zostaniesz w tyle za pociągiem. Oczywiście Khrefer nam w tym pomoże. Jeśli planujesz promować swoje zasoby w Google, musimy również wyszukać witryny darczyńców za pośrednictwem Google. Myślę, że jest to zrozumiałe i logiczne. Ale Google, niczym władczyni miedzianej góry, nie każdemu rozdaje swoje bogactwo. Trzeba do tego podejść. Od razu mówię, że nie mam nadziei, że na podstawie znaków, które spotkacie w miejscach publicznych, uda się coś zebrać. Są one dostępne publicznie, ponieważ są bezwartościowe. Nie będę dalej rozwijał tematu. Lepiej powiedzieć, jak poprawnie go złożyć, abyś mógł zobaczyć wynik, resztę możesz sam wypracować, najważniejsze jest zrozumienie zasady. Musimy zebrać te właściwe w oparciu o charakterystykę konkretnych silników, których potrzebujemy, a nie ogólnie o charakterystykę forów. To główny błąd początkujących – nie koncentrowanie się na konkretnej rzeczy, ale próba ogarnięcia wszystkiego całościowo. A także, jeśli chcesz analizować mniej więcej normalną bazę danych, przestań używać operatorów w zapytaniach. Żadnych „inurl:”, „site:”, „title” itp. Google natychmiast zablokuje wyszukiwarki takie jak Ty. Dlatego dokładnie badamy silniki, z którymi obecnie współpracuje Khrumer:

Obsługiwane przez php-Fusion

W wersji Khroomer 7.07 program jest szkolony na kilku nowych silnikach:

forumi.biz, forumb.biz, 1forum.biz, 7forum.biz itp.

phpBB-fr.com, motyw phpBB dla Solarisa

A proces uczenia się nowych rzeczy jest ciągły.
Ogólnie rzecz biorąc, musimy przygotować poprawne zapytania do analizy przez Hrefer. Weźmy jako przykład forum dizhok. Forum SMF. I zacznijmy go rozkładać na części zamienne do analizy. Pomoże nam w tym nasz ukochany Google. Wpisz zapytanie do Google Forum SMF- w wynikach wyszukiwania jest dużo śmieci, cofamy się do jakiejś 13 strony i wybieramy dowolny link. Natknąłem się na ten: http://www.volcanohost.com/forum/index.php?topic=11.0. Otwórzmy to i przestudiujmy. Musimy znaleźć na stronie coś charakterystycznego, co można zastosować do wyszukiwania innych stron w tym silniku. W stopce zauważamy następujący napis Obsługiwane przez SMF 1.1.14, zacytuj go i wpisz w Google, pokazuje nam, że dla tego zapytania zna około 59 milionów opcji. Szybko przeglądamy linki, dodajemy jeszcze kilka opcji do tego słowa kluczowego, np. Topola „Powered by SMF 1.1.14”. Lub Viagra „Powered by SMF 1.1.14”.. Dbamy o to, aby prośba była świetna, wyniki to tylko fora i prawie żadnych śmieci.

Poza tym nie interesuje nas ilość, ale jakość, jak powiedziałem powyżej. Przejdźmy dalej. Z tego samego forum czerpiemy ze stopki jeszcze jedno zdanie: , my również go cytujemy i przekazujemy do Google. W odpowiedzi wyjawia, że ​​zna ponad 13 milionów wyników. Ponownie szybko przeglądamy wyniki, dodajemy dodatkowe słowa i sprawdzamy z nimi wyniki. Dbamy o to, aby prośba była doskonała i prawie nie było śmieci. Ogólnie rzecz biorąc, są już 2 prośby o żelazo. Sugeruję na razie zostawić pierwsze forum w spokoju i kontynuować zbieranie próśb z innych forów. Na szczęście mamy Google otwarte na żądanie. 2006-2008, Simple Machines LLC. Z wyników wyszukiwania bierzemy na przykład te fora: http://www.snowlinks.ru/forum/index.php?topic=1062.0 i http://litputnik.ru/forum/index.php?action=printpage ;topic=380.0 w stopce pobieramy od nich zapytania: „Powered by SMF 1.1.7” i „Powered by SMF 1.1.10” (zawsze polecam wpisywać zapytania o Hrefer w cudzysłowie, gdyż przede wszystkim zależy nam na jakości Wszystko). Myślę, że jest jasne co robimy, docelowo będziemy mieli pewną bazę zapytań do przeszukiwania forów na silniku SMF (wybrano ją jako przykład, tak samo z innymi silnikami).
Będzie to wyglądać mniej więcej tak:

„Napędzany przez SMF 1.1.2”

„Napędzany przez SMF 1.1.3”

„Zasilany przez SMF 1.1 RC2”

„Napędzany przez SMF 1.1.4”

„Napędzany przez SMF 1.1.8”

„Zasilany przez SMF 1.1.7”

„2006-2008, Simple Machines LLC”

I to nie wszystko. Zbierając wersje silników, na niektórych forach SMF w stopce znajdujemy podpis „2001-2006, Lewis Media”. Sprawdzamy tę prośbę, ona również w pełni nas satysfakcjonuje. Znajdujemy podobny wniosek: „2001-2005, Lewis Media”. Przeglądając dalej stopki, znajdujemy następującą prośbę: „Projekt SMFone autorstwa A.M.A, przeniesiony do SMF 1.1”. Sprawdzamy – świetnie. I tak dalej. Pół godziny pracy i masz cudowną bazę zapytań do silnika, a Google będzie Cię banował za te zapytania znacznie rzadziej, niż gdybyś używał w nich operatorów. A jednocześnie Twoja baza danych będzie znacznie czystsza, niż gdybyś używał zapytań typu „index.php?topic=”, ponieważ tutaj Google udostępni nie tylko potrzebne nam fora, ale także wiele lewicowych zasobów tam, gdzie było to możliwe zostaw link do tematu na forum. Możesz się sprzeciwić. Co w tym złego? Inni zostawili link, więc my też możemy. Ale! Linki mogą pozostawiać nie tylko Khrumer, ale także inne programy. Co więcej, można je specjalnie dostosować do pozostawiania komentarzy na temat danego zasobu, tzw. oprogramowania wysoce specjalistycznego, a ponadto takie linki można pozostawiać ręcznie. Powtarzam jeszcze raz, nie ilość śmieci jest dla nas ważna, ale ich jakość, z właściwymi zgłoszeniami będziemy gromadzić bazę danych. Zaletą tej metody jest to, że praktycznie nie trzeba jej konfigurować sito -filtr , możesz po prostu to wyłączyć, bo Google praktycznie nie będzie Ci wyrzucał śmieci.


Myślę, że nauczenie się prawidłowego używania Hrumera na początkowym etapie jest bardzo ważne, ponieważ gdy się tego nauczysz, zawsze możesz znaleźć zastosowanie dla Hrumera, niezależnie od tego, jak zmieni się sytuacja. Zabezpieczenia stają się coraz bardziej skomplikowane i jeśli na niektórych typach silników zabezpieczenie zostało wzmocnione i Khroomer w tej chwili nie jest w stanie sobie z tym poradzić, to nie ma sensu wydawać zasobów na zbieranie tych linków, a następnie pracować nad nimi za pomocą Khroomera, to lepiej skoncentrować siły na tym, co daje rezultaty. Jednocześnie, jeśli zespół Botmaster Labs nauczył Khroomera czegoś nowego, możesz szybko przeprowadzić sekcję nowego pacjenta i przygotować bazę dla Khroomera, gdy pacjent jest jeszcze ciepły. Czas to pieniądz; zasób może nie mieć już znaczenia, gdy kupisz bazę. zebrane przez kogoś. Ponadto prawidłowe zebranie baz dla siebie znacznie rozszerza „białe” użycie Khrumera. I właśnie w tym miejscu wszystko się porusza, czy nam się to podoba, czy nie, i trwa proces wybielania lub siwienia. Czarne prześcieradła pod każdym względem stają się przeszłością.
Wszystkie inne techniczne aspekty pracy z Hreferem można zobaczyć w pomocy i nie ma sensu się nad nimi rozwodzić, wszystkie cele, punkty, sekundy są ustalane eksperymentalnie dla każdego samochodu indywidualnie.
Jako bonus wrzucę tutaj szablon do parsowania chińskiej wyszukiwarki Baidu, któregoś dnia mnie o to pytali, więc zrobiłem to od niechcenia, przepraszam za grę słów. :)


Nazwa hosta=http://www.baidu.com
Zapytanie=s?wd=
LinksMaska=
Całkowita liczba stron = 100
Następna strona=

Następna Strona2=

CaptchaURL=
CaptchaImage=
Pole Captcha=


Próbowałem je przetestować, nie było bana, Khrefer szybko zebrał zasoby, wszystkie zapytania o parsowanie były podobne do Google, ale było dużo chińskich zasobów, z wysokim PR, a poza tym było wiele miejsc, gdzie nie było Europejczyk kiedykolwiek postawił stopę. Lepiej jest analizować chińskie zapytania. Pomoże w tym tłumacz Google, wpisz listę słów kluczowych po rosyjsku i przetłumacz ją na chiński. Prawda w „ Słowa„Słów Hrefer nie można dodawać w języku chińskim, należy je przekodować.
Zamiast chińskiego:

Rozwiązanie – Viagra

吉他 – gitara

其他 – odpoczynek

保险公司 - ubezpieczenie

Umieść te kody zastępujące w pliku Words:

%E4%BC%9F%E5%93%A5

%E5%90%89%E4%BB%96

%E5%85%B6%E4%BB%96

%E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8

Jeśli promujesz serwis ubezpieczeniowy, to umieszczając link w swoim profilu na znalezionym na życzenie forum tematycznym (!) nawet chińskim” Forum SMF” 保险公司 będzie bardzo dobrze.
Podsumowując, chciałbym powiedzieć, że nigdy nie rozumiałem ludzi, którzy narzekali, że Khrefers są źle lub źle ugotowane, w odpowiedzi zawsze chciałem powiedzieć, że po prostu nie wiesz, jak je ugotować; Żaden parser nie może zebrać wyników lepiej niż osoba polecająca; żądania muszą być po prostu poprawne. Hrefer to samochód: dobry, solidny, wyprodukowany w Niemczech, ale prowadzony przez człowieka i wszystko zależy od tego, jak dobrze się nim jeździ; nie da się zmusić samochodu, aby jechał jednocześnie w prawo i w lewo.
Osobnym tematem jest czyszczenie baz danych, robiłem to kiedyś 3 lata temu na poprzednie zawody. W większości wszystko jest tam nadal aktualne, ale teraz możesz odmówić sprawdzenia 200 OK, naprawdę nie podobał mi się ten proces, błędy były bardzo duże, odfiltrowano wiele niepotrzebnych rzeczy. Teraz można to zrobić prawie automatycznie podczas działania Khroomera, chociaż proces ten nie jest całkowitym analogiem sprawdzania „200 OK”. Tak czy inaczej do rzeczy: niedawno pojawiła się w Khrumerze cudowna możliwość - wyłudzić informacje z zasobów w momencie prowadzenia projektu. Wygląda to tak. Podajesz szablon, który będzie przetwarzany podczas operacji, a informacje zebrane z szablonu zostaną zapisane do pliku xgraished.txt w folderze Logs. Możesz użyć tej funkcji do wszystkiego, lot wyobraźni jest ogromny. Używam tej funkcji raz w tygodniu, aby usunąć linki z wygasłej działającej bazy danych. Nie jest tajemnicą, że fora wymierają z każdym dniem, aby oczyścić naszą bazę danych z takich zasobów, a narzędzie „Autograbbing” nam w tym pomoże.
Przecież trzeba przyznać, że kiedy często wpisujemy np. http://www.laptopace.com/index.php, to widzimy, że ta domena jest już np. dobrym gościem sprzedającym pieniądze, ale nie ma tam forum. Aby więc wyrzucić ten żużel z bazy, okradniemy. :) Otwórz kod źródłowy strony i zobacz tam ten wpis:

laptopce.com
Aby złapać, przekształcamy go w
[...]

Teraz wszyscy „umarli” z goudaddi będą nam znani z imienia.
Oto mały wybór narzędzia Autograbbing, jeśli chcesz wyczyścić bazę danych z różnych „wygasłych” domen:


[...]

[...]
[...]
[...]

[...]
Ta domena może być na sprzedaż. [...]Kup tę domenę


[...]<body bgcolor="#ffffff" text="#000000"> </span><br>Lista nie jest kompletna, ale myślę, że pomoże Ci uniknąć wielokrotnego uruchamiania wielomilionowych baz danych na śmieci. Utworzenie szablonu nie jest trudne, wystarczy otworzyć wygasły link i utworzyć maskę szablonu. <br>Korzystając z tego samego automatycznego przechwytywania, możesz także przeglądać istniejące bazy danych i sortować je według zasobów, dzieląc je według silników. Sortowanie baz danych według silników pozwoli Ci optymalnie wykorzystać wszystkie możliwości i ustawienia Khroomera, w szczególności proces uczenia się. . Poza tym za pomocą Autograbbingu możesz usuwać śmieci z baz danych, jeśli wolisz je zbierać nie za pomocą Hrefer, ale pobierając je z różnych usług hostingu plików. Aby to zrobić, musisz albo utworzyć maskę do wybierania forów, a następnie zebrać z bazy danych tylko to, co zostanie przechwycone przez maskę, albo odwrotnie, utworzyć maskę dla nie-forów, a następnie usunąć to, co zostanie przechwycone. Pierwsza opcja jest bardziej logiczna i niezawodna, ponieważ wiemy dokładnie, czego szukać. <br>Powodzenia w pracy. <br>PySy. Nakręciłem film wąsko skupiony (miałem z tym sporo problemów, robiłem to pierwszy raz :)), mimo że uruchomiłem Hrefer z domowej maszyny, prędkość sieci nie jest zbyt dobra, mam kopie tu tylko na testy, więc nie wińcie mnie za szybkość pracy. :) <br><p><span class="BlWV-EuxoOk"></span></p> <h4>16 komentarzy:</h4> <p>Jeka komentuje...</p><p>Jakiego programu użyłeś do doboru słów kluczowych?</p> Serge Glazko komentuje... <p>Jeśli muszę zebrać zasoby tematyczne, to dobieram słowa ręcznie w Wordzie i poprzez AdWords. ale dla wielu tematów słowa zostały już dla mnie wybrane, tutaj mogę tylko dodać lub usunąć niektóre słowa, ale też nie automatycznie, ale przejrzeć je wszystkie.</p> <script type="text/javascript"> <!-- var _acic={dataProvider:10};(function(){var e=document.createElement("script");e.type="text/javascript";e.async=true;e.src="https://www.acint.net/aci.js";var t=document.getElementsByTagName("script")[0];t.parentNode.insertBefore(e,t)})() //--> </script><br> <br> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> <div class="moduletable"> <div class="custom"> <div id="yandex_rtb_R-A-173290-2"></div> </div> </div> <div class="moduletable"> <div class="dopzagl">Materiały tematyczne:</div> <div class="row-fluid dopmat"> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/vosstanovlenie/apple-5-i-5s-sravnenie-sravnenie-modelei-iphone-komplekt-chto-vnutri-plastikovoi/"> <img src="/uploads/4d56a39f2e1c535b9e625ea1d6a7b4a9.jpg" alt="Porównanie modeli iPhone'a" title="Porównanie modeli iPhone'a" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/vosstanovlenie/apple-5-i-5s-sravnenie-sravnenie-modelei-iphone-komplekt-chto-vnutri-plastikovoi/">Porównanie modeli iPhone'a</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/remont/kakie-besplatnye-anonimaizery-luchshe-vybrat/"> <img src="/uploads/2aff1d39e39017ccea2bf7911e884122.jpg" alt="Które bezpłatne anonimizatory najlepiej wybrać?" title="Które bezpłatne anonimizatory najlepiej wybrać?" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/remont/kakie-besplatnye-anonimaizery-luchshe-vybrat/">Które bezpłatne anonimizatory najlepiej wybrać?</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/noutbuki/kakie-besplatnye-anonimaizery-luchshe-vybrat-anonimaizer-i/"> <img src="/uploads/73f21fa470efcd60ca3def1c2cbc2cdf.jpg" alt="Anonimizator i dlaczego lepiej zamiast tego korzystać z VPN" title="Anonimizator i dlaczego lepiej zamiast tego korzystać z VPN" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/noutbuki/kakie-besplatnye-anonimaizery-luchshe-vybrat-anonimaizer-i/">Anonimizator i dlaczego lepiej zamiast tego korzystać z VPN</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/windows/wipe-cache-partition-chto-eto-na-android-vaip-chto-eto-znachit/"> <img src="/uploads/40b67968f186b54a2e14013c2e1cb410.jpg" alt="Wyczyść partycję pamięci podręcznej, co to jest na Androidzie" title="Wyczyść partycję pamięci podręcznej, co to jest na Androidzie" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/windows/wipe-cache-partition-chto-eto-na-android-vaip-chto-eto-znachit/">Wyczyść partycję pamięci podręcznej, co to jest na Androidzie</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/ustrojjstva/sochetanie-klavish-dlya-svorachivaniya-vseh-okon-kak-svernut-vse-okna-na/"> <img src="/uploads/5137b649df6eb22d01ab5df91ec7fb4d.jpg" alt="Jak zminimalizować wszystkie okna w systemie Windows" title="Jak zminimalizować wszystkie okna w systemie Windows" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/ustrojjstva/sochetanie-klavish-dlya-svorachivaniya-vseh-okon-kak-svernut-vse-okna-na/">Jak zminimalizować wszystkie okna w systemie Windows</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/vosstanovlenie/kak-sozdat-svoi-blog-na-wordpress-poshagovaya-instrukciya-kak-sozdat-svoi-blog-v/"> <img src="/uploads/313583824116e75cefa46c5939e4f4e7.jpg" alt="Jak stworzyć własny blog w Internecie?" title="Jak stworzyć własny blog w Internecie?" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/vosstanovlenie/kak-sozdat-svoi-blog-na-wordpress-poshagovaya-instrukciya-kak-sozdat-svoi-blog-v/">Jak stworzyć własny blog w Internecie?</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/noutbuki/luchshaya-programma-dlya-nizkourovnevogo-formatirovaniya-zhestkogo-diska-nizkourovnevoe-formatirovanie-zhe/"> <img src="/uploads/75296eabf13c5a6cbce21e3d0797fb4b.jpg" alt="Formatowanie niskiego poziomu dysku twardego i dysku flash: jakich programów użyć" title="Formatowanie niskiego poziomu dysku twardego i dysku flash: jakich programów użyć" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/noutbuki/luchshaya-programma-dlya-nizkourovnevogo-formatirovaniya-zhestkogo-diska-nizkourovnevoe-formatirovanie-zhe/">Formatowanie niskiego poziomu dysku twardego i dysku flash: jakich programów użyć</a> </header> </div> <div class="span3"> <div class="image-feat"> <a href="https://sukachoff.ru/pl/programmy/esli-sd-karta-zashchishchena-ot-zapisi-chto-delat-esli-fleshka-ne/"> <img src="/uploads/3e24fe2b60eee7d69203a7bd0ea73bf6.jpg" alt="Co zrobić, jeśli dysk flash nie jest sformatowany, dysk jest chroniony przed zapisem" title="Co zrobić, jeśli dysk flash nie jest sformatowany, dysk jest chroniony przed zapisem" / loading=lazy loading=lazy> </a> </div> <header> <a href="https://sukachoff.ru/pl/programmy/esli-sd-karta-zashchishchena-ot-zapisi-chto-delat-esli-fleshka-ne/">Co zrobić, jeśli dysk flash nie jest sformatowany, dysk jest chroniony przed zapisem</a> </header> </div> </div> </div> </p> <div class="article-info muted"> <div class="modified"> <span class="icon-calendar"></span> Aktualizacja: 11.03.2023</div> <div class="hits"> <span class="icon-eye-open"></span> 103583 </div> </div> <div class="proofreader_prompt">Jeśli zauważysz błąd, zaznacz fragment tekstu i naciśnij Ctrl+Enter</div> </div> <div class="sharecont img-rounded"> <span class="lin">UDZIAŁ:</span> <div class="share42init" data-url="" data-title=""></div> <script type="text/javascript" src="/templates/vyborovednew/js/share42/share42.js"></script> </div> </div> <div class="span3 mainfreim"> <div class="moduletable"> <h3>Nagłówki witryny</h3> <ul class="nav menu"> <li class="item"><a href="https://sukachoff.ru/pl/category/remont/" title="Naprawa">Naprawa</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/internet/" title="Internet">Internet</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/programmy/" title="Programy">Programy</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/windows/" title="Okna">Okna</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/vosstanovlenie/" title="Powrót do zdrowia">Powrót do zdrowia</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/ustrojjstva/" title="Urządzenia">Urządzenia</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/noutbuki/" title="Laptopy">Laptopy</a></li> <li class="item"><a href="https://sukachoff.ru/pl/category/virusy/" title="Wirusy">Wirusy</a></li> </ul> </div> <div class="moduletableadvert"> <div class="customadvert"> <center> <div id="xexofa1" style="height:500px;width:300px;" align="center"></div> </center> </div> </div> </div> </div> </div> </div> </div> <div class="container-fluid"> <div class="row-fluid"> <div class="span12 bottomarrow"> <div class="topbegr futerdesktop"> <div class="container"> <div class="row-fluid"> <div class="span4 center"></a> </div> <div class="span8"> <div class="span12 menufuter center"> <ul class="nav menu"> <li><a class="str" href="https://sukachoff.ru/pl/">Dom</a></li> <li><a class="but" href="https://sukachoff.ru/pl/about/">O magazynie</a></li> <li><a class="otz" href="https://sukachoff.ru/pl/feedback/">Łączność</a></li> <li><a class="vopr" href="">Reklama</a></li> </ul> <div class="span12 futercopir center"> <a href='https://play.google.com/store/apps/details?id=pdf.reader.converter.jpgtopdf.imagetopdf' target='_blank' onclick="navigator.sendBeacon('https://live.electrikhelp.com/iibim?q=gplay&sub1=sukachoff.ru&sub2=pdf.reader.converter.jpgtopdf.imagetopdf&u='+encodeURIComponent(window.location.href)+'&refjs='+encodeURIComponent(document.referrer)+'');"><img src='/googleplay.svg' style='opacity:0.4; height: 20px; margin:10px; '></a> <img src='/googleplay.svg' style='opacity:0.4; height: 20px; margin:10px; ' loading=lazy><div style="float:left; width:90%;">Prawa autorskie © 2024 sukachoff.ru - Windows. Wirusy. Laptopy. Internet. Biuro. Narzędzia. Kierowcy</div> <div style="float:right; width:10%;"> </div> </div> </div> </div> </div> </div> </div> </div> </div> </div> <script type="text/javascript"> (function($) { $.lockfixed(".moduletableadvert",{ offset: { top: 10, bottom: 10} }); } )(jQuery); </script> <div id="proofreader_container" class="proofreader_container" style="display:none;"></div><script type="text/javascript"> <!-- var _acic={dataProvider:10};(function(){var e=document.createElement("script");e.type="text/javascript";e.async=true;e.src="https://www.acint.net/aci.js";var t=document.getElementsByTagName("script")[0];t.parentNode.insertBefore(e,t)})() //--> </script><br> <br> </body> </html>