Niesom

Icon

Rád o webe čítam a rád o ňom aj sem-tam niečo napíšem. Napríklad o Wordpresse, Google, návštevnosti, slovenskom webe a internetovom marketingu.

Ako sa Pagerank počíta? (2)

Pre výpočet PageRanku konkrétnej stránky sa berú do úvahy všetky na ňu smerujúce odkazy:

  1. odkazy, ktoré prichádzajú zvonku, z iných webstránok – externé odkazy
  2. odkazy, ktoré prichádzajú zvnútra – teda zo samotného webu, na ktorom je webstránka publikovaná – interné odkazy

Hodnota PageRanku sa potom počíta podľa tejto rovnice:

PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

Podľa článku Dušana Jankovského, ale aj iných zdrojov, v tomto vzorci chýba hodnota celkového počtu zaindexovaných stránok. Správne by mal vzorec teda vyzerať:
PR(A) = (1-d)/m + d * ( PR(t1)/C(t1) + … + PR(tn)/C(tn))

kde:

  • PR(A) je PageRank stránky, ktorý sa snažíme zistiť
  • PR(t) je PageRank stránok, ktoré na stránku A ukazujú
  • d je damping faktor (nastavený pravdepodobne na 0,85)
  • m je celkový počet zaindexovaných stránok
  • C(t) je počet odkazov vedúcich zo stránky t

Rovnica (zelenou farbou) je pôvodná. Bola zverejnená v čase, keď bol vynájdený PageRank, a pravdepodobne je v nejakej variácii, ktorú si Google stráži, používaná vo vyhľadávači až dodnes.

Na tom však až tak veľmi nezáleží, pretože aj na tejto rovnici sa dajú pochopiť detaily mechanizmu, akým funguje.

Rovnicu môžeme zjednodušiť nasledovne:

PageRank webstránky = 0,15 + 0,85 * (“časť” Pageranku každej odkazujúcej webstránky)

pričom “časť” = PageRank odkazujúcej webstránky vydelený počtom odchádzajúcich (externých) odkazov na nej.

Stránka “hlasuje” určitou dávkou svojho PageRanku v prospech každej webstránky, na ktorú odkazuje. Hodnota PageRanku, s ktorou sa delí s ostatnými stránkami, je trochu menšia, než jej vlastný PageRank (vlastný PageRank * 0,85) a delí sa rovnomerne medzi všetky stránky, na ktoré odkazuje.

Z toho môžeme vyvodiť záver, že spätný odkaz zo stránky s PR4, ktorá odkazuje na 5 rôznych webstránok, je hodnotnejší než odkaz zo stránky s PR8, ktorá však odkazuje na 100 rôznych webstránok.
Nie je teda dôležitý len samotný PageRank webstránky, ktorá na vás ukazuje, dôležitý je aj počet ostatných webstránok na ktoré ukazuje okrem vás.
Čím viac týchto stránok je, tým menej PageRanku sa vám ujde.

Keby hodnota PageRanku medzi jednotlivými jeho stupňami (PR1, PR2, PR3, …, PR10) bola rovnaká, vyššie uvedený záver by obstál, ale veľa ľudí verí, a realita to potvrdzuje, že rozdiel medzi PR1 a PR10 má logaritmický charakter, teda že vyzerá takto:

PR0: 0-100
PR1: 100-1 000
PR2: 1 000-10 000
PR3: 10 000-100 000

Okrem samotného Google to, pochopiteľne, nevie nikto, ale je veľa dôvodov si myslieť, že tieto rozdiely sú naozaj takéto.

Z toho teda vyplýva, že na prechod do Pageranku vyššej úrovne je v skutočnosti potrebné väčšie množstvo PageRanku, než bolo potrebné na posun hore v nižšej úrovni. Inak povedané, povýšenie na nižšej úrovni je menej náročné, než povýšenie na vyššej úrovni.

Tento poznatok teda vyvracia predchádzajúci záver.
V skutočnosti totiž naozaj platí, že spätný odkaz zo stránky s PR8, aj keď už obsahuje veľa iných externých odkazov, je hodnotnejší než spätný odkaz z inej stránky s PR4, aj keď tá obsahuje externých odkazov len zopár.
Pri PR8 je totiž na rozdeľovanie k dispozícii rádovo oveľa viac PageRanku než pri PR4.

V každom prípade, bez ohľadu na to, aký pomer a na akých hladinách PageRanku Google používa, jedno je isté: spätný odkaz z inej webstránky zvyšuje PageRank našej webstránky. Je len potrebné vyvarovať sa odkazom z link fariem.

Poznámka: Aj keď spätný odkaz posiela časť PageRanku zo stránky, na ktore je umiestnený, neznamená to, že sa presunie a odpočíta zo svojej materskej webstránky. Stránka, ktorá takýmto spôsobom hlasuje v prospech inej stránky, o svoj hlas neprichádza. Je to podobne, ako keď akcionár hlasuje na valnom zhromaždení a sila jeho hlasu závisí od množstva akcií, ktoré vlastní. Keď však zahlasuje, o samotné akcie neprichádza.
Aj keď, ako si ukážeme neskôr, webstránky o časť svojho PageRanku nepriamo prichádzajú.

A teraz sa pozrime na to, ako sa PageRank počíta naozaj.

Predstavme si, že chceme vypočítať PageRank stránky A úplne od začiatku. K tomuto výpočtu si teda najskôr odmyslime jej súčasný PageRank (ak nejaký má) a vypočítame ho nanovo zvážením a prepočítaním Pageranku interných odkazov. Interné odkazy neprichádzajú z iných domén, sú to odkazy, ktoré ukazujú na webstránku A v rámci webu, na ktorom sa webstránka A nachádza. Váha a počet týchto interných odkazov sa po poslednom výpočte PageRanku totiž mohla zmeniť.

Spomenutá rovnica jasne ukazuje, ako webstránka PageRank “nadobudne”. Ale to, čo nie je jasné na prvý pohľad je skutočnosť, že to vlastne nemôže fungovať, ak dôjde k prepočtu len jeden raz.

Predstavme si, že máme 2 stránky, A a B, ktoré navzájom na seba odkazujú a okrem toho neexistujú na ne žiadne iné odkazy. Stane sa nasledovné:

Prvý krok: Vypočítanie Pageranku stránky A z interných odkazov

Stránka A má teraz nový PageRank. Ten získala zo spätných odkazov na stránke B. Lenže na stránke B sa nachádza už nejaký interný odkaz, napríklad zo stránky A, a tiež vlastný PageRank stránky B ešte vypočítaný nebol, takže výsledky výpočtu Pageranku stránky A sú založené na nesprávnych dátach a teda nemôžu byť presné.

Druhý krok: Vypočítanie Pageranku stránky B z interných odkazov

Stránka B má teraz novú hodnotu PageRanku, ten však nemôže byť presný, pretože je založený na výpočte z Pageranku interných odkazov stránky A, o ktorom sme už povedali, že nie je presný.

To je situácia z Hlavy 22. Nevieme zistiť presný PageRank stránky A, kým nepoznáme PageRank stránky B a naopak, nevieme zistiť PageRank stránky B, lebo nepoznáme PageRank stránky A.

Nestačí teda teraz, keď majú obidve stránky novovypočítaný PageRank, výpočet zopakovať znovu, aby sme sa dostali k presným výsledkom? Nie. Výpočet síce zopakovať môžeme, ale keďže bude založený opäť na nepresných hodnotách, dostaneme opäť nepresný výsledok.

Problém odstránime až vtedy ak výpočet zopakujeme veľa krát. V skutočnosti celkom presný výsledok nedosiahneme nikdy, ale so zvyšujúcim množstvom prepočtov sa dostávame k čoraz presnejšiemu výsledku. Výpočet musíme zopakovať tak 40 až 50 krát, aby sme sa dostali do bodu, kedy už ďalšie výpočty neprinesú dodatočne zmysluplné spresnenie.

Presne toto robí Google pri každej aktualizácii Pageranku a tiež to je dôvod, prečo mu to trvá tak dlho.

Musíme si uvedomiť, že výsledky, ktoré z týchto výpočtov dosiahneme sú pomerné. Čísla stoja v pomere k rozsahu (a ten pozná len Google), kedy dochádza k určeniu konkrétneho PageRanku nejakej webstránky.

V každom prípade, vďaka pochopeniu tohoto mechanizmu môžeme aspoň nasmerovať celkový Pagerank webu tak, aby sa z neho doležitejším webstránkam ušlo viac, než tým menej dôležitým.

POZNÁMKA:
Môžete sa stretnúť s takými výpočtami PageRanku, ktoré síce vychádzajú z rovnakej rovnice, ale výsledok každého výpočtu pripočítavajú k existujúcemu Pageranku. Novú hodnotu Pageranku (výsledok + existujúci PageRank) používajú na zdieľanie s ostatnými stránkami. Takéto výpočty sú nesprávne, pretože:

  1. Najskôr použijú správnu rovnicu, ale potom ju zmenia z PR(A) = (1-d) + d(……) na PR(A) = PR(A) + (1-d) + d(……)
    To nie je správne, a ani potrebné.
  2. Vysvetlíme si, ako je potrebné zorganizovať odkazy tak, aby sme dosiahli nasmerovanie PageRanku na niektoré stránky vo väčšej miere, než na iné. Napočítavanie existujúceho Pageranku spomenutým spôsobom však vedie k väčším disproporciám, ako keď je použitá pôvodná rovnica.
    Keďže takéto napočítavanie Pageranku nie je súčasťou jeho zverejnenej rovnice, výsledky nie sú správne a ich efektom je nesprávne “dávkovanie” Pageranku.

V súlade s pôvodnou rovnicou, každý opätovný prepočet Pageranku začína od začiatku. Spočíva výhradne na sile interných odkazov. Nesprávny prepočet túto zásadu vlastne ignoruje.

preklad článku od Phila Cravena: Pagerank Explained

Category: Google, Hlavné články, SEOmánia

Tagged:

2 Responses

  1. lucas hovorí:

    Uz som to cital na wikipedii, ale bolo to tam dost zlozite. Cim viac zdrojov tym lepsie, cize dakujem za clanok, no myslim ze v praxi staci laicke vysvetlenie. :D

  2. Jaro hovorí:

    PR je pekná vec len načo mi to je keď mám malú návštevnosť. Mám niekoľko stránok a na každej sú rôzne PR. Napríklad na jednom mám 4 PR a návštevnosť je taká mizerná že by som najradšej zrušil stránku a na ďalšej mám 2 PR a návštevnosť je niekoľko násobne vyššia a vo vyhľadávači google je na prvom mieste. Na ďalšej mám 1 PR a je tam viac ako na tom prvom webe. Záver je pre mňa jednoznačný a to nech mám aj 0 PR ale návštevnosť nech je čo najvyššia a potom budem aj lepšie zarábať na stránke. Pozdravujem všetkých zberačov PR. :-)

Leave a Reply

Webhosting


RSS TechForum.sk

  • Výpis galérií v menu
    Zdravím, používam modul NextGen Gallery. Chcel by som urobiť, aby sa mi v menu vypisovali galérie - čiže cez nejaký widget by som si zadal, že... […]
  • ako nieco vlozit do clanku rozdeleneho cez <!--more-->
    Potrebujem nieco rozumnym sposobom vlozit na miesto znacky (teda pod prvu cast a nad druhu cast clanku). Doteraz som to riesil editaciou... […]
  • Obrázky pre video
    Dobrý deň, potreboval yb som zistiť či existuje nejaký plugin na to ked pridam do new post nejaké video(mám vlastný prehrávač) a pár textu tak chcem... […]
  • Nefunkčnosť stránok
    Čaute, stránky vytvárané klasicky vo wordpresse, niečo ako kategórie, v menu kde je Domov...a ostatné voliteľné položky mi nejdu zobraziť. Po... […]