Význam slov a pojmů, jasné definice a srozumitelné odpovědi na otázku „Co to je?“

Co je to

PageRank

PageRank je algoritmus, který vytvořili Larry Page a Sergey Brin při vzniku společnosti Google. Slouží k určování důležitosti webových stránek podle toho, jak na ně odkazují jiné stránky.

🧒 Základní škola

Představ si, že internet je jako obrovská síť kamarádů, kteří si posílají dopisy. Každý dopis je jako odkaz z jedné stránky na druhou. Když hodně kamarádů pošle dopis jednomu kamarádovi, znamená to, že je asi důležitý nebo oblíbený. Algoritmus PageRank tedy zjišťuje, které stránky mají nejvíc „doporučení“ od jiných stránek. Čím víc jich má, tím výše se objeví ve výsledcích vyhledávání. Ale nepočítá se jen počet dopisů. Když ti napíše někdo, kdo je sám velmi oblíbený, tak to má větší váhu než dopis od někoho, koho skoro nikdo nezná.

🎓 Střední škola

PageRank je metoda, která přiřazuje každé webové stránce číslo vyjadřující její reputaci nebo váhu v síti internetu. Funguje na principu odkazů – stránka, na kterou vede hodně odkazů, je považována za důležitější. Ovšem každý odkaz nemá stejnou hodnotu. Odkaz ze stránky, která je sama hodně důležitá, má větší váhu než odkaz z málo navštěvované stránky. Tím vzniká řetězení důvěry prostřednictvím link juice a autority mezi stránkami. Výpočet probíhá opakovaně, dokud se hodnoty neustálí. Google tuto hodnotu pak využívá při řazení výsledků vyhledávání, i když dnes už PageRank není jediný faktor – přibyl například obsah, uživatelské chování nebo rychlost načítání.

🎓🎓 Vysoká škola

PageRank lze formálně popsat jako model náhodného surfaře. Představuje uživatele, který náhodně kliká na odkazy na internetu. S pravděpodobností d (damping factor), obvykle 0,85, pokračuje klikáním dál a s pravděpodobností 1−d skočí na libovolnou stránku. Hodnota PageRanku stránky A je tedy úměrná součtu hodnot všech stránek, které na A odkazují, dělenému počtem odkazů z těchto stránek. Matematicky se to zapisuje jako iterativní výpočet ve tvaru

PR(A) = (1−d)/N + d × Σ [PR(B)/L(B)],

kde N je počet všech stránek, B jsou stránky odkazující na A, a L(B) je počet odkazů ze stránky B. Po dostatečném počtu iterací se systém ustálí na stabilních hodnotách, které odrážejí topologii webu. PageRank tak odpovídá vlastnímu vektoru největší vlastní hodnoty normalizované maticové reprezentace grafu odkazů.

🧠 Expert

Algoritmus PageRank vychází z principů teorie Markovových řetězců a lineární algebry. Web se modeluje jako orientovaný graf, kde uzly představují stránky a hrany odkazy. Z matice přechodových pravděpodobností M (každý prvek Mᵢⱼ odpovídá pravděpodobnosti, že uživatel přejde ze stránky j na stránku i) se pomocí tlumicího faktoru d konstruuje stochastická matice P = dM + (1−d)/N × 1, která je regulární. Stacionární rozdělení Markovova řetězce pak odpovídá vektoru PageRanku r, který splňuje rovnici r = Pᵗr. Tento vektor se určuje metodou power iteration, tedy postupným násobením do konvergence.
Ve velkých grafech (miliardy uzlů) se využívají efektivní distribuované výpočetní techniky, jako jsou MapReduce nebo Apache Spark, protože matice se neukládá celá, ale v řídce reprezentované podobě. Moderní varianty zahrnují personalizovaný PageRank (zohledňuje preference uživatele), topic-sensitive PageRank (váže se na určitou oblast témat) či TrustRank (přidává faktor důvěryhodnosti proti spamu). V současnosti Google kombinuje tyto modely s machine learningem v rámci složitého hodnoticího systému, kde PageRank tvoří jen část tzv. ranking pipeline.

😇 Pán Bůh

PageRank je jako nebeská kniha zásluh internetu. Každý web se modlí, aby na něj někdo odkázal, protože každý odkaz je jako malý paprsek slávy seslaný z jiného webu. Ale ne každý paprsek má stejnou sílu – když na tebe kývne anděl jménem Wikipedia, je to víc než stovka neznámých blogů z temnoty. V éře Googlovy stvořitelské jiskry byl PageRank svatým algoritmem, který rozděloval digitální spásu a určoval, kdo se zjeví první na stránce výsledků. Dnes je už jeho moc rozptýlena mezi stovky jiných signálů, ale jeho duch stále proudí v algoritmickém nebi, kde se hodnotí každé kliknutí, každý odkaz, každá zmínka. A kdo odkazuje na druhé, ten bude odkazován – tak praví evangelium internetu.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *