Op 25 januari verscheen er op een online forum een bericht met wat volgens gebruiker borderline2023 de broncode van Yandex moet zijn. Yandex is de Russische zoekmachine, al heeft het bedrijf ook andere diensten, zoals Yandex Taxi, dat een Russisch alternatief voor Uber is. In deze broncode zijn door 1922 rankingfactoren geïdentificeerd.
Broncode gelekt of gehackt?
Verschillende bronnen hebben het over hackers die deze broncode van Yandex hebben buitgemaakt, andere bronnen stellen dat een oud-medewerker van Yandex de broncode heeft gelekt. Het feit dat in deze broncode rankingfactoren te vinden zijn maakt het superinteressant voor iedereen die zich met SEO bezighoudt. Er is namelijk een gerede kans dat in ieder geval een deel van de rankingfactoren overeenkomen met die van Google.
Meer dan alleen rankingfactoren
Omdat Yandex meer is dan alleen een zoekmachine, vinden we in deze broncode ook informatie over andere diensten, zoals:
- Taxi: de taxidienst á la Uber van Yandex
- Pay: een betaaldienst vergelijkbaar met Stripe
- Market: een online shoppingdienst
Software-engineer Arseniy Shestakov meldt dat in de broncode informatie te vinden is over zowel de zoekmachine, als deze en diverse andere diensten die Yandex levert.
1923 rankingfactoren, niet alle meer actueel
De complete lijst met Yandex rankingfactoren is door Martin MacDonald gepubliceerd op Web Marketing School. Hier deelt hij ook bevindingen en analyses vanuit de SEO-community. Van de 1923 rankingfactoren die in deze broncode te vinden zijn, zijn er volgens Dan Taylor 244 gecategoriseerd als “niet gebruikt” en verwijderd als signaal dat werkelijk meeweegt. Verder zijn er 988 verouderde rankingfactoren, die volgens Taylor dan ook niet meer in gebruik zullen zijn.
Er wordt online trouwens geschreven over 1922 rankingfactoren, maar in de broncode begint de nummering bij 0 en deze eindigt bij 1922, wat toch echt een totaal van 1923 oplevert.
PageRank: ook bij Yandex
Een opvallende rankingfactor is ‘PageRank’, dat dus ook bij Yandex in gebruik is en een andere PageRank zal zijn dan die van Google. Deze factor staat als eerste vermeld met als naam “PR” en daarbij staat ‘AntiSeoUpperBound: 1.0’, wat volgens Dominic Woodman zou kunnen duiden op een soort wegingsfactor:
Looks like there are some values with a gradient and others with booleans. Reminds me of this post by @jasonmbarnard.
TL;DR Google multiplies lots of ranking values together.
Seems like it would make sense with this description: 1 is good and 0 is bad.
2/x
— Dominic Woodman (@dom_woodman) January 27, 2023
Bij PageRank staat trouwens ook in de tags TG_UNUSED, wat erop zou kunnen duiden dat Yandex hun PageRank niet meer gebruikt.
Nogal wat vraagtekens
Naast de verouderde en niet-gebruikte factoren zijn er ook nog vraagtekens te zetten bij de overgebleven 690 factoren. Zo zijn de beschrijvingen nogal magertjes, en zouden deze 690 rankingfactoren ook grotendeels verouderd kunnen zijn. Bij iedere factor staat een auteur vermeld en sommige van de auteurs zijn al meer dan 10 jaar niet meer werkzaam bij Yandex.
Geen hack volgens Yandex
Yandex stelt in reactie op de gelekte broncode dat er geen sprake is van een hack, maar dat een oud-medewerker deze heeft gelekt. De uitgelekte code is volgens Yandex dan ook niet volledig actueel, maar komt mogelijk zo ongeveer 90% overeen met de code die het bedrijf nu gebruikt.
Meer details op:
Nathan Veenstra
Laatste berichten van Nathan Veenstra (toon alles)
- Verdien als publisher met Google Reader Revenue Manager - 21 april 2023
- Digital product agency Unravel is nu Concept7 Amsterdam - 18 april 2023
- Google integreert AI met Project Magi - 18 april 2023