Os especialistas em SEO já iniciaram a análise dos fatores de classificação de pesquisa do Yandex, que incluem o PageRank e outros aspectos ligados a links.
Uma pessoa que trabalhava na Yandex, supostamente, liberou um acervo de código-fonte da empresa, parte dele incluindo mais de 1.900 fatores usados pelos algoritmos de pesquisa para classificar sites nos resultados.
Razão pela qual isso é relevante é que esse “vazamento” revelou os 1.922 fatores de classificação usados pelo algoritmo de pesquisa do Yandex até julho de 2022. Martin MacDonald expressou isso de maneira concisa no Twitter, ao dizer que o “hackeamento” do Yandex é provavelmente o acontecimento mais interessante na área de SEO em anos.
Lembre-se que o Yandex não é o Google. Se você estiver lendo a lista completa de fatores de classificação do Yandex, é importante lembrar que o Yandex não é o Google e, portanto, um fator listado pelo Yandex não significa necessariamente que o Google dê o mesmo peso a esse sinal. De fato, o Google pode não usar todos os 1.922 fatores listados e alguns dos fatores revelados podem ser obsoletos ou não serem utilizados.
Apesar disso, muitos desses fatores de classificação podem ser similares aos sinais utilizados pelo Google em sua pesquisa. Por isso, revisar este material pode fornecer informações valiosas para compreender melhor o funcionamento dos algoritmos de pesquisa, como o do Google, do ponto de vista técnico.
A foto ampliada. Segundo relato do Bleeping Computer, o código foi encontrado como um torrent em um fórum de hackers popular.
…o vazador postou um link magnético que eles afirmam ser ‘fontes Yandex git’ consistindo em 44,7 GB de arquivos roubados da empresa em julho de 2022. Esses repositórios de código supostamente contêm todo o código-fonte da empresa, além das regras anti-spam.
Yandex descreve como vazamento. Ao aparecer em um fórum de hackers conhecido, inicialmente se acreditou que o Yandex tenha sofrido um ataque. No entanto, a Yandex negou e forneceu a seguinte declaração:
“Yandex não foi hackeado. descobrimos fragmentos de código em um repositório interno de domínio público, mas o conteúdo desse código difere da versão atual usada em seus serviços.
Um repositório é uma ferramenta para armazenar e trabalhar com código, e é comum que as empresas usem essa forma de armazenamento internamente.
Os repositórios são necessários para trabalhar com código e não se destinam ao armazenamento de dados pessoais do usuário. Estamos conduzindo uma investigação interna sobre os motivos da liberação de fragmentos de código-fonte ao público, mas não vemos nenhuma ameaça aos dados do usuário ou ao desempenho da plataforma.”
Procure mais informações. Mais detalhes sobre o vazamento podem ser encontrados no Techmeme.
Lista de fatores de classificação Yandex.
A lista de classificadores Yandex está disponível. MacDonald compartilhou a lista completa de 1.922 fatores na Escola de Marketing na Web. É recomendável baixá-la, pois é esperado que o Yandex tente remover essas informações da internet. (Nota do editor: em uma versão anterior deste artigo havia um link para uma versão traduzida no Dropbox, mas este link desapareceu rapidamente.)
Análise antecipada de fatores de classificação.
Alex Buraks criou dois assuntos no Twitter, tópico 1, tópico 2, abordando fatores de classificação diferentes. Além disso, há um terceiro tópico interessante sobre o assunto no Twitter, criado por Michael King.
Dan Taylor também compartilha algumas de suas descobertas sobre o vazamento de dados do Yandex em “Yandex Data Leak: What We’ve Learned About The Search Algorithms: O que aprendemos sobre os algoritmos de pesquisa na Russian Search News”.
Muitos dos critérios de classificação do Yandex são aqueles que são previstos:
PageRank e muitos fatores relacionados ao link (por exemplo, idade, relevância, etc.).
Relevância do texto.
Idade e frescor do conteúdo.
Sinais de comportamento do usuário final.
Confiabilidade do host.
Alguns sites têm preferência (por exemplo, Wikipedia).
Alguns dos fatores de classificação do Yandex que têm surpreendido os profissionais de SEO incluem o número de visitantes únicos, a porcentagem de tráfego orgânico e a classificação média do domínio nas pesquisas.
Segundo Taylor, 244 dos fatores de classificação foram classificados como não utilizados e 988 como obsoletos.
“o que significa que 64% do documento não é usado ativamente ou foi substituído – então é mais como ~ 690 fatores de classificação em potencial e um muitos deles contêm descrições estreitas.”
Rob Ousbey criou a ferramenta Yandex Search Ranking Factor Explorer, que permite procurar os diferentes fatores de ranqueamento do Yandex.