Rò rỉ các yếu tố xếp hạng tìm kiếm Yandex

Thỏa thuận với vụ rò rỉ dữ liệu các yếu tố xếp hạng Yandex là gì? Tìm hiểu thêm về ý nghĩa của các yếu tố xếp hạng và cách các công cụ tìm kiếm hoạt động.

Cộng đồng tiếp thị tìm kiếm đang cố gắng hiểu ý nghĩa của kho lưu trữ Yandex bị rò rỉ có chứa các tệp liệt kê những gì trông giống như các yếu tố xếp hạng tìm kiếm.

>> Tham khảo: Google Cloud ra mắt công cụ AI mới dành cho nhà bán lẻ.

Một số có thể đang tìm kiếm manh mối SEO có thể hành động nhưng đó có thể không phải là giá trị thực.

Thỏa thuận chung là nó sẽ hữu ích để đạt được sự hiểu biết chung về cách thức hoạt động của các công cụ tìm kiếm.

1. Có rất nhiều điều để học

Ryan Jones (@RyanJones) tin rằng vụ rò rỉ này là một vấn đề lớn.

Anh ấy đã tải một số mô hình máy học Yandex lên máy của mình để thử nghiệm.

Ryan tin chắc rằng có rất nhiều điều để tìm hiểu nhưng sẽ cần nhiều hơn là chỉ kiểm tra danh sách các yếu tố xếp hạng.

Ryan giải thích:

“Mặc dù Yandex không phải là Google, nhưng chúng ta có thể học được rất nhiều điều từ điều này về sự tương đồng.

Yandex sử dụng rất nhiều công nghệ do Google phát minh. Họ tham khảo PageRank theo tên, họ sử dụng Map Reduce và BERT và nhiều thứ khác nữa.

Rõ ràng là các yếu tố sẽ khác nhau và trọng số áp dụng cho chúng cũng sẽ khác nhau, nhưng các phương pháp khoa học máy tính về cách chúng phân tích mức độ liên quan của văn bản, liên kết văn bản và thực hiện các phép tính sẽ rất giống nhau trên các công cụ tìm kiếm.

Tôi nghĩ rằng chúng ta có thể thu thập được nhiều thông tin chi tiết từ các yếu tố xếp hạng, nhưng chỉ nhìn vào danh sách bị rò rỉ thôi là chưa đủ.

>> Tham khảo: Google phản hồi nhiều thương hiệu sử dụng AI để viết nội dung.

Khi bạn nhìn vào các trọng số mặc định được áp dụng (trước ML), có các trọng số âm mà các SEO sẽ cho là dương hoặc ngược lại.

Ngoài ra còn có RẤT NHIỀU yếu tố xếp hạng được tính toán trong mã so với những yếu tố được liệt kê trong danh sách các yếu tố xếp hạng nổi xung quanh.

Danh sách đó dường như chỉ là các yếu tố tĩnh và không tính đến cách họ tính toán mức độ liên quan của truy vấn hoặc nhiều yếu tố động liên quan đến tập kết quả cho truy vấn đó.”

2. Hơn 200 yếu tố xếp hạng

Nó thường được nhắc lại, dựa trên rò rỉ, rằng Yandex sử dụng 1.923 yếu tố xếp hạng (một số nói ít hơn).

Christoph Cemper (hồ sơ LinkedIn), người sáng lập Công cụ nghiên cứu liên kết, nói rằng bạn bè đã nói với anh ấy rằng có nhiều yếu tố xếp hạng hơn.

Christoph chia sẻ:

“Bạn bè đã thấy:

  • 275 yếu tố cá nhân hóa
  • 220 yếu tố “độ mới của web”
  • 3186 yếu tố tìm kiếm hình ảnh
  • 2.314 yếu tố tìm kiếm video

Có lẽ điều đáng ngạc nhiên nhất đối với nhiều người là Yandex có hàng trăm yếu tố cho các liên kết.”

Vấn đề là nó vượt xa hơn 200 yếu tố xếp hạng mà Google từng tuyên bố.

Và ngay cả John Mueller của Google cũng nói rằng Google đã rời xa hơn 200 yếu tố xếp hạng.

Vì vậy, có thể điều đó sẽ giúp ngành công nghiệp tìm kiếm tránh xa việc nghĩ về thuật toán của Google theo những thuật ngữ đó.

3. Không ai biết toàn bộ thuật toán của Google?

Điều nổi bật về vụ rò rỉ dữ liệu là các yếu tố xếp hạng đã được thu thập và sắp xếp theo cách đơn giản như vậy.

Vụ rò rỉ đặt ra câu hỏi rằng thuật toán của Google được bảo vệ nghiêm ngặt và không ai, kể cả ở Google, biết toàn bộ thuật toán.

Có thể có một bảng tính tại Google với hơn một nghìn yếu tố xếp hạng không?

Christoph Cemper đặt câu hỏi về ý kiến ​​cho rằng không ai biết thuật toán của Google.

Christoph đã bình luận với Search Engine Journal:

“Ai đó đã nói trên LinkedIn rằng anh ta không thể tưởng tượng được việc Google “ghi lại” các yếu tố xếp hạng như vậy.

Nhưng đó là cách mà một hệ thống phức tạp như vậy cần được xây dựng. Rò rỉ này là từ một người trong cuộc rất có thẩm quyền.

>> Tham khảo: TikTok đã ra mắt tính năng thương mại điện tử trong ứng dụng.

Google có mã cũng có thể bị rò rỉ.

Câu nói thường được lặp đi lặp lại rằng ngay cả nhân viên của Google cũng không biết các yếu tố xếp hạng luôn có vẻ vô lý đối với một người làm công nghệ như tôi.

Số người có tất cả các chi tiết sẽ rất ít.

Nhưng nó phải ở đó trong mã, bởi vì mã là thứ chạy công cụ tìm kiếm.”

4. Phần nào của Yandex tương tự như Google?

Các tệp Yandex bị rò rỉ cung cấp một cái nhìn thoáng qua về cách thức hoạt động của các công cụ tìm kiếm.

Dữ liệu không cho thấy cách Google hoạt động. Nhưng nó mang đến cơ hội để xem một phần cách công cụ tìm kiếm (Yandex) xếp hạng kết quả tìm kiếm.

Không nên nhầm lẫn những gì có trong dữ liệu với những gì Google có thể sử dụng.

Tuy nhiên, có những điểm tương đồng thú vị giữa hai công cụ tìm kiếm.

5. MatrixNet không phải là RankBrain

Một trong những hiểu biết thú vị mà một số người đang khai thác có liên quan đến mạng thần kinh Yandex có tên là MatrixNet.

MatrixNet là một công nghệ cũ hơn được giới thiệu vào năm 2009 (liên kết tới thông báo của archive.org).

Trái ngược với những gì một số người đang tuyên bố, MatrixNet không phải là phiên bản Yandex của RankBrain của Google.

Google RankBrain là một thuật toán hạn chế tập trung vào việc hiểu 15% truy vấn tìm kiếm mà Google chưa từng thấy trước đây.

Một bài báo trên Bloomberg đã tiết lộ RankBrain vào năm 2015. Bài báo nói rằng RankBrain đã được thêm vào thuật toán của Google vào năm đó, sáu năm sau khi giới thiệu Yandex MatrixNet (ảnh chụp nhanh bài báo của Archive.org).

Bài báo của Bloomberg mô tả mục đích giới hạn của RankBrain:

“Nếu RankBrain nhìn thấy một từ hoặc cụm từ mà nó không quen thuộc, máy có thể đoán xem từ hoặc cụm từ nào có thể có nghÄ©a tÆ°Æ¡ng tá»± và lọc kết quả tÆ°Æ¡ng ứng, giúp xá»­ lý tìm kiếm chÆ°a từng thấy hiệu quả hÆ¡n truy vấn.”

Mặt khác, MatrixNet là một thuật toán học máy thực hiện được rất nhiều việc.

Một trong những điều nó làm là phân loại truy vấn tìm kiếm và sau đó áp dụng các thuật toán xếp hạng thích hợp cho truy vấn đó.

Đây là một phần của thông báo tiếng Anh năm 2016 về thuật toán năm 2009:

“MatrixNet cho phép tạo ra một công thức xếp hạng rất dài và phức tạp, xem xét vô số yếu tố khác nhau và sự kết hợp của chúng.

Một tính năng quan trọng khác của MatrixNet là cho phép tùy chỉnh công thức xếp hạng cho một loại truy vấn tìm kiếm cụ thể.

Ngẫu nhiên, việc điều chỉnh thuật toán xếp hạng cho các tìm kiếm âm nhạc chẳng hạn sẽ không làm giảm chất lượng xếp hạng cho các loại truy vấn khác.

Một thuật toán xếp hạng giống như một cỗ máy phức tạp với hàng chục nút bấm, công tắc, đòn bẩy và thước đo. Thông thường, bất kỳ lần bật nào của bất kỳ công tắc nào trong một cơ chế sẽ dẫn đến thay đổi toàn cục trong toàn bộ máy.

Tuy nhiên, MatrixNet cho phép điều chỉnh các tham số cụ thể cho các lớp truy vấn cụ thể mà không gây ra sự đại tu lớn toàn bộ hệ thống.

Ngoài ra, MatrixNet có thể tự động chọn độ nhạy cho các phạm vi cụ thể của các yếu tố xếp hạng.”

>> Tham khảo: Kỹ năng SEO thiết yếu để thành công.

MatrixNet làm được nhiều hơn RankBrain, rõ ràng là chúng không giống nhau.

Nhưng điều thú vị về MatrixNet là cách các yếu tố xếp hạng động ở chỗ nó phân loại các truy vấn tìm kiếm và áp dụng các yếu tố khác nhau cho chúng.

MatrixNet được tham chiếu trong một số tài liệu về yếu tố xếp hạng, vì vậy, điều quan trọng là phải đặt MatrixNet vào ngữ cảnh phù hợp để các yếu tố xếp hạng được nhìn nhận đúng cách và có ý nghĩa hơn.

Có thể hữu ích khi đọc thêm về thuật toán Yandex để giúp hiểu rõ hơn về vụ rò rỉ Yandex.

6. Một số yếu tố Yandex phù hợp với thực tiễn SEO

Dominic Woodman (@dom_woodman) có một số quan sát thú vị về vụ rò rỉ.

Alex Buraks (@alex_buraks) đã xuất bản một chủ đề lớn trên Twitter về chủ đề có tiếng vang của các hoạt động SEO.

Một trong những yếu tố mà Alex nhấn mạnh liên quan đến việc tối ưu hóa các liên kết nội bộ để giảm thiểu độ sâu thu thập dữ liệu cho các trang quan trọng.

John Mueller của Google từ lâu đã khuyến khích các nhà xuất bản đảm bảo các trang quan trọng được liên kết nổi bật.

Mueller không khuyến khích việc chôn sâu các trang quan trọng trong cấu trúc trang web.

John Mueller đã chia sẻ vào năm 2020:

“Vì vậy, điều sẽ xảy ra là, chúng ta sẽ thấy trang chủ thực sự quan trọng, những thứ được liên kết từ trang chủ nói chung cũng khá quan trọng.

Và sau đó… khi nó di chuyển ra khỏi trang chủ, chúng tôi sẽ nghĩ rằng có lẽ điều này ít quan trọng hơn.”

Giữ các trang quan trọng gần với các trang chính mà khách truy cập vào trang web là rất quan trọng.

Vì vậy, nếu các liên kết trỏ đến trang chủ, thì các trang được liên kết từ trang chủ được xem là quan trọng hơn.

John Mueller không nói rằng độ sâu thu thập thông tin là một yếu tố xếp hạng. Anh ấy chỉ đơn giản nói rằng nó báo hiệu cho Google biết trang nào là quan trọng.

Quy tắc Yandex do Alex trích dẫn sử dụng độ sâu thu thập dữ liệu từ trang chủ làm quy tắc xếp hạng.

Điều đó hợp lý khi coi trang chủ là điểm khởi đầu của tầm quan trọng và sau đó tính toán mức độ quan trọng ít hơn khi một cú nhấp chuột xa hơn vào sâu trong trang web.

Ngoài ra còn có các tài liệu nghiên cứu của Google có ý tưởng tương tự (Mô hình người lướt hợp lý, Mô hình người lướt ngẫu nhiên), đã tính xác suất mà một người lướt ngẫu nhiên có thể kết thúc tại một trang web nhất định chỉ bằng cách nhấp vào các liên kết.

Quy tắc ngón tay cái cho SEO từ lâu đã là giữ cho nội dung quan trọng cách trang chủ (hoặc từ các trang bên trong thu hút các liên kết trong nước) không quá vài cú nhấp chuột.

7. Cập nhật Yandex Vega… Liên quan đến chuyên môn và tính có thẩm quyền?

Yandex đã cập nhật công cụ tìm kiếm của họ vào năm 2019 với một bản cập nhật có tên là Vega.

Bản cập nhật Yandex Vega có các mạng thần kinh được đào tạo với các chuyên gia về chủ đề.

Bản cập nhật năm 2019 này có mục tiêu giới thiệu kết quả tìm kiếm với các trang chuyên gia và có thẩm quyền.

Nhưng các nhà tiếp thị tìm kiếm đang nghiền ngẫm các tài liệu vẫn chưa tìm thấy bất kỳ thứ gì tương quan với những thứ như tiểu sử tác giả, thứ mà một số người tin rằng có liên quan đến chuyên môn và tính xác thực mà Google tìm kiếm.

Related posts

Gắn kết hoạt động truyền thông mạng xã hội và SEO

Làm thế nào để hiệu quả với ngân sách SEO trong thời gian ngừng hoạt động?

Tối đa hóa đầu tư SEO của bạn: Mẹo để vận hành hiệu quả