Tìm kiếm của Google quá tải bởi cuộc tấn công thư rác lớn

MetaDecember 27, 2023066 views

Google rõ ràng đang vật lộn để ngăn chặn một cuộc tấn công thư rác đang diễn ra trong nhiều ngày.

Kết quả tìm kiếm của Google đã bị tấn công bởi một cuộc tấn công thư rác trong vài ngày qua với tình trạng chỉ có thể được mô tả là hoàn toàn ngoài tầm kiểm soát.

>> Tham khảo: Khi nào nên sử dụng từ khóa có thương hiệu và đối thủ cạnh tranh trong PPC?

Nhiều tên miền được xếp hạng cho hàng trăm nghìn từ khóa, mỗi tên miền cho thấy quy mô của cuộc tấn công này có thể dễ dàng tiếp cận hàng triệu cụm từ khóa.

1. Thuật toán của Google có thể được chơi như thế nào

Các trang web spam dường như đang tận dụng ít nhất ba cơ hội, một phần trong cách Google xếp hạng các trang web.

Những cơ hội này không phải là mới và những kẻ gửi thư rác đã tận dụng chúng trong nhiều năm nhưng chưa đến mức như hiện nay.

Có lẽ lý do quan trọng nhất cho sự thành công của thư rác là các truy vấn tìm kiếm mà các trang web spam đang xếp hạng có tính cạnh tranh thấp, giúp xếp hạng dễ dàng hơn.

Có hai loại truy vấn tìm kiếm có khối lượng thấp mà các trang web spam đang tìm kiếm cơ hội.

Cơ hội 1. Thuật toán tìm kiếm địa phương: Tìm kiếm địa phương là một loại tìm kiếm được kích hoạt khi mọi người tìm kiếm những thứ ở gần đó, chẳng hạn như nhà hàng hoặc giờ chiếu phim. Đó là một thuật toán dễ dãi hơn cho phép một nhà hàng địa phương không có liên kết để xếp hạng.

Cơ hội 2. Từ khóa đuôi dài: Từ khóa đuôi dài là các cụm từ có lượng truy vấn thấp, xảy ra một lần mỗi tháng hoặc mỗi năm một lần. Do đó, các truy vấn này có tính cạnh tranh thấp nên dễ dàng xếp hạng hơn.

Cơ hội 3. Nhiều trang web spam là hoàn toàn mới. Các tên miền đã được đăng ký trong vòng 24 đến 48 giờ trước khi xếp hạng.

>> Tham khảo: Tại sao phân tích khoảng cách nội dung nên là một phần trong chiến lược SEO?

Google cung cấp cho các trang web hoàn toàn mới một khoảng thời gian ngắn để nó nhận được lợi ích từ sự nghi ngờ trong khi thuật toán của Google tìm ra trang web trong khoảng thời gian trăng mật ngắn ngủi khi trang web có thể xếp hạng cho các truy vấn tìm kiếm.

Nhiều miền chỉ được đăng ký trong vòng 24-48 giờ qua. Điều đó có thể có nghĩa là những tên miền đó cũng đang tận dụng cơ hội nhỏ này để lẻn vào, xếp hạng cho hàng triệu truy vấn tìm kiếm rồi biến mất.

Một nhân viên của Google đã mô tả lý do tại sao các trang web mới có thể được xếp hạng:

“Đặc biệt, với những website hoàn toàn mới, một trong những khó khăn mà chúng tôi gặp phải là có thể không có nhiều tín hiệu cho những website đó nên phải đưa ra ước tính.

Và tùy thuộc vào cách chúng tôi ước tính, đôi khi điều đó có thể có nghĩa là ngay từ đầu, chúng tôi hiển thị trang web này rõ ràng hơn một chút so với việc cuối cùng các tín hiệu cho chúng tôi biết.

2. Liên kết giúp Google tìm các trang web spam

Điều này gần đây khiến tôi chú ý từ một loạt bài đăng của Bill Hartzer (hồ sơ LinkedIn), trong đó anh ấy đã xuất bản một biểu đồ liên kết được tạo bởi công cụ backlinks Majestic để lộ mạng lưới liên kết của một số trang web spam.

Biểu đồ liên kết mà anh ấy đăng cho thấy rất nhiều trang web liên kết chặt chẽ với nhau, đây là một mô hình khá điển hình cho các mạng liên kết spam.

Bill và tôi đã nói về các trang web spam qua Facebook Messenger và cả hai chúng tôi đều đồng ý rằng mặc dù những kẻ gửi thư rác đã bỏ ra rất nhiều công sức để tạo ra một mạng lưới liên kết ngược, nhưng các liên kết đó thực sự không chịu trách nhiệm cho thứ hạng cao.

Các liên kết này có thể giúp Google tìm ra các trang web spam hoàn toàn mới và thu thập thông tin chúng và cuối cùng là xếp hạng.

Bill nói:

“Theo tôi, điều này một phần là lỗi của Google, hãng dường như đang chú trọng nhiều hơn vào nội dung hơn là các liên kết.”

Tôi đồng ý 100% rằng Google đang chú trọng vào nội dung hơn là liên kết. Nhưng suy nghĩ của tôi là các liên kết spam ở đó để Googlebot có thể phát hiện các trang spam và lập chỉ mục cho chúng, dù chỉ trong một hoặc hai ngày.

Sau khi được lập chỉ mục, các trang spam có khả năng khai thác điều mà tôi cho là hai lỗ hổng trong thuật toán của Google mà tôi sẽ nói đến tiếp theo.

>> Tham khảo: Instagram thêm những cách mới để tạo nội dung.

3. Thư rác ngoài tầm kiểm soát trong Google SERPs

Nhiều trang web đang xếp hạng cho các cụm từ đuôi dài dễ xếp hạng cũng như các cụm từ có thành phần tìm kiếm địa phương cũng dễ xếp hạng.

Đuôi dài là một khái niệm đã tồn tại gần 20 năm và sau đó được phổ biến rộng rãi trong cuốn sách xuất bản năm 2006 có tên Cái đuôi dài: Tại sao tương lai của doanh nghiệp lại bán ít hơn.

Những kẻ gửi thư rác có thể xếp hạng cho những cụm từ hiếm khi được tìm kiếm này vì những cụm từ đó có ít sự cạnh tranh, điều này giúp dễ dàng xếp hạng.

Vì vậy, nếu người gửi thư rác tạo ra hàng triệu trang chứa cụm từ đuôi dài thì những trang đó có thể xếp hạng cho hàng trăm nghìn từ khóa mỗi ngày trong một khoảng thời gian ngắn.

Các công ty như Amazon sử dụng nguyên tắc đuôi dài để bán hàng trăm nghìn sản phẩm riêng lẻ mỗi ngày, khác với việc bán một sản phẩm hàng trăm nghìn lần mỗi ngày.

Đó là điều mà những kẻ gửi thư rác đang khai thác, đó là sự dễ dàng xếp hạng của các cụm từ đuôi dài.

Điều thứ hai mà những kẻ gửi thư rác đang khai thác là lỗ hổng vốn có trong Tìm kiếm Địa phương.

Thuật toán tìm kiếm cục bộ không giống với thuật toán xếp hạng các từ khóa không phải cục bộ.

Các ví dụ được đưa ra ánh sáng là các biến thể của Craigslist và các từ khóa liên quan.

Ví dụ như các cụm từ như phụ tùng ô tô Craigslist, phòng cho thuê trên Craigslist, Craigslist để bán bởi chủ sở hữu và hàng nghìn từ khóa khác, hầu hết đều không sử dụng từ Craigslist.

Quy mô của thư rác là rất lớn và nó vượt xa các từ khóa có từ “Craigslist” trong đó.

>> Tham khảo: Cách tạo chiến lược xây dựng liên kết.

4. Trang thư rác trông như thế nào

Không thể xem trang thư rác trông như thế nào bằng cách truy cập các trang bằng trình duyệt.

Tôi đã cố xem mã nguồn của các trang web được xếp hạng trên Google nhưng tất cả các trang web spam đều tự động chuyển hướng đến một tên miền khác.

Tiếp theo, tôi nhập URL spam vào trình kiểm tra liên kết W3C để truy cập trang web nhưng bot W3C cũng không thể nhìn thấy trang web.

Vì vậy, tôi đã thay đổi tác nhân người dùng trình duyệt của mình để tự nhận mình là Googlebot nhưng trang web spam vẫn chuyển hướng tôi.

Điều đó chỉ ra rằng trang web không kiểm tra xem tác nhân người dùng có phải là Googlebot hay không.

Trang web spam đang kiểm tra địa chỉ IP của Googlebot. Nếu địa chỉ IP của khách truy cập khớp với địa chỉ của Google thì trang spam sẽ hiển thị nội dung cho Googlebot.

Tất cả những khách truy cập khác đều nhận được chuyển hướng đến các tên miền khác hiển thị nội dung sơ sài.

Để xem HTML của trang web, tôi phải truy cập bằng địa chỉ IP của Google. Vì vậy, tôi đã sử dụng Trình kiểm tra kết quả nhiều định dạng của Google để truy cập trang web spam và ghi lại HTML của trang.

Tôi đã chỉ cho Bill Hartzer cách trích xuất HTML bằng cách sử dụng trình kiểm tra Kết quả nhiều định dạng và anh ấy ngay lập tức tweet về nó, cười lớn. Đặng!

Công cụ kiểm tra kết quả nhiều định dạng có tùy chọn hiển thị HTML của trang web. Vì vậy, hãy sao chép HTML, dán nó vào một tệp văn bản rồi lưu nó dưới dạng tệp HTML.

5. Xếp hạng một tên miền cho hơn 300.000 từ khóa

Bill gửi cho tôi một bảng tính chứa danh sách các cụm từ khóa mà chỉ một trong những trang web spam được xếp hạng. Một trang web spam, chỉ một trong số đó, được xếp hạng cho hơn 300.000 cụm từ khóa.

Có rất nhiều cụm từ khóa Craigslist nhưng cũng có những cụm từ đuôi dài khác, nhiều cụm từ trong số đó có chứa yếu tố tìm kiếm địa phương.

Như tôi đã đề cập, thật dễ dàng xếp hạng cho các cụm từ đuôi dài, dễ xếp hạng cho các cụm từ tìm kiếm địa phương và kết hợp hai loại cụm từ đó và thực sự dễ dàng xếp hạng cho các cụm từ khóa này.

>> Tham khảo: LinkedIn tung ra các tính năng mới để nâng cao bản tin.

6. Tại sao kỹ thuật thư rác này lại hiệu quả?

Như đã đề cập trước đó, tìm kiếm cục bộ sử dụng thuật toán khác với thuật toán không cục bộ.

Ví dụ: một trang web địa phương không cần nhiều liên kết để xếp hạng cho truy vấn tìm kiếm.

Các trang chỉ cần loại từ khóa phù hợp để kích hoạt thuật toán tìm kiếm địa phương và sau đó được xếp hạng.

Thuật toán tìm kiếm địa phương khác biệt và dễ dãi hơn để các trang web loại địa phương có thể xếp hạng.

Các thuật toán tìm kiếm địa phương dễ dãi đến mức một trang web được viết gần như hoàn toàn bằng tiếng Latinh có thể xếp hạng cho một cụm từ như Rhinoplasty Plano Texas.

Google đã biết về vấn đề thư rác này ít nhất từ ngày 19 tháng 12, như Danny Sullivan đã thừa nhận trong một tweet.

Có rất nhiều cách Google có thể làm điều đó, chẳng hạn như nghiêm ngặt hơn và không cho phép các trang web trên một số tên miền nhất định được xếp hạng. Sẽ rất thú vị để xem liệu cuối cùng Google có tìm ra cách chống lại loại thư rác này hay không.

1. Thuật toán của Google có thể được chơi như thế nào

2. Liên kết giúp Google tìm các trang web spam

3. Thư rác ngoài tầm kiểm soát trong Google SERPs

4. Trang thư rác trông như thế nào

5. Xếp hạng một tên miền cho hơn 300.000 từ khóa

6. Tại sao kỹ thuật thư rác này lại hiệu quả?

Tại sao Google khuyến nghị cấu trúc trang web phân cấp cho SEO?

Blog công ty của bạn có đủ điều kiện cho Google Tin Tức không?

Related posts

Tại sao đề cập đến thương hiệu là tương lai của backlinks

Tại sao Google khuyến nghị cấu trúc trang web phân cấp cho SEO?

Cách quản lý và tối ưu hóa danh sách địa phương cho SEO