Google Äã cáºp nháºt tà i liá»u chÃnh thức của Googlebot vá»i hÆ°á»ng dẫn má»i vá» lượt truy cáºp từ các IP Äược liên kết vá»i GoogleUserContent.com.
Google Äã cáºp nháºt Tà i liá»u trung tâm tìm kiếm của há» Äá» xác minh Googlebot, thêm tà i liá»u vá» lượt truy cáºp bot do ngÆ°á»i dùng kÃch hoạt, thông tin bá» thiếu trong tà i liá»u Googlebot trÆ°á»c Äây, Äiá»u nà y Äã gây nhầm lẫn trong nhiá»u nÄm, vá»i má»t sá» nhà xuất bản chặn dải IP của lượt truy cáºp hợp pháp.
>> Tham khảo: Trà tuỠnhân tạo sắp ra mắt trên Google Ads.
1. Tà i liá»u Bot má»i Äược cáºp nháºt
Google Äã thêm má»t tà i liá»u má»i phân loại ba loại bot khác nhau mà các nhà xuất bản nên mong Äợi.
Äây là ba loại Google Bots:
- Googlebot â Trình thu tháºp thông tin tìm kiếm
- Trình thu tháºp trÆ°á»ng hợp Äặc biá»t
- Trình tìm nạp do ngÆ°á»i dùng kÃch hoạt (GoogleUserContent)
Äiá»u cuá»i cùng, GoogleUserContent là má»t Äiá»u khiến các nhà xuất bản bá»i rá»i trong má»t thá»i gian dà i vì Google không có bất kỳ tà i liá»u rõ rà ng nà o vá» nó.
Äây là những gì Google nói vá» GoogleUserContent:
âTrình tìm nạp do ngÆ°á»i dùng kÃch hoạt
Các công cụ và chức nÄng của sản phẩm nÆ¡i ngÆ°á»i dùng cuá»i kÃch hoạt tìm nạp.
Và dụ: Google Site Verifier hoạt Äá»ng theo yêu cầu của ngÆ°á»i dùng.
Do ngÆ°á»i dùng yêu cầu tìm nạp nên những trình tìm nạp nà y bá» qua các quy tắc của tá»p robots.txt.â
Tà i liá»u nói rằng mặt nạ DNS Äảo ngược sẽ hiá»n thá» tên miá»n sau:
â–––.gae.googleusercontent.comâ
Google gần Äây Äã cáºp nháºt trang Google Crawlers của há» Äá» tạo má»t phần cụ thá» vá» các trình tìm nạp do ngÆ°á»i dùng kÃch hoạt.
Danh sách các trình thu tháºp dữ liá»u khác nhau chứa các bot giá»ng nhau nhÆ°ng trang nà y Äã Äược sắp xếp lại Äá» phân loại các trình tìm nạp do ngÆ°á»i dùng kÃch hoạt trong nhóm riêng của chúng.
>> Tham khảo: Cách tạo các trang dá»ch vụ Äược xếp hạng và Äem Äến chuyá»n Äá»i.
Các trình thu tháºp thông tin sau hiá»n Äược chá» Äá»nh là trình tìm nạp do ngÆ°á»i dùng kÃch hoạt:
âTrình tải nguá»n cấp dữ liá»u
Feedfetcher Äược sá» dụng Äá» thu tháºp dữ liá»u nguá»n cấp dữ liá»u RSS hoặc Atom cho Google Podcasts, Google News và PubSubHubbub.
Trung tâm xuất bản của Google
Tìm nạp và xá» lý nguá»n cấp dữ liá»u mà nhà xuất bản Äã cung cấp rõ rà ng thông qua Trung tâm xuất bản của Google Äá» sá» dụng trong các trang ÄÃch của Google Tin tức.
Google Äá»c to
Theo yêu cầu của ngÆ°á»i dùng, Google Read Aloud tìm nạp và Äá»c to các trang web bằng tÃnh nÄng chuyá»n vÄn bản thà nh giá»ng nói (TTS).
Trình xác minh trang web của Google
Trình xác minh trang web của Google tìm nạp mã thông báo xác minh Search Console theo yêu cầu của ngÆ°á»i dùng.â
TrÆ°á»c Äây, má»t sá» ngÆ°á»i trong cá»ng Äá»ng SEO Äã nói vá»i tôi rằng hoạt Äá»ng của bot từ các Äá»a chá» IP Äược liên kết vá»i GoogleUserContent.com Äã Äược kÃch hoạt khi ngÆ°á»i dùng xem trang web thông qua chức nÄng dá»ch từng có trong kết quả tìm kiếm, má»t tÃnh nÄng không còn tá»n tại trong SERPs của Google.
Tôi không biết Äiá»u Äó có Äúng hay không trong quá khứ.
NhÆ°ng á» trên là thông tin má»i mà chúng tôi hiá»n có vá» trình tải do ngÆ°á»i dùng kÃch hoạt.
Ngoà i ra, Google Äã thêm thông tin sau vá» trình tìm nạp do ngÆ°á»i dùng kÃch hoạt:
âTrình tìm nạp do ngÆ°á»i dùng kÃch hoạt
Trình tìm nạp do ngÆ°á»i dùng kÃch hoạt Äược ngÆ°á»i dùng kÃch hoạt Äá» thá»±c hiá»n má»t chức nÄng cụ thá» của sản phẩm. Và dụ: Trình xác minh trang web của Google hoạt Äá»ng theo yêu cầu của ngÆ°á»i dùng.
Do ngÆ°á»i dùng yêu cầu tìm nạp nên những trình tìm nạp nà y thÆ°á»ng bá» qua các quy tắc trong tá»p robots.txt. Phạm vi IP mà trình tìm nạp do ngÆ°á»i dùng kÃch hoạt sá» dụng Äược xuất bản trong Äá»i tượng do ngÆ°á»i dùng kÃch hoạt-fetcher.json.â
Tà i liá»u má»i của Google giải thÃch rằng hoạt Äá»ng bot từ các Äá»a chá» IP Äược liên kết vá»i GoogleUserContent.com có ââthá» Äược kÃch hoạt bá»i công cụ Google Site Verifier.
>> Tham khảo: Các tÃnh nÄng má»i của LinkedIn tÄng cÆ°á»ng tìm kiếm viá»c là m dá»±a trên giá trá».
Thay Äá»i khác trong tà i liá»u là má»t tham chiếu Äến googleusercontent.com trong ngữ cảnh Äá»a chá» IP Äược gán cho tên miá»n, GoogleUserContent.com.
Cuá»i cùng, Google Äã gỡ bá» trình thu tháºp dữ liá»u Ứng dụng dà nh cho thiết bá» di Äá»ng Android của há».
Mã thông báo tác nhân ngÆ°á»i dùng và chuá»i Äầy Äủ Äá»u là : AdsBot-Google-Mobile-Apps
Äây là mục ÄÃch của trình thu tháºp thông tin hiá»n Äã ngừng hoạt Äá»ng:
âKiá»m tra chất lượng quảng cáo trên trang ứng dụng Android. Tuân thủ các quy tắc của AdsBot-Google robots, nhÆ°ng bá» qua tác nhân ngÆ°á»i dùng chung (*) trong robots.txt.â
Äây là vÄn bản má»i:
âXác minh rằng tên miá»n là googlebot.com, google.com hoặc googleusercontent.com.â
Má»t bá» sung má»i khác là vÄn bản sau Äược má» rá»ng từ trang cÅ©:
âNgoà i ra, bạn có thá» xác Äá»nh Googlebot theo Äá»a chá» IP bằng cách khá»p Äá»a chá» IP của trình thu tháºp thông tin vá»i danh sách dải IP của trình thu tháºp thông tin và trình tìm nạp của Google:
Googlebot
Trình thu tháºp dữ liá»u Äặc biá»t nhÆ° AdsBot
Tìm nạp do ngÆ°á»i dùng kÃch hoạtâ
2. Tà i liá»u nháºn dạng Google Bot
Tà i liá»u má»i cuá»i cùng cÅ©ng có Äiá»u gì Äó vá» các bot sá» dụng Äá»a chá» IP Äược liên kết vá»i GoogleUserContent.
Các nhà tiếp thá» tìm kiếm Äã nhầm lẫn vá»i các Äá»a chá» IP Äó và cho rằng các bot Äó là thÆ° rác.
Má»t cuá»c thảo luáºn Trợ giúp vá» Google Search Console từ nÄm 2020 cho thấy má»i ngÆ°á»i bá»i rá»i nhÆ° thế nà o vá» hoạt Äá»ng liên quan Äến GoogleUserContent.
Nhiá»u ngÆ°á»i trong cuá»c thảo luáºn Äó Äã kết luáºn Äúng rằng Äó không phải là Googlebot nhÆ°ng sau Äó kết luáºn nhầm rằng Äó là má»t bot giả vá» là Google.
Má»t ngÆ°á»i dùng Äã ÄÄng:
âHà nh vi mà tôi thấy Äến từ các Äá»a chá» nà y rất gần (nếu không muá»n nói là giá»ng há»t) vá»i hà nh vi hợp pháp của Googlebot và nó tấn công nhiá»u trang web của chúng tôi.
â¦Nếu không phải nhÆ° váºy â thì Äiá»u nà y dÆ°á»ng nhÆ° cho thấy có hoạt Äá»ng bot Äá»c hại phá» biến do ai Äó cá» gắng hết sức Äá» trông giá»ng Google trên các trang web của chúng tôi, Äiá»u Äáng lo ngại.â
>> Tham khảo: Google tung ra bản cáºp nháºt thuáºt toán cá»t lõi tháng 3 nÄm 2023.
Sau má»t sá» phản há»i, ngÆ°á»i bắt Äầu cuá»c thảo luáºn kết luáºn rằng hoạt Äá»ng GoogleUserContent là spam.
HỠviết:
ââ¦Googlebots Äược Äá» cáºp có bắt chÆ°á»c các Tác nhân ngÆ°á»i dùng chÃnh thức, nhÆ°ng có vẻ nhÆ° bằng chứng cho thấy chúng là giả mạo.
Tôi sẽ chặn chúng ngay bây giá».
Giá» Äây, chúng tôi biết rằng hoạt Äá»ng của bot từ các IP Äược liên kết vá»i GoogleUserContent không phải là bot spam hoặc tin tặc.
Chúng thá»±c sá»± Äến từ Google. Các nhà xuất bản hiá»n Äang chặn Äá»a chá» IP Äược liên kết vá»i GoogleUserContent có thá» nên bá» chặn chúng.