Google chia sẻ thông tin chi tiết về các yếu tố quyết định liệu nội dung có được lập chỉ mục hay không.
Gần đây, Google đã xuất bản một podcast thảo luận về cái được gọi là ngân sách thu thập thông tin và yếu tố ảnh hưởng đến việc Google lập chỉ mục nội dung.
>> Tham khảo: Vì sao lượng nhấp chuột Google Ads giảm và biện pháp xử lý?
Cả Gary Illyes và Martin Splitt đều chia sẻ thông tin chi tiết về lập chỉ mục web, theo quan điểm của Google.
1. Nguồn gốc của Khái niệm Ngân sách Thu thập thông tin
Gary Illyes nói rằng khái niệm ngân sách thu thập thông tin là thứ được tạo ra bên ngoài Google bởi cộng đồng tìm kiếm.
Anh ấy giải thích rằng không có bất kỳ điều gì trong nội bộ Google tương ứng với ý tưởng về ngân sách thu thập thông tin.
Khi mọi người nói về ngân sách thu thập thông tin, những gì đang xảy ra bên trong Google liên quan đến nhiều số liệu, không phải thứ được gọi là ngân sách thu thập thông tin.
Vì vậy, bên trong Google, họ đã nói về những gì có thể đại diện cho ngân sách thu thập thông tin và đưa ra cách nói về nó.
Anh ấy nói:
“… Trong thời gian dài nhất, chúng tôi đã nói rằng chúng tôi không có khái niệm về ngân sách thu thập thông tin. Và đó là sự thật.
Chúng tôi không có thứ gì đó có thể có nghĩa là tự thu thập ngân sách – chẳng hạn như cách chúng tôi không có con số cho EAT.
Và sau đó, bởi vì mọi người đang nói về nó, chúng tôi đã cố gắng đưa ra một cái gì đó… ít nhất, được xác định bằng cách nào đó.
Và sau đó chúng tôi đã làm việc với hai hoặc ba hoặc bốn nhóm – tôi không nhớ – nơi chúng tôi đã cố gắng đưa ra ít nhất một vài chỉ số nội bộ có thể liên kết với nhau thành một thứ mà mọi người bên ngoài định nghĩa là ngân sách thu thập thông tin. ”
>> Tham khảo: Mẹo cách viết quảng cáo Facebook.
2. Thu thập thông tin Ngân sách có nghĩa là gì trong Google
Theo Gary, một phần của việc tính toán ngân sách thu thập thông tin dựa trên những cân nhắc thực tế như máy chủ cho phép Googlebot thu thập dữ liệu bao nhiêu URL mà không làm quá tải máy chủ.
Gary Illyes và Martin Splitt:
“Gary Illyes:… chúng tôi đã xác định đó là số lượng URL mà Googlebot có thể và sẵn sàng hoặc được hướng dẫn để thu thập thông tin.”
Martin Splitt: Đối với một trang web nhất định.
Gary Illyes: Đối với một trang web nhất định, có.
Và đối với chúng tôi, đó gần như là ý nghĩa của ngân sách thu thập thông tin bởi vì nếu bạn nghĩ về nó, chúng tôi không muốn làm hại các trang web vì Googlebot có đủ năng lực của Chrome để gỡ bỏ các trang web… ”
>> Tham khảo: Mạng xã hội Quora hoạt động như thế nào?
3. Cân bằng các cân nhắc khác nhau
Một điểm thú vị khác đã được thực hiện là làm thế nào, liên quan đến thu thập thông tin, có những cân nhắc khác nhau liên quan. Có những giới hạn đối với những gì có thể được lưu trữ, vì vậy, theo Google, điều đó có nghĩa là sử dụng tài nguyên của Google “ở nơi nó quan trọng”.
“Martin Splitt: Rõ ràng là mọi người đều muốn mọi thứ được lập chỉ mục càng nhanh càng tốt, có thể là trang web mới xuất hiện trực tuyến hoặc là trang web có nhiều trang và họ muốn thường xuyên thay đổi những trang đó, và họ lo lắng về mọi thứ không được thu thập thông tin nhanh chóng.
Tôi thường mô tả nó như một thách thức với sự cân bằng giữa việc không áp đảo trang web và cũng chi tiêu tài nguyên của chúng tôi ở những nơi nó quan trọng. ”
John Mueller gần đây đã tweet rằng Google không lập chỉ mục mọi thứ và đề cập rằng không phải mọi thứ đều hữu ích.
Tweet của Mueller:
“… Điều quan trọng cần lưu ý là Google không lập chỉ mục mọi trang trên web, ngay cả khi nó được gửi trực tiếp. Nếu không có lỗi, nó có thể được chọn để lập chỉ mục theo thời gian – hoặc Google có thể chỉ tập trung vào một số trang khác trên trang web của bạn ”.
Anh ấy tiếp tục với một tweet khác:
“Chà, rất nhiều SEO & trang web (có thể không phải của bạn / của bạn!) Tạo ra nội dung khủng khiếp không đáng được lập chỉ mục. Chỉ vì nó tồn tại không có nghĩa là nó hữu ích cho người dùng. “
Martin Splitt gọi quá trình thu thập thông tin là vấn đề “sử dụng tài nguyên của chúng tôi ở những nơi quan trọng”.
John Mueller đã đề cập nếu nội dung “hữu ích cho người dùng”.
Sự hữu ích là một góc độ thú vị để đánh giá nội dung và theo ý kiến của tôi, nó có thể hữu ích hơn cho việc chẩn đoán nội dung hơn là lời khuyên vô bổ để đảm bảo rằng nội dung “nhắm mục tiêu đến mục đích của người dùng” và đó là “từ khóa được tối ưu hóa”.
Ví dụ: gần đây tôi đã xem xét một trang web YMYL nơi toàn bộ trang web trông giống như được tạo từ danh sách kiểm tra việc cần làm của SEO.
Tạo hồ sơ Tác giả
Hồ sơ tác giả phải có Trang LinkedIn
Từ khóa tối ưu hóa lưu lượng truy cập
Liên kết đến các trang web “có thẩm quyền”
Nhà xuất bản đã sử dụng hình ảnh do AI tạo cho tiểu sử tác giả, hình ảnh này cũng được sử dụng trên hồ sơ LinkedIn giả mạo.
Nhiều trang của trang web được liên kết với các trang .gov mỏng có các từ khóa trong tiêu đề nhưng hoàn toàn không hữu ích. Giống như họ thậm chí còn không xem trang của chính phủ để đánh giá xem trang đó có đáng để liên kết hay không.
Bề ngoài, họ đánh dấu vào các ô của danh sách việc cần làm của SEO, hoàn thành các hoạt động SEO thuộc lòng như liên kết đến trang .gov, tạo hồ sơ tác giả, v.v.
Họ tạo ra hình thức bên ngoài về chất lượng nhưng không thực sự đạt được điều đó bởi vì ở mỗi bước, họ không xem xét liệu những gì họ đang làm có hữu ích hay không.
>> Tham khảo: Sắp ra mắt bản cập nhật thuật toán ‘Nội dung hữu ích’ của Google.
4. Thu thập thông tin ngân sách không phải là điều đáng lo ngại
Gary và Martin đã bắt đầu nói về cách hầu hết các trang web không cần phải lo lắng về ngân sách thu thập thông tin.
Gary chỉ ngón tay vào các blog trong ngành công nghiệp tìm kiếm mà trước đây đã quảng bá ý tưởng rằng ngân sách thu thập thông tin là điều đáng lo ngại trong khi theo anh đó không phải là điều đáng lo ngại.
Anh ấy nói:
“Tôi nghĩ một phần là nỗi sợ hãi về điều gì đó xảy ra mà họ không thể kiểm soát, mọi người không thể kiểm soát và phần khác chỉ là thông tin sai lệch.
… Và có một số blog trong những ngày mà mọi người đang nói về ngân sách thu thập thông tin và nó rất quan trọng, sau đó mọi người nhận thấy điều đó và họ bối rối về việc “Tôi có phải lo lắng về ngân sách thu thập thông tin hay không?”
Martin Splitt hỏi:
“Nhưng giả sử bạn là một blog thú vị… Bạn có cần lo lắng về ngân sách thu thập thông tin không?”
Và Gary đã trả lời:
“Tôi nghĩ rằng hầu hết mọi người không phải lo lắng về điều đó và khi tôi nói hầu hết, có lẽ hơn 90% các trang web trên internet không phải lo lắng về điều đó.”
Vài phút sau trong podcast Martin đã quan sát thấy:
“Nhưng mọi người đang lo lắng về điều đó và tôi không chắc chính xác nó đến từ đâu.
Tôi nghĩ điều đó xuất phát từ thực tế là một số trang web quy mô lớn có các bài báo và bài đăng trên blog, nơi họ nói về việc thu thập thông tin ngân sách.
Nó đang được thảo luận trong các khóa đào tạo SEO. Theo như những gì tôi thấy, nó đang được thảo luận tại các hội nghị.
Nhưng đó là một vấn đề hiếm khi xảy ra. Giống như đó không phải là điều mà mọi trang web đều gặp phải, tuy nhiên, mọi người rất lo lắng về điều đó. “
5. Cách Google xác định nội dung cần lập chỉ mục
Tiếp theo là cuộc thảo luận về các yếu tố khiến Google lập chỉ mục nội dung.
Điều đáng quan tâm là khi Gary nói về việc muốn lập chỉ mục nội dung có thể được tìm kiếm.
Gary Illyes:
“… Vì như chúng tôi đã nói, chúng tôi không có không gian vô hạn, vì vậy chúng tôi muốn lập chỉ mục những thứ mà chúng tôi nghĩ – tốt, không phải chúng tôi– nhưng các thuật toán của chúng tôi xác định rằng nó có thể được tìm kiếm tại một số thời điểm và nếu chúng tôi không có tín hiệu, ví dụ, về một trang web nhất định hoặc một URL nhất định hoặc bất cứ điều gì, thì làm thế nào chúng tôi biết rằng chúng tôi cần phải thu thập dữ liệu đó để lập chỉ mục? ”
Gary, cây bút công nghệ của Google Search Central, Lizzi Sassman (@okaylizzi), tiếp theo nói về việc suy ra từ phần còn lại của trang web xem nội dung mới có đáng lập chỉ mục hay không.
“Và một số điều bạn có thể suy luận – ví dụ: nếu bạn khởi chạy một blog mới trên trang web chính của mình chẳng hạn và bạn có một thư mục con blog mới chẳng hạn, thì chúng tôi có thể sắp xếp suy luận, dựa trên toàn bộ trang web, cho dù chúng ta có muốn thu thập nhiều thông tin từ blog đó hay không.
Lizzi Sassman: Nhưng blog là một loại nội dung mới có thể được cập nhật thường xuyên hơn, vậy làm sao chúng ta có thể biết được đó là…? Nó chỉ là mới. Chúng tôi không chắc liệu nó sẽ có tin tức hay không, như thế nào
thường xuyên thì vẫn cần được xác định.
Gary Illyes: Nhưng chúng tôi cần một tín hiệu khởi động.
Lizzi Sassman: Và tín hiệu khởi động là…
Gary Illyes: Suy luận từ trang web chính. ”
Gary sau đó đã chuyển sang nói về các tín hiệu chất lượng. Các tín hiệu chất lượng mà họ nói đến là liệu các tín hiệu liên quan đến sự quan tâm của người dùng, chẳng hạn như mọi người có quan tâm đến sản phẩm này không? Mọi người có quan tâm đến trang web này không?
Anh ấy đã giải thích:
“Nhưng đó không chỉ là tần suất cập nhật. Đó cũng là tín hiệu chất lượng mà trang web chính có.
Vì vậy, ví dụ: nếu chúng ta thấy rằng một mẫu nhất định rất phổ biến trên Internet, chẳng hạn như một sản phẩm gạch chéo rất phổ biến trên Internet và mọi người trên Reddit đang nói về nó, các trang web khác đang liên kết đến các URL theo mẫu đó, thì đó là một tín hiệu cho chúng tôi rằng mọi người thích trang web nói chung. “
Gary tiếp tục nói về mức độ phổ biến và các tín hiệu quan tâm nhưng trong bối cảnh của cuộc trò chuyện, đó là một phần mới của trang web đã được khởi chạy.
Trong cuộc thảo luận, ông gọi phần mới là Thư mục.
Illyes:
“Mặc dù nếu bạn có thứ gì đó mà mọi người không liên kết đến và sau đó bạn đang cố khởi chạy một thư mục mới, thì giống như mọi người không thích trang web, vậy tại sao chúng tôi lại thu thập dữ liệu thư mục mới mà bạn vừa khởi chạy này?
Và cuối cùng, nếu mọi người bắt đầu liên kết với nó– “
>> Tham khảo: Cập nhật Google Search Console: Thêm dữ liệu trong các báo cáo Core Web Vitals.
6. Thu thập thông tin ngân sách và các trang web được lập chỉ mục
Để tóm tắt một số điều đã được thảo luận:
- Google không có khả năng vô hạn và không thể lập chỉ mục mọi thứ trên web.
- Bởi vì Google không thể lập chỉ mục mọi thứ, điều quan trọng là phải chọn lọc bằng cách chỉ lập chỉ mục những nội dung quan trọng.
- Các chủ đề nội dung quan trọng có xu hướng được thảo luận
- Các trang web quan trọng, có xu hướng hữu ích, có xu hướng được thảo luận và liên kết với
Rõ ràng, đó không phải là danh sách toàn diện về mọi thứ ảnh hưởng đến những gì được lập chỉ mục. Nó cũng không phải là một danh sách kiểm tra SEO.
Đó chỉ là một ý tưởng về những thứ quan trọng đến mức Gary Illyes và Martin Splitt đã thảo luận về nó.