Khám phá sự phức tạp của nội dung do AI tạo ra trong tìm kiếm và cách các mục tiêu dài hạn của Google có thể định hình phản ứng của họ đối với công nghệ.
Sự bùng nổ công cụ AI trong năm qua đã tác động mạnh mẽ đến các nhà tiếp thị kỹ thuật số, đặc biệt là những người làm trong lĩnh vực SEO.
Do tính chất tốn thời gian và tốn kém của việc sáng tạo nội dung, các nhà tiếp thị đã chuyển sang sử dụng AI để được hỗ trợ, mang lại nhiều kết quả khác nhau.
>> Tham khảo: Hướng dẫn quảng cáo tìm kiếm thích ứng của Google: Điều hướng AI trong quảng cáo.
Bất chấp các vấn đề đạo đức, một câu hỏi thường xuyên xuất hiện là “Các công cụ tìm kiếm có thể phát hiện nội dung AI của tôi không?”
Câu hỏi được coi là đặc biệt quan trọng bởi vì nếu câu trả lời là “không”, thì nó sẽ vô hiệu hóa nhiều câu hỏi khác về việc liệu AI có nên được sử dụng hay không và nên sử dụng như thế nào.
1. Lịch sử lâu đời của nội dung do máy tạo ra
Mặc dù tần suất tạo nội dung do máy tạo hoặc có sự hỗ trợ là chưa từng có, nhưng nó không hoàn toàn mới và không phải lúc nào cũng tiêu cực.
Đầu tiên, việc chia sẻ tin tức là bắt buộc đối với các trang web tin tức và từ lâu họ đã sử dụng dữ liệu từ nhiều nguồn khác nhau, chẳng hạn như thị trường chứng khoán và máy đo địa chấn, để tăng tốc độ tạo nội dung.
Chẳng hạn, việc xuất bản một bài báo về rô-bốt có nội dung:
“Một trận động đất [cường độ] đã được phát hiện tại [địa điểm, thành phố] vào [thời gian]/[ngày] sáng nay, trận động đất đầu tiên kể từ [ngày diễn ra sự kiện gần đây nhất]. Thêm tin tức để theo dõi.
Những cập nhật như thế này cũng hữu ích cho người đọc cuối, những người cần nhận được thông tin này càng nhanh càng tốt.
Ở đầu kia của quang phổ, chúng tôi đã thấy nhiều triển khai “mũ đen” của nội dung do máy tạo.
Google đã lên án việc sử dụng chuỗi Markov để tạo văn bản cho nội dung ít nỗ lực trong nhiều năm, dưới biểu ngữ “các trang được tạo tự động không cung cấp giá trị gia tăng”.
Điều đặc biệt thú vị và chủ yếu là điểm gây nhầm lẫn hoặc vùng xám đối với một số người, là ý nghĩa của “không có giá trị gia tăng”.
>> Tham khảo: Cách tạo nội dung địa phương để tạo niềm tin và thúc đẩy doanh số bán hàng.
2. Làm thế nào LLM có thể thêm giá trị?
Mức độ phổ biến của nội dung AI tăng vọt nhờ sự chú ý thu hút bởi các mô hình ngôn ngữ lớn GPTx (LLM) và chatbot AI được tinh chỉnh, ChatGPT, giúp cải thiện tương tác đàm thoại.
Không đi sâu vào các chi tiết kỹ thuật, có một số điểm quan trọng cần xem xét về các công cụ này:
2.1. Văn bản được tạo dựa trên phân phối xác suất
Ví dụ: nếu bạn viết, “Làm SEO rất thú vị vì…”, thì LLM đang xem xét tất cả các mã thông báo và cố gắng tính toán từ có khả năng tiếp theo nhất dựa trên tập huấn luyện của nó. Nhìn chung, bạn có thể coi nó như một phiên bản thực sự tiên tiến của văn bản tiên đoán trên điện thoại của mình.
2.2. ChatGPT là một loại trí tuệ nhân tạo tổng quát
Điều này có nghĩa là đầu ra không thể dự đoán được. Có một yếu tố ngẫu nhiên và nó có thể phản hồi khác nhau với cùng một lời nhắc.
Khi bạn đánh giá cao hai điểm này, rõ ràng là các công cụ như ChatGPT không có bất kỳ kiến thức truyền thống nào hoặc “biết” bất cứ điều gì. Thiếu sót này là cơ sở cho tất cả các lỗi, hay còn gọi là “ảo giác”.
Nhiều tài liệu đầu ra chứng minh cách tiếp cận này có thể tạo ra kết quả không chính xác và khiến ChatGPT tự mâu thuẫn nhiều lần.
Điều này làm dấy lên những nghi ngờ nghiêm trọng về tính nhất quán của việc “gia tăng giá trị” với văn bản do AI viết, do khả năng xảy ra ảo giác thường xuyên.
Nguyên nhân sâu xa nằm ở cách các LLM tạo ra văn bản, vấn đề này sẽ không dễ dàng giải quyết nếu không có cách tiếp cận mới.
Đây là một cân nhắc quan trọng, đặc biệt đối với các chủ đề Tiền của bạn, Cuộc sống của bạn (YMYL), có thể gây tổn hại nghiêm trọng đến tài chính hoặc cuộc sống của mọi người nếu không chính xác.
Các ấn phẩm lớn như Men’s Health và CNET đã bị phát hiện xuất bản thông tin do AI tạo ra không chính xác trong năm nay, làm nổi bật mối lo ngại.
Các nhà xuất bản không đơn độc với vấn đề này, vì Google đã gặp khó khăn trong việc kiểm soát nội dung Trải nghiệm Sáng tạo Tìm kiếm (SGE) với nội dung YMYL.
Mặc dù Google tuyên bố rằng họ sẽ cẩn thận với các câu trả lời được tạo và đi xa hơn nữa là đưa ra ví dụ cụ thể về việc “sẽ không hiển thị câu trả lời cho câu hỏi về việc cho trẻ uống Tylenol vì nó nằm trong lĩnh vực y tế”, SGE rõ ràng sẽ làm như vậy. điều này bằng cách đơn giản hỏi nó câu hỏi.
>> Tham khảo: YouTube Shorts ra mắt sáu tính năng mới để cải thiện việc sáng tạo nội dung.
3. SGE và MUM của Google
Rõ ràng là Google tin rằng có một nơi dành cho nội dung do máy tạo ra để trả lời các truy vấn của người dùng. Google đã gợi ý về điều này kể từ tháng 5 năm 2021, khi họ công bố MUM, Mô hình hợp nhất đa nhiệm của họ.
Một thách thức mà MUM đặt ra để giải quyết dựa trên dữ liệu mà mọi người đưa ra trung bình tám truy vấn cho các tác vụ phức tạp.
Trong một truy vấn ban đầu, người tìm kiếm sẽ tìm hiểu một số thông tin bổ sung, thúc đẩy các tìm kiếm có liên quan và hiển thị các trang web mới để trả lời các truy vấn đó.
Google đã đề xuất: Điều gì sẽ xảy ra nếu họ có thể thực hiện truy vấn ban đầu, dự đoán các câu hỏi tiếp theo của người dùng và tạo ra câu trả lời hoàn chỉnh bằng cách sử dụng kiến thức về chỉ mục của họ?
Nếu nó hoạt động, mặc dù cách tiếp cận này có thể tuyệt vời đối với người dùng, nhưng về cơ bản, nó sẽ loại bỏ nhiều chiến lược từ khóa “đuôi dài” hoặc không có khối lượng mà các SEO dựa vào để có chỗ đứng trong SERPs.
Giả sử Google có thể xác định các truy vấn phù hợp với câu trả lời do AI tạo ra, nhiều câu hỏi có thể được coi là “đã giải quyết”.
Điều này đặt ra câu hỏi…
Tại sao Google lại hiển thị cho người tìm kiếm trang web của bạn với câu trả lời được tạo trước khi họ có thể giữ chân người dùng trong hệ sinh thái tìm kiếm của họ và tự tạo câu trả lời?
Google có động cơ tài chính để giữ người dùng trong hệ sinh thái của mình. Chúng tôi đã thấy nhiều cách tiếp cận khác nhau để đạt được điều này, từ các đoạn trích nổi bật cho đến việc cho phép mọi người tìm kiếm các chuyến bay trong SERPs.
Giả sử Google cho rằng văn bản được tạo của bạn không cung cấp giá trị cao hơn những gì nó có thể cung cấp. Trong trường hợp đó, nó đơn giản trở thành vấn đề chi phí so với lợi ích đối với công cụ tìm kiếm.
Liệu họ có thể tạo ra nhiều doanh thu hơn trong dài hạn bằng cách hấp thụ chi phí tạo và khiến người dùng chờ đợi câu trả lời so với việc đưa người dùng đến một trang mà họ biết đã tồn tại một cách nhanh chóng và rẻ tiền không?
>> Tham khảo: Cách tạo chiến lược xây dựng liên kết.
4. Phát hiện nội dung AI
Cùng với sự bùng nổ của việc sử dụng ChatGPT, hàng tá “trình phát hiện nội dung AI” cho phép bạn nhập nội dung văn bản và sẽ đưa ra điểm phần trăm – đó là vấn đề nằm ở đâu.
Mặc dù có một số khác biệt về cách các trình phát hiện khác nhau gắn nhãn điểm phần trăm này, nhưng chúng hầu như luôn cho kết quả giống nhau: phần trăm chắc chắn rằng toàn bộ văn bản được cung cấp là do AI tạo ra.
Điều này dẫn đến sự nhầm lẫn khi tỷ lệ phần trăm được dán nhãn, chẳng hạn như “75% trí tuệ nhân tạo / 25% con người”.
Nhiều người sẽ hiểu nhầm điều này có nghĩa là “văn bản được viết 75% bởi AI và 25% bởi con người”, khi nó có nghĩa là “Tôi chắc chắn 75% rằng AI đã viết 100% văn bản này”.
Sự hiểu lầm này đã khiến một số người đưa ra lời khuyên về cách điều chỉnh kiểu nhập văn bản để khiến nó “vượt qua” máy dò AI.
Ví dụ: sử dụng dấu chấm than kép (!!) là một đặc điểm rất con người, do đó, việc thêm dấu này vào một số văn bản do AI tạo sẽ dẫn đến một trình phát hiện AI cho điểm “99%+ con người”.
Điều này sau đó bị hiểu sai rằng bạn đã “đánh lừa” máy dò.
Nhưng đó là một ví dụ về việc máy dò hoạt động hoàn hảo vì đoạn văn được cung cấp không còn được tạo ra 100% bởi AI nữa.
Thật không may, kết luận sai lầm về khả năng “đánh lừa” các trình phát hiện AI này cũng thường bị nhầm lẫn với việc các công cụ tìm kiếm như Google không phát hiện nội dung AI mang lại cho chủ sở hữu trang web cảm giác an toàn sai lầm.
5. Chính sách và hành động của Google đối với nội dung AI
Các tuyên bố của Google về nội dung AI trong lịch sử đã đủ mơ hồ để khiến họ lúng túng trong việc thực thi.
Tuy nhiên, hướng dẫn cập nhật đã được xuất bản trong năm nay trên Trung tâm Google Tìm kiếm có nội dung rõ ràng:
“Trọng tâm của chúng tôi là chất lượng nội dung hơn là cách sản xuất nội dung.”
Ngay cả trước đó, Liên lạc viên Tìm kiếm của Google Danny Sullivan đã tham gia vào các cuộc trò chuyện trên Twitter để khẳng định rằng họ “không nói nội dung AI là xấu”.
Google liệt kê các ví dụ cụ thể về cách AI có thể tạo ra nội dung hữu ích, chẳng hạn như tỷ số thể thao, dự báo thời tiết và bảng điểm.
Rõ ràng là Google quan tâm nhiều đến kết quả đầu ra hơn là phương tiện để đạt được điều đó, việc tăng gấp đôi việc “tạo nội dung với mục đích chính là thao túng xếp hạng trong kết quả tìm kiếm là vi phạm chính sách spam của chúng tôi”.
Chống thao túng SERP là điều mà Google đã có nhiều năm kinh nghiệm, tuyên bố rằng những tiến bộ trong hệ thống của họ, chẳng hạn như SpamBrain đã giúp 99% tìm kiếm “không có thư rác”, bao gồm thư rác UGC, quét, che giấu và tất cả các dạng nội dung khác nhau thế hệ.
Nhiều người đã chạy thử nghiệm để xem cách Google phản ứng với nội dung AI và điểm mà họ vạch ra ranh giới về chất lượng.
Trước khi ra mắt ChatGPT, tôi đã tạo một trang web gồm 10.000 trang nội dung chủ yếu được tạo bởi mô hình GPT3 không giám sát, trả lời Mọi người cũng đặt câu hỏi về trò chơi điện tử.
Với các liên kết tối thiểu, trang web đã nhanh chóng được lập chỉ mục và phát triển đều đặn, mang lại hàng nghìn khách truy cập hàng tháng.
>> Tham khảo: Đã giải quyết gián đoạn lập chỉ mục Google Tin tức.
Trong hai lần cập nhật hệ thống của Google vào năm 2022, Bản cập nhật nội dung hữu ích và bản cập nhật Spam sau đó, Google đã bất ngờ và gần như chặn hoàn toàn trang web.
Sẽ là sai lầm khi kết luận rằng “nội dung AI không hoạt động” từ một thử nghiệm như vậy.
Tuy nhiên, điều này đã chứng minh cho tôi thấy rằng vào thời điểm cụ thể đó, Google:
- Không phân loại nội dung GPT-3 không được giám sát là “chất lượng”.
- Có thể phát hiện và loại bỏ các kết quả như vậy bằng một loạt các tín hiệu khác.
6. Để có câu trả lời cuối cùng, bạn cần một câu hỏi hay hơn
Dựa trên nguyên tắc của Google, những gì chúng tôi biết về hệ thống tìm kiếm, thử nghiệm SEO và lẽ thường, “Công cụ tìm kiếm có thể phát hiện nội dung AI không?” có thể là câu hỏi sai.
Tốt nhất, đó là một quan điểm rất ngắn hạn để thực hiện.
Trong hầu hết các chủ đề, LLM cố gắng tạo ra nội dung “chất lượng cao” một cách nhất quán về độ chính xác thực tế và đáp ứng tiêu chí E-E-A-T của Google, mặc dù có quyền truy cập web trực tiếp để biết thông tin ngoài dữ liệu đào tạo của họ.
AI đang có những bước tiến đáng kể trong việc tạo ra câu trả lời cho các truy vấn khan hiếm nội dung trước đây. Nhưng khi Google nhắm đến các mục tiêu dài hạn cao hơn với SGE, xu hướng này có thể phai nhạt.
>> Tham khảo: Bản cập nhật ứng dụng Threads bao gồm cho bạn và nguồn cấp dữ liệu sau.
Trọng tâm dự kiến sẽ quay trở lại nội dung chuyên gia dạng dài hơn, với hệ thống Kiến thức của Google cung cấp câu trả lời để phục vụ cho nhiều truy vấn đuôi dài thay vì hướng người dùng đến nhiều trang web nhỏ.