Dưới đây là sáu điều cần biết về ChatGPT trước khi sử dụng nó cho SEO và nội dung.
ChatGPT là một chatbot trí tuệ nhân tạo có thể chỉ đường và hoàn thành các nhiệm vụ như viết luận. Có rất nhiều vấn đề cần hiểu trước khi đưa ra quyết định về cách sử dụng nó cho nội dung và SEO.
Chất lượng của nội dung ChatGPT thật đáng kinh ngạc, vì vậy ý tưởng sử dụng nó cho mục đích SEO nên được giải quyết.
Hãy cùng khám phá.
1. Tại sao ChatGPT có thể làm những gì nó làm
Tóm lại, ChatGPT là một loại máy học được gọi là Mô hình học tập lớn.
Mô hình học tập lớn là trí tuệ nhân tạo được đào tạo trên lượng dữ liệu khổng lồ có thể dự đoán từ tiếp theo trong câu là gì.
Càng nhiều dữ liệu được đào tạo về nhiều loại nhiệm vụ hơn thì nó có thể hoàn thành (như viết bài).
Đôi khi các mô hình ngôn ngữ lớn phát triển khả năng bất ngờ.
Đại học Stanford viết về cách tăng dữ liệu đào tạo đã cho phép GPT-3 dịch văn bản từ tiếng Anh sang tiếng Pháp, mặc dù nó không được đào tạo cụ thể để thực hiện nhiệm vụ đó.
Các mô hình ngôn ngữ lớn như GPT-3 (và GPT-3.5 làm nền tảng cho ChatGPT) không được đào tạo để thực hiện các tác vụ cụ thể.
Họ được đào tạo với nhiều kiến thức mà sau đó họ có thể áp dụng cho các lĩnh vực khác.
Điều này tương tự như cách một con người học hỏi. Ví dụ: nếu một người học các nguyên tắc cơ bản về nghề mộc, họ có thể áp dụng kiến thức đó để đóng một cái bàn mặc dù người đó chưa bao giờ được dạy cụ thể cách làm việc đó.
>> Tham khảo: Hướng dẫn toàn diện về các mô hình phân bổ tiếp thị.
GPT-3 hoạt động tương tự như bộ não con người ở chỗ nó chứa kiến thức chung có thể áp dụng cho nhiều tác vụ.
Bài báo của Đại học Stanford về GPT-3 giải thích:
“Không giống như các động cơ chơi cờ vua giải quyết một vấn đề cụ thể, con người “nói chung” thông minh và có thể học cách làm bất cứ điều gì, từ viết thơ đến chơi bóng đá đến nộp tờ khai thuế.
Trái ngược với hầu hết các hệ thống AI hiện tại, GPT-3 đang tiến gần hơn đến trí thông minh chung như vậy…”
ChatGPT kết hợp một mô hình ngôn ngữ lớn khác có tên là InstructGPT, được đào tạo để nhận chỉ dẫn từ con người và câu trả lời dạng dài cho các câu hỏi phức tạp.
Khả năng làm theo hướng dẫn này giúp ChatGPT có thể nhận hướng dẫn để tạo một bài luận về hầu hết mọi chủ đề và thực hiện nó theo bất kỳ cách nào được chỉ định.
Nó có thể viết một bài luận trong các ràng buộc như đếm từ và bao gồm các điểm chủ đề cụ thể.
2. Sáu điều cần biết về ChatGPT
ChatGPT có thể viết các bài luận về hầu hết mọi chủ đề vì nó được đào tạo trên nhiều loại văn bản dành cho công chúng.
Tuy nhiên, có những hạn chế đối với ChatGPT mà bạn cần biết trước khi quyết định sử dụng nó trong một dự án SEO.
Hạn chế lớn nhất là ChatGPT không đáng tin cậy để tạo thông tin chính xác. Lý do nó không chính xác là vì mô hình chỉ dự đoán những từ nào sẽ xuất hiện sau từ trước đó trong một câu trong một đoạn văn về một chủ đề nhất định. Nó không liên quan đến độ chính xác.
Đó phải là mối quan tâm hàng đầu đối với bất kỳ ai quan tâm đến việc tạo nội dung chất lượng.
2.1. Được lập trình để tránh một số loại nội dung
Ví dụ: ChatGPT được lập trình cụ thể để không tạo văn bản về chủ đề bạo lực, tình dục khiêu dâm và nội dung có hại, chẳng hạn như hướng dẫn cách chế tạo thiết bị nổ.
>> Tham khảo: Các loại tiếp thị nội dung bạn có thể sử dụng.
2.2. Không Biết Các Sự Kiện Hiện Tại
Một hạn chế khác là nó không biết về bất kỳ nội dung nào được tạo sau năm 2021.
Vì vậy, nếu nội dung của bạn cần được cập nhật và mới thì ChatGPT ở dạng hiện tại có thể không hữu ích.
2.3. Có thành kiến tích hợp
Một hạn chế quan trọng cần lưu ý là được đào tạo để trở nên hữu ích, trung thực và vô hại.
Đó không chỉ là lý tưởng, chúng là những thành kiến có chủ ý được tích hợp sẵn trong máy.
Có vẻ như lập trình để trở nên vô hại làm cho đầu ra tránh tiêu cực.
Đó là một điều tốt nhưng nó cũng thay đổi một cách tinh tế bài báo từ một bài báo lý tưởng có thể là trung lập.
Nói một cách dễ hiểu, người ta phải cầm lái và yêu cầu ChatGPT lái xe theo hướng mong muốn một cách rõ ràng.
Đây là một ví dụ về cách độ lệch thay đổi đầu ra.
Tôi đã yêu cầu ChatGPT viết một câu chuyện theo phong cách của Raymond Carver và một câu chuyện khác theo phong cách của nhà văn trinh thám Raymond Chandler.
Cả hai câu chuyện đều có những kết thúc lạc quan không giống với đặc điểm của cả hai nhà văn.
Để có được đầu ra phù hợp với mong đợi của mình, tôi đã phải hướng dẫn ChatGPT với các hướng dẫn chi tiết để tránh kết thúc lạc quan và để kết thúc kiểu Carver tránh giải quyết câu chuyện vì đó là cách mà các câu chuyện của Raymond Carver thường diễn ra.
Vấn đề là ChatGPT có những thành kiến và người ta cần biết chúng có thể ảnh hưởng đến đầu ra như thế nào.
2.4. ChatGPT yêu cầu hướng dẫn rất chi tiết
ChatGPT yêu cầu hướng dẫn chi tiết để tạo ra nội dung có chất lượng cao hơn, có nhiều khả năng mang tính nguyên bản cao hoặc có quan điểm cụ thể.
Càng nhiều hướng dẫn được đưa ra thì đầu ra sẽ càng tinh vi.
Đây vừa là điểm mạnh vừa là hạn chế cần lưu ý.
Càng ít hướng dẫn trong yêu cầu nội dung thì càng có nhiều khả năng đầu ra sẽ chia sẻ một đầu ra tương tự với yêu cầu khác.
Để thử nghiệm, tôi đã sao chép truy vấn và kết quả mà nhiều người đã đăng trên Facebook.
Khi tôi hỏi ChatGPT chính xác cùng một truy vấn, máy đã tạo ra một bài luận hoàn toàn nguyên bản theo cấu trúc tương tự.
Các bài báo khác nhau nhưng chúng có chung cấu trúc và chạm vào các chủ đề phụ tương tự nhưng với các từ khác nhau 100%.
ChatGPT được thiết kế để chọn các từ hoàn toàn ngẫu nhiên khi dự đoán từ tiếp theo trong một bài viết, vì vậy có nghĩa là bản thân nó không đạo văn.
Nhưng thực tế là các yêu cầu tương tự tạo ra các bài báo tương tự làm nổi bật những hạn chế của việc chỉ yêu cầu “hãy đưa cho tôi cái này. ”
2.5. Nội dung ChatGPT có thể được xác định không?
Các nhà nghiên cứu tại Google và các tổ chức khác đã nghiên cứu các thuật toán trong nhiều năm để phát hiện thành công nội dung do AI tạo ra.
Có nhiều tài liệu nghiên cứu về chủ đề này và tôi sẽ đề cập đến một tài liệu từ tháng 3 năm 2022 sử dụng đầu ra từ GPT-2 và GPT-3.
Bài báo nghiên cứu có tiêu đề, Adversarial Robustness of Neural-Statistical Features in Detection of Generative Transformers (PDF).
Các nhà nghiên cứu đang thử nghiệm để xem loại phân tích nào có thể phát hiện nội dung do AI tạo ra sử dụng các thuật toán được thiết kế để tránh bị phát hiện.
Họ đã thử nghiệm các chiến lược như sử dụng thuật toán BERT để thay thế các từ bằng từ đồng nghĩa, một chiến lược khác bổ sung lỗi chính tả, cùng các chiến lược khác.
Những gì họ phát hiện ra là một số tính năng thống kê của văn bản do AI tạo ra, chẳng hạn như chỉ số Gunning-Fog Index và Flesch Index, rất hữu ích để dự đoán liệu một văn bản có phải do máy tính tạo ra hay không, ngay cả khi văn bản đó đã sử dụng một thuật toán được thiết kế để tránh bị phát hiện.
>> Tham khảo: Mẹo tiếp thị trên Facebook để hồi sinh một trang nhàm chán.
2.6. Hình mờ vô hình
Điều đáng quan tâm hơn là các nhà nghiên cứu OpenAI đã phát triển hình mờ mật mã sẽ hỗ trợ phát hiện nội dung được tạo thông qua một sản phẩm OpenAI như ChatGPT.
Một bài báo gần đây đã kêu gọi sự chú ý đến một cuộc thảo luận của một nhà nghiên cứu OpenAI có sẵn trên một video có tiêu đề, Scott Aaronson nói về An toàn AI.
Nhà nghiên cứu tuyên bố rằng các hoạt động AI có đạo đức như tạo hình mờ có thể phát triển thành tiêu chuẩn ngành theo cách mà Robots.txt trở thành tiêu chuẩn cho hoạt động thu thập thông tin có đạo đức.
Ông tuyên bố:
“…Chúng ta đã thấy trong 30 năm qua rằng các công ty Internet lớn có thể đồng ý về một số tiêu chuẩn tối thiểu, cho dù vì sợ bị kiện, mong muốn được coi là người chơi có trách nhiệm hay bất cứ điều gì khác.
Một ví dụ đơn giản là robots.txt: nếu bạn muốn trang web của mình không bị các công cụ tìm kiếm lập chỉ mục, bạn có thể chỉ định điều đó và các công cụ tìm kiếm chính sẽ tôn trọng điều đó.
Theo cách tương tự, bạn có thể tưởng tượng một thứ gì đó giống như hình mờ—nếu chúng tôi có thể chứng minh và cho thấy rằng nó hoạt động, rẻ và không ảnh hưởng đến chất lượng của đầu ra và không cần tính toán nhiều, v.v.—điều đó nó sẽ chỉ trở thành một tiêu chuẩn của ngành và bất kỳ ai muốn được coi là người chơi có trách nhiệm sẽ đưa nó vào.
Hình mờ mà nhà nghiên cứu đã phát triển dựa trên mật mã. Bất kỳ ai có khóa đều có thể kiểm tra tài liệu để xem tài liệu đó có hình mờ kỹ thuật số cho thấy nó được tạo bởi AI hay không.
Ví dụ, mã có thể ở dạng cách sử dụng dấu chấm câu hoặc trong lựa chọn từ.
Anh ấy giải thích cách hoạt động của watermarking và tại sao nó lại quan trọng:
“Dự án chính của tôi cho đến nay là một công cụ để đánh dấu bằng thống kê các đầu ra của một mô hình văn bản như GPT.
Về cơ bản, bất cứ khi nào GPT tạo ra một số văn bản dài, chúng tôi muốn có một tín hiệu bí mật không đáng chú ý trong các lựa chọn từ ngữ mà bạn có thể sử dụng để sau này chứng minh rằng, vâng, điều này đến từ GPT.
Chúng tôi muốn việc lấy đầu ra GPT và chuyển nó đi như thể nó đến từ con người sẽ khó hơn nhiều.
Rõ ràng, điều này có thể hữu ích trong việc ngăn chặn đạo văn học thuật, nhưng cũng có thể giúp tạo ra tuyên truyền hàng loạt—bạn biết đấy, spam mọi blog với các nhận xét có vẻ đúng chủ đề ủng hộ cuộc xâm lược Ukraine của Nga, thậm chí không cần đến một tòa nhà đầy những kẻ phá bĩnh ở Moscow.
Hoặc giả mạo lối viết của ai đó để buộc tội họ.
Đây là tất cả những thứ mà người ta có thể muốn làm khó hơn, phải không?
Nhà nghiên cứu chia sẻ rằng đánh dấu thủy ấn đánh bại các nỗ lực thuật toán để tránh bị phát hiện.
Nhưng ông cũng tuyên bố rằng có thể đánh bại hình mờ:
“Bây giờ, tất cả điều này có thể bị đánh bại với đủ nỗ lực.
Ví dụ: nếu bạn sử dụng một AI khác để diễn giải đầu ra của GPT—được thôi, chúng tôi sẽ không thể phát hiện ra điều đó.”
Nhà nghiên cứu đã thông báo rằng mục tiêu là triển khai hình mờ trong bản phát hành GPT trong tương lai.
3. Bạn có nên sử dụng AI cho mục đích SEO?
3.1. Nội dung AI có thể phát hiện được
Nhiều người nói rằng không có cách nào để Google biết liệu nội dung có được tạo bằng AI hay không.
Tôi không thể hiểu tại sao mọi người lại giữ quan điểm đó vì phát hiện AI là một vấn đề ít nhiều đã được giải quyết.
Ngay cả nội dung triển khai các thuật toán chống phát hiện cũng có thể bị phát hiện (như đã lưu ý trong tài liệu nghiên cứu mà tôi đã liên kết ở trên).
Phát hiện nội dung do máy tạo ra đã là một chủ đề nghiên cứu từ nhiều năm trước, bao gồm cả nghiên cứu về cách phát hiện nội dung được dịch từ ngôn ngữ khác.
>> Tham khảo: SEO trong thời kỳ suy thoái.
3.2. Nội dung được tạo tự động vi phạm Nguyên tắc của Google?
John Mueller của Google vào tháng 4 năm 2022 cho biết nội dung do AI tạo ra vi phạm nguyên tắc của Google.
“Đối với chúng tôi, về cơ bản, những thứ này vẫn thuộc danh mục nội dung được tạo tự động, đây là thứ chúng tôi đã có trong Nguyên tắc quản trị trang web gần như ngay từ đầu.
Và mọi người đã tự động tạo nội dung theo nhiều cách khác nhau. Và đối với chúng tôi, nếu bạn đang sử dụng các công cụ máy học để tạo nội dung của mình, thì về cơ bản nó cũng giống như việc bạn chỉ xáo trộn các từ xung quanh hoặc tra cứu các từ đồng nghĩa hoặc thực hiện các thủ thuật dịch thuật mà mọi người thường làm. Những thứ đó.
Nghi ngờ của tôi là có thể chất lượng nội dung tốt hơn một chút so với các công cụ trường học thực sự cũ, nhưng đối với chúng tôi, đó vẫn là nội dung được tạo tự động và điều đó có nghĩa là đối với chúng tôi, nội dung đó vẫn vi phạm Nguyên tắc quản trị trang web. Vì vậy, chúng tôi sẽ coi đó là thư rác.”
Google gần đây đã cập nhật phần nội dung “được tạo tự động” trên trang dành cho nhà phát triển của họ về spam.
Được tạo vào tháng 10 năm 2022, nó được cập nhật vào gần cuối tháng 11 năm 2022.
Những thay đổi này phản ánh sự làm rõ về nguyên nhân khiến nội dung được tạo tự động trở thành spam.
Ban đầu nó nói thế này:
“Nội dung được tạo tự động (hoặc “được tạo tự động”) là nội dung được tạo theo chương trình mà không tạo ra bất kỳ thứ gì gốc hoặc bổ sung đủ giá trị;”
Google đã cập nhật câu đó để bao gồm từ “spam”:
“Nội dung spam được tạo tự động (hoặc “được tạo tự động”) là nội dung được tạo theo chương trình mà không tạo ra bất kỳ thứ gì nguyên bản hoặc bổ sung đủ giá trị;”
Thay đổi đó dường như để làm rõ rằng nội dung được tạo tự động không khiến nội dung trở thành spam. Việc thiếu tất cả các giá trị gia tăng và phẩm chất chung chung là “spam” khiến nội dung đó trở nên có vấn đề.
3.3. ChatGPT có thể tại một số điểm chứa hình mờ
Cuối cùng, nhà nghiên cứu OpenAI cho biết (một vài tuần trước khi phát hành ChatGPT) rằng hình mờ “hy vọng” sẽ xuất hiện trong phiên bản GPT tiếp theo.
Vì vậy, ChatGPT đôi khi có thể được nâng cấp với hình mờ, nếu nó chưa được đóng dấu chìm.
Cách sử dụng AI tốt nhất cho SEO
Việc sử dụng tốt nhất các công cụ AI là để mở rộng quy mô SEO theo cách giúp nhân viên làm việc hiệu quả hơn. Điều đó thường bao gồm việc để AI thực hiện công việc nghiên cứu và phân tích tẻ nhạt.
Việc tóm tắt các trang web để tạo mô tả meta có thể là một cách sử dụng được chấp nhận, vì Google đặc biệt nói rằng điều đó không trái với nguyên tắc của nó.
Sử dụng ChatGPT để tạo dàn bài hoặc tóm tắt nội dung có thể là một cách sử dụng thú vị.
Giao việc tạo nội dung cho AI và xuất bản nguyên trạng nội dung đó có thể không phải là cách sử dụng AI hiệu quả nhất nếu nó không được đánh giá lần đầu về chất lượng, độ chính xác và tính hữu ích.