Home » Google hiện đang lập chỉ mục các tệp CSV
Google lập chỉ mục tệp CSV

Google hiện đang lập chỉ mục các tệp CSV

by Meta

Google hiện đang lập chỉ mục các tệp CSV, mặc dù trước đây họ đã sử dụng dữ liệu CSV thông qua dữ liệu có cấu trúc để nâng cao giao diện tìm kiếm.

Google lặng lẽ cập nhật tài liệu của Trung tâm Google Tìm kiếm để lưu ý rằng họ hiện đang lập chỉ mục các tệp .csv.

>> Tham khảo: Tối đa hóa tác động thương hiệu với quảng cáo video của Amazon.

Điều này mở ra một cách mới để thu thập thông tin hoặc nếu nhà xuất bản không muốn các tệp .csv của họ được thu thập thông tin thì điều đó có thể có nghĩa là cập nhật robots.txt để loại trừ các tệp đó.

1. Giá trị được phân tách bằng dấu phẩy (CSV)

Tệp giá trị được phân tách bằng dấu phẩy (CSV) là tệp văn bản lưu dữ liệu ở định dạng bảng có thể được hiển thị dưới dạng bảng tính.

Tệp CSV chứa dữ liệu ở dạng văn bản thuần túy, có nghĩa là tệp CSV không chứa các thành phần kiểu như phông chữ cũng như không chứa hình ảnh hoặc liên kết hoạt động.

Chúng rất hữu ích khi thực hiện những việc như tải lên danh sách URL để thu thập thông tin lên phần mềm như Screaming Frog.

Nhưng chúng cũng hữu ích cho việc tổ chức dữ liệu trong bảng tính.

>> Tham khảo: Công cụ tìm kiếm có thể phát hiện nội dung AI không?

2. Lập chỉ mục tệp CSV là mới

Khả năng lập chỉ mục tệp CSV của Google là một chức năng mới vì tìm kiếm “loại tệp” trên Google cho tệp CSV hiện không trả về tệp CSV.

Các tìm kiếm như sau hiện không trả về tệp CSV:

  • filetype:csv trang web:.gov
  • filetype:trang web csv:.edu
  • filetype:csv trang web:.com

3. Google đã sử dụng gián tiếp các tệp CSV

Điều gây tò mò về việc Google lập chỉ mục các tệp CSV là giao diện tìm kiếm Tập dữ liệu của Google đã sử dụng các tệp CSV nhưng dường như chỉ khi được mô tả bằng dữ liệu có cấu trúc.

Tài liệu về dữ liệu có cấu trúc tập dữ liệu trên tài liệu cũ dành cho Nhà phát triển của Google (có thể xem trên Archive.org) nêu rõ rằng tệp CSV là tiêu chuẩn được chấp nhận để xuất hiện trong các tính năng tìm kiếm tập dữ liệu.

Việc sử dụng dữ liệu dạng bảng làm giao diện tìm kiếm đã có từ năm 2018, khi Google thông báo rằng họ sẽ hiển thị loại dữ liệu đó trong tìm kiếm khi dữ liệu đi kèm với dữ liệu có cấu trúc.

>> Tham khảo: LinkedIn tung ra các tính năng mới để nâng cao bản tin.

Theo tài liệu gốc:

“Các tập dữ liệu sẽ dễ tìm thấy hơn khi bạn cung cấp thông tin hỗ trợ như tên, mô tả, người tạo và định dạng phân phối được cung cấp dưới dạng dữ liệu có cấu trúc…

Dưới đây là một số ví dụ về những gì có thể đủ điều kiện làm tập dữ liệu:

  • Một bảng hoặc tệp CSV có một số dữ liệu
  • Một tập hợp các bảng có tổ chức
  • Một tệp ở định dạng độc quyền có chứa dữ liệu
  • Một tập hợp các tệp cùng nhau tạo thành một số tập dữ liệu có ý nghĩa
  • Một đối tượng có cấu trúc với dữ liệu ở một số định dạng khác mà bạn có thể muốn tải vào một công cụ đặc biệt để xử lý
  • Hình ảnh thu thập dữ liệu
  • Các tệp liên quan đến học máy, chẳng hạn như các tham số được đào tạo hoặc định nghĩa cấu trúc mạng thần kinh
  • Bất cứ thứ gì trông giống như một tập dữ liệu đối với bạn”

Google đã cập nhật tài liệu trên vào năm 2022 và chuyển hướng tài liệu đó sang Tài liệu mới của Trung tâm Tìm kiếm.

Tài liệu cập nhật làm rõ hơn rằng Google dựa vào dữ liệu có cấu trúc để sử dụng tệp CSV trong giao diện tìm kiếm tập dữ liệu của họ.

Nhưng liệu sự thay đổi này có nghĩa là cuối cùng Google sẽ thu thập dữ liệu các tệp CSV và sử dụng chúng để xuất hiện trong tìm kiếm (ngoài dữ liệu dạng bảng được ghi chú trong dữ liệu có cấu trúc) không?

Đây là những gì tài liệu hiện tại giải thích ngày hôm nay:

“Các tập dữ liệu sẽ dễ tìm thấy hơn khi bạn cung cấp thông tin hỗ trợ như tên, mô tả, người tạo và định dạng phân phối dưới dạng dữ liệu có cấu trúc.

Phương pháp khám phá tập dữ liệu của Google sử dụng lược đồ.org và các tiêu chuẩn siêu dữ liệu khác có thể được thêm vào các trang mô tả tập dữ liệu…

Dưới đây là một số ví dụ về những gì có thể đủ điều kiện làm tập dữ liệu:

Một bảng hoặc một tệp CSV có một số dữ liệu…”

>> Tham khảo: Sức mạnh của đánh giá từ khách hàng: hướng dẫn toàn diện cho các đại lý.

4. CSV lập chỉ mục của Google có liên quan đến cập nhật gần đây?

Định nghĩa của bản cập nhật thuật toán cốt lõi là khi Google thực hiện “những thay đổi đáng kể” và “những thay đổi lớn” đối với thuật toán cốt lõi của họ.

Có thể là một sự trùng hợp ngẫu nhiên khi việc lập chỉ mục các tệp CSV và cập nhật thuật toán cốt lõi hầu như diễn ra cùng một lúc.

Nhưng có thể cân nhắc xem liệu Google có cải thiện công cụ thu thập dữ liệu của họ để có thể lập chỉ mục CSV hay không hay khả năng đó đã có sẵn hay chưa.

Related Posts

Leave a Comment

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00