Từ khóa tìm kiếm cho: File Robots.txt là gì? Các sử dụng và tối ưu Robots.txt hiệu quả : Robots.txt, File robots.txt, Tại sao cần dùng Robots.txt,

Vào 25/10/2022 || Cập nhật: 03/07/2026

Lượt vote bài viết:

5/5 (4 votes)

Viết bởi TrungNgoc || Có 1038 từ và 4 phút để nắm hết nội dung!

File Robots.txt là gì? Các sử dụng và tối ưu Robots.txt hiệu quả

Robots.txt là nơi để người quản trị website hướng dẫn các bot công cụ tìm kiếm cách thu thập trang web của bạn. Thực tế thì nó được thực hiện như thế nào? Cấu hình ra sao, các thành phần trong đó có ý nghĩa gì cùng TNDigi tìm hiểu nhé.

File robots.txt là gì?

Robots.txt là một file cho phép các user-agent của BOT thu thập các tài nguyên của website. Tệp này có thể dùng để ngăn chặn các request đến trang quá nhiều. Trên thực tế thì nó dùng để nhà quản trị web chủ động hơn trong việc cho phép các bot crawl hay không crawl thành phần nào đó trong trang.

Cú pháp có trong một file Robots.txt:

User-agent: tên trình thu phập, ví dụ như Googlebot, Bingbot,…
Disallow: Thông báo không được thu thập dữ liệu
Allow: Thông báo cho phép thu thập dữ liệu
Crawl-delay: Thông báo cho các bot phải đợi bao lâu trước khi thu thập thông tin
Sitemap: Dùng để cung cấp các vị trí bất kì của sitemap liên kết với URL này.

Các thành phần matching:

*: là ký tự đại diện cho bất kì chuỗi nào, nghĩa là cho phép tất cả
$: có nghĩa là khớp với phần cuối của URL

File robot.txt - TNDigi Việt Nam — File robot.txt – TNDigi Việt Nam

Tại sao cần dùng Robots.txt

File này được tạo ra nhằm kiểm soát việc truy cập đến các thành phần của các Bots. Nó sẽ thật sự hữu ích bởi một vài lợi ích như bên dưới, nhưng sẽ thật tai hại nếu như bạn làm sai hoặc chặn nhầm bất kì điều gì mà bạn không muốn.

Chặn nội dung trùng lặp
Giữ một số thành phần ở chế độ riêng tư
Giữ các trang nội bộ không xuất hiện trên kết quả tìm kiếm
Chỉ định vị trí của sitemap
Ngăn không cho index một số tệp nhất định
Giảm thiểu máy chủ bị quá tải nếu như phải thu thập quá nhiều thông tin cùng lúc.

Những hạn chế của Robots.txt

Một số trình duyệt không hỗ trợ
Mỗi trình dữ liệu có cú pháp phân tích riêng
Chặn ở tệp robots.txt nhưng vẫn có thể được index

Một số lưu ý khi sử dụng robots.txt:

Chỉ định User-agent là không cần thiết vì các công cụ tìm kiếm đều tuân thủ theo quy tắc chung
Không nên dùng tệp này để chặn các dữ liệu riêng tư vì google bot vẫn có thể index được
Bạn nên dùng mật khẩu riêng để truy cập các URL trên trang.

Robots.txt nằm ở đâu trên trang web?

Kiểm tra file robot.txt - TNDigi Việt Nam — Kiểm tra file robot.txt – TNDigi Việt Nam

File này nằm ở thư mục gốc ở trên trang, tương tự như trang có cài google ads thì nó nằm cùng cấp, bạn có thể truy cập file này thông qua domain/robots.txt.

Nếu như bạn chưa có file này thì hãy tạo thông qua FPT nhé, điều này sẽ giảm thiểu việc cài plugin gây nặng site. Nhưng nếu như bạn có dùng plugin cho tối ưu SEO thì nó sẽ tự tạo và đây là một số cách để bạn chủ động hơn trong file này. Tham khảo file robots.txt của TNDiGi tại đây nhé.

Nếu bạn dùng Yoast SEO

Bạn vào SEO -> Công cụ -> Trình chỉnh sửa tập tin

File robot.txt trong plugin Yoast SEO - TNDigi Việt Nam — File robot.txt trong plugin Yoast SEO

Chỉnh sửa file robot.txt trong plugin Yoast SEO - TNDigi Việt Nam — Chỉnh sửa file robot.txt trong plugin Yoast SEO

Nếu bạn dùng Rank math

Chỉnh sửa file robot.txt trong plugin Rank math - TNDigi Việt Nam — Chỉnh sửa file robot.txt trong plugin RankMath

Nếu bạn tạo trực tiếp trên cPanel

Nếu bạn tạo trực tiếp trên cPanel thì nó sẽ ở thư mục gốc

File robot.txt trong cPanel - TNDigi Việt Nam — File robot.txt trong cPanel sẽ cùng cấp với thư mục gốc của mã nguồn

Bạn đã hiểu Robots.txt dùng để làm gì rồi phải không? Ở lần cập nhật bài viết tới mình sẽ hướng dẫn chi tiết cách cấu hình cho từng nhu cầu nhé. Nếu như bạn cần trao đổi thông tin gì đừng ngại để lại bình luận ở phía bên dưới nhé.

Bạn đang xem bài viết: File Robots.txt là gì? Vì sao phải sử dụng Robots.txt khi SEO trang web

Kết luận - đúc kết nội dung

Robots. txt là một tệp văn bản có dạng . txt, được sử dụng để hướng dẫn các công cụ tìm kiếm về cách thu thập dữ liệu trên website. Tệp này quy định những phần nào của trang web nên hoặc không nên được thu thập và lập chỉ mục.

Hi vọng nội dung bài viết File Robots.txt là gì? Các sử dụng và tối ưu Robots.txt hiệu quả đã giúp bạn hiểu hơn về nội dung bạn đang tìm kiếm. Nếu bạn thấy nội dung nào chưa hợp ý, bị nông hay còn lang mang vui lòng để lại ý kiến thảo luận để hiểu sâu hơn về bài viết hơn nhé!

Tóm tắt

Robots.txt là file quan trọng giúp người quản trị website hướng dẫn bot tìm kiếm thu thập nội dung. Cấu trúc file bao gồm User-agent, Disallow, Allow, Crawl-delay, Sitemap, và các thành phần matching. Việc sử dụng Robots.txt mang lại nhiều lợi ích như chặn nội dung trùng lặp, bảo vệ dữ liệu riêng tư, và giảm tải cho máy chủ. Tuy nhiên, cũng cần lưu ý những hạn chế như không phải trình duyệt nào cũng hỗ trợ. File này cần được đặt ở thư mục gốc của trang web và có thể tạo thông qua FPT hoặc các plugin SEO phổ biến. Hãy hiểu rõ về Robots.txt để tối ưu hóa trang web của bạn!

* Tóm tắt được tạo bởi AI

Nếu bạn thấy Video không hiển thị, hình ảnh hiển thị lỗi hoặc không đúng vui lòng nhấn vào nút bên dưới để Admin sửa lỗi nhé!

Theo dõi chi tiết các thuật ngữ có trong bài: thuật ngữ Rank, thuật ngữ AI, thuật ngữ Crawl, thuật ngữ Index, thuật ngữ Sitemap, thuật ngữ Robots.txt, thuật ngữ Domain, thuật ngữ SEO.

TNDigi Digital Marketing Team

TNDigi cung cấp các giải pháp SEO, Marketing, Website giúp bạn nâng cao thương hiệu bền vững

Địa chỉ: 101 Bình Kỳ (vào 100m - Đối diện công viên), P.Hoà Quý, Q.Ngũ Hành Sơn, TP. Đà Nẵng

VPĐD-ĐN: Lầu 4, Tòa nhà Tuấn Toàn, 35 Cao Thắng, P.Thanh Bình, Q.Hải Châu, TP. Đà Nẵng

VPĐD-HCM: 37 Tân Lập, P.Đông Hòa, TX.Dĩ An, T.Bình Dương

Hotline, zalo: 0915 666 571

Email: [email protected]

Vote bài viết: