Robots.txt? Công dụng file là gì? Viết chúng thế nào?

Robots.txt là gì? Chúng có công dụng file là gì? Viết chúng như thế nào?

Bạn không phải là một người chuyên thiết kế website, là một tập sự về website thì đây cũng có thể là một nội dung giới thiệu về file robots.txt giúp ít cho bạn trong việc quản bá website. Vậy File robots.txt này là gì? Nó có quan trọng cho website của bạn? Cùng Ez Lasso tìm hiểu về File này nhé.

Robots.txt là gì? Có quan trọng không?

Robots.txt ?

Đầu tiên đây là một file như một con robots của trang website của bạn. Với nhiêm vụ chính là cho phép hay ngăn chặn các con robot của các nhà tìm kiếm, đo lường: google, bing, MOZ,… vào đọc nội dung website của bạn. Nói cách khác robots là người bảo vệ web tránh những con bot khác đọc mặc dù người dùng vẫn vào website của bạn đọc nội dung nhưng những con robots thu thâp thông tin khác không thể vào đươc.

Robots.txt là gì? Chúng có công dụng file là gì? Viết chúng như thế nào?
Robots bảo vệ website bạn

Không những thế con robots này còn hỗ trợ những con robots của website khác đọc nội dung website của bạn. Nó gần như người dẫn đường cho con robots website khác. Đọc tới đây bạn hơi thắc mắc 1 xí về việc tại sao phải tạo file robots này? Robots của website khác có được bảo vệ không? Tại sao lại cho phép robots khác đọc website của mình? Những thắc mắc này mình sẽ giải đáp tại phần tầm quan trọng sau đây.

Tầm quan trọng của robots.txt

Như đã nói trên thì robots.txt là người bảo vệ website với khả năng này chúng sẽ quản lý việc robots khác ra vào website. Với công dụng chủ yếu đó robots sẽ cho phép website của bạn được xuất hiện tại google, bing ,… những mạng tìm kiếm, hoặc có những chỉ số đo lường website như moz, ahrefs,… Nếu như bạn cho phép những con robots khác vào.

Hiên nay, các trang website tìm kiếm, cung cấp giá trị website dùng những con robots khác nhau. Nên việc vào được website của bạn thì chúng mới được xuất hiện trên những website tìm kiếm, website đánh giá.  Nói theo một cách khác nếu có file robots.txt nó sẽ thông báo cho các con robots khác: “Hey, tôi ở đây nek bạn nên vào đọc những nội dung của website tôi nó thật sự tốt cho người dùng”.

Có một số con robot được sử dụng với mục tiêu phá hoại hay hack website của bạn. Thì đây cũng chính là cách giúp bạn bảo về website của mình. Dù bạn cho phép những con robots vào nhưng bạn sẽ cấm một số URL quan trọng như wp-admin (cho các bạn dùng wordpress). Việc này cũng gần như không cho các con robots khác đi vào và đọc website của bạn.

Robots.txt là gì? Chúng có công dụng file là gì? Viết chúng như thế nào?
Điểm lưu trữ file robots.txt trong thư mục publict.html (demo qua File zilla)

Nếu bạn là một người làm SEO hay quản bá website, thì file robots.txt là một trợ thủ đặt lực trong việc giới thiệu website lên nhiều thể loại mạng. Bạn hãy chú ý để đặt đúng những chỉ dẫn cho robots của bạn để khai thác triệt để nhé.

Viết Robots.txt?

Viết file này khá đơn giản chỉ vài dòng lên và lưu lại với đuôi txt. Bạn có thể dùng notepad hay notepad++ nhé.

Robots.txt là gì? Chúng có công dụng file là gì? Viết chúng như thế nào?
Lưu file robot.txt qua notepad++

Địa điểm lưu lưu trên dịch vụ lưu trữ dữ liệu website. Và kiểm tra website đã có file robots.txt

Bạn lưu vào ngay thư mục public_html của dịch vụ lưu trữ.

Bạn có thể kiểm tra file robots.txt đã có chưa bằng cách bằng cách vào trình duyệt website: gõ domain/sitemap.txt. Nếu website bạn bị 404 thì không có file, nếu load ra đoạn code bất kỳ thì đã có nhé. Bạn hãy vào dịch vụ lưu trữ website và sửa nó nhé. Bạn có thể tham khảo cách viết dưới phần sau này.

Robots.txt đơn giản

Đây là một file robots.txt  được mình viết đơn giản nhất:

User-Agent: *
Allow: /
Disallow: /admin
Sitemap: tên_website/sitemap.xml

Trong đó:

  • User-Agent:* là cho phép tất cả các rotbots vào website của bạn
  • Allow: / cho phép các con robot đọc các url trên trang website của bạn
  • Disallow: /admin đây là chặn các robot đọc url (domain/admin) của website bạn. (domain/admin: là phần admin quản trị website của mình
  • Sitemap: tên_website/sitemap.xml  đây là phần bản đồ tại website của bạn

Xem thêm: sitemap.xml là gì? Làm sao tạo được sitemaps cho website? Những website hỗ trợ tạo sitemaps

Bạn có thể biến tấu với 2 lệnh allow:url (cho phép)disallow:url (không cho phép): để đặt robots khác vào website bạn hợp lý. Đối với các url bạn điền vào thì bỏ phần phần domain (tên miền) phía trước.

Robots.txt cho wordpress

Đây là một file robots.txt chuẩn theo wp được website mình làm lúc bắt đầu nhé

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Allow: /wp-admin/images/*
Sitemap: tên_website/sitemap.xml

Bạn có thể coppy và điền lại. Hoặc bạn có thể tải về và sửa lại.

Dùng plugin yoastseo cho wordpress

Nếu bạn dùng wordpress bạn có thể dùng plugin yoastseo để tạo được file robots.txt và quản lý các file robots hay sitemaps không cần phải vào dịch vụ lưu trữ website.

Đầu tiên bạn đăng nhập quản trị wordpress => chọn biểu tượng yoast seo => Tool => File editor

Robots.txt là gì? Chúng có công dụng file là gì? Viết chúng như thế nào?
Công cụ hỗ trợ của Yoast SEO
Robots.txt là gì? Chúng có công dụng file là gì? Viết chúng như thế nào?
Chỉnh sửa file Robots.txt và lưu chúng lại

Tại đây bạn sẽ tạo và quản lý 2 file robots.txt hoặc .htccass. Nếu chưa có bạn tạo ra còn có rồi hãy chỉnh sửa tại đây rồi lưu lại nhé.

Lưu ý: yoast seo dù bản trả phí hay không vẫn có thể sử dụng được.

Tại đây mình sẽ share một bản yoast seo được active bạn chỉ cẩn tải lên wordpress và dùng nhé.

Tải File Robots.txt mẫu- Yoast SEO Active:

File Yoast SEO Active:

Tải drive

File Robots.txt mẫu:

Tải drive

Toby Trương
Tôi là Admin của website EzLasso.com Xin chào! Tôi là Khai còn gọi là "Toby", người viết website này. Tôi có một đam mê về công nghệ, thiết bị máy tính và mong muốn được chia sẻ cho tất cả mọi người .