Lorem ipsum dolor sit amet, consectetur adipiscing elit. Test link

Search Suggest

Disallow: / search Ý nghĩa gì trong robot.txt?

Trong bảng điều khiển Công cụ quản trị trang web Google của blog của tôi, tôi đã tìm thấy đoạn mã sau trong tệp robots.txt của tôi về phần URL bị chặn.

Dis Disallow: / search Ý nghĩa gì trong robot.txt?

User-agent: Mediapartners-Google
Disallow: /search
Allow: /
Tôi biết điều đó Disallowsẽ ngăn Googlebot lập chỉ mục một trang web, nhưng tôi không hiểu cách sử dụngDisallow: /searchÝ nghĩa chính xác của là Disallow: /searchgì?

Câu trả lời:
Trong Disallow bạn chỉ định bắt đầu đường dẫn URL của URL cần bị chặn.
Vì vậy, nếu bạn cóDisallow: /nó sẽ chặn mọi thứ , vì mọi đường dẫn URL bắt đầu bằng/

Nếu bạn có Disallow: /a, nó sẽ chặn tất cả các URL có đường dẫn bắt đầu /aĐó có thể là /a.html/a/b/c/hellohoặc /about.

Theo nghĩa tương tự, nếu bạn cóDisallow: /searchnó sẽ chặn tất cả các URL có đường dẫn bắt đầu bằng chuỗi /searchVì vậy, nó sẽ chặn các URL sau, ví dụ (nếu robot.txt nằm tronghttp://example.com/):

  • http://example.com/search
  • http://example.com/search.html
  • http://example.com/searchengine
  • http://example.com/search/
  • http://example.com/search/index.html
Mặc dù các URL sau vẫn sẽ được cho phép:
  • http://example.com/foo/search
  • http://example.com/sea

Điều đó có nghĩa là bot (chỉ bot bot ở đây) không được phép truy cập tài nguyên trong /searchthư mục. Ví dụ: bot AdSense không có quyền truy cập vào loại URL này:www.example.com/search/hoặc www.example.com/search/file.html


Lưu ýRằng robot.txt không biết / làm phiền nếu chuỗi khớp với thư mục, tệp hoặc không có gì cả. Nó chỉ nhìn vào các ký tự trong URL.