Robots.txtRobots.txt 是一个通常放置在任何网站根目录下的文件。它决定了爬虫是否被允许访问网站。 例如,网站管理员可以禁止爬虫访问某个文件夹(以及其中包含的所有文件)或爬取特定文件,通常是为了防止这些文件被其他搜索引擎索引。参见 维基百科上的 Robots.txt https://developers.google.com/search/reference/robots_txt 标准规范:RFC 9309 https://www.robotstxt.org/