R爬虫必备基础——CSS+SelectorGadget

CSS是一种美化网页的工具。

简单来说,就是根据规则改变样式。

例如,对于容器,选择 ID Container,对于 .wrapper,选择类 Wrapper。

HTML 决定结构,CSS 改变外观。

网页的节点树,从根节点开始。

父、子、兄弟之间的关系明确,有层次。

爬虫使用选择器来查找要爬取的节点。

SelectorGadget 插件。
单击以生成选择器。

点击红色删除,点击无红色添加,很简单。

但是,对于复杂的网页,您需要在进行更改之前了解其结构。

您还可以自己创建选择器。
关键是要理解网页。

浏览器影子提示,非常有用。

首先是这个。

wwwroot是什么文件夹可以删吗,在c盘?

IIS服务器的默认站点文件位于C盘的inetpub下。
首先通过删除该文件并确认它不再存在来备份该文件。

在我的计划中,我总是在删除文件之前备份文件,然后进行测试以确认它们不会影响功能。

评价一下自己。