发布时间:2020-02-11 13: 49: 40
站点抓取功能是Internet Download Manager(简称:IDM)可以代替离线浏览器的功能,它可以将网站内容全部存储在你的硬盘上,以便你在离线、连接慢、连接不稳定等情况下顺利访问网站。
上篇文章如何创建站点抓取方案(上)如何创建站点抓取方案的前两步操作,今天这篇文章小编聊聊下两步操作。
抓取方案前两步操作设置完成之后,点击“前进>”,进入设置步骤3,需要设置站点资源过滤器。
图1:探索过滤器
该步骤中需要指定要探测和搜索网页中所需文件。如果只为探索网页设置标准,可以设置文件类型,位置和有关内容,对文件下载设置进行过滤。
还有个关于“处理JavaScript”的复选框,Internet Download Manager可以在一个页面上运行JavaScript 并且分析它的结果。但以这种方法可以找到一个站点上的更多链接。需要谨慎使用该功能。
底部还有一个“高级>>”按钮,该功能可以对您指定需要的探测的包含和排除的域/路径内的网页,也可以使用(;)分隔多个条目,进行创建过滤器的样例。
图2:高级选项
以上内容设置完成后,点击“前进>”,进入设置第四步,设置文件过滤器。确定下载过程中包含或排除文件的类型以及站点搜索方式。
图3:文件过滤器
如果对下载文件过滤器不太满意,可以通过“添加过滤器”按钮添加/更改他们,点击后添加过滤器会出现如下“编辑过滤对话框”。
图4:包含过滤器对话框
“只在此站点搜索文件”复选框,指的就是IDM的主窗口将不会显示其它站点的文件位置并且IDM也不会检查这些文件的大小和类型。
因为IDM在探测方案的时候,可能会在不同的位置有相同文件的复件,所以在设置的过程中选择“隐藏发现不同路径下的重复文件”复选框。
“同时开始下载所有匹配的文件”复选框,如果选中IDM找到的文件将会被立即下载。
页面底部“高级>>”按钮可以用来拓展对话框并且设置包含和排除的IDM将下载文件的域/路径内的过滤器,也可以使用(;)来进行分隔各条目。
图5:高级设置
该页面设置完成之后,点击“前进>”,进入站点抓取页面,该方案就设置完成啦。
图6:下载页面
以上,关于如何创建站点抓取方案就已经介绍完成了,掌握一项操作的比较好的方式就是多尝试,所以抓紧下载IDM,尝试创建一个站点抓取方案试试吧。
展开阅读全文
︾