使用火车采集器内置的浏览器,能很方便的获取到需要登陆的网站Cookie值,基本上能满足大多数网站的采集需求。
然而,受系统权限和目标网站的验证限制,有一些情况,使用火车采集器内置浏览器获取的Cookie并不准确,或者虽然Cookie值是准确的,却无法正常的模拟登陆,出现一些不能登陆发布内容、不能正常发布附件的情况。造成反复登陆却总是提示没有登陆的错误提示,或者下载附件时,出现下载的附件是一些.php文件的情况。
针对这种情况,尘缘今天做了2010年的第一个视频教程。今天讲的内容,着重分析了问题产生的原因和解决办法,并仔细讲了如何解决不能下载附件的一些解决办法。
希望对大家有用。今天的视频,我依然使用最高清晰度的压制比例,视频文件可能个头比较大,目的是为了让大家看清楚画面上的文字,避免产生误导。
不能正常登陆和不能下载附件,常见于一些论坛附件下载,
主要原因是由于火车采集器模拟的浏览器参数与实际情况不符合。
问题原因
1,火车采集器没有设置或者设置出错,也包括设置的数据已经过期
2,Cookie获取不正确
解决办法
1,选项设置-采集发布设置-本机浏览器User-Agent,重新获取或者使用抓包工具
2,任务-编辑任务-使用抓包工具获取 Cookie
3,将下载链接中的 & 替换为 & ,不含空格
常见的抓包工具及下载
1,WSockExpert数据包抓取工具,http://www.locoy.com/locoy/download/
2,HttpAnalyzerFullV5+keymaker,http://www.boom.im/archives/3/
3,火狐浏览器中的 FireBug 组件,目前版本:Firebug 1.5.2,使用火狐点此可直接安装!
HttpAnalyzerFullV5最新版及注册机下载:
最新版:http://www.ieinspector.com/httpanalyzer/downloadV5/full_edition/HttpAnalyzerFullV5.exe
注册机:HttpAnalyzerStdV5_keygen
你可以任意转摘“火车采集器获取Cookie不准确、登陆不正常、不能下载附件的解决办法”,但请保留本文出处和版权信息。
作者:尘缘,QQ:130775,来源:http://www.4wei.cn/archives/1000446