实用软件资讯

火车头采集器:发布失败常见问题汇总

     10.未找到任何可发布的内容.

     答:这个是程序在本地数据库里找不到未标记为未发的记录。这种情况是您将所有数据已发布过了,或是您在任务栏目里没有选 发内容

     11.测试时或发布时出现 "出现同一帐号同时只能一个在线,或是您的帐号已被禁用"

     答:这个是网站系统不允许一个帐号同时在多个在线,比如帝国系统。这个情况下建议您使用专门的一个帐号用来采集发布。不要用它来登陆网站。

     12.有些时候,明明已经正确获取web cookie,但是测试的时候仍然是没有登录呢?

     答:这个一个是cookie 过期的问题,另一个可能是我们程序获取的不正确(很抱歉,程序目前还无法正确获取所有的cookie)。这种情况下,建议您使用专业的抓包软件,如 WSockExpert.用来抓取cookie,然后将抓取到的cookie填写到程序保存cookie的地方。

     13.如何设置发表的速度?

     答:请在“编辑任务”里"文件保存及高级设置里"设置采集及发布速度,时间单 位是毫秒。

     14.采集地址重复.

     答:程序会保存采集页的地址,默认是采过的是不再再去采集。如果你是需要重新采的话可以将原来的任务 地址库和本地已采数据全部删掉。如果您要采的网页里内容是不断变化的,你可以选不检测重复的选项

  15.论坛怎么能更换用户发帖,一个用户发太假了?

  答:如果你使用web在线发布的方式,那么程序发帖就相当于你手工发,你不能同时登陆多个帐号,所以程序也 不能。要实现多个帐号发布,你需要修改原来的论坛程序,使他可以使用多个用户名发布。discuz随机发布接口就是修改后的程序,用不同用户来向自己论坛 发帖的。

  14.测试网址采集正常,但真正采集的时候漏掉许多 。

  答:程序默认是会过滤掉重复网址的。在同一个站点下如果一个网址已采过,就不会再去采集。

  17.采集的数据入库后,显示出很多问号 ?

  答:这个一般是你入库时没有选对编码所引起的,请注意选择编码;

希望看到您的想法,请您发表评论x