网页抓取

网页抓取主要有三个方面: 1、搜集新出现的网页; 2、搜集那些在上次搜集后有改变的网页; 3、发现自从上次搜集后已经不再存了的网页,并从库中删除。

共 1 讨论,7天新增 0 个讨论,30天新增 0 个讨论

给问题加一个自动清理垃圾问题的方法
你的网站是不是也被灌水机攻击了,删问题删的手软,以下方法可以让它自动清理: 1、禁止灌水发提问的用户(这是关键) 2、在程序目录下的 models\question.php 代码最下面 } 前添加:   ...
差不多4个月的时间,WeCenter2.5算是做一个小小的完结,虽然还是很多需要改进和提高的地方,暂时都让他们去下一个版本吧。下个版本的重心我们会着重处理内容首页信息流的算法调整,全局用户体验方面的优化,插件和模板中心的上线,以及开发接口等...
WeCenter中还没有实现i18n, 所以改动字符串的话,需要直接修改PHP源代码,这样带来的问题是改动不集中,很难追踪到所有的改动。其实WeCenter提供了扩展度更好的语言包形式,可以在一个文件中修改所有的缺省文字显示。 按下述步骤...
发布的文章不能让其他用户编辑tag 也不能删除自己的文章??
关于网站被黑,
记得前面说我的问答网被黑了(原来的网站问题:http://wenda.wecenter.com/question/20211) 最近空闲下来,说一说被黑后恢复的一些心得。 我的网站黑了之后访问不了,我要求服务器提供商恢复备份。恢复备份之...
报个bug,用户隐私开关设置不起作用
设否后,个人主页仍然能被其它id看到,亲身测试。 微博设置 是否允许别人访问我的微博 :

热门话题

搜索问题

网页静态化

弹窗登陆

海外购物

热门文章