网页抓取

网页抓取主要有三个方面: 1、搜集新出现的网页; 2、搜集那些在上次搜集后有改变的网页; 3、发现自从上次搜集后已经不再存了的网页,并从库中删除。

共 1 讨论,7天新增 0 个讨论,30天新增 0 个讨论

发布内容,目前只有文字性的内容。这点跟不上时代的发展,用户的发展了。建议发布分类里,可以发布图片,发布视频。发布出来的图片有专业的显示页面,视频也是专门的展示页面,集中展示,利于用户搜索用
231321321
文章 测试
测试
转载来源[虎嗅](http://www.huxiu.com) 搅局者360面临的巨额诉讼官司即将开庭。百度起诉奇虎360违反“Robots协议”(又称机器人协议或爬虫协议)抓取、复制其网站内容的不正当竞争行为,并索赔1亿元人民币。这个官司...
我一直希望借鉴官方的这种产品带动社区的模式来做问答网,独立做问答社区,像知乎那样对于我等屌丝来说,实在是难度好大;我搞了2年了多了,基本都没有注册用户,都靠自己在导入问题。用户来了浏览完东西就走了。   但这个产品也好难选的。
建议官方做问卷调查的插件 ... 在知识库中嵌入问卷调查的插件, 一是能通过积分之类的鼓励大家参与, 二是能通过调查问卷来增加行业数据的收集   不晓得官方会不会关注这块

热门话题

百度

官网APP

编辑器工具栏

打赏

div