12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
相关推荐
最新更新
推荐阅读
如何评价高圆圆的身材算是美女类型的吗?
我特别不明白,我们这边做j***a 的,为什么要用windows 做server?
我是新手想养鱼,预算不超过200。有什么好的建议或者禁忌吗。?
女性为什么不普遍跟男性那样只留个几毫米或2-3厘米短发,女性不觉得长发麻烦吗?
如何评价华为最新长焦专利技术?能否颠覆手机长焦摄影的目前限制?
联想 128GB 超大内存迷你 AMD 主机上架,此款主机有哪些亮点?
为什么iPhone各方面都是顶配,却唯独信号不好?
你在出租房屋发现过什么前租客留下的“宝藏”?
为什么这次以色列打伊朗,网上声讨的人少了,反而都是嘲笑调侃伊朗?
大厂后端开发需要掌握docker和k8s吗?
猜你喜欢
关注我们

包装项目合作
网站首页
