12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
相关推荐
最新更新
推荐阅读
如何高效将 HTML 内容转换成卡片形式?
怎么才能有尤雨溪一半强,该怎么学习?
女生有男朋友之后才知道的事情有哪些?
有没有一款音乐播放器,能连接nas音乐,创建音乐库,自动匹配歌词封面等等?类似infuse的概念呢?
有没有一款音乐播放器,能连接nas音乐,创建音乐库,自动匹配歌词封面等等?类似infuse的概念呢?
北京多所高校建议舍弃罗马仕充电宝,品牌方称正调查,罗马仕充电宝质量如何?如何排查所用充电宝是否安全?
为什么现在的年轻人宁愿自己工资低点,也要过得舒服、不那么累?
为什么感觉德国在中国的名声比英法美日好一点?
为什么开发一个 AI Agent 看似容易,但真正让它「好用」却如此困难?技术瓶颈主要在哪里?
哪张照片让你觉得刘亦菲美得不可方物?
猜你喜欢
关注我们

包装成型机械
网站首页
