12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
相关推荐
最新更新
巴基斯坦援助伊朗防空,大家怎么看?
如何看待伊朗导弹打击以色列医院?
我想知道女生有没有处男情结?
为什么国外网站总喜欢弹出cookie访问权限弹窗,国内网站却没有,这么做有什么意义?
2025年wta500柏林站女单第二轮,王欣瑜2:0击溃高芙强势晋级八强,怎么评价这一场对决?
印度成为美俄中后第四个成功实现空间对接的国家,这具有怎样的意义?印度在航天领域实力如何?
golang 与rust 在服务器程序领域相比较,各有什么优劣势?
MiniMax 推出全球首个开源大规模混合架构的推理模型 MiniMax-M1,其有何技术优势?
为什么开发一个 AI Agent 看似容易,但真正让它「好用」却如此困难?技术瓶颈主要在哪里?
我国的军工能力可以实现一天5000枚火箭弹连着炸三个月吗?
推荐阅读
猜你喜欢
关注我们

包装印刷加工
网站首页
