一聚教程网：一个值得你收藏的教程网站

ps教程| flash教程| 路由器设置| Jsp教程| 加入收藏

首页游戏下载软件下载专题资讯教程 php教程 asp.net教程 css教程网页制作网页特效手机开发办公数码

+ -

当前位置：一聚教程网 > asp教程 > ASP入门

推荐专题

最新下载

1

歧路旅人大陆的霸者国服安卓版v1.0.1
1.1GB 类型： 角色扮演
2

艾拉世界小镇生活无限钻石最新版v1.3
104.99MB 类型： 角色扮演
3

屠夫躲猫猫免广告版 v1.0.6
35.46MB 类型： 角色扮演
4

梦想城镇vivo最新版本安卓版v12.0.1
365.7MB 类型： 模拟经营
5

偶像梦幻祭2网易版安卓版v3.2.7104
593.3MB 类型： 音乐舞蹈
6

弓箭传说2 安卓版v1.0.13
424.3MB 类型： 射击枪战
7

勇者传说终末之战内置菜单版 v2.1.2
213.5MB 类型： 策略塔防
8

滑雪大冒险应用宝服安卓版v2.3.16
86.3MB 类型： 休闲益智
9

仙国志百度版安卓版v1.17.0
365MB 类型： 角色扮演
10

神偷鲍勃 (Robbery Bob)安卓版v1.8.0
135.34MB 类型： 休闲益智

热门教程

1

《暗黑破坏神：不朽》新职业Coser今日亮相2024ChinaJoy
时间：2024-08-14 类型： 游戏攻略
2

《物华弥新》闪耀2024CJ 8月新版本福利享不停
时间：2024-08-14 类型： 游戏攻略
3

长安城“导游”招募开启,和兄弟组团共赴大话嘉年华
时间：2024-08-14 类型： 游戏攻略
4

《蛋仔派对》首届蛋仔电影节隆重开幕,播映主题全公开
时间：2024-08-14 类型： 游戏攻略
5

暑期不无聊,《蛋仔派对》和《疯狂动物城》联动重磅上线
时间：2024-08-14 类型： 游戏攻略
6

齐力挖金《一梦江湖》七夕节双人黄金矿工玩法刺激开启
时间：2024-08-14 类型： 游戏攻略
7

《梦幻西游三维版》暑期活动进行中,全新锦衣潮翻三界
时间：2024-08-14 类型： 游戏攻略
8

KK联动虎牙澄海主播邀请赛圆满落幕,高玩云集巅峰会战
时间：2024-08-14 类型： 游戏攻略
9

《阴阳师》全新结界皮肤华夜枫舞即将上线
时间：2024-08-14 类型： 游戏攻略
10

CS2沙二A小假打烟雾弹攻略
时间：2024-08-14 类型： 游戏攻略

基于python 爬虫爬到含空格的url的处理方法

时间：2022-06-29 13:42:27 编辑：袖梨来源：一聚教程网

道友问我的一个问题，之前确实没遇见过，在此记录一下。

问题描述

在某网站主页提取url进行迭代，爬虫请求主页时没有问题，返回正常，但是在访问在主页提取到的url时出现了400状态码(400 Bad Request)。

结论

先贴出结论来，如果url里有空格的话，要把空格替换成%20，也就是url编码，否则就会出现400。

解决过程

首先百度了一下400状态码什么意思：

400页面是当用户在打开网页时，返回给用户界面带有400提示符的页面。其含义是你访问的页面域名不存在或者请求错误。

主要有两种形式：

1、bad request意思是“错误的请求”；

2、invalid hostname意思是”不存在的域名”。

所以说问题应该是出在了url上，我怀疑是他的url提取逻辑有问题，于是让他把url打印一下看看，他说看不出什么问题。

然后我就把他代码要了过来，自己调调试试，发现前几个子url是访问正常的，但是其中一个出现了400，那个url如下：

http://www.qichacha.com/company_getinfos?unique=4d5ad1bc15ddc4ad9873e5b0ff4f93d3&companyname=意大利C.D.VIDEO S.P.A.深圳代表处&tab=base

下面是一个访问正常的url：

http://www.qichacha.com/company_getinfos?unique=f6aa78d2e9f4b0bc98103785f96c1353&companyname=深圳市联得自动化装备股份有限公司&tab=base

我首先把这个url复制到浏览器，发现可以正常访问，然后就留神了一下浏览器上url的变化，发现空格变成了%20，在代码里把url中的空格都替换成%20后，

程序访问也正常了。

问题解决。

启示

以后做爬虫，对于不可预测的不规律的请求，在发请求之前先把url进行url编码，以免出现这种错误。

相关文章

热门栏目