Python爬虫入门教程 7-100 蜂鸟网图片爬取之二

2018-12-19 09:03

万码学堂

简介

今天玩点新鲜的，使用一个新库 aiohttp ，利用它提高咱爬虫的爬取速度。

安装模块常规套路

pip install aiohttp

在这里插入图片描述

运行之后等待，安装完毕，想要深造，那么官方文档必备：https://aiohttp.readthedocs.io/en/stable/

接下来就可以开始写代码了。

我们要爬取的页面，这一次选取的是

http://bbs.fengniao.com/forum/forum_101_1_lastpost.html

打开页面，我们很容易就获取到了页码

在这里插入图片描述
好久没有这么方便的看到页码了。

尝试用 aiohttp 访问这个页面吧，模块的引入，没有什么特殊的，采用 import 即可
如果我们需要使用Asyncio + Aiohttp异步IO 编写爬虫，那么需要注意，你需要异步的方法前面加上async

接下来，先尝试去获取一下上面那个地址的网页源码。

代码中，先声明一个fetch_img_url的函数，同时携带一个参数，这个参数也可以直接写死。

with 上下文不在提示，自行搜索相关资料即可 (｀・ω・´)

aiohttp.ClientSession() as session: 创建一个session对象，然后用该session对象去打开网页。session可以进行多项操作，比如post, get, put等

代码中 await response.text() 等待网页数据返回

asyncio.get_event_loop创建线程，run_until_complete方法负责安排执行 tasks中的任务。tasks可以为单独的函数，也可以是列表。

import aiohttp   import asyncio    async



                    
                        关键字：



            
            
                
                
                    青岛软件培训
                    
                        
可能你正在寻找一家靠谱的IT培训机构，
渴望突破职业瓶颈，
找一份得体的工作。
恰巧万码学堂正在寻找像你这样不甘平凡的追光者！
我们拒绝纸上谈兵，直接参与真实开发流程！

现在行动，未来可期‌

立即拨打0532-85025005，预约免费职业规划咨询
前20名咨询者赠送《2025高薪技术岗位白皮书》!

你不是在报名课程，而是在投资五年后的自己！


申请免费试听课程










    
        
            
                
                    50000+
                    5万行代码练就真实本领
                
            
            
                
                    17年
                    创办于2008年老牌培训机构
                
            
            
                
                    1000+
                    合作企业
                
            
            
                
                    98%
                    就业率
                
            
        
    




    
        联系我们
        
            
                
                    
                        
                            
                            电话咨询
                            0532-85025005
                        
                    
                    
                        
                            
                            扫码添加微信
                            
                                
                            
                        
                    
                
            
        
    






    
        
            
                万码学堂
                青岛软件培训
            
            
                选择一家好的青岛软件培训学校，就要看教学质量和口碑

            
        
        
        
            
                万码学堂-做最负责任的教育-联系电话0532-85025005
鲁ICP备09077726号-3