2019-09-09 10:28
目录
小米应用商店抓取(多线程)
腾讯招聘数据抓取(Ajax)
应用场景
1、多进程 :CPU密集程序
2、多线程 :爬虫(网络I/O)、本地磁盘I/O
知识点回顾
队列
复制代码
# 导入模块
from queue import Queue
# 使用
q = Queue()
q.put(url)
q.get() # 当队列为空时,阻塞
q.empty() # 判断队列是否为空,True/False
复制代码
线程模块
复制代码
# 导入模块
from threading import Thread
...
2019-09-09 10:39
什么是事件?事件是用户触摸手机屏幕,引起的一系列TouchEvent,包括ACTION_DOWN、ACTION_MOVE、ACTION_UP、ACTION_CANCEL等,这些action组合后变成点击事件、长按事件等。...
2019-09-09 10:05
1、了解 Apache Kafka
1.1、简介
file
官网:http://kafka.apache.org/
Apache Kafka 是一个开源消息系统,由Scala 写成。是由Apache 软件基金会开发的一个开源消息系统项目。
Kafka 最初是由LinkedIn 开发,并于2011 年初开源。2012 年10 月从Apache Incubator 毕业。该项目的目标是为处理实时数据提供一个统一、高通量、低等待(低延时)的平台。
Kafka 是一个分布式消息系统:具有生产者、消费者的功能。它提供了类似于JMS 的特性,但是在设计实现上完全不同,此外它并不是JMS 规范的实现。【重点】
...
2019-09-09 10:53
在小伙伴们开发微信公众号、小程序或者是在微信内置浏览器打开的项目时,会遇到的第一个问题就是如何获取openId,今天小编就给大家带来的是如何获取openId。 首先 我们要从微信开发者后台得到appid,这个appid是管理员在设置微信后台时获取的,而且是唯一的,而且还需要在微信后台设置回调域名。...
2019-09-06 16:07
上文总结了csrf攻击以及一些常用的防护方式,csrf全称Cross-site request forgery(跨站请求伪造),是一类利用信任用户已经获取的注册凭证,绕过后台用户验证,向被攻击网站发送未被用户授权的跨站请求以对被攻击网站执行某项操作的一种恶意攻击方式。...
2019-09-06 16:40
继上篇的CSS 之Grid下半部分
14.将单元格划分到一个区域,使用grid-template-areas属性;
ag: grid-template-areas:
"header header header"
"advert content content"
"footer footer footer";
上段代码中,每个单词代表一个单元格,每对引号代表一行(当想让指定单元格为空时,使用“.”(点号)表示)
...
2019-09-06 16:26
了解神器:PhpStudy 一键搭建PHP环境
语法:
PHP是一种可以嵌套在HTML页面的脚本语言
嵌套HTML文件:
PHP
PHP同时也可以以 “*.php” 文件单独保存和被访问,但是在php文件中,也必须以 “”结束!php代码只会在这里被执行和解析
...
2019-09-06 16:29
参加工作三年多了,最近业务不是很忙,心里反而空落落的。最近参与了一个公司UI库开发,发现自己不懂的东西实在太多。以此为契机吧:
1. 有必要把近两年的经验知识沉淀一下,与标准和文档进行一一印证,查漏补缺。
2. 工具不仅要会用,用的好,还要知道原理。
3. 即便是有些知识暂时用不到,作为一名有点追求的工程师,应该提前做一些知识储备。
写到此处惊觉自己这两三年在技术上还是成长了的,2016年我需要看着前辈们的分享,大家说有用我就学,听前辈的总没错,2019年我可以根据自己的经验和体会总结出该怎么去系统的学习了,并且轻重缓急自己心里都有底。
...
2019-09-06 16:57
简介 已经有了Membercache和各种数据库,Redis为什么会产生?Redis纯粹为应用而产生,它是一个高性能的key-value数据库。Redis的出现,很大程序补偿了Memcached这类key-value存储的不足,解决了断电后数据库完全丢失的情况;在部分场合可以对关系数据库起到很好的补偿作用。性能测试结果表示SET操作每秒钟可达110000,GET操作每秒81000次(当然不同的服务器配置性能不同)。...
2019-09-06 16:08
一,JVM内存分配和常量池 在介绍String类之前,先来简单分析一下在JVM中,对内存的使用是如何进行分配的。如下图所示(注意:在jdk1.8之后便没有方法区了):...
2019-09-06 16:33
这篇博客讲到基本概念包括: Index、Type、Document。集群,节点,分片及副本,倒排索引。
一、Index、Type、Document
1、Index
index:索引是文档(Document)的容器,是一类文档的集合。
索引这个词在 ElasticSearch 会有三种意思:
1)、索引(名词)
类比传统的关系型数据库领域来说,索引相当于SQL中的一个数据库(Database)。索引由其名称(必须为全小写字符)进行标识。
2)、索引(动词)
保存一个文档到索引(名词)的过程。这非常类似于SQL语句中的 INSERT关键词。如果该文档已存在时那就相当于数据库的UPDATE。
...
2019-09-06 16:26
spring作为目前我们开发的基础框架,每天的开发工作基本和他形影不离,作为管理bean的最经典、优秀的框架,它的复杂程度往往令人望而却步。不过作为朝夕相处的框架,我们必须得明白一个问题就是spring是如何加载bean的,我们常在开发中使用的注解比如@Component、@AutoWired、@Socpe等注解,Spring是如何解析的,明白这些原理将有助于我们更深刻的理解spring。需要说明一点的是spring的源码非常精密、复杂,限于篇幅的关系,本篇博客不会细致的分析源码,会采取抽丝剥茧的方式,避轻就重,抓住重点来分析整个流程(不会分析具体的细节),本次将会基于spring5.0的版本
...
2019-09-06 16:39
在 上一篇 中讲到了在NetCore项目中如何进行全局异常处理,当手动抛出或系统未处理异常出现时进行的一个拦截处理。...
2019-09-06 16:06
一、@EnableAspectJAutoProxy注解
在主配置类中添加@EnableAspectJAutoProxy注解,开启aop支持,那么@EnableAspectJAutoProxy到底做了什么?接下来分析下:
@EnableAspectJAutoProxy点进去如下:
此时看到了我们非常熟悉的@Import注解,@Import(AspectJAutoProxyRegistrar.class),进入到AspectJAutoProxyRegistrar发现实现了ImportBeanDefinitionRegistrar如下:
...