Python 中的一些小技巧

 这里是本人收集的一些 Python 小技巧,目前主要是一些实用函数,适合有一定基础的童鞋观看(不会专门介绍使用到的标准库函数)。。

一、函数式编程

函数式编程用来处理数据,感觉很方便。(要是再配上管道操作符 | 或者 Java 的那种链式调用,超级爽!可惜 Python 都没有。。需要借助第三方库)

1. 分组/group

数据处理中一个常见的操作,是将列表中的元素,依次每 k 个分作一组。

def group_each(a, size: int):     """         将一个可迭代对象 a 内的元素, 每 size 个分为一组         group_each([1,2,3,4], 2) -> [(1,2), (3,4)]     """     iterators = [iter(a)] * size  # 将新构造的 iterator 复制 size 次(浅复制)     return zip(*iterators)  # 然后 zip

这个函数之前在 

对这种 html 元素,我一般会直接把它转换成 list,结果如下:

table = [['label1', 'value1', 'label2', 'value2'],          ['label3', 'value3'],          ['label4', 'value4', 'label5', 'value5'],          ...          ]

为了方便索引,现在我需要把上面的数据转换成下面这个样子的 dict

{     'label1': 'value1',     'label2': 'value2',     'label3': 'value3',     'label4': 'value4',     'label5': 'value5' }

如果是平常,大概需要写循环了。不过如果用刚刚说到的几个函数的话,会变得异常简单

 # 1. 分组 groups = flat_map(group_each_2, table)  # 1.1 flat_map 返回的是迭代器,list 后内容如下: # [('label1', 'value1'), #  ('label2', 'value2'), #  ('label3', 'value3'), #  ('label4', 'value4'), #  ('label5', 'value5')]  # 2. 转换成 dict key_values = dict(groups)   # 得到的 key_values 与上面需要的 dict 别无二致。

涨姿势的模块

  1. 迭代器:itertools,这个模块的内容,感觉全都非常实用。
  2. 特殊数据结构:colletions,也都各有用途,我用的最多的应该是 defaultdict。
  3. 函数式:functools 中的 partical、reduce 可以了解一下,还有 builtins 的 map、filter、zip.(不过这后面的三个函数,其实可以用推导式替代)
  4. 和比较有关的函数:sorted、max、min 和 itertools.groupby,常常使用 opreator 的 itemgetter (有时可能是 attrgetter/methodcaller)作为参数 key。
  5. 常用操作的函数库:operator,包含了非常多的抽象操作的函数形式(加减乘除、in、等等),经常被用作 reduce/map/filter 的参数 function。内容比较多,建议在需要用到时再查阅.

P.S. 使用这些模块的话,最好附带上详细的注释。(方便事后理解)

二、其他

1. 多 dict 的去重

假设我们有一个 dict 的列表,里面可能有内容一模一样的 dict,我们需要对它做去重。
容易想到的方法就是使用 set,可是 set 中的元素必须是 hashable 的,而 dict 是 unhashable 的,因此不能直接放进 set 里。

>>> a = [{'a': 1}, {'a': 1}, {'b': 2}] >>> set(a) Traceback (most recent call last):   File "/usr/local/lib/python3.7/site-packages/IPyt
                    
50000+
5万行代码练就真实本领
17年
创办于2008年老牌培训机构
1000+
合作企业
98%
就业率

联系我们

电话咨询

0532-85025005

扫码添加微信