摸摸妖精
03
16
经典论文:MapReduce 经典论文:MapReduce
前言:这是《云计算》课程指定的论文阅读笔记。 MapReduce 0. 摘要概念定义:MapReduce是一个 programming model,可以用来处理和生成大量数据集。 方法简介: specify 一个 map 函数处理键值生
2021-03-16 yangli
16
14
pandas 数据处理方法与问题 pandas 数据处理方法与问题
前言:近期参与了一个大数据挖掘项目,我在项目中负责部分数据预处理的工作。主要使用的工具为pandas,而在使用pandas进行大数据预处理工作的时候,遇到了较多问题需要回头总结。因此在这篇博客中,记录一些我使用的pandas等数据预处理方
2021-03-14 yangli