电子书 | 加速 Apache Spark 3.x——利用 NVIDIA GPU 助力分析和 AI 新时代
| 2021-03-05
Apache Spark是一个强大的执行引擎,可以跨机器集群进行大规模并行数据处理,实现快速应用程序开发和高性能。Spark3 的改进,使GPU的大规模并行架构进一步加速Spark数据处理成为可能。
在这本电子书中,学习 Spark 3 的创新如何使使用 GPU 的大规模并行架构进一步加速 Spark 数据处理成为可能。
您可以了解以下内容:
数据处理的发展,从 Hadoop 到 GPU 和 NVIDIA RAPIDS™ 图书馆
Spark,它是什么,它做什么,它为什么重要
Spark 中的 GPU 加速
数据帧和 Spark SQL
具有随机森林分类器的 Spark 回归实例
使用 XGBoost 加速的端到端机器学习工作流 GPU 示例