Data Engineering với Apache Spark
2 lượt xem
0 lượt tải

Data Engineering với Apache Spark

Tác giả: Bill Chambers Matei Zaharia

★★★★½ 4.6/5
ISBN978-1-49-208274-7
Nhà xuất bảnO'Reilly Media
Năm xuất bản2022
Số trang422 trang
Định dạngPDF
Dung lượng7.1 MB
Giá199,000 đ

Giới thiệu nội dung

Giới thiệu Apache Spark – framework xử lý big data phân tán. Bao gồm RDDs, DataFrames, Spark SQL, Spark Streaming, MLlib và tích hợp với Hadoop ecosystem. Xây dựng data pipeline xử lý terabytes dữ liệu và real-time streaming analytics với Kafka và Spark.

Viết một bình luận