Gregory Kimball

Gregory Kimball 是 NVIDIA 的軟件工程經理,在 RAPIDS 團隊工作。 Gregory 負責 libcudf 的開發, libcudf 是一個用于柱狀數據處理的 CUDA / C ++庫,為 RAPIDS cuDF 提供動力。格雷戈里擁有加州理工學院應用物理學博士學位。

Posts by Gregory Kimball

數據中心/云端

在 NVIDIA Grace CPU 上使用 Polars 和 Apache Spark 實現高效 ETL

NVIDIA Grace CPU 超級芯片可為數據中心和云端的 CPU 工作負載提供出色的性能和出色的能效。 3 MIN READ
數據科學

使用 NVIDIA cuDF,pandas 讀取 JSON 行文件速度提升100倍

JSON 是一種廣泛采用的格式,用于在系統之間 (通常用于 Web 應用和大語言模型 (LLMs)) 以互操作方式運行的基于文本的信息。 3 MIN READ
數據科學

使用 RAPIDS cuDF pandas 加速器模式處理 10 億行數據

十億行挑戰賽 (One Billion Row Challenge) 是一個有趣的基準測試,旨在展示基本的數據處理操作。 3 MIN READ
數據科學

使用 RAPIDS 的 Parquet 字符串數據的編碼和壓縮指南

Parquet Writer 提供了默認關閉的編碼和壓縮選項。啟用這些選項可以為數據提供更好的無損壓縮, 3 MIN READ
數據科學

在 RAPIDS libcudf 中使用嵌入式數據類型簡化 ETL 工作流程

嵌入式數據類型是一種表示列式數據中分層關系的便捷方式。它們經常用于 提取、轉換、加載(ETL)在商業智能領域的工作負載、推薦系統、網絡安全、 2 MIN READ
數據科學

GPU 加速的 RAPID JSON 數據處理

JSON 是一種廣泛采用的基于文本的信息格式,可在系統之間互操作,最常見于 web 應用程序。雖然 JSON 格式是人類可讀的, 3 MIN READ