Wolohan - Mastering Large Datasets with Python: Parallelize and Distribute Your Python Code Современные решения для науки о данных должны быть ясными, легко читаемыми и масштабируемыми. В книге "Mastering Large Datasets with Python" автор Джон Волохан научит вас, как сделать небольшой проект и масштабировать его с помощью функционального подхода к программированию на Python. Вы будете исследовать методы и встроенные инструменты Python, которые поддаются ясности и масштабируемости, как метод высокопроизводительного параллелизма, а также распределенные технологии, которые разрешают высокую скорость передачи данных. Обилие практических упражнений в этом практическом руководстве закрепит эти важные навыки для любого крупномасштабного проекта науки о данных.The goal of this book is to teach a scalable style of programming. To do that, we’ll cover a wider range of material than you might be familiar with from other programming or technology books. Where other books might cover a single library, this book covers many libraries—both built-in modules, such as functools and itertools, as well as third-party libraries, such as toolz, pathos, and mrjob. Where other books cover just one technology, this book covers many, including Hadoop, Spark, and Amazon Web Services (AWS). The choice to cover a broad range of technologies is admitting the fact that to scale your code, you need to be able to adapt to new situations. Across all the technologies, however, I emphasize a “map and reduce” style of programming in Python.
Мир книг
John T.
Wolohan - Mastering Large Datasets with Python: Parallelize and Distribute Your Python Code
Современные решения для науки о данных должны быть ясными, легко читаемыми и масштабируемыми. В книге "Mastering Large Datasets with Python" автор Джон Волохан научит вас, как сделать небольшой проект и масштабировать его с помощью функционального подхода к программированию на Python. Вы будете исследовать методы и встроенные инструменты Python, которые поддаются ясности и масштабируемости, как метод высокопроизводительного параллелизма, а также распределенные технологии, которые разрешают высокую скорость передачи данных. Обилие практических упражнений в этом практическом руководстве закрепит эти важные навыки для любого крупномасштабного проекта науки о данных.The goal of this book is to teach a scalable style of programming. To do that, we’ll cover a wider range of material than you might be familiar with from other programming or technology books. Where other books might cover a single library, this book covers many libraries—both built-in modules, such as functools and itertools, as well as third-party libraries, such as toolz, pathos, and mrjob. Where other books cover just one technology, this book covers many, including Hadoop, Spark, and Amazon Web Services (AWS). The choice to cover a broad range of technologies is admitting the fact that to scale your code, you need to be able to adapt to new situations. Across all the technologies, however, I emphasize a “map and reduce” style of programming in Python.