Big Data for Chimps: A Guide to Massive-Scale Data Processing in Practice + code


Книга Big Data for Chimps: A Guide to Massive-Scale Data Processing in Practice + code


Название: Big Data for Chimps: A Guide to Massive-Scale Data Processing in Practice
Автор:Philip (flip) Kromer, Russell Jurney
Издательство: O'Reilly Media
Год: 2015
Страниц: 220
Язык: English
Формат: pdf+code
Размер: 3,5 Mb
Finding patterns in massive event streams can be difficult, but learning how to find them doesn’t have to be. This unique hands-on guide shows you how to solve this and many other problems in large-scale data processing with simple, fun, and elegant tools that leverage Apache Hadoop. You’ll gain a practical, actionable view of big data by working with real data and real problems.
Perfect for beginners, this book’s approach will also appeal to experienced practitioners who want to brush up on their skills. Part I explains how Hadoop and MapReduce work, while Part II covers many analytic patterns you can use to process any data. As you work through several exercises, you’ll also learn how to use Apache Pig to process data.
Learn the necessary mechanics of working with Hadoop, including how data and computation move around the cluster
Dive into map/reduce mechanics and build your first map/reduce job in Python
Understand how to run chains of map/reduce jobs in the form of Pig scripts
Use a real-world dataset—baseball performance statistics—throughout the book
Work with examples of several analytic patterns, and learn when and where you might use them
Introduction: Theory and Tools
Chapter 1Hadoop Basics
Chimpanzee and Elephant Start a Business
Map-Only Jobs: Process Records Individually
Pig Latin Map-Only Job
Setting Up a Docker Hadoop Cluster
Wrapping Up
Chapter 2MapReduce
Chimpanzee and Elephant Save Christmas
Pygmy Elephants Carry Each Toy Form to the Appropriate Workbench
Example: Reindeer Games
Hadoop Versus Traditional Databases
The MapReduce Haiku
Wrapping Up
Chapter 3A Quick Look into Baseball
The Data
Acronyms and Terminology
The Rules and Goals
Performance Metrics
Wrapping Up
Chapter 4Introduction to Pig
Pig Helps Hadoop Work with Tables, Not Records
Fundamental Data Operations
LOAD Locates and Describes Your Data
STORE Writes Data to Disk
Development Aid Commands
Pig Functions
Piggybank
Apache DataFu
Wrapping Up
Tactics: Analytic Patterns
Chapter 5Map-Only Operations
Pattern in Use
Eliminating Data
Selecting Records That Satisfy a Condition: FILTER and Friends
Project Only Chosen Columns by Name
Transforming Records
Operations That Break One Table into Many
Operations That Treat the Union of Several Tables as One
Wrapping Up
Chapter 6Grouping Operations
Grouping Records into a Bag by Key
Group and Aggregate
Calculating the Distribution of Numeric Values with a Histogram
The Summing Trick
Wrapping Up
References
Chapter 7Joining Tables
Matching Records Between Tables (Inner Join)
How a Join Works
Enumerating a Many-to-Many Relationship
Joining a Table with Itself (Self-Join)
Joining Records Without Discarding Nonmatches (Outer Join)
Selecting Only Records That Lack a Match in Another Table (Anti-Join)
Selecting Only Records That Possess a Match in Another Table (Semi-Join)
Wrapping Up
Chapter 8Ordering Operations
Preparing Career Epochs
Sorting All Records in Total Order
Sorting Records Within a Group
Numbering Records in Rank Order
Wrapping Up
Chapter 9Duplicate and Unique Records
Handling Duplicates
Set Operations
Wrapping Up
book+code
depositfiles.com
turbobit.net

Рейтинг: 4.8 баллов / 2537 оценок
Формат: Книга
Уже скачали: 12770 раз



Похожие Книги

Нам показалось, что Книги ниже Вас заинтересуют не меньше. Эти издания Вы так же можете скачивать и читать совершенно бесплатно на сайте!

  • Журнал Вяжем САМИ Спецвыпуск 2009: Шапки, шали, шарфы и веселые носки

    Вяжем САМИ Спецвыпуск 2009: Шапки, шали, шарфы и веселые носки

    Название: Вяжем САМИ Год: 2009 Страниц: 34 Размер: 15.8мб Формат: jpeg Журнал по вязанию спицами и крючком. Тема номера: Шапки, шали, шарфы и веселые носки. uploadbox.com ifolder.ru . . .

  • Журнал Debbi Bliss 2009 Spring-Summer

    Debbi Bliss 2009 Spring-Summer

    Название: Debbi Bliss Год: 2009 Страниц: 72 Формат: jpeg Размер: 21.6мб Журнал по вязанию спицами. uploadbox.com depositfiles.com . . .

  • Книга Иван Бунин. Полное собрание сочинений (16 книг)

    Иван Бунин. Полное собрание сочинений (16 книг)

    Название: Иван Бунин. Полное собрание сочинений (16 книг) Автор: Иван Бунин Издательство: Разные Год издания: 2006-2007 Язык: Русский Формат: PDF Качество: отличное Размер: 181,1 МбОписание: Впервые . . .

  • Книга Кобен Харлан - Прошлое не отпустит

    Кобен Харлан - Прошлое не отпустит

    Название: Прошлое не отпустит Автор: Кобен Харлан Серия: Супердетективы Харлана Кобена Страниц: 416 Издательство: АСТ Год: 2014 Формат: fb2,epub,pdf,rtf,txt Качество: отличное Размер файла: 9.15 Мб Яз . . .

  • Книга Казанцев Кирилл - Отпуск строгого режима

    Казанцев Кирилл - Отпуск строгого режима

    Название: Отпуск строгого режима Автор: Казанцев Кирилл Серия: Воровская любовь Страниц: 352 Издательство: Эксмо Год: 2013 Формат: fb2,epub,pdf,rtf,txt Качество: отличное Размер файла: 6,37 Мб Язык: р . . .

  • Книга Серия "Майрон Болитар" (7 книг)

    Серия "Майрон Болитар" (7 книг)

    Новая книжная серия "Майрон Болитар" написана американским писателем Харланом Кобеном. Харлан Кобен – признанный мастер современного триллера, лауреат многих престижных премий, присуждаемых за достиже . . .

  • Книга Кротков Антон - Загадка о русском экспрессе

    Кротков Антон - Загадка о русском экспрессе

    Название: Загадка о русском экспрессе Автор: Кротков Антон Павлович Страниц: 352 Издательство: АСТ Год: 2014 Формат: fb2,epub,pdf,rtf,txt Качество: отличное Размер файла: 6,45 Мб Язык: русский ISBN: 9 . . .

  • Книга Сборник произведений Ирины Хрусталевой (34 книги)

    Сборник произведений Ирины Хрусталевой (34 книги)

    Автор иронического детектива Ирина Хрусталёва родилась в 1957 году. Её книги основательно заняли свою нишу среди многочисленных произведений современных авторов этого жанра. Особенно большим успехом о . . .

  • Книга Сборник произведений - Майкл Коннелли (23книги)

    Сборник произведений - Майкл Коннелли (23книги)

    Название: Сборник произведений - Майкл Коннелли (23книги) Автор: Майкл Коннелли Издательство: Разные Год выпуска: 1995-2013 Страниц: много Формат: fb2 Размер: 21.3 Mb Качество: отличное Язык: русски . . .

  • Книга Книги Питера Бенчли

    Книги Питера Бенчли

    Из неимоверных глубин Мирового океана поднимается чудовище, несущее с собой первобытный ужас и смерть. Все живое, что попадает в его мир, это жуткое создание воспринимает одинаково — как объект для ун . . .


Вы не зарегистрированы!

Если вы хотите скачивать книги, журналы и аудиокниги бесплатно, без рекламы и без смс, оставлять комментарии и отзывы, учавствовать в различных интересных мероприятиях, получать скидки в книжных магазинах и многое другое, то Вам необходимо зарегистрироваться в нашей Электронной Библиотеке.

Отзывы читателей


Ой!

К сожалению, в нашей Бесплатной Библиотеке пока нет отзывов о Книге Big Data for Chimps: A Guide to Massive-Scale Data Processing in Practice + code. Помогите нам и другим читателям окунуться в сюжет Книги и узнать Ваше мнение. Оставьте свой отзыв или обзор сейчас, это займет у Вас всего-лишь несколько минут.