Search Results: practical-statistics-for-data-scientists-50-essential-concepts

Practical Statistics for Data Scientists

50 Essential Concepts

Author: Peter Bruce,Andrew Bruce

Publisher: "O'Reilly Media, Inc."

ISBN: 1491952938

Category: Computers

Page: 318

View: 6002

Statistical methods are a key part of of data science, yet very few data scientists have any formal statistics training. Courses and books on basic statistics rarely cover the topic from a data science perspective. This practical guide explains how to apply various statistical methods to data science, tells you how to avoid their misuse, and gives you advice on what's important and what's not. Many data science resources incorporate statistical methods but lack a deeper statistical perspective. If you’re familiar with the R programming language, and have some exposure to statistics, this quick reference bridges the gap in an accessible, readable format. With this book, you’ll learn: Why exploratory data analysis is a key preliminary step in data science How random sampling can reduce bias and yield a higher quality dataset, even with big data How the principles of experimental design yield definitive answers to questions How to use regression to estimate outcomes and detect anomalies Key classification techniques for predicting which categories a record belongs to Statistical machine learning methods that “learn” from data Unsupervised learning methods for extracting meaning from unlabeled data

Neuronale Netze selbst programmieren

Ein verständlicher Einstieg mit Python

Author: Tariq Rashid

Publisher: O'Reilly

ISBN: 3960101031

Category: Computers

Page: 232

View: 9759

Neuronale Netze sind Schlüsselelemente des Deep Learning und der Künstlichen Intelligenz, die heute zu Erstaunlichem in der Lage sind. Sie sind Grundlage vieler Anwendungen im Alltag wie beispielsweise Spracherkennung, Gesichtserkennung auf Fotos oder die Umwandlung von Sprache in Text. Dennoch verstehen nur wenige, wie neuronale Netze tatsächlich funktionieren. Dieses Buch nimmt Sie mit auf eine unterhaltsame Reise, die mit ganz einfachen Ideen beginnt und Ihnen Schritt für Schritt zeigt, wie neuronale Netze arbeiten: - Zunächst lernen Sie die mathematischen Konzepte kennen, die den neuronalen Netzen zugrunde liegen. Dafür brauchen Sie keine tieferen Mathematikkenntnisse, denn alle mathematischen Ideen werden behutsam und mit vielen Illustrationen und Beispielen erläutert. Eine Kurzeinführung in die Analysis unterstützt Sie dabei. - Dann geht es in die Praxis: Nach einer Einführung in die populäre und leicht zu lernende Programmiersprache Python bauen Sie allmählich Ihr eigenes neuronales Netz mit Python auf. Sie bringen ihm bei, handgeschriebene Zahlen zu erkennen, bis es eine Performance wie ein professionell entwickeltes Netz erreicht. - Im nächsten Schritt tunen Sie die Leistung Ihres neuronalen Netzes so weit, dass es eine Zahlenerkennung von 98 % erreicht – nur mit einfachen Ideen und simplem Code. Sie testen das Netz mit Ihrer eigenen Handschrift und werfen noch einen Blick in das mysteriöse Innere eines neuronalen Netzes. - Zum Schluss lassen Sie das neuronale Netz auf einem Raspberry Pi Zero laufen. Tariq Rashid erklärt diese schwierige Materie außergewöhnlich klar und verständlich, dadurch werden neuronale Netze für jeden Interessierten zugänglich und praktisch nachvollziehbar.

Statistik-Workshop für Programmierer

Author: Allen B. Downey

Publisher: O'Reilly Germany

ISBN: 3868993436

Category: Computers

Page: 160

View: 3306

Wenn Sie programmieren können, beherrschen Sie bereits Techniken, um aus Daten Wissen zu extrahieren. Diese kompakte Einführung in die Statistik zeigt Ihnen, wie Sie rechnergestützt, anstatt auf mathematischem Weg Datenanalysen mit Python durchführen können. Praktischer Programmier-Workshop statt grauer Theorie: Das Buch führt Sie anhand eines durchgängigen Fallbeispiels durch eine vollständige Datenanalyse -- von der Datensammlung über die Berechnung statistischer Kennwerte und Identifikation von Mustern bis hin zum Testen statistischer Hypothesen. Gleichzeitig werden Sie mit statistischen Verteilungen, den Regeln der Wahrscheinlichkeitsrechnung, Visualisierungsmöglichkeiten und vielen anderen Arbeitstechniken und Konzepten vertraut gemacht. Statistik-Konzepte zum Ausprobieren: Entwickeln Sie über das Schreiben und Testen von Code ein Verständnis für die Grundlagen von Wahrscheinlichkeitsrechnung und Statistik: Überprüfen Sie das Verhalten statistischer Merkmale durch Zufallsexperimente, zum Beispiel indem Sie Stichproben aus unterschiedlichen Verteilungen ziehen. Nutzen Sie Simulationen, um Konzepte zu verstehen, die auf mathematischem Weg nur schwer zugänglich sind. Lernen Sie etwas über Themen, die in Einführungen üblicherweise nicht vermittelt werden, beispielsweise über die Bayessche Schätzung. Nutzen Sie Python zur Bereinigung und Aufbereitung von Rohdaten aus nahezu beliebigen Quellen. Beantworten Sie mit den Mitteln der Inferenzstatistik Fragestellungen zu realen Daten.

Datenanalyse mit Python

Auswertung von Daten mit Pandas, NumPy und IPython

Author: Wes McKinney

Publisher: O'Reilly

ISBN: 3960102143

Category: Computers

Page: 542

View: 5132

Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.6, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet Datenanalyse mit Python einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.Aus dem Inhalt:Nutzen Sie die IPython-Shell und Jupyter Notebook für das explorative ComputingLernen Sie Grundfunktionen und fortgeschrittene Features von NumPy kennenSetzen Sie die Datenanalyse-Tools der pandasBibliothek einVerwenden Sie flexible Werkzeuge zum Laden, Bereinigen, Transformieren, Zusammenführen und Umformen von DatenErstellen Sie interformative Visualisierungen mit matplotlibWenden Sie die GroupBy-Mechanismen von pandas an, um Datensätzen zurechtzuschneiden, umzugestalten und zusammenzufassenAnalysieren und manipulieren Sie verschiedenste Zeitreihen-DatenFür diese aktualisierte 2. Auflage wurde der gesamte Code an Python 3.6 und die neuesten Versionen der pandas-Bibliothek angepasst. Neu in dieser Auflage: Informationen zu fortgeschrittenen pandas-Tools sowie eine kurze Einführung in statsmodels und scikit-learn.

Data Science für Dummies

Author: Lillian Pierson

Publisher: John Wiley & Sons

ISBN: 352780675X

Category: Mathematics

Page: 382

View: 4624

Daten, Daten, Daten? Sie haben schon Kenntnisse in Excel und Statistik, wissen aber noch nicht, wie all die Datensätze helfen sollen, bessere Entscheidungen zu treffen? Von Lillian Pierson bekommen Sie das dafür notwendige Handwerkszeug: Bauen Sie Ihre Kenntnisse in Statistik, Programmierung und Visualisierung aus. Nutzen Sie Python, R, SQL, Excel und KNIME. Zahlreiche Beispiele veranschaulichen die vorgestellten Methoden und Techniken. So können Sie die Erkenntnisse dieses Buches auf Ihre Daten übertragen und aus deren Analyse unmittelbare Schlüsse und Konsequenzen ziehen.

Mathematik für Informatiker

Ein praxisbezogenes Lehrbuch

Author: Peter Hartmann

Publisher: Springer-Verlag

ISBN: 3834820024

Category: Computers

Page: 520

View: 5537

Dieses Buch enthält den Mathematik-Stoff, der für das Informatik-Studium an Fachhochschulen benötigt wird. Die Stoffauswahl und Ausführlichkeit der Darstellung sind auf die Informatik ausgerichtet und der praxisorientierten Ausbildung an Fachhochschulen angepasst. Das heißt: Sie finden immer wieder konkrete Anwendungen aus der Informatik, so erkennen Sie die Nützlichkeit der Mathematik für Ihr Fachgebiet. Das Buch zeigt durch die ausführliche Motivation der Ergebnisse, durch viele Beispiele, durch das ständige Aufzeigen von Querbezügen zwischen Mathematik und Informatik und auch durch gelegentliche Ausblicke in die Welt der "richtigen" Mathematik, dass Mathematik nicht nur nützlich ist, sondern interessant sein kann und sogar Spaß macht.

Data Science mit Python

Das Handbuch für den Einsatz von IPython, Jupyter, NumPy, Pandas, Matplotlib und Scikit-Learn

Author: Jake VanderPlas

Publisher: MITP-Verlags GmbH & Co. KG

ISBN: 3958456979

Category: Computers

Page: 552

View: 9255

Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: ● IPython und Jupyter für datenintensive Berechnungen ● NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python ● Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten ● Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

SQL f?r Dummies

Author: Allen G. Taylor

Publisher: John Wiley & Sons

ISBN: 352768039X

Category: Computers

Page: 432

View: 6001

Datenbanken sind das beste Werkzeug, um wichtige Informationen im Auge zu behalten. Mit SQL k?nnen die vorhandenen Daten strukturiert und zielsicher abgefragt werden. In "SQL f?r Dummies" macht Allen G. Taylor die Leser mit der Abfragesprache SQL und dem aktuellen Standard SQL:2011 verst?ndlich und humorvoll vertraut. Er beginnt mit dem notwendigen Grundlagenwissen f?r den Aufbau eines Datenbankmanagementsystems und den SQL-Hauptkomponenten, zeigt auf, wie man die Daten erstellt, ordnet und abfragt und SQL-Anweisungen in Programme einbindet. Zudem erkl?rt er, wie SQL mit XML verkn?pft werden kann, um Websites mit einer Datenbank zu verbinden. Au?erdem gibt es jede Menge Profi-Informationen, wie man zum Beispiel Datenbanken und Daten sch?tzen kann und Fehler lokalisiert und behebt.

Programmieren mit R

Author: Uwe Ligges

Publisher: Springer-Verlag

ISBN: 3540267328

Category: Mathematics

Page: 237

View: 5974

R ist eine objekt-orientierte und interpretierte Sprache und Programmierumgebung für Datenanalyse und Grafik - frei erhältlich unter der GPL. Ziel dieses Buches ist es, nicht nur ausführlich in die Grundlagen der Sprache R einzuführen, sondern auch ein Verständnis der Struktur der Sprache zu vermitteln. Leicht können so eigene Methoden umgesetzt, Objektklassen definiert und ganze Pakete aus Funktionen und zugehöriger Dokumentation zusammengestellt werden. Die enormen Grafikfähigkeiten von R werden detailliert beschrieben. Das Buch richtet sich an alle, die R als flexibles Werkzeug zur Datenenalyse und -visualisierung einsetzen möchten: Studierende, die Daten in Projekten oder für ihre Diplomarbeit analysieren möchten, Forschende, die neue Methoden ausprobieren möchten, und diejenigen, die in der Wirtschaft täglich Daten aufbereiten, analysieren und anderen in komprimierter Form präsentieren.

R für Data Science

Daten importieren, bereinigen, umformen, modellieren und visualisieren

Author: Hadley Wickham,Garrett Grolemund

Publisher: O'Reilly

ISBN: 3960101546

Category: Computers

Page: 502

View: 1123

Lernen Sie, wie Sie mit R Ihre Rohdaten in Erkenntnisse und Wissen umwandeln. Dieses Buch führt Sie ein in R, RStudio und tidyverse – eine Sammlung von R-Paketen, die ineinandergreifen, um Data Science schnell, flüssig und komfortabel zu machen. R für Data Science ist geeignet für Leser ohne vorherige Programmierkenntnisse und zielt darauf ab, dass Sie Techniken der Data Science so schnell wie möglich in der Praxis umsetzen können. Die Autoren Hadley Wickham und Garrett Grolemund zeigen, wie Sie Daten importieren, aufbereiten, untersuchen und modellieren und wie Sie die Ergebnisse kommunizieren können. So bekommen Sie einen vollständigen Überblick über den Data-Science-Zyklus und die Tools, die für die Detailarbeit erforderlich sind.

Statistik für Dummies

Author: Deborah Rumsey

Publisher: John Wiley & Sons

ISBN: 3527705945

Category: Mathematics

Page: 352

View: 8329

Entdecken Sie mit "Statistik für Dummies" Ihren Spaß an der Statistik und werfen Sie einen Blick hinter die Kulissen der so beliebten Manipulation von Zahlenmaterial! Deborah Rumsey zeigt Ihnen das nötige statistische Handwerkszeug wie Stichprobe, Wahrscheinlichkeit, Bias, Median, Durchschnitt und Korrelation. Sie lernen die verschiedenen grafischen Darstellungsmöglichkeiten von statistischem Material kennen und werden über die unterschiedlichen Methoden der Auswertung erstaunt sein. Schärfen Sie mit diesem Buch Ihr Bewusstsein für Zahlen und deren Interpretation, so dass Ihnen keiner mehr etwas vormachen kann!

Visualize This!

Author: Nathan Yau

Publisher: John Wiley & Sons

ISBN: 3527760229

Category: Statistics / Graphic methods / Data processing

Page: 422

View: 3896

A guide on how to visualise and tell stories with data, providing practical design tips complemented with step-by-step tutorials.

Data Science für Unternehmen

Data Mining und datenanalytisches Denken praktisch anwenden

Author: Foster Provost,Tom Fawcett

Publisher: MITP-Verlags GmbH & Co. KG

ISBN: 3958455484

Category: Computers

Page: 432

View: 1971

R für Dummies

Author: Andrie de Vries,Joris Meys

Publisher: John Wiley & Sons

ISBN: 3527812520

Category: Computers

Page: 414

View: 9205

Wollen Sie auch die umfangreichen Möglichkeiten von R nutzen, um Ihre Daten zu analysieren, sind sich aber nicht sicher, ob Sie mit der Programmiersprache wirklich zurechtkommen? Keine Sorge - dieses Buch zeigt Ihnen, wie es geht - selbst wenn Sie keine Vorkenntnisse in der Programmierung oder Statistik haben. Andrie de Vries und Joris Meys zeigen Ihnen Schritt für Schritt und anhand zahlreicher Beispiele, was Sie alles mit R machen können und vor allem wie Sie es machen können. Von den Grundlagen und den ersten Skripten bis hin zu komplexen statistischen Analysen und der Erstellung aussagekräftiger Grafiken. Auch fortgeschrittenere Nutzer finden in diesem Buch viele Tipps und Tricks, die Ihnen die Datenauswertung erleichtern.

Einführung in TensorFlow

Deep-Learning-Systeme programmieren, trainieren, skalieren und deployen

Author: Tom Hope,Yehezkel S. Resheff,Itay Lieder

Publisher: O'Reilly

ISBN: 3960101813

Category: Computers

Page: 238

View: 8331

Deep-Learning-Netze, die mit großen Datenmengen angelernt wurden, lösen komplexe Aufgaben mit erstaunlicher Genauigkeit. TensorFlow ist die führende Open-Source-Bibliothek zum Erstellen und Trainieren neuronaler Deep-Learning-Netze z.B. für die Sprach- und Bilderkennung, die Verarbeitung natürlicher Sprache (NLP) oder die vorhersagende Datenanalyse. Dieses Buch bietet einer breiten technisch orientierten Leserschaft einen praxisnahen Zugang zu den Grundlagen von TensorFlow.Sie erarbeiten zunächst einige einfache Beispielaufgaben mit TensorFlow und tauchen anschließend tiefer in Themen ein wie die Architektur neuronaler Netze, die Visualisierung mit TensorBoard, Abstraktionsbibliotheken für TensorFlow oder Multithread-Pipelines zur Dateneingabe. Wenn Sie dieses Buch durchgearbeitet haben, sind Sie in der Lage, Deep-Learning-Systeme mit TensorFlow zu erstellen und im Produktivbetrieb einzusetzen.

Python kurz & gut

Author: Mark Lutz

Publisher: O'Reilly Germany

ISBN: 3955617718

Category: Computers

Page: 280

View: 1905

Die objektorientierte Sprache Python eignet sich hervorragend zum Schreiben von Skripten, Programmen und Prototypen. Sie ist frei verfügbar, leicht zu lernen und zwischen allen wichtigen Plattformen portabel, einschließlich Linux, Unix, Windows und Mac OS. Damit Sie im Programmieralltag immer den Überblick behalten, sind die verschiedenen Sprachmerkmale und Elemente in Python – kurz & gut übersichtlich zusammengestellt. Für Auflage 5 wurde die Referenz komplett überarbeitet, erweitert und auf den neuesten Stand gebracht, so dass sie die beiden aktuellen Versionen 2.7 und 3.4 berücksichtigt. Python – kurz & gut behandelt unter anderem: Eingebaute Typen wie Zahlen, Listen, Dictionarys u.v.a.; nweisungen und Syntax für Entwicklung und Ausführung von Objekten; Die objektorientierten Entwicklungstools in Python; Eingebaute Funktionen, Ausnahmen und Attribute; pezielle Methoden zur Operatorenüberladung; Weithin benutzte Standardbibliotheksmodule und Erweiterungen; Kommandozeilenoptionen und Entwicklungswerkzeuge. Mark Lutz stieg 1992 in die Python-Szene ein und ist seitdem als aktiver Pythonista bekannt. Er gibt Kurse, hat zahlreiche Bücher geschrieben und mehrere Python-Systeme programmiert.

SQL von Kopf bis Fuss

Author: Lynn Beighley

Publisher: O'Reilly Germany

ISBN: 3955619443

Category: Computers

Page: 608

View: 9068

Ihre Daten erdrücken Sie? Ihre Tabellen verheddern sich regelmäßig? Wir haben ein Mittel, wie Sie Ihre Datenbanken in den Griff bekommen: SQL von Kopf bis Fuß nimmt Sie mit auf eine Reise durch die SQL-Welt, es geleitet Sie von einfachen INSERT-Anweisungen und SELECT-Abfragen zu knallharten Datenbank-Manipulationen mit Indizes, Joins und Transaktionen. Erwarten Sie dennoch Spaß, gehen Sie davon aus, etwas zu lernen, und machen Sie sich darauf gefasst, dass Sie Ihre Daten wie ein Profi abfragen, normalisieren und verknüpfen werden, noch bevor Sie dieses Buch ausgelesen haben. SQL von Kopf bis Fuß ist in einem visuell abwechslungsreichen Format gestaltet, das sich an den neuesten Forschungsergebnissen aus Kognitionswissenschaft und Lerntheorie orientiert und Ihnen das Lernen so einfach wie möglich machen soll. Das Buch bietet Ihnen ein unterhaltsames Lernerlebnis und spielt Ihnen SQL direkt ins Hirn - und zwar so, dass es sitzt.

Wahrscheinlichkeitsrechnung und Statistik

Author: Robert Hafner

Publisher: Springer-Verlag

ISBN: 3709169445

Category: Mathematics

Page: 512

View: 4454

Das Buch ist eine Einführung in die Wahrscheinlichkeitsrechnung und mathematische Statistik auf mittlerem mathematischen Niveau. Die Pädagogik der Darstellung unterscheidet sich in wesentlichen Teilen – Einführung der Modelle für unabhängige und abhängige Experimente, Darstellung des Suffizienzbegriffes, Ausführung des Zusammenhanges zwischen Testtheorie und Theorie der Bereichschätzung, allgemeine Diskussion der Modellentwicklung – erheblich von der anderer vergleichbarer Lehrbücher. Die Darstellung ist, soweit auf diesem Niveau möglich, mathematisch exakt, verzichtet aber bewußt und ebenfalls im Gegensatz zu vergleichbaren Texten auf die Erörterung von Meßbarkeitsfragen. Der Leser wird dadurch erheblich entlastet, ohne daß wesentliche Substanz verlorengeht. Das Buch will allen, die an der Anwendung der Statistik auf solider Grundlage interessiert sind, eine Einführung bieten, und richtet sich an Studierende und Dozenten aller Studienrichtungen, für die mathematische Statistik ein Werkzeug ist.

Grundlagen der Mathematik für Dummies

Author: Mark Zegarelli

Publisher: John Wiley & Sons

ISBN: 3527657657

Category: Mathematics

Page: 353

View: 7962

Mathematik ist nicht jedermanns Sache, manchmal sind es schon die Grundlagen, die fehlen: Einst gelernt, doch jetzt vergessen. Bruch- und Prozentrechnung, Fl?cheninhalt, Gleichungen, wie funktionierte das noch einmal? Mark Zegarelli erkl?rt es Ihnen, einfach und am?sant und immer schnell auf dem Punkt, hilft er Ihnen Ihre Wissensl?cken zu schlie?en. So verlieren Geometrie und Algebra f?r Sie den Schrecken.

Find eBook