R for Data Science

Import, Tidy, Transform, Visualize, and Model Data

Author: Hadley Wickham,Garrett Grolemund

Publisher: "O'Reilly Media, Inc."

ISBN: 1491910348

Category: Computers

Page: 520

View: 9785

Learn how to use R to turn raw data into insight, knowledge, and understanding. This book introduces you to R, RStudio, and the tidyverse, a collection of R packages designed to work together to make data science fast, fluent, and fun. Suitable for readers with no previous programming experience, R for Data Science is designed to get you doing data science as quickly as possible. Authors Hadley Wickham and Garrett Grolemund guide you through the steps of importing, wrangling, exploring, and modeling your data and communicating the results. You’ll get a complete, big-picture understanding of the data science cycle, along with basic tools you need to manage the details. Each section of the book is paired with exercises to help you practice what you’ve learned along the way. You’ll learn how to: Wrangle—transform your datasets into a form convenient for analysis Program—learn powerful R tools for solving data problems with greater clarity and ease Explore—examine your data, generate hypotheses, and quickly test them Model—provide a low-dimensional summary that captures true "signals" in your dataset Communicate—learn R Markdown for integrating prose, code, and results

Data Science

Eine praxisorientierte Einführung im Umfeld von Machine Learning, künstlicher Intelligenz und Big Data

Author: Michael Oettinger

Publisher: tredition

ISBN: 3743936291

Category: Computers

Page: 208

View: 4060

Data Scientisten (m/w) sind derzeit auf dem Jobmarkt heißbegehrt. In Amerika sind erfahrene Data Scientisten so beliebt wie eine Getränkebude in der Wüste. Aber auch in Deutschland ist eine steigende Nachfrage nach diesem Skillprofil erkennbar. Immer mehr Unternehmen bauen "Analytics"-Abteilungen auf bzw. aus und suchen entsprechende Mitarbeiter. Nur: was macht eigentlich ein Data Scientist? Irgendetwas mit künstlicher Intelligenz, Machine Learning, Data-Mining, Python-Programmierung und Big Data. So genau weiß es eigentlich niemand ... Das Buch ist eine Einführung und Übersicht über das weitumfassende Themengebiet Data Science. Es werden die Datenquellen (Datenbanken, Data-Warehouse, Hadoop etc.) und die Softwareprodukte für die Datenanalyse vorgestellt (Data-Science-Plattformen, ML Bibliotheken). Die wichtigsten Verfahren des Machine Learnings werden ebenso behandelt wie beispielhafte Anwendungsfälle aus verschiedenen Branchen.

R für Data Science

Daten importieren, bereinigen, umformen, modellieren und visualisieren

Author: Hadley Wickham,Garrett Grolemund

Publisher: O'Reilly

ISBN: 3960101546

Category: Computers

Page: 502

View: 8428

Lernen Sie, wie Sie mit R Ihre Rohdaten in Erkenntnisse und Wissen umwandeln. Dieses Buch führt Sie ein in R, RStudio und tidyverse – eine Sammlung von R-Paketen, die ineinandergreifen, um Data Science schnell, flüssig und komfortabel zu machen. R für Data Science ist geeignet für Leser ohne vorherige Programmierkenntnisse und zielt darauf ab, dass Sie Techniken der Data Science so schnell wie möglich in der Praxis umsetzen können. Die Autoren Hadley Wickham und Garrett Grolemund zeigen, wie Sie Daten importieren, aufbereiten, untersuchen und modellieren und wie Sie die Ergebnisse kommunizieren können. So bekommen Sie einen vollständigen Überblick über den Data-Science-Zyklus und die Tools, die für die Detailarbeit erforderlich sind.

Datenanalyse mit Python

Auswertung von Daten mit Pandas, NumPy und IPython

Author: Wes McKinney

Publisher: O'Reilly

ISBN: 3960102143

Category: Computers

Page: 542

View: 8688

Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.6, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet Datenanalyse mit Python einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.Aus dem Inhalt:Nutzen Sie die IPython-Shell und Jupyter Notebook für das explorative ComputingLernen Sie Grundfunktionen und fortgeschrittene Features von NumPy kennenSetzen Sie die Datenanalyse-Tools der pandasBibliothek einVerwenden Sie flexible Werkzeuge zum Laden, Bereinigen, Transformieren, Zusammenführen und Umformen von DatenErstellen Sie interformative Visualisierungen mit matplotlibWenden Sie die GroupBy-Mechanismen von pandas an, um Datensätzen zurechtzuschneiden, umzugestalten und zusammenzufassenAnalysieren und manipulieren Sie verschiedenste Zeitreihen-DatenFür diese aktualisierte 2. Auflage wurde der gesamte Code an Python 3.6 und die neuesten Versionen der pandas-Bibliothek angepasst. Neu in dieser Auflage: Informationen zu fortgeschrittenen pandas-Tools sowie eine kurze Einführung in statsmodels und scikit-learn.

R für Dummies

Author: Andrie de Vries,Robert Leidenfrost

Publisher: John Wiley & Sons

ISBN: 3527812520

Category: Computers

Page: 414

View: 6677


Data Science für Dummies

Author: Lillian Pierson

Publisher: John Wiley & Sons

ISBN: 352780675X

Category: Mathematics

Page: 382

View: 5656

Daten, Daten, Daten ?, Sie haben schon Kenntnisse in Excel und Statistik, wissen aber noch nicht, wie all die Datensï¿1⁄2tze helfen sollen, bessere Entscheidungen zu treffen? Von Lillian Pierson bekommen Sie das dafï¿1⁄2r notwendige Handwerkszeug: Bauen Sie Ihre Kenntnisse in Statistik, Programmierung und Visualisierung aus. Nutzen Sie Python, R, SQL, Excel und KNIME. Zahlreiche Beispiele veranschaulichen die vorgestellten Methoden und Techniken. So kï¿1⁄2nnen Sie die Erkenntnisse dieses Buches auf Ihre Daten ï¿1⁄2bertragen und aus deren Analyse unmittelbare Schlï¿1⁄2sse und Konsequenzen ziehen.

Leben 3.0

Mensch sein im Zeitalter Künstlicher Intelligenz

Author: Max Tegmark

Publisher: Ullstein Buchverlage

ISBN: 3843716706

Category: Social Science

Page: 528

View: 1526

Die Nobelpreis-Schmiede Massachusetts Institute of Technology ist der bedeutendste technologische Think Tank der USA. Dort arbeitet Professor Max Tegmark mit den weltweit führenden Entwicklern künstlicher Intelligenz zusammen, die ihm exklusive Einblicke in ihre Labors gewähren. Die Erkenntnisse, die er daraus zieht, sind atemberaubend und zutiefst verstörend zugleich. Neigt sich die Ära der Menschen dem Ende zu? Der Physikprofessor Max Tegmark zeigt anhand der neusten Forschung, was die Menschheit erwartet. Hier eine Auswahl möglicher Szenarien: - Eroberer: Künstliche Intelligenz übernimmt die Macht und entledigt sich der Menschheit mit Methoden, die wir noch nicht einmal verstehen. - Der versklavte Gott: Die Menschen bemächtigen sich einer superintelligenten künstlichen Intelligenz und nutzen sie, um Hochtechnologien herzustellen. - Umkehr: Der technologische Fortschritt wird radikal unterbunden und wir kehren zu einer prä-technologischen Gesellschaft im Stil der Amish zurück. - Selbstzerstörung: Superintelligenz wird nicht erreicht, weil sich die Menschheit vorher nuklear oder anders selbst vernichtet. - Egalitäres Utopia: Es gibt weder Superintelligenz noch Besitz, Menschen und kybernetische Organismen existieren friedlich nebeneinander. Max Tegmark bietet kluge und fundierte Zukunftsszenarien basierend auf seinen exklusiven Einblicken in die aktuelle Forschung zur künstlichen Intelligenz.

Statistik-Workshop für Programmierer

Author: Allen B. Downey

Publisher: O'Reilly Germany

ISBN: 3868993436

Category: Computers

Page: 160

View: 3426

Wenn Sie programmieren können, beherrschen Sie bereits Techniken, um aus Daten Wissen zu extrahieren. Diese kompakte Einführung in die Statistik zeigt Ihnen, wie Sie rechnergestützt, anstatt auf mathematischem Weg Datenanalysen mit Python durchführen können. Praktischer Programmier-Workshop statt grauer Theorie: Das Buch führt Sie anhand eines durchgängigen Fallbeispiels durch eine vollständige Datenanalyse -- von der Datensammlung über die Berechnung statistischer Kennwerte und Identifikation von Mustern bis hin zum Testen statistischer Hypothesen. Gleichzeitig werden Sie mit statistischen Verteilungen, den Regeln der Wahrscheinlichkeitsrechnung, Visualisierungsmöglichkeiten und vielen anderen Arbeitstechniken und Konzepten vertraut gemacht. Statistik-Konzepte zum Ausprobieren: Entwickeln Sie über das Schreiben und Testen von Code ein Verständnis für die Grundlagen von Wahrscheinlichkeitsrechnung und Statistik: Überprüfen Sie das Verhalten statistischer Merkmale durch Zufallsexperimente, zum Beispiel indem Sie Stichproben aus unterschiedlichen Verteilungen ziehen. Nutzen Sie Simulationen, um Konzepte zu verstehen, die auf mathematischem Weg nur schwer zugänglich sind. Lernen Sie etwas über Themen, die in Einführungen üblicherweise nicht vermittelt werden, beispielsweise über die Bayessche Schätzung. Nutzen Sie Python zur Bereinigung und Aufbereitung von Rohdaten aus nahezu beliebigen Quellen. Beantworten Sie mit den Mitteln der Inferenzstatistik Fragestellungen zu realen Daten.

Data Science mit Python

Das Handbuch für den Einsatz von IPython, Jupyter, NumPy, Pandas, Matplotlib und Scikit-Learn

Author: Jake VanderPlas

Publisher: MITP-Verlags GmbH & Co. KG

ISBN: 3958456979

Category: Computers

Page: 552

View: 2065

Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: ● IPython und Jupyter für datenintensive Berechnungen ● NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python ● Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten ● Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

R in a Nutshell

Author: Joseph Adler

Publisher: O'Reilly Germany

ISBN: 3897216507

Category: Computers

Page: 768

View: 9258

Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.

Nonparametric Models for Longitudinal Data

With Implementation in R

Author: Colin O. Wu,Xin Tian

Publisher: CRC Press

ISBN: 0429939086

Category: Mathematics

Page: 552

View: 4019

Nonparametric Models for Longitudinal Data with Implementations in R presents a comprehensive summary of major advances in nonparametric models and smoothing methods with longitudinal data. It covers methods, theories, and applications that are particularly useful for biomedical studies in the era of big data and precision medicine. It also provides flexible tools to describe the temporal trends, covariate effects and correlation structures of repeated measurements in longitudinal data. This book is intended for graduate students in statistics, data scientists and statisticians in biomedical sciences and public health. As experts in this area, the authors present extensive materials that are balanced between theoretical and practical topics. The statistical applications in real-life examples lead into meaningful interpretations and inferences. Features: Provides an overview of parametric and semiparametric methods Shows smoothing methods for unstructured nonparametric models Covers structured nonparametric models with time-varying coefficients Discusses nonparametric shared-parameter and mixed-effects models Presents nonparametric models for conditional distributions and functionals Illustrates implementations using R software packages Includes datasets and code in the authors’ website Contains asymptotic results and theoretical derivations Both authors are mathematical statisticians at the National Institutes of Health (NIH) and have published extensively in statistical and biomedical journals. Colin O. Wu earned his Ph.D. in statistics from the University of California, Berkeley (1990), and is also Adjunct Professor at the Georgetown University School of Medicine. He served as Associate Editor for Biometrics and Statistics in Medicine, and reviewer for National Science Foundation, NIH, and the U.S. Department of Veterans Affairs. Xin Tian earned her Ph.D. in statistics from Rutgers, the State University of New Jersey (2003). She has served on various NIH committees and collaborated extensively with clinical researchers.

Programmieren lernen mit Python

Author: Allen B. Downey

Publisher: O'Reilly Germany

ISBN: 3955618072

Category: Computers

Page: 320

View: 2057

Python ist eine moderne, interpretierte, interaktive und objektorientierte Skriptsprache, vielseitig einsetzbar und sehr beliebt. Mit mathematischen Vorkenntnissen ist Python leicht erlernbar und daher die ideale Sprache für den Einstieg in die Welt des Programmierens. Das Buch führt Sie Schritt für Schritt durch die Sprache, beginnend mit grundlegenden Programmierkonzepten, über Funktionen, Syntax und Semantik, Rekursion und Datenstrukturen bis hin zum objektorientierten Design. Zur aktualisierten Auflage Diese Auflage behandelt Python 3, geht dabei aber auch auf Unterschiede zu Python 2 ein. Außerdem wurde das Buch um die Themen Unicode, List und Dictionary Comprehensions, den Mengen-Typ Set, die String-Format-Methode und print als Funktion ergänzt. Jenseits reiner Theorie Jedes Kapitel enthält passende Übungen und Fallstudien, kurze Verständnistests und kleinere Projekte, an denen Sie die neu erlernten Programmierkonzepte gleich ausprobieren und festigen können. Auf diese Weise können Sie das Gelernte direkt anwenden und die jeweiligen Programmierkonzepte nachvollziehen. Lernen Sie Debugging-Techniken kennen Am Ende jedes Kapitels finden Sie einen Abschnitt zum Thema Debugging, der Techniken zum Aufspüren und Vermeiden von Bugs sowie Warnungen vor entsprechenden Stolpersteinen in Python enthält.

Applied Financial Economics -- Programming

Excel, VBA and R

Author: Chiu Yu Ko

Publisher: Chiu Yu Ko

ISBN: N.A

Category:

Page: 267

View: 9209

This book is about programming for trading in financial market. We cover Excel (Part 1), Excel VBA (Part 2) and R (Part3) are covered. We first cover Excel that requires minimum programming technique, it is desirable to start learning it first. Then Excel VBA is covered to provide a smooth transition to more complicated R programming. In particular, students first learn how to use Excel to generate a simple trading system and this builds the foundation for the more complicated trading system in R. Excel VBA is commonly used for computationally less demanding calculations in both academic and business world. Students are prepared to how to use them to do various financial analysis including fundamental analysis, technical analysis and time series analysis. In particular, students will learn how to write an analyst report, and create computer-aided technical trading system. R is widely used in computationally heavy financial and statistical computation. Students are prepared how to do data manipulation, conduct econometric analysis (regression, time series), plotting package, webscrapping, and financial analysis. In particular, students will learn how to backtest complex trading strategy and evaluate the performance.

HCI in Business, Government and Organizations. Supporting Business

4th International Conference, HCIBGO 2017, Held as Part of HCI International 2017, Vancouver, BC, Canada, July 9-14, 2017, Proceedings

Author: Fiona Fui-Hoon Nah,Chuan-Hoo Tan

Publisher: Springer

ISBN: 3319584847

Category: Computers

Page: 457

View: 4027

This 2-volume set constitutes the refereed proceedings of the 4th International Conference on HCI in Business, Government and Organizations, HCIBGO 2017, held as part of the 19 International Conference on Human-Computer Interaction , HCII 2017, which took place in Vancouver, Canada, in July 2017. HCII 2017 received a total of 4340 submissions, of which 1228 papers were accepted for publication after a careful reviewing process. The 35 papers presented in this volume, focusing on supporting business, are organized in topical sections named: e-commerce and consumer behavior; social media for business; analytics, visualization and decision support.

Die Berechnung der Zukunft

Warum die meisten Prognosen falsch sind und manche trotzdem zutreffen - Der New York Times Bestseller

Author: Nate Silver

Publisher: Heyne Verlag

ISBN: 3641112702

Category: Business & Economics

Page: 656

View: 3951

Zuverlässige Vorhersagen sind doch möglich! Nate Silver ist der heimliche Gewinner der amerikanischen Präsidentschaftswahlen 2012: ein begnadeter Statistiker, als »Prognose-Popstar« und »Wundernerd« weltberühmt geworden. Er hat die Wahlergebnisse aller 50 amerikanischen Bundesstaaten absolut exakt vorausgesagt – doch damit nicht genug: Jetzt zeigt Nate Silver, wie seine Prognosen in Zukunft Terroranschläge, Umweltkatastrophen und Finanzkrisen verhindern sollen. Gelingt ihm die Abschaffung des Zufalls? Warum werden Wettervorhersagen immer besser, während die Terrorattacken vom 11.09.2001 niemand kommen sah? Warum erkennen Ökonomen eine globale Finanzkrise nicht einmal dann, wenn diese bereits begonnen hat? Das Problem ist nicht der Mangel an Informationen, sondern dass wir die verfügbaren Daten nicht richtig deuten. Zuverlässige Prognosen aber würden uns helfen, Zufälle und Ungewissheiten abzuwehren und unser Schicksal selbst zu bestimmen. Nate Silver zeigt, dass und wie das geht. Erstmals wendet er seine Wahrscheinlichkeitsrechnung nicht nur auf Wahlprognosen an, sondern auf die großen Probleme unserer Zeit: die Finanzmärkte, Ratingagenturen, Epidemien, Erdbeben, den Klimawandel, den Terrorismus. In all diesen Fällen gibt es zahlreiche Prognosen von Experten, die er überprüft – und erklärt, warum sie meist falsch sind. Gleichzeitig schildert er, wie es gelingen kann, im Rauschen der Daten die wesentlichen Informationen herauszufiltern. Ein unterhaltsamer und spannender Augenöffner!