Data Science

Concepts and Practice

Author: Vijay Kotu,Bala Deshpande

Publisher: Morgan Kaufmann

ISBN: 0128147628

Category: Computers

Page: 568

View: 2041

DOWNLOAD NOW »
Learn the basics of Data Science through an easy to understand conceptual framework and immediately practice using RapidMiner platform. Whether you are brand new to data science or working on your tenth project, this book will show you how to analyze data, uncover hidden patterns and relationships to aid important decisions and predictions. Data Science has become an essential tool to extract value from data for any organization that collects, stores and processes data as part of its operations. This book is ideal for business users, data analysts, business analysts, engineers, and analytics professionals and for anyone who works with data. You’ll be able to: Gain the necessary knowledge of different data science techniques to extract value from data. Master the concepts and inner workings of 30 commonly used powerful data science algorithms. Implement step-by-step data science process using using RapidMiner, an open source GUI based data science platform Data Science techniques covered: Exploratory data analysis, Visualization, Decision trees, Rule induction, k-nearest neighbors, Naïve Bayesian classifiers, Artificial neural networks, Deep learning, Support vector machines, Ensemble models, Random forests, Regression, Recommendation engines, Association analysis, K-Means and Density based clustering, Self organizing maps, Text mining, Time series forecasting, Anomaly detection, Feature selection and more... Contains fully updated content on data science, including tactics on how to mine business data for information Presents simple explanations for over twenty powerful data science techniques Enables the practical use of data science algorithms without the need for programming Demonstrates processes with practical use cases Introduces each algorithm or technique and explains the workings of a data science algorithm in plain language Describes the commonly used setup options for the open source tool RapidMiner

Statistik II für Dummies

Author: Deborah J. Rumsey

Publisher: John Wiley & Sons

ISBN: 3527669248

Category: Mathematics

Page: 372

View: 8018

DOWNLOAD NOW »
Es gibt Qualen, verdammte Qualen und Statistik, so sehen es viele Studenten. Mit ?Statistik II f?r Dummies? lernen Sie so leicht wie m?glich. Deborah Rumsey zeigt Ihnen, wie Sie Varianzanalysen und Chi-Quadrat-Test machen, wie Sie mit Regressionen arbeiten, ein Modell erstellen, Korrelationen bilden und vieles mehr. So lernen Sie die Methoden, die Sie brauchen, und erhalten das Handwerkszeug, erfolgreich Ihre Statistikpr?fungen zu bestehen.

Das Streben nach Autonomie

Reflexionen zum digitalen Wandel

Author: Thomas Breyer-Mayländer

Publisher: Nomos Verlag

ISBN: 3845282541

Category: Business & Economics

Page: 292

View: 7940

DOWNLOAD NOW »
Die digitale Transformation als Vernetzung von Menschen, Organisationen, Maschinen, bis hin zu simplen Gegenständen des täglichen Lebens hat mehr oder weniger starke Auswirkungen auf alle Lebensbereiche. Künstliche Intelligenz und autonome technische Systeme haben direkte Auswirkungen auf die Autonomie des Einzelnen, was neue Fragen für Wissenschaft und Praxis aufwirft. In unterschiedlichen Beiträgen werden Autonomiegewinne und -verluste skizziert, die sich unter anderem im Bereich des Rechts, der Informations- und Kommunikationstechnologien, in Kunst und Gestaltung, bei Kundenbeziehungen, Kryptowährungen, Medieninhalten sowie im digitalen Arbeitsalltag feststellen lassen. Kritische Entwicklungen wie digitale Sorglosigkeit und Tools und Verfahren wie Projektmanagementsoftware oder predictive analytics gilt es dabei zu bewerten. Damit liefert dieser Band einen Überblick zum aktuellen Stand der Diskussion, zeigt Zusammenhänge auf und sensibilisiert für die Gestaltung des digitalen Wandels. Mit Beiträgen von Prof. Dr. Dirk Drechsler, Prof. Dr. Dirk Westhoff, Prof. Daniel Fetzner, Prof. Dr. Hans-Ulrich Werner, Prof. Dr. Stefan Ernst, Prof. Dr. Volker Sänger, Prof. Dr. Erik Zenner, Prof. Dr. Ralf Lankau, Prof. Dr. Christopher Zerres, Kai Rahnenführer, Prof. Dr. Thomas Breyer-Mayländer

Proaktives ereignisgesteuertes Geschäftsprozessmanagement

Referenzmodell, prototypische Implementierung und exemplarische Anwendung

Author: Julian Krumeich

Publisher: Logos Verlag Berlin GmbH

ISBN: 3832546480

Category: Business & Economics

Page: 363

View: 3465

DOWNLOAD NOW »
Die Digitalisierung ermöglicht feingranulare Datenströme in betrieblichen Abläufen zu erfassen. Mittels moderner Analyseverfahren, wie dem Complex Event Processing (CEP), können relevante Ereignismuster hieraus identifiziert und korrespondierende Maßnahmen unverzüglich initiiert werden. Vielversprechend erweist sich, zukünftige Geschäftsereignisse zu prognostizierten und hierdurch eine proaktive Steuerung von Unternehmensabläufen zu realisieren. Hierzu muss eine Kombination aus CEP und prädiktiven Analysen in die operativen Entscheidungs- und Steuerungsprozesse verankert werden. Dies bedingt einen Veränderungsprozess in Unternehmen und somit die Integration in das Geschäftsprozessmanagement. Das von Julian Krumeich konstruierte Referenzmodell dient als Gestaltungsvorlage für die Realisierung eines proaktiven ereignisgesteuerten Geschäftsprozessmanagements. Das Modell umfasst Komponenten zur Modellierung von komplexen Ereignismustern sowie deren automatisierten Transformation in EPL-Spezifikationen. Zudem ermöglicht ein methodisches Vorgehen, Prognosepotenziale in Geschäftsprozessen zu identifizieren, um auf dieser Grundlage reaktive Prozesse durch die Einbettung proaktiver Bestandteile in proaktive Prozesse zu transformieren. Die Praxistauglichkeit des Referenzmodells wird anhand eines Anwendungsbeispiels aus der Stahlproduktion validiert und die Umsetzbarkeit durch Prototypen unterstrichen. Dieses Buch erweist sich nicht nur für Wissenschaftler von Interesse, sondern dient auch Lesern aus der Unternehmenspraxis als Impulsgeber zur Bewältigung der notwendigen Transformation ihrer Geschäftsprozesse.

Predictive Analytics

The Power to Predict Who Will Click, Buy, Lie, or Die

Author: Eric Siegel

Publisher: John Wiley & Sons

ISBN: 1119145686

Category: Business & Economics

Page: 368

View: 9959

DOWNLOAD NOW »
"Mesmerizing & fascinating..." —The Seattle Post-Intelligencer "The Freakonomics of big data." —Stein Kretsinger, founding executive of Advertising.com Award-winning | Used by over 30 universities | Translated into 9 languages An introduction for everyone. In this rich, fascinating — surprisingly accessible — introduction, leading expert Eric Siegel reveals how predictive analytics works, and how it affects everyone every day. Rather than a “how to” for hands-on techies, the book serves lay readers and experts alike by covering new case studies and the latest state-of-the-art techniques. Prediction is booming. It reinvents industries and runs the world. Companies, governments, law enforcement, hospitals, and universities are seizing upon the power. These institutions predict whether you're going to click, buy, lie, or die. Why? For good reason: predicting human behavior combats risk, boosts sales, fortifies healthcare, streamlines manufacturing, conquers spam, optimizes social networks, toughens crime fighting, and wins elections. How? Prediction is powered by the world's most potent, flourishing unnatural resource: data. Accumulated in large part as the by-product of routine tasks, data is the unsalted, flavorless residue deposited en masse as organizations churn away. Surprise! This heap of refuse is a gold mine. Big data embodies an extraordinary wealth of experience from which to learn. Predictive Analytics unleashes the power of data. With this technology, the computer literally learns from data how to predict the future behavior of individuals. Perfect prediction is not possible, but putting odds on the future drives millions of decisions more effectively, determining whom to call, mail, investigate, incarcerate, set up on a date, or medicate. In this lucid, captivating introduction — now in its Revised and Updated edition — former Columbia University professor and Predictive Analytics World founder Eric Siegel reveals the power and perils of prediction: What type of mortgage risk Chase Bank predicted before the recession. Predicting which people will drop out of school, cancel a subscription, or get divorced before they even know it themselves. Why early retirement predicts a shorter life expectancy and vegetarians miss fewer flights. Five reasons why organizations predict death — including one health insurance company. How U.S. Bank and Obama for America calculated — and Hillary for America 2016 plans to calculate — the way to most strongly persuade each individual. Why the NSA wants all your data: machine learning supercomputers to fight terrorism. How IBM's Watson computer used predictive modeling to answer questions and beat the human champs on TV's Jeopardy! How companies ascertain untold, private truths — how Target figures out you're pregnant and Hewlett-Packard deduces you're about to quit your job. How judges and parole boards rely on crime-predicting computers to decide how long convicts remain in prison. 182 examples from Airbnb, the BBC, Citibank, ConEd, Facebook, Ford, Google, the IRS, LinkedIn, Match.com, MTV, Netflix, PayPal, Pfizer, Spotify, Uber, UPS, Wikipedia, and more. How does predictive analytics work? This jam-packed book satisfies by demystifying the intriguing science under the hood. For future hands-on practitioners pursuing a career in the field, it sets a strong foundation, delivers the prerequisite knowledge, and whets your appetite for more. A truly omnipresent science, predictive analytics constantly affects our daily lives. Whether you are a consumer of it — or consumed by it — get a handle on the power of Predictive Analytics.

Data mining

praktische Werkzeuge und Techniken für das maschinelle Lernen

Author: Ian H. Witten,Eibe Frank

Publisher: N.A

ISBN: 9783446215337

Category:

Page: 386

View: 7772

DOWNLOAD NOW »

Datenanalyse mit Python

Auswertung von Daten mit Pandas, NumPy und IPython

Author: Wes McKinney

Publisher: O'Reilly

ISBN: 3960102143

Category: Computers

Page: 542

View: 2823

DOWNLOAD NOW »
Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.6, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet Datenanalyse mit Python einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.Aus dem Inhalt:Nutzen Sie die IPython-Shell und Jupyter Notebook für das explorative ComputingLernen Sie Grundfunktionen und fortgeschrittene Features von NumPy kennenSetzen Sie die Datenanalyse-Tools der pandasBibliothek einVerwenden Sie flexible Werkzeuge zum Laden, Bereinigen, Transformieren, Zusammenführen und Umformen von DatenErstellen Sie interformative Visualisierungen mit matplotlibWenden Sie die GroupBy-Mechanismen von pandas an, um Datensätzen zurechtzuschneiden, umzugestalten und zusammenzufassenAnalysieren und manipulieren Sie verschiedenste Zeitreihen-DatenFür diese aktualisierte 2. Auflage wurde der gesamte Code an Python 3.6 und die neuesten Versionen der pandas-Bibliothek angepasst. Neu in dieser Auflage: Informationen zu fortgeschrittenen pandas-Tools sowie eine kurze Einführung in statsmodels und scikit-learn.

Big Data in der Praxis

Beispiellösungen mit Hadoop und NoSQL. Daten speichern, aufbereiten, visualisieren

Author: Jonas Freiknecht

Publisher: Carl Hanser Verlag GmbH Co KG

ISBN: 3446441778

Category: Computers

Page: 448

View: 943

DOWNLOAD NOW »
BIG DATA IN DER PRAXIS // - Für Analysten, BI-Verantwortliche, Data-Scientists, Consultants - Auf der DVD finden Sie: 18 fertige Projekte, die im Buch Schritt für Schritt entwickelt werden; Videotutorials u.a. zur Installation von Hadoop, Hive, HBase (Gesamtdauer: 80 Min.); Testdatensätze für die Wissensdatenbank Dieses Buch bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und bekommen aufgezeigt, wie Sie bestehende Systeme vorausschauend auf die mit dem Big Data-Trend einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu behandeln. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit dem Autor werden Sie ganz konkret Schritt für Schritt viele kleinere Projekte aufbauen bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen. AUS DEM INHALT // Einführung rund um Big Data // Hadoop installieren, konfigurieren & bedienen // HDFS, Map-Reduce & YARN: Daten speichern und verarbeiten // Hadoop-Ecosystem: Überblick über dessen Komponenten // Einführung in NoSQL // HBase installieren, einrichten & auf Daten zugreifen // Data-Warehousing mit Apache Hive // HiveQL als Abfragesprache, Hive Security, Hive & JDBC // Datenimport aus relationalen Datenbanken mit Sqoop // Big Data-Visualisierung: Diagrammarten, Tipps & Trends // Visualisierungs-Frameworks im Vergleich // D3.js: Entwicklung einiger Beispieldiagramme // Entwicklung einer abschließenden Big Data-Analyse-Lösung // Troubleshooting für die Arbeit mit Hadoop, Hive & HBase

Smart Data Analytics

Mit Hilfe von Big Data Zusammenhänge erkennen und Potentiale nutzen

Author: Andreas Wierse,Till Riedel

Publisher: Walter de Gruyter GmbH & Co KG

ISBN: 3110461919

Category: Technology & Engineering

Page: 440

View: 416

DOWNLOAD NOW »
Wenn in Datenbergen wertvolle Geheimnisse schlummern, aus denen Profit erzielt werden soll, dann geht es um Big Data. Doch wie schöpft man aus »großen Daten« echte Werte, wenn man nicht gerade Google ist? Um aus Unternehmens-, Maschinen- oder Sensordaten einen Ertrag zu erzielen, reicht Big Data-Technologie allein nicht aus. Entscheidend sind die übergeordneten Innovations prozesse: die smarte Analyse von Big Data. Erst durch den kompetenten Einsatz der richtigen Werkzeuge und Techniken werden aus Big Data tatsächlich Smart Data. Das Praxishandbuch Smart Data Analytics gibt einen Überblick über die Technologie, die bei der Analyse von großen und heterogenen Datenmengen – inklusive Echtzeitdaten – zum Einsatz kommt. Elf Praxisbeispiele zeigen die konkrete Anwendung in kleinen und mittelständischen Unternehmen. So erfahren Sie, wie Sie Ihr Smart Data Analytics-Projekt in Ihrem eigenen Unternehmen vorbereiten und umsetzen können. Das Buch erläutert neben den organisatorischen Aspekten auch die rechtlichen Rahmenbedingungen. Und es zeigt, wie Sie sowohl den Nutzen bewerten können, der aus den Daten gezogen werden soll, als auch den Aufwand, den Sie dafür betreiben müssen. Denn Smart Data steht für mehr als nur die Untersuchung großer Datenmengen: Smart Data Analytics ist der Schlüssel zu einem smarten Umgang mit Ihren Unternehmensdaten und hilft, bislang unentdecktes Potenzial zu entdecken. Dr. Andreas Wierse studierte Mathematik und promovierte in den Ingenieurwissenschaften im Bereich Visualisierung, seit 2011 unterstützt er mittelständische Unternehmen rund um Big und Smart Data Technologie. Dr. Till Riedel lehrt als Informatiker am KIT und koordiniert im Smart Data Solution Center Baden-Württemberg und Smart Data Innovation Lab Forschung und Innovation auf industriellen Datenschätzen.

Risiko

Wie man die richtigen Entscheidungen trifft

Author: Gerd Gigerenzer

Publisher: C. Bertelsmann Verlag

ISBN: 3641119901

Category: Psychology

Page: 400

View: 6906

DOWNLOAD NOW »
Der neue Bestseller von Gerd Gigerenzer Erinnern wir uns an die weltweite Angst vor der Schweinegrippe, als Experten eine nie dagewesene Pandemie prognostizierten und Impfstoff für Millionen produziert wurde, der später still und heimlich entsorgt werden musste. Für Gerd Gigerenzer ist dies nur ein Beleg unseres irrationalen Umgangs mit Risiken. Und das gilt für Experten ebenso wie für Laien. An Beispielen aus Medizin, Rechtswesen und Finanzwelt erläutert er, wie die Psychologie des Risikos funktioniert, was sie mit unseren entwicklungsgeschichtlich alten Hirnstrukturen zu tun hat und welche Gefahren damit einhergehen. Dabei analysiert er die ungute Rolle von irreführenden Informationen, die von Medien und Fachleuten verbreitet werden. Doch Risiken und Ungewissheiten richtig einzuschätzen kann und sollte jeder lernen. Diese Risikoschulung erprobt Gigerenzer seit vielen Jahren mit verblüffenden Ergebnissen. Sein Fazit: Schon Kinder können lernen, mit Risiken realistisch umzugehen und sich gegen Panikmache wie Verharmlosung zu immunisieren.

Corporate Data Quality

Voraussetzung erfolgreicher Geschäftsmodelle

Author: Boris Otto,Hubert Österle

Publisher: Springer-Verlag

ISBN: 3662468069

Category: Business & Economics

Page: 205

View: 4634

DOWNLOAD NOW »
Daten sind die strategische Ressource des 21. Jahrhunderts. Es findet kein Geschäftsprozess, keine Kommunikation zwischen Geschäftspartnern, keine Wertschöpfung statt, ohne dass die involvierten Personen, Maschinen und IT-Systeme Daten nutzen, erzeugen oder verändern. Trends wie die Digitalisierung, Industrie 4.0 und Social Media tragen ebenfalls dazu bei, dass Datenmanagement zu einer Kernkompetenz für erfolgreiche Unternehmen dieser Zeit geworden ist. Damit Daten ihren ganzen Wert entfalten können, müssen sie stets in angemessener Qualität zur Verfügung stehen. Dies gilt besonders für Stammdaten, die zentralen Geschäftsobjekte eines Unternehmens. Dieses Buch zeigt einen ganzheitlichen Ansatz zum qualitätsbewussten Management von Stammdaten auf und richtet sich damit sowohl an Praktiker als auch an die Wissenschaft. Das „Framework für Stammdatenqualitätsmanagement“ wurde im Rahmen des „Competence Center Corporate Data Quality“ der Universität St. Gallen seit dem Jahr 2006 gemeinsam mit Unternehmen aus unterschiedlichen Industrien in zahlreichen praktischen Anwendungen entwickelt und verbessert. Neben den theoretischen Grundlagen räumt das Buch der praktischen Sicht mit 10 Fallstudien großen Raum ein, die erfolgreich durchgeführte Datenqualitätsprojekte praxisnah aufbereiten. Schließlich führt das Buch noch Methoden und Werkzeuge für das Datenqualitätsmanagement auf, die (Stamm-)datenmanager bei Projekten im eigenen betrieblichen Umfeld unterstützen können.

Synthese der Zellbausteine in Pflanze und Tier

Lösung des Problems der künstlichen Darstellung der Nahrungsstoffe

Author: Emil Abderhalden

Publisher: Springer-Verlag

ISBN: 3662403927

Category: Science

Page: 132

View: 2005

DOWNLOAD NOW »
Dieser Buchtitel ist Teil des Digitalisierungsprojekts Springer Book Archives mit Publikationen, die seit den Anfängen des Verlags von 1842 erschienen sind. Der Verlag stellt mit diesem Archiv Quellen für die historische wie auch die disziplingeschichtliche Forschung zur Verfügung, die jeweils im historischen Kontext betrachtet werden müssen. Dieser Titel erschien in der Zeit vor 1945 und wird daher in seiner zeittypischen politisch-ideologischen Ausrichtung vom Verlag nicht beworben.

Die Fünfte Computer-Generation

Künstliche Intelligenz und die Herausforderung Japans an die Welt

Author: FEIGENBAUM,MCCORDUCK

Publisher: Springer-Verlag

ISBN: 3034865287

Category: Juvenile Nonfiction

Page: 322

View: 9724

DOWNLOAD NOW »

Einführung in SQL

Author: Alan Beaulieu

Publisher: O'Reilly Germany

ISBN: 3897219387

Category: Computers

Page: 353

View: 5084

DOWNLOAD NOW »
SQL kann Spaß machen! Es ist ein erhebendes Gefühl, eine verworrene Datenmanipulation oder einen komplizierten Report mit einer einzigen Anweisung zu bewältigen und so einen Haufen Arbeit vom Tisch zu bekommen. Einführung in SQL bietet einen frischen Blick auf die Sprache, deren Grundlagen jeder Entwickler beherrschen muss. Die aktualisierte 2. Auflage deckt die Versionen MySQL 6.0, Oracle 11g und Microsoft SQL Server 2008 ab. Außerdem enthält sie neue Kapitel zu Views und Metadaten. SQL-Basics - in null Komma nichts durchstarten: Mit diesem leicht verständlichen Tutorial können Sie SQL systematisch und gründlich lernen, ohne sich zu langweilen. Es führt Sie rasch durch die Basics der Sprache und vermittelt darüber hinaus eine Reihe von häufig genutzten fortgeschrittenen Features. Mehr aus SQL-Befehlen herausholen: Alan Beaulieu will mehr vermitteln als die simple Anwendung von SQL-Befehlen: Er legt Wert auf ein tiefes Verständnis der SQL-Features und behandelt daher auch den Umgang mit Mengen, Abfragen innerhalb von Abfragen oder die überaus nützlichen eingebauten Funktionen von SQL. Die MySQL-Beispieldatenbank: Es gibt zwar viele Datenbankprodukte auf dem Markt, aber welches wäre zum Erlernen von SQL besser geeignet als MySQL, das weit verbreitete relationale Datenbanksystem? Der Autor hilft Ihnen, eine MySQL-Datenbank anzulegen, und nutzt diese für die Beispiele in diesem Buch. Übungen mit Lösungen: Zu jedem Thema finden Sie im Buch gut durchdachte Übungen mit Lösungen. So ist sichergestellt, dass Sie schnell Erfolgserlebnisse haben und das Gelernte auch praktisch umsetzen können.

Informatik kompakt

Eine grundlegende Einführung mit Java

Author: Katharina Morik,Volker Klingspor

Publisher: Springer-Verlag

ISBN: 3540292756

Category: Computers

Page: 234

View: 2756

DOWNLOAD NOW »
Die Autoren geben eine fundierte Einführung in die Informatik, die von Anfang an die Zusammenhänge zwischen den Teilgebieten des Faches betont. Das Buch ist kompakt, weil der gemeinsame Kern der verschiedenen Informatikgebiete betrachtet wird. In einer integrativen Sichtweise werden Modellierung, abstrakte Datentypen, Algorithmen sowie nebenläufige und verteilte Programmierung behandelt. Die grundlegenden Konzepte der Informatik werden dabei mittels der Programmiersprache Java realisiert. Wesentliches Anliegen der Autoren ist es, die Informatik als Wissenschaft der Abstraktion herauszustellen und in diesem Sinne den Studierenden allgemeine Methoden zum Lösen praktischer Probleme zu vermitteln. Lernkontrollen und ein effektiver Index, der vor allem diejenigen Begriffe aufführt, die ein Informatiker einfach können muss, ermöglichen ein fokussiertes Studium. Ferner stehen vielfältige Programm-Beispiele im Internet bereit.

Real-Time Data Mining

Author: Florian Stompe

Publisher: Diplomica Verlag

ISBN: 3836678799

Category: Business & Economics

Page: 106

View: 4771

DOWNLOAD NOW »
Data Mining ist ein inzwischen etabliertes, erfolgreiches Werkzeug zur Extraktion von neuem, bislang unbekanntem Wissen aus Daten. In mittlerweile fast allen gr eren Unternehmen wird es genutzt um Mehrwerte f r Kunden zu generieren, den Erfolg von Marketingkampagnen zu erh hen, Betrugsverdacht aufzudecken oder beispielsweise durch Segmentierung unterschiedliche Kundengruppen zu identifizieren. Ein Grundproblem der intelligenten Datenanalyse besteht darin, dass Daten oftmals in rasanter Geschwindigkeit neu entstehen. Eink ufe im Supermarkt, Telefonverbindungen oder der ffentliche Verkehr erzeugen t glich eine neue Flut an Daten, in denen potentiell wertvolles Wissen steckt. Die versteckten Zusammenh nge und Muster k nnen sich im Zeitverlauf mehr oder weniger stark ver ndern. Datenmodellierung findet in der Regel aber noch immer einmalig bzw. sporadisch auf dem Snapshot einer Datenbank statt. Einmal erkannte Muster oder Zusammenh nge werden auch dann noch angenommen, wenn diese l ngst nicht mehr bestehen. Gerade in dynamischen Umgebungen wie zum Beispiel einem Internet-Shop sind Data Mining Modelle daher schnell veraltet. Betrugsversuche k nnen dann unter Umst nden nicht mehr erkannt, Absatzpotentiale nicht mehr genutzt werden oder Produktempfehlungen basieren auf veralteten Warenk rben. Um dauerhaft Wettbewerbsvorteile erzielen zu k nnen, muss das Wissen ber Daten aber m glichst aktuell und von ausgezeichneter Qualit t sein. Der Inhalt dieses Buches skizziert Methoden und Vorgehensweisen von Data Mining in Echtzeit.

Statistik-Workshop für Programmierer

Author: Allen B. Downey

Publisher: O'Reilly Germany

ISBN: 3868993436

Category: Computers

Page: 160

View: 7465

DOWNLOAD NOW »
Wenn Sie programmieren können, beherrschen Sie bereits Techniken, um aus Daten Wissen zu extrahieren. Diese kompakte Einführung in die Statistik zeigt Ihnen, wie Sie rechnergestützt, anstatt auf mathematischem Weg Datenanalysen mit Python durchführen können. Praktischer Programmier-Workshop statt grauer Theorie: Das Buch führt Sie anhand eines durchgängigen Fallbeispiels durch eine vollständige Datenanalyse -- von der Datensammlung über die Berechnung statistischer Kennwerte und Identifikation von Mustern bis hin zum Testen statistischer Hypothesen. Gleichzeitig werden Sie mit statistischen Verteilungen, den Regeln der Wahrscheinlichkeitsrechnung, Visualisierungsmöglichkeiten und vielen anderen Arbeitstechniken und Konzepten vertraut gemacht. Statistik-Konzepte zum Ausprobieren: Entwickeln Sie über das Schreiben und Testen von Code ein Verständnis für die Grundlagen von Wahrscheinlichkeitsrechnung und Statistik: Überprüfen Sie das Verhalten statistischer Merkmale durch Zufallsexperimente, zum Beispiel indem Sie Stichproben aus unterschiedlichen Verteilungen ziehen. Nutzen Sie Simulationen, um Konzepte zu verstehen, die auf mathematischem Weg nur schwer zugänglich sind. Lernen Sie etwas über Themen, die in Einführungen üblicherweise nicht vermittelt werden, beispielsweise über die Bayessche Schätzung. Nutzen Sie Python zur Bereinigung und Aufbereitung von Rohdaten aus nahezu beliebigen Quellen. Beantworten Sie mit den Mitteln der Inferenzstatistik Fragestellungen zu realen Daten.