Search Results: text-mining-and-visualization-case-studies-using-open-source-tools-chapman-hall-crc-data-mining-and-knowledge-discovery-series

Text Mining and Visualization

Case Studies Using Open-Source Tools

Author: Markus Hofmann,Andrew Chisholm

Publisher: CRC Press

ISBN: 148223758X

Category: Business & Economics

Page: 297

View: 499

Text Mining and Visualization: Case Studies Using Open-Source Tools provides an introduction to text mining using some of the most popular and powerful open-source tools: KNIME, RapidMiner, Weka, R, and Python. The contributors—all highly experienced with text mining and open-source software—explain how text data are gathered and processed from a wide variety of sources, including books, server access logs, websites, social media sites, and message boards. Each chapter presents a case study that you can follow as part of a step-by-step, reproducible example. You can also easily apply and extend the techniques to other problems. All the examples are available on a supplementary website. The book shows you how to exploit your text data, offering successful application examples and blueprints for you to tackle your text mining tasks and benefit from open and freely available tools. It gets you up to date on the latest and most powerful tools, the data mining process, and specific text mining activities.

Feature Engineering for Machine Learning and Data Analytics

Author: Guozhu Dong,Huan Liu

Publisher: CRC Press

ISBN: 1351721275

Category: Business & Economics

Page: 400

View: 8466

Feature engineering plays a vital role in big data analytics. Machine learning and data mining algorithms cannot work without data. Little can be achieved if there are few features to represent the underlying data objects, and the quality of results of those algorithms largely depends on the quality of the available features. Feature Engineering for Machine Learning and Data Analytics provides a comprehensive introduction to feature engineering, including feature generation, feature extraction, feature transformation, feature selection, and feature analysis and evaluation. The book presents key concepts, methods, examples, and applications, as well as chapters on feature engineering for major data types such as texts, images, sequences, time series, graphs, streaming data, software engineering data, Twitter data, and social media data. It also contains generic feature generation approaches, as well as methods for generating tried-and-tested, hand-crafted, domain-specific features. The first chapter defines the concepts of features and feature engineering, offers an overview of the book, and provides pointers to topics not covered in this book. The next six chapters are devoted to feature engineering, including feature generation for specific data types. The subsequent four chapters cover generic approaches for feature engineering, namely feature selection, feature transformation based feature engineering, deep learning based feature engineering, and pattern based feature generation and engineering. The last three chapters discuss feature engineering for social bot detection, software management, and Twitter-based applications respectively. This book can be used as a reference for data analysts, big data scientists, data preprocessing workers, project managers, project developers, prediction modelers, professors, researchers, graduate students, and upper level undergraduate students. It can also be used as the primary text for courses on feature engineering, or as a supplement for courses on machine learning, data mining, and big data analytics.

Exploratory Data Analysis Using R

Author: Ronald K. Pearson

Publisher: CRC Press

ISBN: 0429847033

Category: Business & Economics

Page: 548

View: 8922

Exploratory Data Analysis Using R provides a classroom-tested introduction to exploratory data analysis (EDA) and introduces the range of "interesting" – good, bad, and ugly – features that can be found in data, and why it is important to find them. It also introduces the mechanics of using R to explore and explain data. The book begins with a detailed overview of data, exploratory analysis, and R, as well as graphics in R. It then explores working with external data, linear regression models, and crafting data stories. The second part of the book focuses on developing R programs, including good programming practices and examples, working with text data, and general predictive models. The book ends with a chapter on "keeping it all together" that includes managing the R installation, managing files, documenting, and an introduction to reproducible computing. The book is designed for both advanced undergraduate, entry-level graduate students, and working professionals with little to no prior exposure to data analysis, modeling, statistics, or programming. it keeps the treatment relatively non-mathematical, even though data analysis is an inherently mathematical subject. Exercises are included at the end of most chapters, and an instructor's solution manual is available. About the Author: Ronald K. Pearson holds the position of Senior Data Scientist with GeoVera, a property insurance company in Fairfield, California, and he has previously held similar positions in a variety of application areas, including software development, drug safety data analysis, and the analysis of industrial process data. He holds a PhD in Electrical Engineering and Computer Science from the Massachusetts Institute of Technology and has published conference and journal papers on topics ranging from nonlinear dynamic model structure selection to the problems of disguised missing data in predictive modeling. Dr. Pearson has authored or co-authored books including Exploring Data in Engineering, the Sciences, and Medicine (Oxford University Press, 2011) and Nonlinear Digital Filtering with Python. He is also the developer of the DataCamp course on base R graphics and is an author of the datarobot and GoodmanKruskal R packages available from CRAN (the Comprehensive R Archive Network).

Human Capital Systems, Analytics, and Data Mining

Author: Robert C. Hughes

Publisher: CRC Press

ISBN: 1351649701

Category: Business & Economics

Page: 272

View: 9525

Human Capital Systems, Analytics, and Data Mining provides human capital professionals, researchers, and students with a comprehensive and portable guide to human capital systems, analytics and data mining. The main purpose of this book is to provide a rich tool set of methods and tutorials for Human Capital Management Systems (HCMS) database modeling, analytics, interactive dashboards, and data mining that is independent of any human capital software vendor offerings and is equally usable and portable among both commercial and internally developed HCMS. The book begins with an overview of HCMS, including coverage of human resource systems history and current HCMS Computing Environments. It next explores relational and dimensional database management concepts and principles. HCMS Instructional databases developed by the Author for use in Graduate Level HCMS and Compensation Courses are used for database modeling and dashboard design exercises. Exciting knowledge discovery and research Tutorials and Exercises using Online Analytical Processing (OLAP) and data mining tools through replication of actual original pay equity research by the author are included. New findings concerning Gender Based Pay Equity Research through the lens Comparable Worth and Occupational Mobility are covered extensively in Human Capital Metrics, Analytics and Data Mining Chapters.

RapidMiner

Data Mining Use Cases and Business Analytics Applications

Author: Markus Hofmann,Ralf Klinkenberg

Publisher: CRC Press

ISBN: 1482205505

Category: Business & Economics

Page: 525

View: 7654

Powerful, Flexible Tools for a Data-Driven World As the data deluge continues in today’s world, the need to master data mining, predictive analytics, and business analytics has never been greater. These techniques and tools provide unprecedented insights into data, enabling better decision making and forecasting, and ultimately the solution of increasingly complex problems. Learn from the Creators of the RapidMiner Software Written by leaders in the data mining community, including the developers of the RapidMiner software, RapidMiner: Data Mining Use Cases and Business Analytics Applications provides an in-depth introduction to the application of data mining and business analytics techniques and tools in scientific research, medicine, industry, commerce, and diverse other sectors. It presents the most powerful and flexible open source software solutions: RapidMiner and RapidAnalytics. The software and their extensions can be freely downloaded at www.RapidMiner.com. Understand Each Stage of the Data Mining Process The book and software tools cover all relevant steps of the data mining process, from data loading, transformation, integration, aggregation, and visualization to automated feature selection, automated parameter and process optimization, and integration with other tools, such as R packages or your IT infrastructure via web services. The book and software also extensively discuss the analysis of unstructured data, including text and image mining. Easily Implement Analytics Approaches Using RapidMiner and RapidAnalytics Each chapter describes an application, how to approach it with data mining methods, and how to implement it with RapidMiner and RapidAnalytics. These application-oriented chapters give you not only the necessary analytics to solve problems and tasks, but also reproducible, step-by-step descriptions of using RapidMiner and RapidAnalytics. The case studies serve as blueprints for your own data mining applications, enabling you to effectively solve similar problems.

Real-Time Data Mining

Author: Florian Stompe

Publisher: Diplomica Verlag

ISBN: 3836678799

Category: Business & Economics

Page: 106

View: 9707

Data Mining ist ein inzwischen etabliertes, erfolgreiches Werkzeug zur Extraktion von neuem, bislang unbekanntem Wissen aus Daten. In mittlerweile fast allen gr eren Unternehmen wird es genutzt um Mehrwerte f r Kunden zu generieren, den Erfolg von Marketingkampagnen zu erh hen, Betrugsverdacht aufzudecken oder beispielsweise durch Segmentierung unterschiedliche Kundengruppen zu identifizieren. Ein Grundproblem der intelligenten Datenanalyse besteht darin, dass Daten oftmals in rasanter Geschwindigkeit neu entstehen. Eink ufe im Supermarkt, Telefonverbindungen oder der ffentliche Verkehr erzeugen t glich eine neue Flut an Daten, in denen potentiell wertvolles Wissen steckt. Die versteckten Zusammenh nge und Muster k nnen sich im Zeitverlauf mehr oder weniger stark ver ndern. Datenmodellierung findet in der Regel aber noch immer einmalig bzw. sporadisch auf dem Snapshot einer Datenbank statt. Einmal erkannte Muster oder Zusammenh nge werden auch dann noch angenommen, wenn diese l ngst nicht mehr bestehen. Gerade in dynamischen Umgebungen wie zum Beispiel einem Internet-Shop sind Data Mining Modelle daher schnell veraltet. Betrugsversuche k nnen dann unter Umst nden nicht mehr erkannt, Absatzpotentiale nicht mehr genutzt werden oder Produktempfehlungen basieren auf veralteten Warenk rben. Um dauerhaft Wettbewerbsvorteile erzielen zu k nnen, muss das Wissen ber Daten aber m glichst aktuell und von ausgezeichneter Qualit t sein. Der Inhalt dieses Buches skizziert Methoden und Vorgehensweisen von Data Mining in Echtzeit.

Graphische Darstellungen und die graphische Weiterverarbeitung der Information

Author: Jacques Bertin

Publisher: Walter de Gruyter

ISBN: 9783110069006

Category: Computer science

Page: 275

View: 6936

R in a Nutshell

Author: Joseph Adler

Publisher: O'Reilly Germany

ISBN: 3897216507

Category: Computers

Page: 768

View: 3640

Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.

Datenanalyse mit Python

Auswertung von Daten mit Pandas, NumPy und IPython

Author: Wes McKinney

Publisher: O'Reilly

ISBN: 3960102143

Category: Computers

Page: 542

View: 4790

Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.6, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet Datenanalyse mit Python einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.Aus dem Inhalt:Nutzen Sie die IPython-Shell und Jupyter Notebook für das explorative ComputingLernen Sie Grundfunktionen und fortgeschrittene Features von NumPy kennenSetzen Sie die Datenanalyse-Tools der pandasBibliothek einVerwenden Sie flexible Werkzeuge zum Laden, Bereinigen, Transformieren, Zusammenführen und Umformen von DatenErstellen Sie interformative Visualisierungen mit matplotlibWenden Sie die GroupBy-Mechanismen von pandas an, um Datensätzen zurechtzuschneiden, umzugestalten und zusammenzufassenAnalysieren und manipulieren Sie verschiedenste Zeitreihen-DatenFür diese aktualisierte 2. Auflage wurde der gesamte Code an Python 3.6 und die neuesten Versionen der pandas-Bibliothek angepasst. Neu in dieser Auflage: Informationen zu fortgeschrittenen pandas-Tools sowie eine kurze Einführung in statsmodels und scikit-learn.

Graphische Semiologie

Diagramme, Netze, Karten

Author: Jacques Bertin

Publisher: Walter de Gruyter

ISBN: 3110834901

Category: Science

Page: 430

View: 5898

Die Balanced Scorecard als Konzept für das ganzheitliche Personalcontrolling

Analyse und Gestaltungsmöglichkeiten

Author: Christian Tonnesen

Publisher: Springer-Verlag

ISBN: 332297832X

Category: Business & Economics

Page: 325

View: 3225

Christian T. Tonnesen analysiert, welche grundsätzlichen Möglichkeiten die Balanced Scorecard als Ansatz zur Steuerungsunterstützung des Personalmanagements bietet, und entwickelt auf dieser Basis ein Balanced-Scorecard-Modell für das kundenorientierte Personalmanagement.

Computational Social Network Analysis

Trends, Tools and Research Advances

Author: Kai Subel,Michel Schultz

Publisher: GRIN Verlag

ISBN: 3640733061

Category: Computers

Page: 21

View: 9692

Studienarbeit aus dem Jahr 2010 im Fachbereich Informatik - Internet, neue Technologien, Universität Hamburg, Sprache: Deutsch, Abstract: Diese Ausarbeitung befasst sich mit dem Thema Computational Soical Network Analysis. Ziel ist es, dem Leser einen Einblick in diese Thematik zu verschaffen. Dabei werden Hintergründe, anwendbare Methoden und Tools vorgestellt, die hierbei Verwendung finden. Zunächst wird dabei näher auf den Hintergrund, also warum dieses Gebiet als Forschungsgegenstand so interessant ist, eingegangen. Anschließend werden verschiedene Aspekte, die man im Rahmen der Analyse sozialer Netzwerke untersuchen kann benannt. In diesem Zusammenhang werden auch zwei verschiedene Kategorien zur formalen Analyse benannt. Zur Verdeutlichung wird die Verwendung dieser am Ende des Kapitels auch noch einmal anhand eines Praxisbeispiels gezeigt. Das nächste Kapitel befasst sich mit der Fragstellung, wie Schlüsselfiguren in Netzwerken ermittelt werden können und was für Rollen diese spielen. Dabei werden auch die verschiedenen Arten von Schlüsselfiguren benannt. Eine weitere zentrale Rolle in der Analyse sozialer Netzwerke nehmen Gruppen ein. Die Bedeutung von Gruppen und wie man sie ermitteln kann wird im nächsten Kapitel erläutert. Aufbauend auf den Gruppen sollen Interaktionen innerhalb von Netzwerken untersucht werden. Hierfür werden zunächst die nötigen Werkzeuge, wie die SCAN oder DISSECT Methode vorgestellt und anschließend die Einsatzgebiete anhand von Beispielen verdeutlicht. Im 7. Kapitel wird eine eLearning Plattform näher betrachtet. Hierbei werden zunächst die Eigenschaften und Besonderheiten von eLearning Plattformen beschrieben und anschießend anhand eines Praxisbeispiels verschiedene Methoden zur Analyse sozialer Netzwerke angewendet.

Formale Begriffsanalyse

Mathematische Grundlagen

Author: Bernhard Ganter,Rudolf Wille

Publisher: Springer-Verlag

ISBN: 3642614507

Category: Computers

Page: 286

View: 1793

Dieses erste Lehrbuch zur Formalen Begriffsanalyse gibt eine systematische Darstellung der mathematischen Grundlagen und ihrer Verbindung zu Anwendungen in der Informatik, insbesondere in der Datenanalyse und Wissensverarbeitung. Das Buch vermittelt vor allem Methoden der graphischen Darstellung von Begriffssystemen, die sich in der Wissenskommunikation bestens bewährt haben. Theorie und graphische Darstellung werden dabei eng miteinander verknüpft. Die mathematischen Grundlagen werden vollständig abgehandelt und durch zahlreiche Beispiele anschaulich gemacht. Da zur Wissensverarbeitung immer stärker der Computer genutzt wird, gewinnen formale Methoden begrifflicher Analyse überall an Bedeutung. Das Buch macht die dafür grundlegende Theorie in kompakter Form zugänglich.

Informatik kompakt

Eine grundlegende Einführung mit Java

Author: Katharina Morik,Volker Klingspor

Publisher: Springer-Verlag

ISBN: 3540292756

Category: Computers

Page: 234

View: 779

Die Autoren geben eine fundierte Einführung in die Informatik, die von Anfang an die Zusammenhänge zwischen den Teilgebieten des Faches betont. Das Buch ist kompakt, weil der gemeinsame Kern der verschiedenen Informatikgebiete betrachtet wird. In einer integrativen Sichtweise werden Modellierung, abstrakte Datentypen, Algorithmen sowie nebenläufige und verteilte Programmierung behandelt. Die grundlegenden Konzepte der Informatik werden dabei mittels der Programmiersprache Java realisiert. Wesentliches Anliegen der Autoren ist es, die Informatik als Wissenschaft der Abstraktion herauszustellen und in diesem Sinne den Studierenden allgemeine Methoden zum Lösen praktischer Probleme zu vermitteln. Lernkontrollen und ein effektiver Index, der vor allem diejenigen Begriffe aufführt, die ein Informatiker einfach können muss, ermöglichen ein fokussiertes Studium. Ferner stehen vielfältige Programm-Beispiele im Internet bereit.

Einkommensbesteuerung in der Insolventen Personengesellschaft

Author: Tina Kießling

Publisher: Peter Lang Gmbh, Internationaler Verlag Der Wissenschaften

ISBN: 9783631757345

Category: Law

Page: 508

View: 2561

Die Arbeit wendet sich grundlegend Problemen aus den einzelnen Schnittstellen dieser Fragestellung zu. Auf dieser Grundlage kann die Verfasserin die wenigen Äußerungen in Rechtsprechung und Literatur zu dieser Thematik systematisch aufbereiten und einen eigenen Lösungsvorschlag zur Auflösung der Problematik formulieren.

R für Dummies

Author: Andrie de Vries,Joris Meys

Publisher: John Wiley & Sons

ISBN: 3527812520

Category: Computers

Page: 414

View: 6859

Wollen Sie auch die umfangreichen Möglichkeiten von R nutzen, um Ihre Daten zu analysieren, sind sich aber nicht sicher, ob Sie mit der Programmiersprache wirklich zurechtkommen? Keine Sorge - dieses Buch zeigt Ihnen, wie es geht - selbst wenn Sie keine Vorkenntnisse in der Programmierung oder Statistik haben. Andrie de Vries und Joris Meys zeigen Ihnen Schritt für Schritt und anhand zahlreicher Beispiele, was Sie alles mit R machen können und vor allem wie Sie es machen können. Von den Grundlagen und den ersten Skripten bis hin zu komplexen statistischen Analysen und der Erstellung aussagekräftiger Grafiken. Auch fortgeschrittenere Nutzer finden in diesem Buch viele Tipps und Tricks, die Ihnen die Datenauswertung erleichtern.

Ökonometrie für Dummies

Author: Roberto Pedace

Publisher: John Wiley & Sons

ISBN: 3527801529

Category: Business & Economics

Page: 388

View: 828

Theorien verstehen und Techniken anwenden Was haben die Gehälter von Spitzensportlern und der Mindestlohn gemeinsam? Richtig, man kann sie mit Ökonometrie erforschen. Im Buch steht, wie es geht. Und nicht nur dafür, sondern für viele weitere Gebiete lohnt es sich, der zunächst etwas trocken und sperrig anmutenden Materie eine Chance zu geben. Lernen Sie von den Autoren, wie Sie spannende Fragen formulieren, passende Variablen festlegen, treffsichere Modelle entwerfen und Ihre Aussagen auf Herz und Nieren prüfen. Werden Sie sicher im Umgang mit Hypothesentests, Regressionsmodellen, Logit- & Probit-Modellen und allen weiteren gängigen Methoden der Ökonometrie. So begleitet Ökonometrie für Dummies Sie Schritt für Schritt und mit vielen Beispielen samt R Output durch dieses spannende Thema.

Regression

Modelle, Methoden und Anwendungen

Author: Ludwig Fahrmeir,Thomas Kneib,Stefan Lang

Publisher: Springer-Verlag

ISBN: 3642018378

Category: Business & Economics

Page: 502

View: 3334

In dem Band beschreiben die Autoren erstmals klassische Regressionsansätze und moderne nicht- und semiparametrische Methoden in einer integrierten und anwendungsorientierten Form. Um Lesern die Analyse eigener Fragestellungen zu ermöglichen, demonstrieren sie die praktische Anwendung der Konzepte und Methoden anhand ausführlicher Fallstudien. Geeignet für Studierende der Statistik sowie für Wissenschaftler und Praktiker, zum Beispiel in den Wirtschafts- und Sozialwissenschaften, der Bioinformatik und -statistik, Ökonometrie und Epidemiologie.

Pascal, Fermat und die Berechnung des Glücks

eine Reise in die Geschichte der Mathematik

Author: Keith J. Devlin

Publisher: C.H.Beck

ISBN: 9783406590993

Category: Wahrscheinlichkeitstheorie - Geschichte

Page: 204

View: 2529

Der Autor stellt die Entstehung der Wahrscheinlichkeitsrechnung und den damit verbundenen Wandel des menschlichen Alltagslebens dar.

Creating Shared Value

Eine Strategieinnovation auf Basis der Theorie U

Author: Claudia Fichtenbauer

Publisher: Springer-Verlag

ISBN: 3658079843

Category: Business & Economics

Page: 103

View: 5159

Das Streben nach Shared Value muss die Gesamtstrategie eines Unternehmens bestimmen, damit es durch diesen Ansatz gesellschaftliche Herausforderungen lösen und zugleich seine Profitabilitätsziele erreichen kann – diese These legt Claudia Fichtenbauer ihrer Forschung zugrunde. Die Autorin erarbeitet ein theoretisches Modell auf Basis der Theorie U nach C. O. Scharmer, die originär als Rahmen zur Kreierung von Innovationen gilt, und untersucht, wie der Strategieentwicklungsprozess zu gestalten ist. Auf diesen Erkenntnissen aufbauend führt sie eine qualitative Befragung zur Vollendung dieses Strategieentwicklungsprozesses durch.

Find eBook