Data Architecture: A Primer for the Data Scientist

Big Data, Data Warehouse and Data Vault
Author: W.H. Inmon,Dan Linstedt
Publisher: Morgan Kaufmann
ISBN: 0128020911
Category: Computers
Page: 378
View: 5067

Continue Reading →

Today, the world is trying to create and educate data scientists because of the phenomenon of Big Data. And everyone is looking deeply into this technology. But no one is looking at the larger architectural picture of how Big Data needs to fit within the existing systems (data warehousing systems). Taking a look at the larger picture into which Big Data fits gives the data scientist the necessary context for how pieces of the puzzle should fit together. Most references on Big Data look at only one tiny part of a much larger whole. Until data gathered can be put into an existing framework or architecture it can’t be used to its full potential. Data Architecture a Primer for the Data Scientist addresses the larger architectural picture of how Big Data fits with the existing information infrastructure, an essential topic for the data scientist. Drawing upon years of practical experience and using numerous examples and an easy to understand framework. W.H. Inmon, and Daniel Linstedt define the importance of data architecture and how it can be used effectively to harness big data within existing systems. You’ll be able to: Turn textual information into a form that can be analyzed by standard tools. Make the connection between analytics and Big Data Understand how Big Data fits within an existing systems environment Conduct analytics on repetitive and non-repetitive data Discusses the value in Big Data that is often overlooked, non-repetitive data, and why there is significant business value in using it Shows how to turn textual information into a form that can be analyzed by standard tools. Explains how Big Data fits within an existing systems environment Presents new opportunities that are afforded by the advent of Big Data Demystifies the murky waters of repetitive and non-repetitive data in Big Data

Data Warehouse Blueprints

Business Intelligence in der Praxis
Author: Dani Schnider,Claus Jordan,Peter Welker,Joachim Wehner
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 3446451455
Category: Computers
Page: 283
View: 4815

Continue Reading →

Data-Warehouse-Lösungen mit Blueprints erfolgreich umsetzen Dieses Buch gibt Ihnen einen Überblick über eine typische Data-Warehouse-Architektur und zeigt anhand von zahlreichen Best Practice-Beispielen, wie Sie die einzelnen Komponenten eines Data Warehouses realisieren und betreiben können. Skalierbarkeit, Performance und Integration sind dabei die wichtigsten Erfolgsfaktoren. Der kompakte und kompetente Leitfaden für Ihr Projekt Warum benötigt man eine Staging Area? Wie sollen fehlende oder fehlerhafte Daten beim Ladeprozess behandelt werden? Ist es zweckmäßiger, einen oder mehrere Data Marts zu erstellen? Wo werden die Daten aus verschiedenen Datenquellen integriert und wie sollen sie historisiert werden? Zu diesen und vielen weiteren Fragen erhalten Sie Antworten sowie Tipps und Tricks aus der Praxis. Wertvolles Know-how aus der Praxis Profitieren Sie von der langjährigen Erfahrung der Autoren. Die vorgestellten Konzepte und Vorgehensweisen haben sich bereits in zahlreichen Projekten bewährt. EXTRA: E-Book inside AUS DEM INHALT • Einleitung • Architektur • Datenmodellierung • Datenintegration • Design der DWH-Schichten • Physisches Datenbankdesign • BI-Anwendungen • Betrieb

Die komplexe Perspektive

Einführung in die digitale Wirtschaft
Author: Jörn Dinkla
Publisher: BoD – Books on Demand
ISBN: 3839136938
Category: Computers
Page: 284
View: 2616

Continue Reading →

Die Menschheit ist in der Informations- und Wissensgesellschaft angekommen, und ständig tauchen weitere Neuigkeiten am Horizont auf: Das Internet der Dinge, Big Data, Data Science, intelligente Roboter und selbstfahrende Autos mit künstlicher Intelligenz. Wie soll man diese Technologien bewerten? Welche Folgen werden sie haben? Viele Menschen sind hier sehr skeptisch und fürchten, dass die Arbeitsplätze, die Privatsphäre und die Freiheit von diesen neuen Technologien bedroht werden. Politiker nutzen diese Ängste wiederum aus, um ihre politischen und wirtschaftlichen Interessen durchzusetzen, wie die Diskussionen zur Regulierung des Internets, zum Datenschutz, zur Buchpreisbindung und zur Scheinselbständigkeit zeigen. Aber die Gefahren lauern ganz woanders, als die meisten vermuten. Das Ziel dieses Buches ist, das Grundwissen für die digitale Wirtschaft und Gesellschaft möglichst einfach zu vermitteln. Das Buch richtet sich an alle, und es werden keine speziellen Vorkenntnisse benötigt. In diesem Buch erfährt man u.a. die folgenden Dinge... - Warum komplexe Systeme so schwierig zu kontrollieren sind - Wie man Daten verarbeitet und mit Data Science wichtiges Wissen darin findet - Warum die Künstliche Intelligenz noch lange nicht so intelligent wie Menschen ist - Warum die Marktwirtschaft ein Informationssystem ist und warum Sozialismus nicht funktioniert - Warum "Wissen" heute wichtiger ist als "Kapital" und wir nicht im "Kapitalismus" leben - Warum die Informationstechnologie, die Digitalisierung und Innovationen so wichtig sind - Warum der Fortschritt immer schneller wird - Warum die Politik vorsichtig bei einer Regulierung der IT sein muss Das Thema ist so umfangreich, weil die Technik sehr viele Bereiche des Lebens beeinflusst. Um die Grenzen der künstlichen Intelligenz zu verstehen, muss man auch die Grenzen der menschlichen Intelligenz kennen. Um die Gefährlichkeit einer falschen Regulierung einschätzen zu können, muss man über Grundwissen der Wirtschaft verfügen. Dazu behandelt dieses Buch viele unterschiedliche Bereiche: Datenverarbeitung, Data Science, Künstliche Intelligenz, die Digitalisierung, komplexe Systeme, die begrenzte Rationalität der Menschen, Wirtschaftswissenschaften, Globalisierung, Wettbewerb, Innovation, die agentenbasierte-Modellierung und ein wenig Politik. Nach dem Lesen dieses Buchs kann man die Welt aus der Perspektive der „komplexen Systeme“ betrachten und die „Gefahren“ neu bewerten.

Bioinformatics and Biomedical Engineering

5th International Work-Conference, IWBBIO 2017, Granada, Spain, April 26–28, 2017, Proceedings
Author: Ignacio Rojas,Francisco Ortuño
Publisher: Springer
ISBN: 3319561480
Category: Computers
Page: 673
View: 6207

Continue Reading →

This two volume set LNBI 10208 and LNBI 10209 constitutes the proceedings of the 5th International Work-Conference on Bioinformatics and Biomedical Engineering, IWBBIO 2017, held in Granada, Spain, in April 2017. The 122 papers presented were carefully reviewed and selected from 309 submissions. The scope of the conference spans the following areas: advances in computational intelligence for critical care; bioinformatics for healthcare and diseases; biomedical engineering; biomedical image analysis; biomedical signal analysis; biomedicine; challenges representing large-scale biological data; computational genomics; computational proteomics; computational systems for modeling biological processes; data driven biology - new tools, techniques and resources; eHealth; high-throughput bioinformatic tools for genomics; oncological big data and new mathematical tools; smart sensor and sensor-network architectures; time lapse experiments and multivariate biostatistics.

Relational Database Design and Implementation


Author: Jan L. Harrington
Publisher: Morgan Kaufmann
ISBN: 0128499028
Category: Computers
Page: 712
View: 1500

Continue Reading →

Relational Database Design and Implementation: Clearly Explained, Fourth Edition, provides the conceptual and practical information necessary to develop a database design and management scheme that ensures data accuracy and user satisfaction while optimizing performance. Database systems underlie the large majority of business information systems. Most of those in use today are based on the relational data model, a way of representing data and data relationships using only two-dimensional tables. This book covers relational database theory as well as providing a solid introduction to SQL, the international standard for the relational database data manipulation language. The book begins by reviewing basic concepts of databases and database design, then turns to creating, populating, and retrieving data using SQL. Topics such as the relational data model, normalization, data entities, and Codd's Rules (and why they are important) are covered clearly and concisely. In addition, the book looks at the impact of big data on relational databases and the option of using NoSQL databases for that purpose. Features updated and expanded coverage of SQL and new material on big data, cloud computing, and object-relational databases Presents design approaches that ensure data accuracy and consistency and help boost performance Includes three case studies, each illustrating a different database design challenge Reviews the basic concepts of databases and database design, then turns to creating, populating, and retrieving data using SQL

big data @ work

Chancen erkennen, Risiken verstehen
Author: Thomas H. Davenport
Publisher: Vahlen
ISBN: 3800648156
Category: Fiction
Page: 214
View: 4265

Continue Reading →

Big Data in Unternehmen. Dieses neue Buch gibt Managern ein umfassendes Verständnis dafür, welche Bedeutung Big Data für Unternehmen zukünftig haben wird und wie Big Data tatsächlich genutzt werden kann. Am Ende jedes Kapitels aktivieren Fragen, selbst nach Lösungen für eine erfolgreiche Implementierung und Nutzung von Big Data im eigenen Unternehmen zu suchen. Die Schwerpunkte - Warum Big Data für Sie und Ihr Unternehmen wichtig ist - Wie Big Data Ihre Arbeit, Ihr Unternehmen und Ihre Branche verändern - - wird - Entwicklung einer Big Data-Strategie - Der menschliche Aspekt von Big Data - Technologien für Big Data - Wie Sie erfolgreich mit Big Data arbeiten - Was Sie von Start-ups und Online-Unternehmen lernen können - Was Sie von großen Unternehmen lernen können: Big Data und Analytics 3.0 Der Experte Thomas H. Davenport ist Professor für Informationstechnologie und -management am Babson College und Forschungswissenschaftler am MIT Center for Digital Business. Zudem ist er Mitbegründer und Forschungsdirektor am International Institute for Analytics und Senior Berater von Deloitte Analytics.

Data Science mit Python

Das Handbuch für den Einsatz von IPython, Jupyter, NumPy, Pandas, Matplotlib und Scikit-Learn
Author: Jake VanderPlas
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 3958456979
Category: Computers
Page: 552
View: 5040

Continue Reading →

Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: ● IPython und Jupyter für datenintensive Berechnungen ● NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python ● Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten ● Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

Visualize This!


Author: Nathan Yau
Publisher: John Wiley & Sons
ISBN: 3527760229
Category: Statistics / Graphic methods / Data processing
Page: 422
View: 4004

Continue Reading →

A guide on how to visualise and tell stories with data, providing practical design tips complemented with step-by-step tutorials.

SAP Business Information Warehouse

Mehrdimensionale Datenmodellierung
Author: Michael Hahne
Publisher: Springer-Verlag
ISBN: 3540269584
Category: Business & Economics
Page: 219
View: 4005

Continue Reading →

Das SAP Business Information Warehouse (BW) als Data Warehouse-Lösung zielt auf eine zeitnahe Versorgung betrieblicher Entscheidungsträger mit relevanten Informationen zu Analysezwecken. Basis hierfür sind die mehrdimensionalen Info-Cubes, deren Modellierung maßgeblich die Leistungsfähigkeit und erfolgreiche Nutzung eines BW-Systems beeinflusst. Dieses Buch stellt den gesamten Prozess der mehrdimensionalen Modellierung von Informationssystemen auf Basis des Business Information Warehouse dar, präsentiert adäquate Methoden und gibt Gestaltungsempfehlungen. Das Buch wendet sich an SAP-Berater und IT-Mitarbeiter, die mit der Implementierung eines BW-Systems betraut sind. Es ist als praktischer Leitfaden konzipiert und bietet neben dem Einstieg in das Thema auch ein fundiertes Nachschlagewerk für die tägliche Arbeit.

Additive Fertigungsverfahren

Additive Manufacturing und 3D-Drucken für Prototyping - Tooling - Produktion
Author: Andreas Gebhardt
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 3446452362
Category: Technology & Engineering
Page: 736
View: 9095

Continue Reading →

Die aktualisierte 5. Auflage dieses Standardwerks beschreibt die, noch anhaltende, Entwicklung und Verbreitung der Generativen Fertigungstechnik über alle Branchen und viele Anwendergruppen hinweg. Leistungsfähige Production Printer arbeiten in der Industrie und Fabber, kleine, preiswerte und meist selbst zu bauende 3D-Drucker, erschließen die Generative Fertigung auch für Privatleute und an entlegenen Orten. Seriöse Journale und Tageszeitungen machen mit Druckern Erfolgsgeschichten auf. Drucker sind in aller Munde. Daneben wird die Technik sukzessive verbessert. Die Prozesse werden stabiler und vor allem reproduzierbar. Eine wirkliche Massenproduktion von Einzelteilen gelingt in einzelnen Branchen und beginnt sich durchzusetzen. Neu in der 5. Auflage sind: - Aktualisierungen: Firmen, Maschinen und Material; Anwendungsbeispiele - Erweiterungen: Fabbertechnologie, Do It Yourself Drucker EXTRA: E-Book inside

Microservices

Konzeption und Design
Author: Sam Newman
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 3958450830
Category: Computers
Page: 312
View: 4642

Continue Reading →

Feingranulare Systeme mit Microservices aufbauen Design, Entwicklung, Deployment, Testen und Monitoring Sicherheitsaspekte, Authentifizierung und Autorisierung Verteilte Systeme haben sich in den letzten Jahren stark verändert: Große monolithische Architekturen werden zunehmend in viele kleine, eigenständige Microservices aufgespalten. Aber die Entwicklung solcher Systeme bringt Herausforderungen ganz eigener Art mit sich. Dieses Buch richtet sich an Softwareentwickler, die sich über die zielführenden Aspekte von Microservice-Systemen wie Design, Entwicklung, Testen, Deployment und Monitoring informieren möchten. Sam Newman veranschaulicht und konkretisiert seine ganzheitliche Betrachtung der grundlegenden Konzepte von Microservice-Architekturen anhand zahlreicher praktischer Beispiele und Ratschläge. Er geht auf die Themen ein, mit denen sich Systemarchitekten und Administratoren bei der Einrichtung, Verwaltung und Entwicklung dieser Architekturen in jedem Fall auseinandersetzen müssen. Aus dem Inhalt: Vorteile von Microservices Gestaltung von Services Ausrichtung der Systemarchitektur an der Organisationsstruktur Möglichkeiten zur Integration von Services Schrittweise Aufspaltung einer monolithischen Codebasis Deployment einzelner Microservices mittels Continuous Integration Testen und Monitoring verteilter Systeme Sicherheitsaspekte Authentifizierung und Autorisierung zwischen Benutzer und Service bzw. zwischen Services untereinander Skalierung von Microservice-Architekturen »Microservice-Architekturen besitzen viele interessante Eigenschaften, allerdings sind bei der Umstellung so einige Fallstricke zu beachten. Dieses Buch wird Ihnen helfen herauszufinden, ob Microservices für Ihre Zwecke geeignet sind und zeigt Ihnen, wie Sie die Fallstricke umgehen können.« Martin Fowler, Chief Scientist, ThoughtWorks

Walkaway

Roman
Author: Cory Doctorow
Publisher: Heyne Verlag
ISBN: 3641195799
Category: Fiction
Page: 736
View: 4188

Continue Reading →

Die nahe Zukunft: Der Planet ist vom Klimawandel gezeichnet, die moderne Gesellschaft wird von den Ultra-Reichen regiert und die Städte haben sich in Gefängnisse für den normalen Bürger verwandelt. Doch es ist auch eine Welt, in der sich Lebensmittel, Kleidung und Obdach per Knopfdruck produzieren lassen. Warum also in einem System ausharren, das die Freiheit des Menschen beschränkt? Vier ungleiche Helden machen sich auf den Weg in die Wildnis. Dort suchen sie Unabhängigkeit, Glück und Selbstbestimmung. Was sie aber stattdessen dort finden, stellt ihre ganze Welt auf den Kopf: den Weg zur Unsterblichkeit ...

Risiko

Wie man die richtigen Entscheidungen trifft
Author: Gerd Gigerenzer
Publisher: C. Bertelsmann Verlag
ISBN: 3641119901
Category: Psychology
Page: 400
View: 9740

Continue Reading →

Der neue Bestseller von Gerd Gigerenzer Erinnern wir uns an die weltweite Angst vor der Schweinegrippe, als Experten eine nie dagewesene Pandemie prognostizierten und Impfstoff für Millionen produziert wurde, der später still und heimlich entsorgt werden musste. Für Gerd Gigerenzer ist dies nur ein Beleg unseres irrationalen Umgangs mit Risiken. Und das gilt für Experten ebenso wie für Laien. An Beispielen aus Medizin, Rechtswesen und Finanzwelt erläutert er, wie die Psychologie des Risikos funktioniert, was sie mit unseren entwicklungsgeschichtlich alten Hirnstrukturen zu tun hat und welche Gefahren damit einhergehen. Dabei analysiert er die ungute Rolle von irreführenden Informationen, die von Medien und Fachleuten verbreitet werden. Doch Risiken und Ungewissheiten richtig einzuschätzen kann und sollte jeder lernen. Diese Risikoschulung erprobt Gigerenzer seit vielen Jahren mit verblüffenden Ergebnissen. Sein Fazit: Schon Kinder können lernen, mit Risiken realistisch umzugehen und sich gegen Panikmache wie Verharmlosung zu immunisieren.

Grundlagen der Computerlinguistik

Mensch-Maschine-Kommunikation in natürlicher Sprache
Author: Roland R. Hausser
Publisher: Springer-Verlag
ISBN: 3642573061
Category: Computers
Page: 572
View: 1230

Continue Reading →

Die zentrale Aufgabe einer zukunftsorientierten Computerlinguistik ist die Entwicklung kognitiver Maschinen, mit denen Menschen in ihrer jeweiligen Sprache frei reden können. Langfristig umfaßt diese Zielsetzung eine funktional ausgerichtete Theoriebildung, eine objektive Verifikationsmethode und eine Fülle praktischer Anwendungen. Für die natürlichsprachliche Kommunikation wird nicht nur Sprachverarbeitung, sondern auch nichtsprachliche Wahrnehmung und Handlung benötigt. Deshalb ist der Inhalt dieses Lehrbuchs als Sprachtheorie für die Konstruktion sprechender Roboter organisiert. Sein zentrales Thema ist die Kommunikationsmechanik natürlicher Sprachen - beim Sprecher und beim Hörer. Der Inhalt ist in folgende vier Teile mit je sechs Kapiteln gegliedert: Sprachtheorie; Formale Grammatik; Morphologie und Syntax; Semantik und Pragmatik. Insgesamt 772 Übungsaufgaben dienen der Verständniskontrolle und -vertiefung.

UML 2 Für Dummies


Author: Michael Jesse Chonoles,James A. Schardt
Publisher: N.A
ISBN: 9783527701124
Category:
Page: 415
View: 9996

Continue Reading →

Meinen Sie nicht auch, dass man beim objektorientierten Programmieren schnell den Überblick verlieren kann? Nicht mit Unified Modeling Language und diesem Buch! Michael J. Chonoles und James A. Schardt zeigen Ihnen, wie Sie UML auf die un-terschiedlichen Systeme und Problemstellungen anwenden. Viele Fälle aus den verschiedenen Businessbereichen geben eine Vorstellung von den praktischen Einsatzbereichen und stehen Ihnen hilfreich zur Seite, eigene Anwendungen zu konstruieren und zu visualisieren. Tauchen Sie mit der aktuellsten Version 2.0 tief ins Objekt-, Komponenten- und dynamische Modeling ein und erhalten Sie darüber hinaus sehr viel Know-how zu Soft-wareentwicklung und -Design mit UML. Sie erfahren: * Welche Grundlagen der UML es gibt und wie man sie benutzt * Wie Sie ein Modell mit Hilfe der UML erstellen, und was man mit Klassen, Objek-ten, Assoziationen, Vererbungen und Generalisierungen anfängt * Wieso Use Cases so großartig für die Organisation Ihrer Produkte und Ihrer Systeme sind * Wie die verschiedenen Arten von Interaktionsdiagrammen in Aktion aussehen, und wie Sie diese zu Lösungen, Mustern oder Frameworks kombinieren * Wie Sie Zustandsdiagramme entwickeln und ein System entwerfen, in dem Sie Systempläne, Packages und Untersysteme benutzen

Die Gräber

Srebrenica und Vukovar
Author: Eric Stover,Gilles Peress
Publisher: N.A
ISBN: 9783931141752
Category:
Page: 334
View: 5054

Continue Reading →

Internet und Partizipation

Bottom-up oder Top-down? Politische Beteiligungsmöglichkeiten im Internet
Author: Kathrin Voss
Publisher: Springer-Verlag
ISBN: 3658010282
Category: Political Science
Page: 348
View: 7174

Continue Reading →

Mit dem Internet wurde schon früh die Vision einer partizipativen Gesellschaft verbunden, die Vorstellung, das neue Medium würde zu politisch besser informierten Bürgern und zu mehr Beteiligung der Bürger am politischen Prozess führen. Doch ist das so? Wer beteiligt sich an E-Partizipationsangeboten? Lassen sich Menschen online mobilisieren? Welchen Einfluss haben die neuen Online-Tools auf die politische Kommunikation, politische Entscheidungen und das politische System selbst? Dieser Band behandelt diese Fragen aus unterschiedlichen Perspektiven, sowohl von der zivilgesellschaftlichen Seite, also bottom-up, als auch von Seiten der Politik, also top-down. Enthalten sind Beiträge von WissenschaftlerInnen und VertreterInnen aus der Praxis, zivilgesellschaftlichen Organisationen, der Politik und den Medien.