Algorithms for Reinforcement Learning


Author: Csaba Szepesvari
Publisher: Morgan & Claypool Publishers
ISBN: 1608454924
Category: Computers
Page: 89
View: 1803

Continue Reading →

Reinforcement learning is a learning paradigm concerned with learning to control a system so as to maximize a numerical performance measure that expresses a long-term objective. What distinguishes reinforcement learning from supervised learning is that only partial feedback is given to the learner about the learner's predictions. Further, the predictions may have long term effects through influencing the future state of the controlled system. Thus, time plays a special role. The goal in reinforcement learning is to develop efficient learning algorithms, as well as to understand the algorithms' merits and limitations. Reinforcement learning is of great interest because of the large number of practical applications that it can be used to address, ranging from problems in artificial intelligence to operations research or control engineering. In this book, we focus on those algorithms of reinforcement learning that build on the powerful theory of dynamic programming.We give a fairly comprehensive catalog of learning problems, describe the core ideas, note a large number of state of the art algorithms, followed by the discussion of their theoretical properties and limitations.

Reinforcement Learning

State-of-the-Art
Author: Marco Wiering,Martijn van Otterlo
Publisher: Springer Science & Business Media
ISBN: 3642276458
Category: Computers
Page: 638
View: 6146

Continue Reading →

Reinforcement learning encompasses both a science of adaptive behavior of rational beings in uncertain environments and a computational methodology for finding optimal behaviors for challenging problems in control, optimization and adaptive behavior of intelligent agents. As a field, reinforcement learning has progressed tremendously in the past decade. The main goal of this book is to present an up-to-date series of survey articles on the main contemporary sub-fields of reinforcement learning. This includes surveys on partially observable environments, hierarchical task decompositions, relational knowledge representation and predictive state representations. Furthermore, topics such as transfer, evolutionary methods and continuous spaces in reinforcement learning are surveyed. In addition, several chapters review reinforcement learning methods in robotics, in games, and in computational neuroscience. In total seventeen different subfields are presented by mostly young experts in those areas, and together they truly represent a state-of-the-art of current reinforcement learning research. Marco Wiering works at the artificial intelligence department of the University of Groningen in the Netherlands. He has published extensively on various reinforcement learning topics. Martijn van Otterlo works in the cognitive artificial intelligence group at the Radboud University Nijmegen in The Netherlands. He has mainly focused on expressive knowledge representation in reinforcement learning settings.

Machine Learning and Knowledge Discovery in Databases

European Conference, ECML PKDD 2012, Bristol, UK, September 24-28, 2012. Proceedings
Author: Peter A. Flach,Tijl De Bie,Nello Cristianini
Publisher: Springer
ISBN: 3642334865
Category: Computers
Page: 867
View: 1359

Continue Reading →

This two-volume set LNAI 7523 and LNAI 7524 constitutes the refereed proceedings of the European Conference on Machine Learning and Knowledge Discovery in Databases: ECML PKDD 2012, held in Bristol, UK, in September 2012. The 105 revised research papers presented together with 5 invited talks were carefully reviewed and selected from 443 submissions. The final sections of the proceedings are devoted to Demo and Nectar papers. The Demo track includes 10 papers (from 19 submissions) and the Nectar track includes 4 papers (from 14 submissions). The papers grouped in topical sections on association rules and frequent patterns; Bayesian learning and graphical models; classification; dimensionality reduction, feature selection and extraction; distance-based methods and kernels; ensemble methods; graph and tree mining; large-scale, distributed and parallel mining and learning; multi-relational mining and learning; multi-task learning; natural language processing; online learning and data streams; privacy and security; rankings and recommendations; reinforcement learning and planning; rule mining and subgroup discovery; semi-supervised and transductive learning; sensor data; sequence and string mining; social network mining; spatial and geographical data mining; statistical methods and evaluation; time series and temporal data mining; and transfer learning.

Künstliche Intelligenz

ein moderner Ansatz
Author: Stuart J. Russell,Stuart Russell,Peter Norvig
Publisher: N.A
ISBN: 9783827370891
Category:
Page: 1327
View: 3673

Continue Reading →

Logische Grundlagen der Künstlichen Intelligenz


Author: Nils J. Nilsson
Publisher: Springer-Verlag
ISBN: 3322928810
Category: Technology & Engineering
Page: 576
View: 5958

Continue Reading →

Das Buch ist die deutsche Übersetzung des Standardwerkes der Stanforder Professoren Michael R. Genesereth und Nils J. Nilsson.Im Unterschied zu deutschen Lehrbüchern der Informatik zeichnet sich das Buch dadurch aus, daß es einen gut lesbaren Überblick gibt, ohne allzu formalistisch zu werden, gleichwohl aber von hohem Niveau ist und die Ergebnisse jüngster Forschung berücksichtigt. Das Buch empfiehlt sich sowohl für Studenten und Dozenten der Inf ormatik, aber auch für Forscher aus anderen Gebieten, die von den Grundlagen der Künstlichen Intelligenz profitieren möchten.

Planning with Markov Decision Processes

An AI Perspective
Author: Mausam,Andrey Kolobov
Publisher: Morgan & Claypool Publishers
ISBN: 1608458865
Category: Computers
Page: 194
View: 7629

Continue Reading →

Markov Decision Processes (MDPs) are widely popular in Artificial Intelligence for modeling sequential decision-making scenarios with probabilistic dynamics. They are the framework of choice when designing an intelligent agent that needs to act for long periods of time in an environment where its actions could have uncertain outcomes. MDPs are actively researched in two related subareas of AI, probabilistic planning and reinforcement learning. Probabilistic planning assumes known models for the agent's goals and domain dynamics, and focuses on determining how the agent should behave to achieve its objectives. On the other hand, reinforcement learning additionally learns these models based on the feedback the agent gets from the environment. This book provides a concise introduction to the use of MDPs for solving probabilistic planning problems, with an emphasis on the algorithmic perspective. It covers the whole spectrum of the field, from the basics to state-of-the-art optimal and approximation algorithms. We first describe the theoretical foundations of MDPs and the fundamental solution techniques for them. We then discuss modern optimal algorithms based on heuristic search and the use of structured representations. A major focus of the book is on the numerous approximation schemes for MDPs that have been developed in the AI literature. These include determinization-based approaches, sampling techniques, heuristic functions, dimensionality reduction, and hierarchical representations. Finally, we briefly introduce several extensions of the standard MDP classes that model and solve even more complex planning problems. Table of Contents: Introduction / MDPs / Fundamental Algorithms / Heuristic Search Algorithms / Symbolic Algorithms / Approximation Algorithms / Advanced Notes

Neuronale Netze selbst programmieren

Ein verständlicher Einstieg mit Python
Author: Tariq Rashid
Publisher: O'Reilly
ISBN: 3960101031
Category: Computers
Page: 232
View: 2893

Continue Reading →

Neuronale Netze sind Schlüsselelemente des Deep Learning und der Künstlichen Intelligenz, die heute zu Erstaunlichem in der Lage sind. Sie sind Grundlage vieler Anwendungen im Alltag wie beispielsweise Spracherkennung, Gesichtserkennung auf Fotos oder die Umwandlung von Sprache in Text. Dennoch verstehen nur wenige, wie neuronale Netze tatsächlich funktionieren. Dieses Buch nimmt Sie mit auf eine unterhaltsame Reise, die mit ganz einfachen Ideen beginnt und Ihnen Schritt für Schritt zeigt, wie neuronale Netze arbeiten: - Zunächst lernen Sie die mathematischen Konzepte kennen, die den neuronalen Netzen zugrunde liegen. Dafür brauchen Sie keine tieferen Mathematikkenntnisse, denn alle mathematischen Ideen werden behutsam und mit vielen Illustrationen und Beispielen erläutert. Eine Kurzeinführung in die Analysis unterstützt Sie dabei. - Dann geht es in die Praxis: Nach einer Einführung in die populäre und leicht zu lernende Programmiersprache Python bauen Sie allmählich Ihr eigenes neuronales Netz mit Python auf. Sie bringen ihm bei, handgeschriebene Zahlen zu erkennen, bis es eine Performance wie ein professionell entwickeltes Netz erreicht. - Im nächsten Schritt tunen Sie die Leistung Ihres neuronalen Netzes so weit, dass es eine Zahlenerkennung von 98 % erreicht – nur mit einfachen Ideen und simplem Code. Sie testen das Netz mit Ihrer eigenen Handschrift und werfen noch einen Blick in das mysteriöse Innere eines neuronalen Netzes. - Zum Schluss lassen Sie das neuronale Netz auf einem Raspberry Pi Zero laufen. Tariq Rashid erklärt diese schwierige Materie außergewöhnlich klar und verständlich, dadurch werden neuronale Netze für jeden Interessierten zugänglich und praktisch nachvollziehbar.

Homo sapiens.

Leben im 21. Jahrhundert. Was bleibt vom Menschen?
Author: Ray Kurzweil
Publisher: N.A
ISBN: 9783548750262
Category:
Page: 509
View: 4371

Continue Reading →

Statistical Relational Artificial Intelligence

Logic, Probability, and Computation
Author: Luc De Raedt,Kristian Kersting,Sriraam Natarajan,David Poole
Publisher: Morgan & Claypool Publishers
ISBN: 1627058427
Category: Computers
Page: 189
View: 1078

Continue Reading →

An intelligent agent interacting with the real world will encounter individual people, courses, test results, drugs prescriptions, chairs, boxes, etc., and needs to reason about properties of these individuals and relations among them as well as cope with uncertainty. Uncertainty has been studied in probability theory and graphical models, and relations have been studied in logic, in particular in the predicate calculus and its extensions. This book examines the foundations of combining logic and probability into what are called relational probabilistic models. It introduces representations, inference, and learning techniques for probability, logic, and their combinations. The book focuses on two representations in detail: Markov logic networks, a relational extension of undirected graphical models and weighted first-order predicate calculus formula, and Problog, a probabilistic extension of logic programs that can also be viewed as a Turing-complete relational extension of Bayesian networks.

Design Thinking Live

Wie man Ideen entwickelt und Probleme löst
Author: Christoph Meinel,Ulrich Weinberg,Timm Krohn
Publisher: N.A
ISBN: 9783867744270
Category:
Page: 268
View: 9227

Continue Reading →

Beiträger aus Forschung, Lehre und Wirtschaft (darunter Jochen Gürtler, SAP; Martin Wegner, DHL; Julia Leihener, Telekom Creation Center) berichten über ihre Erfahrungen oder besser ihre Erlebnisse mit Design Thinking. Sie machen anschaulich, dass und wie Problemlösung, Ideenfindung und 'sechte ́ Innovation im interdisziplinär, experimentell und vor allem nutzerorientiert angelegten Rahmen besser und erfolgreicher möglich sind als in herkömmlichen Innovationsprozessen. Für sie alle steht Design Thinking für eine Denkweise, eine Art, die Welt zu sehen, in deren Zentrum unbedingt der Mensch steht-als Kunde, als Nutzer, als Lernender-, auf den sich alle Entwicklungs-und Innovationsarbeit beziehen soll. Sie wollen vermitteln, wie Design Thinking sich 'sanfühlt ́, welche Wirkungen, bis hinein in den persönlichen Alltag, sich ergeben, wie sich eine neue Form der Aufmerksamkeit und Achtsamkeit, eine Haltung des vernetzten Denkens einstellt und schließlich-auf Unternehmensebene-eine neue Arbeitskultur entstehen kann.

Statistik-Workshop für Programmierer


Author: Allen B. Downey
Publisher: O'Reilly Germany
ISBN: 3868993436
Category: Computers
Page: 160
View: 7329

Continue Reading →

Wenn Sie programmieren können, beherrschen Sie bereits Techniken, um aus Daten Wissen zu extrahieren. Diese kompakte Einführung in die Statistik zeigt Ihnen, wie Sie rechnergestützt, anstatt auf mathematischem Weg Datenanalysen mit Python durchführen können. Praktischer Programmier-Workshop statt grauer Theorie: Das Buch führt Sie anhand eines durchgängigen Fallbeispiels durch eine vollständige Datenanalyse -- von der Datensammlung über die Berechnung statistischer Kennwerte und Identifikation von Mustern bis hin zum Testen statistischer Hypothesen. Gleichzeitig werden Sie mit statistischen Verteilungen, den Regeln der Wahrscheinlichkeitsrechnung, Visualisierungsmöglichkeiten und vielen anderen Arbeitstechniken und Konzepten vertraut gemacht. Statistik-Konzepte zum Ausprobieren: Entwickeln Sie über das Schreiben und Testen von Code ein Verständnis für die Grundlagen von Wahrscheinlichkeitsrechnung und Statistik: Überprüfen Sie das Verhalten statistischer Merkmale durch Zufallsexperimente, zum Beispiel indem Sie Stichproben aus unterschiedlichen Verteilungen ziehen. Nutzen Sie Simulationen, um Konzepte zu verstehen, die auf mathematischem Weg nur schwer zugänglich sind. Lernen Sie etwas über Themen, die in Einführungen üblicherweise nicht vermittelt werden, beispielsweise über die Bayessche Schätzung. Nutzen Sie Python zur Bereinigung und Aufbereitung von Rohdaten aus nahezu beliebigen Quellen. Beantworten Sie mit den Mitteln der Inferenzstatistik Fragestellungen zu realen Daten.

Das Geheimnis des menschlichen Denkens

Einblicke in das Reverse Engineering des Gehirns
Author: Ray Kurzweil
Publisher: Lola Books
ISBN: 394420316X
Category: Science
Page: 352
View: 8118

Continue Reading →

Der Wettlauf um das Gehirn hat begonnen. Sowohl die EU als auch die USA haben gewaltige Forschungsprojekte ins Leben gerufen um das Geheimnis des menschlichen Denkens zu entschlüsseln. 2023 soll es dann soweit sein: Das menschliche Gehirn kann vollständig simuliert werden. In "Das Geheimnis des menschlichen Denkens" gewährt Googles Chefingenieur Ray Kurzweil einen spannenden Einblick in das Reverse Engineering des Gehirns. Er legt dar, wie mithilfe der Mustererkennungstheorie des Geistes der ungeheuren Komplexität des Gehirns beizukommen ist und wirft einen ebenso präzisen wie überraschenden Blick auf die am Horizont sich bereits abzeichnende Zukunft. Ist das menschliche Gehirn erst einmal simuliert, wird künstliche Intelligenz die Fähigkeiten des Menschen schon bald übertreffen. Ein Ereignis, das Kurzweil aufgrund der bereits in "Menschheit 2.0" entworfenen exponentiellen Wachstumskurve der Informationstechnologien bereits für das Jahr 2029 prognostiziert. Aber was dann? Kurzweil ist zuversichtlich, dass die Vorteile künstlicher Intelligenz mögliche Bedrohungsszenarien überwiegen und sie uns entscheidend dabei hilft, uns weiterzuentwickeln und die Herausforderungen der Zukunft zu meistern.

Leben 3.0

Mensch sein im Zeitalter Künstlicher Intelligenz
Author: Max Tegmark
Publisher: Ullstein Buchverlage
ISBN: 3843716706
Category: Social Science
Page: 528
View: 6935

Continue Reading →

Die Nobelpreis-Schmiede Massachusetts Institute of Technology ist der bedeutendste technologische Think Tank der USA. Dort arbeitet Professor Max Tegmark mit den weltweit führenden Entwicklern künstlicher Intelligenz zusammen, die ihm exklusive Einblicke in ihre Labors gewähren. Die Erkenntnisse, die er daraus zieht, sind atemberaubend und zutiefst verstörend zugleich. Neigt sich die Ära der Menschen dem Ende zu? Der Physikprofessor Max Tegmark zeigt anhand der neusten Forschung, was die Menschheit erwartet. Hier eine Auswahl möglicher Szenarien: - Eroberer: Künstliche Intelligenz übernimmt die Macht und entledigt sich der Menschheit mit Methoden, die wir noch nicht einmal verstehen. - Der versklavte Gott: Die Menschen bemächtigen sich einer superintelligenten künstlichen Intelligenz und nutzen sie, um Hochtechnologien herzustellen. - Umkehr: Der technologische Fortschritt wird radikal unterbunden und wir kehren zu einer prä-technologischen Gesellschaft im Stil der Amish zurück. - Selbstzerstörung: Superintelligenz wird nicht erreicht, weil sich die Menschheit vorher nuklear oder anders selbst vernichtet. - Egalitäres Utopia: Es gibt weder Superintelligenz noch Besitz, Menschen und kybernetische Organismen existieren friedlich nebeneinander. Max Tegmark bietet kluge und fundierte Zukunftsszenarien basierend auf seinen exklusiven Einblicken in die aktuelle Forschung zur künstlichen Intelligenz.

Grundkurs Künstliche Intelligenz

Eine praxisorientierte Einführung
Author: Wolfgang Ertel
Publisher: Springer-Verlag
ISBN: 3658135492
Category: Computers
Page: 385
View: 5258

Continue Reading →

Alle Teilgebiete der KI werden mit dieser Einführung kompakt, leicht verständlich und anwendungsbezogen dargestellt. Hier schreibt jemand, der das Gebiet nicht nur bestens kennt, sondern auch in der Lehre engagiert und erfolgreich vertritt. Von der klassischen Logik über das Schließen mit Unsicherheit und maschinelles Lernen bis hin zu Anwendungen wie Expertensysteme oder lernfähige Roboter. Neben dem umfassenden Einblick in dieses faszinierende Teilgebiet der Informatik gewinnen Sie vertiefte Kenntnisse, z. B. hinsichtlich wichtiger Verfahren zur Repräsentation und Verarbeitung von Wissen. Der Anwendungsbezug steht im Fokus der Darstellung. Viele Übungsaufgaben mit Lösungen sowie strukturierte Verweise auf Literatur und Ressourcen im Web ermöglichen ein effektives und kurzweiliges Selbststudium. Für die 3. Auflage ...

Data mining

praktische Werkzeuge und Techniken für das maschinelle Lernen
Author: Ian H. Witten,Eibe Frank
Publisher: N.A
ISBN: 9783446215337
Category:
Page: 386
View: 9033

Continue Reading →