• Kapcsolat

  • Hírlevél

  • Rólunk

  • Szállítási lehetőségek

  • Prospero könyvpiaci podcast

  • Markov Decision Processes and Reinforcement Learning

    Markov Decision Processes and Reinforcement Learning by Puterman, Martin L.; Chan, Timothy C. Y.;

      • 10% KEDVEZMÉNY?

      • A kedvezmény csak az 'Értesítés a kedvenc témákról' hírlevelünk címzettjeinek rendeléseire érvényes.
      • Kiadói listaár GBP 110.00
      • Az ár azért becsült, mert a rendelés pillanatában nem lehet pontosan tudni, hogy a beérkezéskor milyen lesz a forint árfolyama az adott termék eredeti devizájához képest. Ha a forint romlana, kissé többet, ha javulna, kissé kevesebbet kell majd fizetnie.

        52 552 Ft (50 050 Ft + 5% áfa)
      • Kedvezmény(ek) 10% (cc. 5 255 Ft off)
      • Kedvezményes ár 47 297 Ft (45 045 Ft + 5% áfa)

    52 552 Ft

    db

    Beszerezhetőség

    Még nem jelent meg, de rendelhető. A megjelenéstől számított néhány héten belül megérkezik.

    Why don't you give exact delivery time?

    A beszerzés időigényét az eddigi tapasztalatokra alapozva adjuk meg. Azért becsült, mert a terméket külföldről hozzuk be, így a kiadó kiszolgálásának pillanatnyi gyorsaságától is függ. A megadottnál gyorsabb és lassabb szállítás is elképzelhető, de mindent megteszünk, hogy Ön a lehető leghamarabb jusson hozzá a termékhez.

    A termék adatai:

    • Kiadó Cambridge University Press
    • Megjelenés dátuma 2026. április 30.

    • ISBN 9781009098410
    • Kötéstípus Keménykötés
    • Terjedelem780 oldal
    • Méret 0x0x0 mm
    • Súly 500 g
    • Nyelv angol
    • 700

    Kategóriák

    Rövid leírás:

    Provides a systematic, applications-oriented development of MDPs and RL theory and methods with algorithms and simulations.

    Több

    Hosszú leírás:

    This book offers a comprehensive introduction to Markov decision process and reinforcement learning fundamentals using common mathematical notation and language. Its goal is to provide a solid foundation that enables readers to engage meaningfully with these rapidly evolving fields. Topics covered include finite and infinite horizon models, partially observable models, value function approximation, simulation-based methods, Monte Carlo methods, and Q-learning. Rigorous mathematical concepts and algorithmic developments are supported by numerous worked examples. As an up-to-date successor to Martin L. Puterman's influential 1994 textbook, this volume assumes familiarity with probability, mathematical notation, and proof techniques. It is ideally suited for students, researchers, and professionals in operations research, computer science, engineering, and economics.

    Több

    Tartalomjegyzék:

    Preface; 1. Introduction; Part I. Fundamentals: 2. Markov decision process fundamentals; 3. Examples and applications; Part II. Classical Markov Decision Process Models: 4. Finite horizon models; 5. Infinite horizon models: expected discounted reward; 6. Infinite horizon models: expected total reward; 7. Infinite horizon models: long-run average reward; 8. Partially observable Markov decision processes; Part III. Reinforcement Learning: 9. Value function approximation; 10. Simulation in tabular models; 11. Simulation with function approximation; Appendix A. Notation and conventions; Appendix B. Markov chains; Appendix C. Linear programming; Bibliography; Index.

    Több
    0