Extensive Form Game. “Burn the Boats” לעיתים אנחנו שומעים את הביטוי “let’s burn the boats”. מה הכוונה ? –לוותר על אלטרנטיבה B –ובכך לא להותיר ברירה ולנסות.

Slides:



Advertisements
Similar presentations
Completeness and Expressiveness. תזכורת למערכת ההוכחה של לוגיקה מסדר ראשון : אקסיומות 1. ) ) (( 2. )) ) (( )) ( ) ((( 3. ))) F( F( ( 4. ) v) ( ) v ((
Advertisements

An Introduction to Game Theory Part V: Extensive Games with Perfect Information Bernhard Nebel.
M9302 Mathematical Models in Economics Instructor: Georgi Burlakov 3.1.Dynamic Games of Complete but Imperfect Information Lecture
Game Theory Assignment For all of these games, P1 chooses between the columns, and P2 chooses between the rows.
ECON 100 Tutorial: Week 9 office: LUMS C85.
BASICS OF GAME THEORY. Recap Decision Theory vs. Game Theory Rationality Completeness Transitivity What’s in a game? Players Actions Outcomes Preferences.
This Segment: Computational game theory Lecture 1: Game representations, solution concepts and complexity Tuomas Sandholm Computer Science Department Carnegie.
Stackelberg -leader/follower game 2 firms choose quantities sequentially (1) chooses its output; then (2) chooses it output; then the market clears This.
תרגילי חזרה. General Things to Remember Be careful to identify if we’re talking about gains or costs (because the search cost is always negative) Check.
Non-Cooperative Game Theory To define a game, you need to know three things: –The set of players –The strategy sets of the players (i.e., the actions they.
Chapter 6 Game Theory © 2006 Thomson Learning/South-Western.
TOPIC 5 SEQUENTIAL MOVE GAMES WITH PERFECT INFORMATION. Sequential games: Strategic interactions where there is a strict order of play. At least one player.
Game-theoretic analysis tools Necessary for building nonmanipulable automated negotiation systems.
Game Theory Lecture 8.
Extensive-form games. Extensive-form games with perfect information Player 1 Player 2 Player 1 2, 45, 33, 2 1, 00, 5 Players do not move simultaneously.
Chapter 11 Game Theory and the Tools of Strategic Business Analysis.
EC941 - Game Theory Prof. Francesco Squintani Lecture 8 1.
(Paradigm=Example) Artist unknown A group of scientists placed 5 monkeys in a cage and in the middle, a ladder with bananas on the top. קבוצת מדענים.
1 Unless otherwise noted, the content of this course material is licensed under a Creative Commons Attribution – Non-Commercial 3.0 License.
Chapter 9: Economics of Strategy: Game theory
A camper awakens to the growl of a hungry bear and sees his friend putting on a pair of running shoes, “You can’t outrun a bear,” scoffs the camper. His.
Intro to Game Theory Revisiting the territory we have covered.
Managerial Economics and Organizational Architecture, 5e Chapter 9: Economics of Strategy: Game Theory McGraw-Hill/Irwin Copyright © 2009 by The McGraw-Hill.
David Bryce © Adapted from Baye © 2002 Game Theory: The Competitive Dynamics of Strategy MANEC 387 Economics of Strategy MANEC 387 Economics.
Games with Sequential Moves
מתמטיקה בדידה תרגול 3.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
Game Theory: Key Concepts Zero Sum Games Zero Sum Games Non – Zero Sum Games Non – Zero Sum Games Strategic Form Games  Lay out strategies Strategic Form.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
Partially Observable Markov Decision Processes (POMDP) תומר באום Based on ch. 15 in “Probabilistic Robotics” by Thrun et al. ב"הב"ה.
Static Games of Complete Information: Subgame Perfection
UNIT II: The Basic Theory Zero-sum Games Nonzero-sum Games Nash Equilibrium: Properties and Problems Bargaining Games Review Midterm3/23 3/2.
Extensive Game with Imperfect Information Part I: Strategy and Nash equilibrium.
הפקולטה למדעי המחשב אוטומטים ושפות פורמליות (236353)
מערכים עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר int grade1, grade2, …, grade20; int grade1, grade2, …, grade20;
עקרון ההכלה וההדחה.
Game Theoretic Analysis of Oligopoly lr L R 0000 L R 1 22 The Lane Selection Game Rational Play is indicated by the black arrows.
מבוא למדעי המחשב, סמסטר א ', תשע " א תרגול מס ' 1 נושאים  הכרת הקורס  פסאודו - קוד / אלגוריתם 1.
Markov Decision Processes (MDP) תומר באום Based on ch. 14 in “Probabilistic Robotics” By Thrun et al. ב"הב"ה.
© 2009 Institute of Information Management National Chiao Tung University Lecture Notes II-2 Dynamic Games of Complete Information Extensive Form Representation.
David J. Bryce © 2002 Michael R. Baye © 2002 Game Theory: Entry Games MANEC 387 Economics of Strategy MANEC 387 Economics of Strategy David J. Bryce.
Reading Osborne, Chapters 5, 6, 7.1., 7.2, 7.7 Learning outcomes
Presentation by Gil Perry Supervised by Amos Fiat 1.
EC941 - Game Theory Prof. Francesco Squintani Lecture 5 1.
Extensive-form games Vincent Conitzer
M9302 Mathematical Models in Economics Instructor: Georgi Burlakov 4.1.Dynamic Games of Incomplete Information Lecture
Dynamic Games & The Extensive Form
Game-theoretic analysis tools Tuomas Sandholm Professor Computer Science Department Carnegie Mellon University.
Chapters 29 and 30 Game Theory and Applications. Game Theory 0 Game theory applied to economics by John Von Neuman and Oskar Morgenstern 0 Game theory.
Chapter 5 Game Theory and the Tools of Strategic Business Analysis.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
1 Topics covered in the course Games in extensive and strategic (normal form) Games in extensive and strategic (normal form) Backwards induction (zermelo’s.
Practice session 3 תחביר ממשי ( קונקרטי ) ותחביר מופשט ( אבסטרקטי ) שיטות חישוב : Applicative & Normal Evaluation Partial Evaluation.
Extensive Games with Imperfect Information
M9302 Mathematical Models in Economics Instructor: Georgi Burlakov 2.1.Dynamic Games of Complete and Perfect Information Lecture
Practice session 3.  תחביר ממשי ( קונקרטי ) ותחביר מופשט ( אבסטרקטי )  שיטות חישוב : Applicative & Normal Evaluation.
Game theory 2 Lukáš Lehotský
Chapters 29 and 30 Game Theory and Applications. Game Theory 0 Game theory applied to economics by John Von Neuman and Oskar Morgenstern 0 Game theory.
Chapter 6 Extensive Form Games With Perfect Information (Illustrations)
Extensive Form Games With Perfect Information (Illustrations)
Extensive Form (Dynamic) Games With Perfect Information (Theory)
Entry Deterrence Players Two firms, entrant and incumbent Order of play Entrant decides to enter or stay out. If entrant enters, incumbent decides to fight.
Dynamic Game Theory and the Stackelberg Model. Dynamic Game Theory So far we have focused on static games. However, for many important economic applications.
ECO290E: Game Theory Lecture 10 Examples of Dynamic Games.
M9302 Mathematical Models in Economics Instructor: Georgi Burlakov 2.1.Dynamic Games of Complete and Perfect Information Lecture
Game Theory: The Competitive Dynamics of Strategy
Managerial Economics Kyle Anderson
Multiagent Systems Extensive Form Games © Manfred Huber 2018.
Learning 6.2 Game Theory.
Managerial Economics Kyle Anderson
Presentation transcript:

Extensive Form Game

“Burn the Boats” לעיתים אנחנו שומעים את הביטוי “let’s burn the boats”. מה הכוונה ? –לוותר על אלטרנטיבה B –ובכך לא להותיר ברירה ולנסות להשיג A Paradox of commitment Paradox of commitment It is by limiting my own options that I can manage to influence the rival’s course of actions in my interest. It is by limiting my own options that I can manage to influence the rival’s course of actions in my interest.

Hernan Cortes and the Aztecs From a good Spanish family. – Failed at being a European soldier. – Failed at becoming a lawyer. Cortes was hungry for wealth and recognition.

Cortes 1519 – landed on the coast of Mexico with : – 600 men, 16 horses, and a few cannon. WHY WOULD CORTES BURN HIS SHIPS WHEN HE GOT TO THE NEW WORLD?

5 C Burn ships Keep Ships S S Be careful Fight Hard C = 100, S = 0 C = -100, S = -100 C = 100, S = 0 C = 0, S = 10 Think of Cortes trying to motivate his own soldiers Fight Hard Be careful

6 C Burn ships Keep Ships S S Be careful Fight Hard C = 100, S = 0 C = -100, S = -100 C = 100, S = 0 C = 0, S = 10 If no retreat possible, will fight hard or die. But if retreat is possible, may fight less hard and ‘run away’ Fight Hard Be careful

7 C Burn ships Keep Ships S S Be careful Fight Hard C = 100, S = 0 C = -100, S = -100 C = 100, S = 0 C = 0, S = 10 So Cortes wants to burn his ships. It is a credible commitment not to retreat – and this alters how his own troops behave. Fight Hard Be careful

עוד על Burn the boats היכן נתקלנו בזה עד כה ? – Golden Balls – התחייבות ל - steal ובכך ביטול האופציה ל - split –עקירת ההגה ב - chicken game Busi­ness guru, Tom Peters swears by Cortés’ destruc­tive strat­egy by going so far as to sug­ gest that every com­pany hire a CDO – a Chief Destruc­tive Officer.

מימד הזמן - Extensive Form Game מימד הזמן וסדר הפעולות - מרכיב משמעותי בניתוח משחק תצוגת ה - normal form game לא משלבת שום מרכיב של סדר הפעולות (sequence) או זמן –השחקנים פועלים בו זמנית תצוגת ה - extensive form game הינה אלטרנטיבה שמייצגת גם את המרכיב הטמפורלי שבמשחק – perfect information extensive-form games – imperfect-information extensive-form games

Perfect Information Extensive Form Game A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where: – Players: N – Actions: A – Choice nodes and labels for these nodes: Choice nodes: H Action function: χ : H → 2 A assigns to each choice node a set of possible actions Player function: ρ : H → N assigns to each non-terminal node h a player iϵN who chooses an action at h –.

Perfect Information Extensive Form Game

דוגמה – The Sharing Game אח ואחות צריכים לחלק ביניהם 2 דולר האח מתחיל אם האחות לא מסכימה אז שניהם מקבלים 0

אסטרטגיות כמה אסטרטגיות טהורות יש לכל שחקן במשחק ? –לשחקן 1 יש 3 אסטרטגיות (2-0,1-1,0-2) –לשחקן 2 יש 8 (3^2) אסטרטגיות

אסטרטגיה טהורה - הגדרה אסטרטגיה טהורה של שחקן ב - perfect information game היא הגדרה מלאה של הפעולה בה ינקוט עבור כל צומת (node) השייכת לשחקן זה

דוגמה מהן האסטרטגיות הטהורות של שחקן 2? – S2 = {(C,E),(C,F),(D,E),(D,F)} מהן האסטרטגיות הטהורות של שחקן 1? – S1 = }(B,G),(B,H),(A,G),(A,H)} במצב זה לא נגיע לעולם ל - H אבל עדיין האסטרטגיה הטהורה (A,H) שונה מ - (A,G)

ש " מ נאש על - בסיס הגדרת האסטרטגיה הטהורה, ניתן להגדיר מחדש גם : –אסטרטגיות מעורבות – Best response –ש " מ נאש

המרת המשחק ל - Normal Form ניתן להמיר את ה - extensive form game ל - normal form game בצורה יחסית קלה חשיבות : כל התוצאות / הוכחות שהתקיימו ב - normal form game יתקיימו גם ב - extensive form

יתרונות ה - extensive form game מאפשר לייצג משחקים שיש בהם אלמנט של זמן מאפשר לייצג משחקים בצורה קומפקטית : –משחקים עם הרבה פעולות –מונע חזרה של מצבים ( למשל בדוגמה הקודמת היינו צריכים 16 payoff pairs בעוד שבאמצעות ה - extensive form מספיק לנו 5 אבל... –לא כל משחק ניתן לייצג כ - extensive form ( כלומר, המעבר מ - normal form ל - extensive form לא תמיד מתקיים ) –דוגמה – matching pennies

ש " מ ב - Extensive Form נובע מכך שאנחנו עובדים בצורה סדרתית (sequential) שימ / י לב !!! המשפט נכון אך ורק ל - perfect information extensive form game ( כבר ראינו שב - normal form יש מצבים שבהם אין PSNE, למשל ב - matching pennies) האם יש טעם להשתמש באסטרטגיה מעורבת ב - perfect information extensive form game? –לא ! כי ממילא השחקן השני רואה מה עשינו ( אני לא מרוויח כלום מה - randomization)

המרת המשחק ל - Normal Form מהם שיוויי המשקל על בסיס אסטרטגיות טהורות במשחק ?

Subgame Perfection ש " מ (BH,CE) קצת מוזר – למה ששחקן 1 ישחק H אם יש לו גם את האלטרנטיבה G? –למעשה הבחירה ב - H היא האיום ששומר עלינו בש " מ – שחקן 2 יודע שאם יבחר ב - F אז שחקן 1 יבחר ב - H ולכן עדיף לו לבחור ב - E –אבל האמנם זה איום אמין ? האם באמת שחקן 1 יפעל כך ברגע האמת ?

הגדרה פורמלית s הוא subgame perfect equilibrium של G אם ורק אם לכל subgame G’ של G, הנגזרת של s ל - G’ היא Nash equilibrium של G’

דוגמה ב - subgame הזה הפעולה H היא לא ש " מ נאש ולכן הפיתרון (BH,CE) הוא לא subgame perfect equilibrium Subgame G’

נקודות נוספות מכיוון ש - G הוא גם subgame של עצמו אז כל SPE הוא גם NE. ההגדרה הנוכחית פוסלת איומים לא אמינים non- credible threats

האם יש לנו subgame perfect equilibrium במשחק ? האסטרטגיה H ב - (AH,CF) נקראת off path

Backward Induction דרך לחישוב ה - subgame perfect equilibrium של משחק all leaf nodes vector denoting the utility for each player set of all actions available to player at that node

דוגמה – Centipede game מהו ה - subgame perfect equilibrium? –שחקן 1 בוחר D כבר בתור הראשון תוצאה זו היא Pareto-dominated על - ידי כל התוצאות האחרות ( מלבד השניה ) האם אנשים ישחקו לפי ש " מ זה ? מה צריך שחקן 2 לעשות אם שחקן 1 בחר A? לפי ה - SPE עליו לבחור D –אבל גם שחקן 1 היה צריך לבחור D לפי היגיון זה. אז אולי שחקן 1 משחק בצורה לא רציונלית ? –הנושא נחקר רבות בספרות

Example: Mini Ultimatum Game Proposer (Player 1) can suggest one of two splits of £10: (5,5) and (9,1). Responder (Player 2) can decide whether to accept or reject (9,1), but has to accept (5,5). Reject leads to 0 for both Player 1 (9,1) ar 9 10 (5,5) 5 Player 2

Mini Ultimatum Game in Strategic Form Player2 accept (9,1)reject (9,1) Player 1propose (5,5)5,5 propose (9,1)9,10,0 There are two equilibria: 1.(propose (9,1), accept (9,1)) 2.(propose (5,5), reject (9,1)). Equilibrium 2 is in weakly dominated strategies (reject (9,1) is weakly dominated)

Example: Mini Ultimatum Game There is one subgame of length 1, following (9,1) Player 1 (9,1) ar 9 10 (5,5) 5 Player 2

Example: Mini Ultimatum Game There is one subgame of length 1, following (9,1) The optimal action is accept Player 1 (9,1) ar 9 10 (5,5) 5 Player 2

Example: Mini Ultimatum Game There is one subgame of length 1, following (9,1) The optimal action is accept There is one subgame of length 2, the whole game Player 1 (9,1) ar 9 10 (5,5) 5 Player 2

Example: Mini Ultimatum Game There is one subgame of length 1, following (9,1) The optimal action is accept There is one subgame of length 2, the whole game Taking “accept” in the subgame of length 1 as given, we see that (9,1) is optimal Player 1 (9,1) ar 9 10 (5,5) 5 Player 2

Extensive Form Games with Perfect Information Example (172.1) C E F D G H 2,1 1,3 2,2 3,0 2 KJ I 1,1 1,0

Extensive Form Games with Perfect Information Example (172.1) C E F D G H 2,1 1,3 2,2 3,0 2 KJ I 1,1 1,0 Player 2 Optimal Strategies: (FHK),(FIK),(GHK),(GIK)

Extensive Form Games with Perfect Information Example (172.1) C E F D G H 2,1 1,3 2,2 3,0 2 KJ I 1,1 1,0 Player 2 Optimal Strategies: (FHK),(FIK),(GHK),(GIK) Player 1 Best Responses: (C),(C),(C or D, or E),(D)

Extensive Form Games with Perfect Information C E F D G H 2,1 1,3 2,2 3,0 2 KJ I 1,1 1,0 Strategy Pairs: (C,FHK), (C,FIK), (C,GHK), (D,GHK), (E,GHK), (D,GIK) Player 2 Optimal Strategies: (FHK),(FIK),(GHK),(GIK) Player 1 Best Responses: (C),(C),(C or D, or E),(D) All SPE

Example: Voting for a Payraise Three legislators are voting on whether to give themselves a pay raise. All three want the pay raise; however, Each face a small cost in voter resentment c>0. The benefit for the raise is greater than cost: b>c They vote in the order Simple majority rule What is the outcome obtained by backward induction? (N; NY; nyyn) Diagram courtesy: Dr. Tayfun Sönmez