Am ajuns sa studiez teoria Nash equilibrium - Wikipedia, the free encyclopedia .
" In game theory, Nash equilibrium (named after John Forbes Nash, who proposed it) is a solution concept of a game involving two or more players, in which each player is assumed to know the equilibrium strategies of the other players, and no player has anything to gain by changing only his or her own strategy unilaterally. If each player has chosen a strategy and no player can benefit by changing his or her strategy while the other players keep theirs unchanged, then the current set of strategy choices and the corresponding payoffs constitute a Nash equilibrium.
Stated simply, Amy and Bill are in Nash equilibrium if Amy is making the best decision she can, taking into account Bill's decision, and Bill is making the best decision he can, taking into account Amy's decision. Likewise, a group of players is in Nash equilibrium if each one is making the best decision that he or she can, taking into account the decisions of the others. "
Pe net se pune accentul pe posibilitatea matematica de a creea un AI care sa fie inexploatabil data fiind puterea de calcul a computerelor actuale/viitoare.
Desi discutia pe tema asta ar fi foarte interesanta, eu sunt preocupat mai mult de aplicatiile teoriei in jocul vs regs buni.
Sa presupunem doi regs de NL100 care se afla in echilibrul descris mai sus, fiecare ia decizia optima raportat la actiunile celuilalt. Toti avem regs de genul asta , cu care dam banii de la unul la altul , pt ca aplicam concepte identice, vedem training videos identice, stam pe aceleasi forumuri, avem aceeasi gandire formata.
Sigur ca in realitate toti regs buni au mici leaks, dar pt simplificare presupunem ca ele nu exista.
O masa cu 6 regs de NL100 de valoare aproximativ egala putem spune ca se afla in echilibru. Sigur ca variatia va face ca unii sa castige si altii sa piarda pe termen scurt dar, pe termen lung nimeni nu va castiga si toti vor pierde datorita rake-ului.
Putem spune deci ca cei 6 regs "au rezolvat" strategia pt a bate confortabil NL100.
Ce se intampla insa cand un reg de NL1000 se aseaza la masa cu acei regs de NL100? Reg de NL1000 va incepe sa castige -cel putin pe termen lung- deci ce s-a intamplat cu echilibrul anterior ?
Explicatia ar fi ca regs de NL 100 sunt in echilibru DOAR pt nivelul lor si pot sa bata doar NL100 (eventual 200) si toate nivelele de dedesubt.
Intrebarea e ce are in plus reg de NL1000 fate de acei regs buni de NL100? Experienta? Alt proces de gandire?
Insemna ca echilibrul celor 6 regs de la NL100 era artificial.Inseamna ca mai devreme sau mai tarziu unii dintre ei s-ar fi delimitat clar fata de ceilalti reg buni, devenind regs f buni (si s-ar fi mutat probabil la NL200).
Problema poate fi pusa la fel de bine cu niste regs buni de NL1000 vs al reg bun de la mize superioare.Same shit.
So unde putem intalni acest Nash equilibrium in stare pura (in poker)? Exista un nivel unde nu se mai poate imbunatati nimic si unde intradevar jucatorii sunt condamnati sa dea banii de la unul la altul in timp ce platesc rake?
Matematic se pare ca da.
" In game theory, Nash equilibrium (named after John Forbes Nash, who proposed it) is a solution concept of a game involving two or more players, in which each player is assumed to know the equilibrium strategies of the other players, and no player has anything to gain by changing only his or her own strategy unilaterally. If each player has chosen a strategy and no player can benefit by changing his or her strategy while the other players keep theirs unchanged, then the current set of strategy choices and the corresponding payoffs constitute a Nash equilibrium.
Stated simply, Amy and Bill are in Nash equilibrium if Amy is making the best decision she can, taking into account Bill's decision, and Bill is making the best decision he can, taking into account Amy's decision. Likewise, a group of players is in Nash equilibrium if each one is making the best decision that he or she can, taking into account the decisions of the others. "
Pe net se pune accentul pe posibilitatea matematica de a creea un AI care sa fie inexploatabil data fiind puterea de calcul a computerelor actuale/viitoare.
Desi discutia pe tema asta ar fi foarte interesanta, eu sunt preocupat mai mult de aplicatiile teoriei in jocul vs regs buni.
Sa presupunem doi regs de NL100 care se afla in echilibrul descris mai sus, fiecare ia decizia optima raportat la actiunile celuilalt. Toti avem regs de genul asta , cu care dam banii de la unul la altul , pt ca aplicam concepte identice, vedem training videos identice, stam pe aceleasi forumuri, avem aceeasi gandire formata.
Sigur ca in realitate toti regs buni au mici leaks, dar pt simplificare presupunem ca ele nu exista.
O masa cu 6 regs de NL100 de valoare aproximativ egala putem spune ca se afla in echilibru. Sigur ca variatia va face ca unii sa castige si altii sa piarda pe termen scurt dar, pe termen lung nimeni nu va castiga si toti vor pierde datorita rake-ului.
Putem spune deci ca cei 6 regs "au rezolvat" strategia pt a bate confortabil NL100.
Ce se intampla insa cand un reg de NL1000 se aseaza la masa cu acei regs de NL100? Reg de NL1000 va incepe sa castige -cel putin pe termen lung- deci ce s-a intamplat cu echilibrul anterior ?
Explicatia ar fi ca regs de NL 100 sunt in echilibru DOAR pt nivelul lor si pot sa bata doar NL100 (eventual 200) si toate nivelele de dedesubt.
Intrebarea e ce are in plus reg de NL1000 fate de acei regs buni de NL100? Experienta? Alt proces de gandire?
Insemna ca echilibrul celor 6 regs de la NL100 era artificial.Inseamna ca mai devreme sau mai tarziu unii dintre ei s-ar fi delimitat clar fata de ceilalti reg buni, devenind regs f buni (si s-ar fi mutat probabil la NL200).
Problema poate fi pusa la fel de bine cu niste regs buni de NL1000 vs al reg bun de la mize superioare.Same shit.
So unde putem intalni acest Nash equilibrium in stare pura (in poker)? Exista un nivel unde nu se mai poate imbunatati nimic si unde intradevar jucatorii sunt condamnati sa dea banii de la unul la altul in timp ce platesc rake?
Matematic se pare ca da.
Comment