Anunț

Collapse

Regulile forumului www.holdem.ro

Nu folositi holdem.ro pentru a trimite oferte private/rb deals prin mesajele private. Va rog sa va faceti site pentru asta (va pot da sfaturi).

Nu se accepta conturi care contin adrese de web (ex: Zapp.ro)

Nu se accepta posturi (sau semnaturi) care contin link-uri de afiliere/refer a friend/free money/alte forumuri de poker!

Nu se accepta injuraturi si atacuri la persoana. Nu sunt tolerate posturile ofensatoare, abuzive, sau rasiale

Nu se accepta discutii despre warez (cereri, oferte etc)

Nu se accepta semnaturi cu caractere mai mari decit size 2 (default). Nu se accepta semnaturi colorate.
Nu se accepta poze in semnaturi decit daca este vorba de grafice dinamice de pe sharkscope.com.

Nu se încurajează sub nici o formă goana după posturi. Nu se oferă absolut nici un premiu celui care depăşeşte recordul de posturi pe zi.

Nu se accepta posturi in care se scrie "check pm" sau "ai pm".

Nu se accepta posturi care contin doar smileys sau lol-uri

Nu cereti bani imprumut pe forum.

Nu ne dati mesaje private ca sa intrebati de parolele turneelor private organizate de alte siteuri (sau de la free-urile noastre).
Exista o singura metoda de a afla parolele noastre: Sa faceti 10 posturi de calitate pe forum. Nu va grabiti pentru ca pe sectiunea ascunsa apar DOAR parolele turneelor noastre, nimic altceva. Nu faceti spam pentru ca puteti fi avertizati. Acest sistem a fost introdus pentru a proteja turneele private holdem.ro de prezenta strainilor!

Nu postati in legatura cu alte turnee private decit cele organizate de holdem.ro

Ca ei ajungeti daca puneti parolele noastre pe alte siteuri!

Nu faceti referiri la pokeredge /poker crusher si nu prezentati informatii oferite de pokeredge/poker crusher.
Site-ul este considerat ilegal pe holdem.ro.

Daca vreti pareri despre statsurile din Poker Tracker, nu postati decit daca aveti in baza de date cel putin 6000 de miini.

Aveti voie cu avataruri animate. 160x160 dimensiune maxima. Va rog fara avataruri porno (Sexy da, porno nu)

Cei care au in semnatura linkuri clickable catre blog-uri personale sint rugati sa posteze pe acel blog si un link clickable inapoi catre holdem.ro!

------

Indatoririle userilor:

- Sa CAUTE cu atentie (folosind functia SEARCH) INAINTE de a deschide un subiect nou
- Sa NU posteze link-uri directe catre alte site-uri/resurse decat in cazul in care acest lucru este JUSTIFICAT si nu poate fi evitat. Regula se refera mai ales la siteuri cu informatii despre poker.

- Sa RESPECTE deciziile moderatorilor si DACA doresc sa se planga de ele sa se adreseze DOAR pe PM/E-MAIL super-moderatorilor sau administratorilor
- Sa NU abuzeze de functia PM / Chiar daca exista mesaje private, in cazul in care vom primi reclamatii un user poate si va fi banat daca in cadrul unui PM a avut o atitudine incorecta. (injuraturi, amenintari...etc)
- Sa incerce sa AJUTE colegii de forum si sa NU ii puna in posturi proaste cei ce poate nu sunt atat de priceputi.

TOTI membrii forumului raspund personal pentru continutul mesajelor publicate.
Desi incercam sa monitorizam cat mai bine continutul mesajelor publicate, Holdem.ro nu poate fi tras la raspundere pentru oricare din regulile incalcate de membrii acestui forum

---

Userii banati nu au voie sa isi faca un alt cont.

Userii dezamagiti nu pot deschide topicuri in care isi anunta plecarea de pe forum.

Adminii/moderatorii au ultimul cuvint.
Prezenta pe acest forum si acceptarea ca user reprezinta un PRIVILEGIU si nu un DREPT! In orice moment puteti fi banat daca NU respectati regulamentul si daca nu aveti un comportament CIVILIZAT.

Necunoasterea regulamentului forumului nu va absolva de incalcarea regulilor!
See more
See less

Nash equilibrium

Collapse
X
 
  • Filter
  • Ora
  • Show
Clear All
new posts

  • Nash equilibrium

    Am ajuns sa studiez teoria Nash equilibrium - Wikipedia, the free encyclopedia .

    " In game theory, Nash equilibrium (named after John Forbes Nash, who proposed it) is a solution concept of a game involving two or more players, in which each player is assumed to know the equilibrium strategies of the other players, and no player has anything to gain by changing only his or her own strategy unilaterally. If each player has chosen a strategy and no player can benefit by changing his or her strategy while the other players keep theirs unchanged, then the current set of strategy choices and the corresponding payoffs constitute a Nash equilibrium.

    Stated simply, Amy and Bill are in Nash equilibrium if Amy is making the best decision she can, taking into account Bill's decision, and Bill is making the best decision he can, taking into account Amy's decision. Likewise, a group of players is in Nash equilibrium if each one is making the best decision that he or she can, taking into account the decisions of the others. "

    Pe net se pune accentul pe posibilitatea matematica de a creea un AI care sa fie inexploatabil data fiind puterea de calcul a computerelor actuale/viitoare.
    Desi discutia pe tema asta ar fi foarte interesanta, eu sunt preocupat mai mult de aplicatiile teoriei in jocul vs regs buni.

    Sa presupunem doi regs de NL100 care se afla in echilibrul descris mai sus, fiecare ia decizia optima raportat la actiunile celuilalt. Toti avem regs de genul asta , cu care dam banii de la unul la altul , pt ca aplicam concepte identice, vedem training videos identice, stam pe aceleasi forumuri, avem aceeasi gandire formata.
    Sigur ca in realitate toti regs buni au mici leaks, dar pt simplificare presupunem ca ele nu exista.
    O masa cu 6 regs de NL100 de valoare aproximativ egala putem spune ca se afla in echilibru. Sigur ca variatia va face ca unii sa castige si altii sa piarda pe termen scurt dar, pe termen lung nimeni nu va castiga si toti vor pierde datorita rake-ului.
    Putem spune deci ca cei 6 regs "au rezolvat" strategia pt a bate confortabil NL100.

    Ce se intampla insa cand un reg de NL1000 se aseaza la masa cu acei regs de NL100? Reg de NL1000 va incepe sa castige -cel putin pe termen lung- deci ce s-a intamplat cu echilibrul anterior ?
    Explicatia ar fi ca regs de NL 100 sunt in echilibru DOAR pt nivelul lor si pot sa bata doar NL100 (eventual 200) si toate nivelele de dedesubt.

    Intrebarea e ce are in plus reg de NL1000 fate de acei regs buni de NL100? Experienta? Alt proces de gandire?
    Insemna ca echilibrul celor 6 regs de la NL100 era artificial.Inseamna ca mai devreme sau mai tarziu unii dintre ei s-ar fi delimitat clar fata de ceilalti reg buni, devenind regs f buni (si s-ar fi mutat probabil la NL200).

    Problema poate fi pusa la fel de bine cu niste regs buni de NL1000 vs al reg bun de la mize superioare.Same shit.

    So unde putem intalni acest Nash equilibrium in stare pura (in poker)? Exista un nivel unde nu se mai poate imbunatati nimic si unde intradevar jucatorii sunt condamnati sa dea banii de la unul la altul in timp ce platesc rake?
    Matematic se pare ca da.
    Last edited by sever; 27.05.2010, 05:47.
    Don’t be discouraged. It’s often the last key in the bunch that opens the lock.

  • #2
    Este atat de mult pana sa se ajunga acolo, incat puteam aborda tema asta cel mult doar din grija fata de nepotii nostri.
    Lumea face greseli nenumarate cu toata instructia disponibila. Este practic imposibil ca in viitorul apropiat sa se intalneasca la mese de small stakes cate 6 regs care joaca toti GTO.
    In plus, cand ma vad cat de prost joc, ma linistesc complet in legatura ipoteza disparitiei pestilor de la mese.

    Comment


    • #3
      Mda atat timp cat joaca OBS putem fi linistiti . Teoria evidentiaza ce stim toti faptul ca este necesar un table selection riguros si faptul ca luam bani de la jucatorii mai putin experimentati .

      Comment


      • #4
        Poate nu am pus io problema bine , ma gandeam la aplicatiile matematice ale teoriei -pt cine s-a uitat pe linkul de pe wiki-

        E clar ca daca se va realiza un AI care sa rezolve complet jocul de poker , aceasta teorie sigur va fi dintre cele de baza.

        Revenind la aplicabilitatea teoriei in jocul nostru de zi cu zi sa ne uitati-va la asta:

        Prisoner's Dilemma Two suspects in a major crime are held in separate
        cells. There is enough evidence to convict each of them of a minor offense,
        but not enough evidence to convict either of them of the major crime unless one of
        them acts as an informer against the other (finks). If they both stay quiet, each will
        be convicted of the minor offense and spend one year in prison. If one and only
        one of them finks, she will be freed and used as a witness against the other, who
        will spend four years in prison. If they both fink, each will spend three years in
        prison.

        This situation may be modeled as a strategic game:


        Players The two suspects.

        Actions Each player's set of actions is {Quiet, Fink}.
        Preferences Suspect 1's ordering of the action profiles, from best to worst, is
        (Fink, Quiet) (she finks and suspect 2 remains quiet, so she is freed), (Quiet,
        Quiet) (she gets one year in prison), (Fink, Fink) (she gets three years in prison),
        (Quiet, Fink) (she gets four years in prison). Suspect 2's ordering is (Quiet, Fink),
        (Quiet, Quiet), (Fink, Fink), (Fink, Quiet).
        We can represent the game compactly in a table. First choose payoff functions
        that represent the suspects' preference orderings. For suspect 1 we need a function
        u1 for which
        u1(Fink, Quiet) > u1(Quiet, Quiet) > u1(Fink, Fink) > u1(Quiet, Fink).
        A simple specification is u1(Fink, Quiet) = 3, u1(Quiet, Quiet) = 2, u1(Fink, Fink) =
        1, and u1(Quiet, Fink) = 0. For suspect 2 we can similarly choose the function
        u2 for which u2(Quiet, Fink) = 3, u2(Quiet, Quiet) = 2, u2(Fink, Fink) = 1, and
        u2(Fink, Quiet) = 0.

        The Prisoner's Dilemma models a situation in which there are gains from cooperation
        (each player prefers that both players choose Quiet than they both choose
        Fink) but each player has an incentive to “free ride” (choose Fink) whatever the
        other player does. The game is important not because we are interested in understanding
        the incentives for prisoners to confess, but because many other situations
        have similar structures. Whenever each of two players has two actions, say C
        (corresponding to Quiet) and D (corresponding to Fink), player 1 prefers (D, C) to
        (C, C) to (D, D) to (C, D), and player 2 prefers (C, D) to (C, C) to (D, D) to (D, C),
        the Prisoner's Dilemma models the situation that the players face.

        Nu va suna familiar mai ales in jocul de HU sau cand ramanem HU la 6max.
        Intr-un 3bet pot cand nu nimerim flopul si ne gandim daca sa dam cbet si adversarul nostru-care nici el nu a nimerit- se gandeste sa dea raise daca facem cbet....
        E cineva in stare sa transpuna matematic actiunile probabile a doi regs buni intr-un 3bet pot unde nimeni nu a nimerit flopul?
        Don’t be discouraged. It’s often the last key in the bunch that opens the lock.

        Comment


        • #5
          Postat în original de Pepsi Vezi post
          sa nu ajungi sa ai prieteni imaginari

          Comment


          • #6
            parerea nespecialistului

            este posibil un model matematic...dar,cel putin eu,nu-i vad rostul.Iti poti stoarce creierii sa te gandesti ca el se gandeste ca tu te gandesti....s.a.m.d. si,daca ai o memorie f.bun (cam aceea a unui sahist bun),poti ajunge la un nivel high cu rationamentele...Nu stii insa la ce nivel se opreste el cu rationamentul sau...iar confruntarea se decide atunci luand in considerare si alti factori (read-uri,outs etc) Asa cred eu...
            Nu contează decât un singur lucru: să înveţi să pierzi.

            Comment


            • #7
              Consider ca sunt prea multe variabile de luat in considerare pentru a vedea un AI care sa joace perfect matematic pentru ca e greu de implementat modul in care sa actioneze in functie de imaginea de moment pe care o ai la masa, practic ar trebui creat un AI capabil sa se adapteze la fieacare jucator in parte.

              Un AI facut pentru poker se diferentiaza de cel facut pentru sah prin faptul ca la sah nu poti sa deviezi de la perfect game theory ca sa faci un fancy play (de exemplu iti risti o piesa la o mutare pentru ca stii ca adversarul nu o sa o vada, sau sa incerci sa faci leveling ca sa creada ca este o capcana chiar daca nu o vede) pentru ca la sah ai informatii complete.

              Un AI de poker poate fi usor exploatat daca ii descoperi regulile dupa care face deciziile, si asa vei sti ce face in functie de orice miscare a ta, practic ar fi mai profitabil jocul oop. Mai e de luat in considerare ca din cauza faptului ca pokerul este un joc al informatiei incomplete ar putea face ca AI-ul sa se adapteze prost in anumite situatii.
              LoveisintheSky

              Comment


              • #8
                Lol @aia care nu vad ca si creierul nostru e tot un computer. Nu lucram si noi tot cu if x=*** and y is true then bet 3/4 pot?
                Ce ne lipseste e skillul de programare dar o sa se rezolve si asta. Un AI programat bine si cababil sa invete si sa se adapteze o sa joace linistit la nosebleeds. 5, 10 50 de ani...chestiune de timp.

                Also pe topicu asta nu vroiam sa discutam de AI , dupa cum am mentionat in primul post.

                Postat în original de ottokar Vezi post
                este posibil un model matematic...dar,cel putin eu,nu-i vad rostul.Iti poti stoarce creierii sa te gandesti ca el se gandeste ca tu te gandesti....s.a.m.d. si,daca ai o memorie f.bun (cam aceea a unui sahist bun),poti ajunge la un nivel high cu rationamentele...
                Pai cam la asa ceva ma gandeam, cum la sah intr-o anumita deschidere se muta piesele in acelasi mod pt ca modul ala e studiat ca cel mai eficient. Bineinteles ca , pt a ramane in patternul unei deschideri anume trebuie ca si adversarul sa fie competent pt ca daca face greseli abandonezi modelul si incepi sa exploatezi oportunitatile create.

                Postat în original de mYgu Vezi post
                Un AI facut pentru poker se diferentiaza de cel facut pentru sah prin faptul ca la sah nu poti sa deviezi de la perfect game theory ca sa faci un fancy play (de exemplu iti risti o piesa la o mutare pentru ca stii ca adversarul nu o sa o vada, sau sa incerci sa faci leveling ca sa creada ca este o capcana chiar daca nu o vede) pentru ca la sah ai informatii complete.
                .
                Si sahul poate fi considerat un joc al informatiilor incomplete cel putin in cazul oamenilor pt ca au putere de procesare limitata. O anumita mutare sau actiune la inceputul partidei se poate materializa intr-un mic dezavantaj strategic spre sfarsitul partidei...lucru aproape imposibil de prevazut. Cine a jucat pe bune stie la ce ma refer, genul de mutare care oricat te-ai gandi pe moment pare ok dar la o analiza ulterioara se dovedeste a fi precursoarea pierderii partidei.
                Last edited by Pepsi; 07.06.2010, 18:44. Motiv: Automerged Doublepost
                Don’t be discouraged. It’s often the last key in the bunch that opens the lock.

                Comment


                • #9
                  pff.. lol @ aia care nu vad k computerul e o imitatie inca foarte ieftina dupa creierul 'nostru' :P
                  el are multe lipsuri, noi mai putin...
                  sta bine rau la numere in rest e praf

                  Comment


                  • #10
                    un AI care sa foloseasca statsurile din PT de ex (cat mai multe maini) ar fi imbatabil daca nu itzi schimbi jocul total...si ai face asta decat daca ai stii ca e AI...deci daca nu stii esti pierzator clar

                    la fiecare actiune el itzi poate calcula range-ul cu o precizie direct proportionala cu numarul de maini.
                    trollin

                    Comment


                    • #11
                      Eu unu nu cred in teoria asta si cred ca iti pierzi timpul degeaba cu ea.

                      Comment


                      • #12
                        Cu care parte a teoriei nu esti de acord? Sa inteleg ca ai studiat-o in amanunt si ai gasit cateva inconsistente?
                        Te-ai uitat pe linkul de pe wiki? Cu asta esti de acord:

                        Let (S, f) be a game with n players, where Si is the strategy set for player i, S=S1 X S2 ... X Sn is the set of strategy profiles and f=(f1(x), ..., fn(x)) is the payoff function. Let x − i be a strategy profile of all players except for player i. When each player i \in {1, ..., n} chooses strategy xi resulting in strategy profile x = (x1, ..., xn) then player i obtains payoff fi(x). Note that the payoff depends on the strategy profile chosen, i.e. on the strategy chosen by player i as well as the strategies chosen by all the other players. A strategy profile x* \in S is a Nash equilibrium (NE) if no unilateral deviation in strategy by any single player is profitable for that player, that is


                        A game can have either a pure-strategy or a mixed Nash Equilibrium, (in the latter a pure strategy is chosen stochastically with a fixed frequency). Nash proved that if we allow mixed strategies, then every n-player game in which every player can choose from finitely many strategies admits at least one Nash equilibrium.

                        Daca nu va cheama mentosan sau pe aproape pls nu mai postati in threadul asta intre doua meciuri la cm cand mancati shaorma cu de toate si va vine cheful de dat cu parerea.
                        Don’t be discouraged. It’s often the last key in the bunch that opens the lock.

                        Comment


                        • #13
                          Postat în original de uKwPlayer Vezi post
                          Eu unu nu cred in teoria asta si cred ca iti pierzi timpul degeaba cu ea.
                          ca nu crezi e o greseala,fiindca e ft adevarata.
                          dar cand spui ca-si pierde timpul ai perfecta dreptate.

                          cat despre teorie,nu va mai certati degeaba.
                          nu sunt 5 oameni in tara asta sa capabili sa inteleaga demonstratia.

                          Comment


                          • #14
                            Postat în original de xRIGAx Vezi post
                            ca nu crezi e o greseala,fiindca e ft adevarata.
                            dar cand spui ca-si pierde timpul ai perfecta dreptate.

                            cat despre teorie,nu va mai certati degeaba.
                            nu sunt 5 oameni in tara asta sa capabili sa inteleaga demonstratia.
                            de acord, dar sunt mult mai multi decit 5.

                            Comment


                            • #15
                              Am o intrebare legata de folosirea tabelului Nash pentru stackuri mai mari de 10 bb. Ar fi o strategie buna sa folosesc acest tabel, dar in loc de shove sa dau raise 3xbb, respectiv call la un raise de 3xbb atunci cand tabelul (conceput pentru fold/shove) specifica acest lucru?

                              Comment

                              Working...
                              X