Nešo pusiausvyra. Žaidimo teorija ekonomistams (John Nash)

1930 m. Johnas von Neumannas ir Oskaras Morgensternas tapo naujos įdomios matematikos srities, kuri buvo vadinama „žaidimų teorija“, įkūrėjais. Šeštajame dešimtmetyje šia sritimi susidomėjo jaunas matematikas Johnas Nashas. Pusiausvyros teorija tapo jo disertacijos, kurią jis parašė, kai jam buvo 21 metai, objektu. Taip gimė nauja žaidimų strategija, pavadinta „Nash Equilibrium“, kuri po daugelio metų, 1994 m., Pelnė Nobelio premiją.

Ilgas atotrūkis tarp disertacijos rašymo ir visuotinio priėmimo buvo matematiko išbandymas. Genijus be pripažinimo sukėlė rimtus psichinius pažeidimus, tačiau Johnas Nešas sugebėjo išspręsti šią problemą dėl savo puikaus loginio proto. Jo „Nešo pusiausvyros“ teorija buvo apdovanota Nobelio premija, o jo adaptacija filme „Gražus protas“ („Proto žaidimai“).

Žaidimo teorija trumpai

Kadangi Nešo pusiausvyros teorija paaiškina žmonių elgesį sąveikos prasme, todėl verta apsvarstyti pagrindines žaidimo teorijos sąvokas.

Žaidimo teorija tiria dalyvių (agentų) elgesį sąveikos sąlygomis atsižvelgiant į žaidimo tipą, kai rezultatas priklauso nuo kelių žmonių sprendimo ir elgesio. Dalyvis priima sprendimus, remdamasis savo prognozėmis dėl kitų elgesio, kuris vadinamas žaidimo strategija.

Taip pat yra dominuojanti strategija, kurios metu dalyvis gauna optimalų rezultatą už bet kokį kitų dalyvių elgesį. Tai geriausia žaidėjo strategija, kuriai naudinga.

Kalinio dilema ir mokslo proveržis

Kalinio dilema yra žaidimas, kai dalyviai yra priversti priimti racionalius sprendimus, pasiekdami bendrą tikslą alternatyvių konfliktų atveju. Klausimas yra tas, kurį iš šių variantų jis pasirinks, pripažindamas savo asmeninį ir bendrąjį interesą, taip pat nesugebėjimą gauti tiek. Atrodo, kad žaidėjai yra uždaromi atšiauriomis žaidimo sąlygomis, todėl kartais jie verčia mąstyti labai produktyviai.

Šią dilemą ištyrė amerikiečių matematikas Johnas Nashas. Jo išvesta pusiausvyra tapo tokio pobūdžio revoliucija. Ypač ryškiai ši nauja mintis turėjo įtakos ekonomistų nuomonei, kaip rinkos žaidėjai renkasi, atsižvelgdami į kitų interesus, glaudžiai sąveikaudami ir keisdami interesus.

Geriausia žaidimų teoriją mokytis pateikiant konkrečius pavyzdžius, nes pati ši matematikos disciplina nėra sausa teorija.

Kalinio dilemos pavyzdys

Pavyzdys, du žmonės buvo apiplėšti, pateko į policijos rankas ir tardomi atskirose kamerose. Tuo pačiu metu policijos pareigūnai kiekvienam dalyviui siūlo palankias sąlygas, kuriomis jis bus paleistas, jei jis parodys prieš savo partnerį. Kiekvienas nusikaltėlis turi šias strategijas, kurias jis apsvarstys:

Abu kartu liudija ir gauna 2, 5 metų kalėjimo.
Abu tyli tuo pačiu metu ir gauna vienerius metus, nes tokiu atveju jų kaltės įrodymų bazė bus maža.
Vienas duoda parodymus ir gauna laisvę, o kitas tyli ir gauna 5 metus kalėjimo.

Akivaizdu, kad bylos baigtis priklauso nuo abiejų dalyvių sprendimo, tačiau jie negali susitarti, nes jie sėdi skirtingose kamerose. Taip pat aiškiai matomas jų asmeninių interesų konfliktas kovoje dėl bendro intereso. Kiekvienas kalinys turi dvi veikimo galimybes ir 4 išeities galimybes.

Išvada grandinė

Taigi, kriminalinis A svarsto šias galimybes:

Aš tyliu, o mano partneris tyli - abu gausime 1 metus kalėjimo.
Aš duodu savo partneriui, o jis man - mes abu gauname 2, 5 metų kalėjimo.
Aš tyliu, o mano partneris mane perduoda - gausiu 5 metus kalėjimo, o jis bus laisvas.
Aš nuomojuosi savo partneriui, o jis tyli - aš gaunu laisvę, o jis yra 5 metus kalėjęs.

Pateikiame galimų sprendimų ir rezultatų matricą aiškumui.

Tikėtinų kalinio dilemos pasekmių lentelė.

Kyla klausimas, ką pasirinks kiekvienas dalyvis?

„Tyla, tu negali kalbėti“ arba „Tyla, tu negali kalbėti“

Norėdami suprasti dalyvio pasirinkimą, turite pereiti jo minčių grandinę. Vadovaudamiesi nusikaltėlio A samprotavimais: jei tyliu ir tyliu savo partneriui, mes gausime minimalų terminą (1 metus), bet aš negaliu sužinoti, kaip jis elgsis. Jei jis liudija prieš mane, tada man taip pat geriau liudyti, kitaip aš galiu atsisėsti 5 metus. Geriau sėdėčiau ne 2, 5, o 5 metus. Jei jis nieko nesako, tada aš turiu paliudyti, nes tokiu būdu aš įgysiu laisvės. Panašiai teigia ir narys B.

Nesunku suprasti, kad dominuojanti kiekvieno nusikaltėlio strategija yra liudyti. Optimalus šio žaidimo taškas įvyksta tada, kai abu nusikaltėliai duoda parodymus ir gauna savo „prizą“ - 2, 5 metų kalėjimo. Nasho žaidimų teorija vadina tai pusiausvyra.

Optimalus „Nash“ sprendimas

Naševo požiūrio revoliucija yra tokia, kad tokia pusiausvyra nėra optimali, jei atsižvelgiame į individualų dalyvį ir jo asmeninius interesus. Galų gale, geriausias pasirinkimas yra tylėti ir išeiti laisvai.

Nash pusiausvyra yra sąlyčio taškas, kur kiekvienas dalyvis pasirenka sau optimalų variantą tik tuo atveju, jei kiti dalyviai pasirenka konkrečią strategiją.

Atsižvelgiant į variantą, kai abu nusikaltėliai tyli ir gauna tik po vienerius metus, galime jį vadinti optimaliausiu „Pareto“ variantu. Tačiau tai įmanoma tik tuo atveju, jei nusikaltėliai galėjo susitarti iš anksto. Bet net tai negarantuotų tokio rezultato, nes pagunda atsitraukti nuo įtikinėjimo ir išvengti bausmės yra didžiulė. Visiško nepasitikėjimo vienas kitu trūkumas ir 5 metų pavojus verčia pasirinkti variantą su pripažinimu. Mąstyti apie tai, kad dalyviai tyliai laikysis šio varianto, veikdami kartu, yra tiesiog neracionalu. Tokią išvadą galima padaryti, jei ištirsime Nash pusiausvyrą. Pavyzdžiai tik tai įrodo.

Savanaudiškas ar racionalus

Nešo pusiausvyros teorija pateikė stulbinančias išvadas, paneigiančias anksčiau galiojusius principus. Pavyzdžiui, Adamas Smithas kiekvieno dalyvio elgesį vertino kaip absoliučiai savanaudišką, dėl kurio sistema buvo pusiausvyra. Ši teorija buvo vadinama „nematoma rinkos ranka“.

Johnas Nashas pastebėjo, kad jei visi dalyviai veiks įgyvendindami savo interesus, tai niekada neduos optimalaus grupės rezultato. Atsižvelgiant į tai, kad racionalus mąstymas yra būdingas kiekvienam dalyviui, labiau tikėtina pasirinkimas, kurį siūlo Nash pusiausvyros strategija.

Grynai vyrų eksperimentas

Ryškus pavyzdys yra žaidimas „blondinis paradoksas“, kuris, nors ir atrodo netinkamas, yra ryškus iliustracija, parodantis, kaip veikia „Nash“ žaidimo teorija.

Šiame žaidime reikia įsivaizduoti, kad į barą atėjo laisvų vaikinų kompanija. Toliau - mergaičių kompanija, kuriai viena geriau nei kitos, tarkime blondinė. Kaip elgiasi vaikinai, norėdami gauti geriausią merginą sau?

Taigi, vaikinų samprotavimas: jei visi pradeda susipažinti su blondine, greičiausiai ji su niekuo nesusipažins, tada jos draugai nenorės susitikti. Niekas nenori būti antruoju atsarginiu dalyviu. Bet jei vaikinai pasirenka vengti blondinės, tada tikimybė, kad kiekvienas iš vaikinų suras gerą merginą, yra didelė.

Nešo pusiausvyros padėtis vaikinams nėra optimali, nes, vykdydami tik savo savanaudiškus interesus, kiekvienas pasirinktų blondinę. Akivaizdu, kad tik savanaudiškų interesų siekimas bus prilyginamas grupės interesų žlugimui. Nash pusiausvyra reikš, kad kiekvienas vaikinas veikia pagal savo asmeninius interesus, kurie liečiasi su visos grupės interesais. Tai nėra optimalus pasirinkimas asmeniškai kiekvienam, bet optimalus kiekvienam, remiantis bendra sėkmės strategija.

Visas mūsų gyvenimas yra žaidimas

Sprendimų priėmimas realiomis sąlygomis yra labai panašus į žaidimą, kai iš kitų dalyvių tikiesi tam tikro racionalaus elgesio. Versle, darbe, komandoje, įmonėje ir net santykiuose su priešinga lytimi. Nuo didelių sandorių iki įprastų gyvenimo situacijų viskas laikosi vieno ar kito įstatymo.

Žinoma, svarstomos žaidimų situacijos su nusikaltėliais ir baras yra tik puikios iliustracijos, parodančios Nash pusiausvyrą. Tokių dilemų pavyzdžių labai dažnai iškyla realiojoje rinkoje, ir tai ypač aktualu tais atvejais, kai du monopolistai kontroliuoja rinką.

Mišrios strategijos

Dažnai dalyvaujame ne viename, o keliuose žaidimuose iš karto. Pasirinkę vieną iš žaidimų variantų, vadovaukitės racionalia strategija, tačiau pateksite į kitą žaidimą. Po kelių racionalių sprendimų galite pastebėti, kad jūsų rezultatas jums netinka. Ką daryti?

Apsvarstykite dviejų tipų strategijas:

Gryna strategija yra dalyvio elgesys, kylantis galvojant apie galimą kitų dalyvių elgesį.
Mišri strategija arba atsitiktinė strategija yra grynų strategijų kaita atsitiktine tvarka arba grynos strategijos pasirinkimas su tam tikra tikimybe. Ši strategija taip pat vadinama atsitiktine.

Atsižvelgdami į tokį elgesį, gauname naują požiūrį į Nash pusiausvyrą. Jei anksčiau buvo sakoma, kad žaidėjas vieną kartą pasirenka strategiją, tada galima įsivaizduoti kitą elgesį. Galime sutikti su galimybe, kad žaidėjai pasirenka strategiją atsitiktinai su tam tikra tikimybe. Žaidimai, kuriuose Nash pusiausvyros neįmanoma rasti grynose strategijose, visada būna mišrūs.

Nasso pusiausvyra mišriose strategijose vadinama mišria pusiausvyra. Tai yra toks balansas, kai kiekvienas dalyvis pasirenka optimaliausią savo strategijų pasirinkimo dažnumą, su sąlyga, kad kiti dalyviai pasirenka jų strategijas nurodytu dažnumu.