Nash-likevekt. Spillteori for økonomer (John Nash)

Innholdsfortegnelse:

Nash-likevekt. Spillteori for økonomer (John Nash)
Nash-likevekt. Spillteori for økonomer (John Nash)

Video: Nash-likevekt. Spillteori for økonomer (John Nash)

Video: Nash-likevekt. Spillteori for økonomer (John Nash)
Video: NASH EQUILIBRIUM 2024, November
Anonim

På 1930-tallet ble John von Neumann og Oscar Morgenstern grunnleggerne av en ny og interessant gren av matematikken k alt "spillteori". På 1950-tallet ble den unge matematikeren John Nash interessert i denne retningen. Teorien om likevekt ble gjenstand for avhandlingen hans, som han skrev i en alder av 21. Dermed ble det født en ny spillstrategi k alt "Nash Equilibrium", som vant Nobelprisen mange år senere - i 1994.

Nash likevekt
Nash likevekt

Det lange gapet mellom å skrive en avhandling og generell anerkjennelse har blitt en prøve for en matematiker. Geni uten anerkjennelse resulterte i alvorlige psykiske lidelser, men John Nash var i stand til å løse dette problemet takket være hans utmerkede logiske sinn. Nash Equilibrium-teorien hans vant en Nobelpris og livet hans ble filmet i Beautiful mind.

Kort om spillteori

Siden Nash-likevektsteorien forklarer atferden til mennesker i forhold til samhandling, er det verdt å vurdere de grunnleggende konseptene for spillteori.

Spillteori studerer atferden til deltakere (agenter) når det gjelder interaksjon med hverandre som et spill, når utfallet avhenger av beslutningen og oppførselen til flere personer. Deltakeren tar avgjørelser basert på sine spådommer om andres oppførsel, som kalles spillstrategien.

Det er også en dominerende strategi der deltakeren får det beste resultatet for andre deltakeres oppførsel. Dette er spillerens beste vinn-vinn-strategi.

Fangens dilemma og vitenskapelig gjennombrudd

Prisoner's dilemma er et tilfelle av et spill der deltakerne blir tvunget til å ta rasjonelle beslutninger, for å oppnå et felles mål i møte med en konflikt av alternativer. Spørsmålet er hvilket av disse alternativene han vil velge, innse personlig og generell interesse, samt umuligheten av å få begge. Spillerne ser ut til å være fengslet i et tøft spillmiljø, noe som noen ganger får dem til å tenke veldig produktivt.

Eksempler på Nash-likevekt
Eksempler på Nash-likevekt

Dette dilemmaet ble utforsket av den amerikanske matematikeren John Nash. Balansen han fant var revolusjonerende på sin måte. Spesielt sterkt påvirket denne nye tanken økonomenes mening om hvordan markedsaktører tar valg, tar hensyn til andres interesser, med nært samspill og skjæringspunktet mellom interesser.

Det er best å studere spillteori gjennom konkrete eksempler, siden denne matematiske disiplinen i seg selv ikke er tørt teoretisk.

eksempel på fangens dilemma

Eksempel, to personer begikk et ran, f alt i hendene på politiet og blir avhørt i separate celler. Samtidig tilbyr polititjenestemenn hver deltaker gunstige betingelser for at han vil bli løslatt dersom han vitner mot sin partner. Hver avkriminelle har følgende sett med strategier som han vil vurdere:

  1. Begge vitner samtidig og får 2,5 års fengsel.
  2. Begge er stille samtidig og får 1 år hver, fordi i dette tilfellet vil bevisgrunnlaget for deres skyld være lite.
  3. Den ene vitner og blir løslatt, mens den andre tier og får 5 års fengsel.

Selvsagt avhenger utfallet av saken av beslutningen til begge deltakerne, men de kan ikke bli enige, fordi de sitter i forskjellige celler. Konflikten mellom deres personlige interesser i kampen for en felles interesse er også tydelig synlig. Hver av fangene har to handlings alternativer og 4 alternativer for utfall.

Kjede av logiske slutninger

Så, lovbryter A vurderer følgende alternativer:

  1. Jeg er stille og partneren min er stille - vi får begge 1 års fengsel.
  2. Jeg leverer partneren min og han melder meg inn - vi får begge 2,5 års fengsel.
  3. Jeg er stille, og partneren min forråder meg - jeg får 5 års fengsel, og han blir fri.
  4. Jeg overlater partneren min, men han er stille - jeg får frihet, og han får 5 års fengsel.

La oss gi en matrise med mulige løsninger og utfall for klarhet.

Tabell over mulige utfall av fangens dilemma.

Nash likevektsteori
Nash likevektsteori

Spørsmålet er, hva vil hver deltaker velge?

"Vær stille, du kan ikke snakke" eller "Du kan ikke være stille, du kan ikke snakke"

For å forstå deltakerens valg må du gå gjennom kjeden av hans tanker. Etter resonnementet til kriminell A: hvis jeg forblir taus og partneren min forblir taus, vil vi få en minimumsperiode (1 år), men jegJeg vet ikke hvordan han vil oppføre seg. Hvis han vitner mot meg, så er det bedre for meg å vitne, ellers kan jeg sitte ned i 5 år. Jeg vil heller sitte ned i 2,5 år enn 5 år. Hvis han tier, så desto mer trenger jeg å vitne, for på den måten får jeg min frihet. Deltaker B.

john nash balanse
john nash balanse

Det er ikke vanskelig å se at den dominerende strategien for hver av gjerningsmennene er å vitne. Det optimale poenget med dette spillet kommer når begge kriminelle vitner og mottar sin "premie" - 2,5 års fengsel. Nash-spillteori kaller dette likevekt.

Ikke-optimal optimal Nash-løsning

Den revolusjonerende karakteren til det nashianske synet er at en slik likevekt ikke er optimal når man tar hensyn til den enkelte deltaker og hans egeninteresse. Tross alt er det beste alternativet å være stille og gå fri.

Nash-likevekt er et punkt for konvergens av interesser, der hver deltaker velger det alternativet som er optim alt for ham bare hvis andre deltakere velger en bestemt strategi.

Vurderer alternativet når begge kriminelle er stille og får bare 1 år, kan vi kalle det et Pareto-optim alt alternativ. Det er imidlertid bare mulig hvis de kriminelle kunne bli enige på forhånd. Men selv dette vil ikke garantere dette utfallet, siden fristelsen til å trekke seg tilbake fra avtalen og unngå straff er stor. Mangelen på fullstendig tillit til hverandre og faren for å få 5 år tvunget til å velge alternativet med anerkjennelse. Reflekter over hva deltakerne vil forholde seg til alternativet med stillhet, å opptre i konsert, er rett og slett irrasjonelt. En slik konklusjon kan trekkes hvis vi studerer Nash-likevekten. Eksempler viser bare at du har rett.

Egoistisk eller rasjonelt

The Nash Equilibrium Theory ga oppsiktsvekkende konklusjoner som motbeviste prinsippene som eksisterte før. For eksempel anså Adam Smith oppførselen til hver av deltakerne som fullstendig egoistisk, noe som brakte systemet i balanse. Denne teorien ble k alt "markedets usynlige hånd."

John Nash likevektsteori
John Nash likevektsteori

John Nash så at dersom alle deltakere handler i sine egne interesser, vil dette aldri føre til et optim alt grupperesultat. Gitt at rasjonell tenkning er iboende i hver deltaker, er valget som tilbys av Nash-likevektsstrategien mer sannsynlig.

Rent mannlig eksperiment

Et godt eksempel er det blonde paradoksspillet, som, selv om det tilsynelatende er malplassert, er en tydelig illustrasjon av hvordan Nash-spillteori fungerer.

I dette spillet må du forestille deg at et selskap med gratis gutter kom til en bar. I nærheten er et selskap med jenter, hvorav en er å foretrekke fremfor andre, si en blondine. Hvordan handler gutter for å skaffe seg den beste kjæresten?

balansesituasjon
balansesituasjon

Så, resonnementet til gutta: hvis alle begynner å bli kjent med blondinen, så er det mest sannsynlig at ingen får det, da vil ikke vennene hennes ønske å bli kjent. Ingen ønsker å være den andre reserven. Men hvis guttene velger å unngåblond, da er sannsynligheten stor for at hver av gutta finner en god kjæreste blant jentene.

Nash-likevektssituasjonen er ikke optimal for gutter, fordi alle ville velge blondinen, for bare å forfølge sine egne egoistiske interesser. Det kan sees at jakten på kun egoistiske interesser vil være ensbetydende med sammenbruddet av gruppeinteresser. Nash-likevekt vil bety at hver fyr handler i sine egne interesser, som er i kontakt med interessene til hele gruppen. Dette er ikke det beste alternativet for alle personlig, men det beste for alle, basert på den overordnede strategien for suksess.

Hele livet vårt er et spill

Beslutningstaking i den virkelige verden ligner veldig på et spill der du forventer viss rasjonell oppførsel fra andre deltakere også. I virksomheten, på jobben, i et team, i et selskap, og til og med i forhold til det motsatte kjønn. Fra store avtaler til vanlige livssituasjoner, alt følger en eller annen lov.

nash spillteori
nash spillteori

Selvfølgelig er spillsituasjonene ovenfor med kriminelle og en bar bare utmerkede illustrasjoner som demonstrerer Nash-likevekten. Eksempler på slike dilemmaer oppstår veldig ofte i det virkelige markedet, og dette fungerer spesielt i tilfeller der to monopolister kontrollerer markedet.

Mixed Strategies

Ofte er vi involvert i ikke én, men flere kamper på en gang. Velger du ett av alternativene i ett spill, styrt av en rasjonell strategi, men du havner i et annet spill. Etter noen rasjonelle avgjørelser kan du finne ut at resultatet ikke faller i smak. Hvata?

La oss vurdere to typer strategier:

  • Ren strategi er deltakerens atferd, som kommer fra å tenke på mulig oppførsel til andre deltakere.
  • Blandet strategi eller tilfeldig strategi er veksling av rene strategier tilfeldig eller valget av en ren strategi med en viss sannsynlighet. Denne strategien kalles også randomisert.
Nash-likevekt i blandede strategier
Nash-likevekt i blandede strategier

Med tanke på denne oppførselen får vi et nytt blikk på Nash-likevekten. Hvis det tidligere ble sagt at spilleren velger en strategi én gang, kan en annen oppførsel tenkes. Det kan antas at spillerne velger en strategi tilfeldig med en viss sannsynlighet. Spill som ikke kan finne Nash-likevekter i rene strategier, har dem alltid i blandede strategier.

Nash-likevekt i blandede strategier kalles blandet likevekt. Dette er en likevekt der hver deltaker velger den optimale frekvensen for å velge sine strategier, forutsatt at andre deltakere velger sine strategier med en gitt frekvens.

Straffer og blandet strategi

Et eksempel på en blandet strategi finner du i fotball. Den beste illustrasjonen på en blandet strategi er kanskje en straffesparkkonkurranse. Så vi har en keeper som bare kan hoppe inn i ett hjørne, og en spiller som tar straffen.

Så, hvis første gang spilleren velger strategien for å skyte til venstre hjørne, og keeperen også faller ned i dette hjørnet og fanger ballen, hvordan kan ting utvikle seg andre gang? Hvis spillerenvil treffe i motsatt hjørne, er dette mest sannsynlig for tydelig, men å treffe i samme hjørne er ikke mindre åpenbart. Derfor har både målvakten og sparkeren ikke noe annet valg enn å stole på tilfeldig valg.

Dermed, ved å veksle tilfeldig valg med en viss ren strategi, prøver spilleren og keeperen å få maksim alt resultat.

Anbefalt: