damianosk2001's blog

Just another Blogs.sch.gr site Μαθηματικα

Θεωρία παιγνίων…

Συγγραφέας: damianosk2001 στις 30 Αυγούστου 2017

Τελικά υπάρχει θεωρία ακόμη και για τα παιχνίδια!

Ημερομηνια: 08-02-2017

Το 2001 κυκλοφόρησε στις κινηματογραφικές αίθουσες μια ταινία με μαθηματικό θέμα, «Ενας υπέροχος άνθρωπος – A Beautiful Mind». Πρόκειται για μια ταινία που θα μαγέψει τους μαθητές της Ε και Στ Δημοτικού. Η ταινία αναφέρεται στην ζωή του νομπελίστα μαθηματικού John Forbes Nash (1928 – 2015) που ασχολήθηκε με την θεωρία παιγνίων. Πέρα όμως από την απόλαυση αυτής της ταινίας, και με αφορμή το μαθηματικό θέμα της θεωρίας παιγνίων που πραγματεύεται, μπορούμε να συζητήσουμε με τους μαθητές πως αυτή η μαθηματική θεωρία μας διδάσκει να συνεργαζόμαστε, να έχουμε σαν σκοπό το καλό του κοινωνικού συνόλου, και να μην είμαστε ατομιστές.

Ο μαθηματικός Γεώργιος Γ. Ούτρας μας κάνει μια σύντομη παρουσίαση της θεωρίας παιγνίων από την “ματιά” των Μαθηματικών.

Η θεωρία παιγνίων (game theory) ξεκίνησε ως κλάδος των οικονομικών με το βιβλίο των Τζον φον Νόιμαν (John von Neumann) και Όσκαρ Μόργκενστερν (Oskar Morgenstern), Theory of Games and Economic Behaviour πάνω σε παιχνίδια μηδενικού αθροίσματος (zerosum games). Το κύριο αντικείμενό της είναι η ανάλυση των αποφάσεων σε καταστάσεις στρατηγικής αλληλεξάρτησης. Σύμφωνα με την θεωρία αυτή , με χρήση απλών υπολογισμών και λογικής, μπορεί να μελετηθεί – και πιθανότατα προβλεφθεί – ο τρόπος με τον οποίο άτομα ή ομάδες ατόμων λαμβάνουν αποφάσεις, σ’ ένα ανταγωνιστικό μεταξύ τους, περιβάλλον. Με (όσο γίνεται πιο) απλά λόγια, είναι η μελέτη των διαδικασιών λήψης στρατηγικών αποφάσεων. Θεωρείται δε πλέον τόσο σημαντική επιστημονικά ώστε, μέχρι και το 2014, να έχουν τιμηθεί με Βραβείο Νόμπελ 11 μελετητές/θεωρητικοί της. Γνωστότερος όλων στο ευρύ κοινό, ο John Forbes Nash που τιμήθηκε με το Βραβείο το 1994 (μαζί με τους John Harsanyi και Reinhard Selten) και του οποίου η ζωή του έγινε κινηματογραφική ταινία που κέρδισε 4 βραβεία Όσκαρ. (Ένας υπέροχος άνθρωπος- A beautiful mind) .

Εφαρμογές της Θεωρίας Παιγνίων – Κοινωνικά Διλήμματα :

Τα τελευταία 30 χρόνια, η θεωρία παιγνίων έχει βρει ευρύτατη εφαρμογή στα οικονομικά, όπου ολόκληροι κλάδοι στηρίζονται στις μεθόδους της, όπως π.χ. η βιομηχανική οργάνωση (industrial organisation), ο σχεδιασμός μηχανισμών (mechanism design) με σπουδαιότερο υποκλάδο τον σχεδιασμό δημοπρασιών (auctions) κ.α. Επίσης, η θεωρία παιγνίων χρησιμοποιείται και στην Πολιτική Οικονομία και ειδικά στη θεωρία της συλλογικής δράσης, όπου εξηγεί ενδεχόμενα συνεργασίας μεταξύ των παικτών. Στη συγκεκριμένη εκδοχή, μιλάμε για παίγνια συνεργασίας (Cooperative Game Theory). Αυτό βρίσκεται σε άμεση συσχέτιση με τον ρόλο του κράτους και των θεσμών σε θέματα συνεργασίας. Χαρακτηριστικό παράδειγμα είναι η παροχή δημόσιων αγαθών και η φορολογία. Επιπρόσθετα χρησιμοποιείται ευρέως και σε άλλες επιστήμες με τις οποίες παράλληλα αλληλεπιδρά, όπως η εξελικτική βιολογία, η ψυχολογία, η κοινωνιολογία κλπ. Ένα γνωστό παράδειγμα στη θεωρία των παιγνίων είναι το δίλημμα του φυλακισμένου. Το παιχνίδι αυτό έχει χρησιμοποιηθεί ευρέως για την ανάλυση καταστάσεων κοινωνικών διλημμάτων (social dilemmas). Η γνωστότερη στρατηγική επίλυσης της εκτεταμένης μορφής του διλήμματος του φυλακισμένου είναι η «μία σου και μία μου» (tit for tat). Αυτή η στρατηγική παρουσιάστηκε από τον Ανατόλ Ράποπορτ (Anatol Rapoport) στο τουρνουά που διεξήχθη από τον Ρόμπερτ Άξελροντ (Robert Axelrod), πολιτικό επιστήμονα στο Πανεπιστήμιο του Michigan στα τέλη της δεκαετίας του 1970. Η στρατηγική συνίσταται στο ότι η πρώτη κίνηση που κάνει ο παίκτης είναι πάντα η συνεργασία, ενώ στα επόμενα βήματα επιλέγει την στρατηγική του αντιπάλου του στον προηγούμενο γύρο. Στο τουρνουά του Άξελροντ, η στρατηγική αυτή κατέλαβε την πρώτη θέση (με κριτήριο το άθροισμα τιμών ωφέλειας που απέσπασε παίζοντας ενάντια σε όλες τις υπόλοιπες στρατηγικές).

Τύποι παιγνίων :

1) Συνεταιριστικά / Μη συνεταιριστικά

Ένα παιχνίδι είναι συνεταιριστικό αν οι παίκτες είναι σε θέση να σχηματίσουν δεσμεύσεις. Απαιτεί από τους παίκτες να τηρούν τις υποσχέσεις τους. Σε μη-συνεταιριστικά παιχνίδια, αυτό δεν είναι δυνατό.

2) Συμμετρικά / Ασύμμετρα

Ένα συμμετρικό παιχνίδι είναι ένα παιχνίδι όπου τα κέρδη για την αναπαραγωγή μιας συγκεκριμένης στρατηγικής εξαρτάται μόνο από τις άλλες στρατηγικές που χρησιμοποιούνται, όχι από το ποιος παίζει.

3) Μηδενικού αθροίσματος / μη-μηδενικού αθροίσματος

Ένα παιχνίδι μηδενικού αθροίσματος είναι μια ειδική περίπτωση παιχνιδιών σταθερού αθροίσματος στα οποία οι επιλογές από τους παίκτες δεν μπορεί ούτε να μειώσει ούτε να αυξήσει τους διαθέσιμους πόρους.

4) Ταυτόχρονα / Ακολουθιακά

Ταυτόχρονα παιχνίδια είναι παιχνίδια όπου και οι δύο παίκτες κινούνται ταυτόχρονα ή εάν δεν κινούνται ταυτόχρονα, οι παίκτες που παίζουν αργότερα αγνοούν τις ενέργειες των παικτών που έπαιξαν νωρίτερα.

5) Τέλειας πληροφορίας και ελλιπής ενημέρωσης

Ένα σημαντικό υποσύνολο διαδοχικών παιχνιδιών αποτελείται από παιχνίδια τέλειας πληροφόρησης. Ένα παιχνίδι είναι παιχνίδι τέλειας πληροφόρησης, εάν όλοι οι παίκτες γνωρίζουν τις κινήσεις που έχουν ήδη πραγματοποιηθεί από όλους τους άλλους παίκτες.

6) Συνδυαστικά παιχνίδια

Συνδυαστικά παιχνίδια είναι αυτά στα οποία η δυσκολία εύρεσης της βέλτιστης στρατηγικής προέρχεται από την πολλαπλότητα των δυνατών κινήσεων.

7) Παιχνίδια άπειρου μήκους

Όπως μελετήθηκε από τους οικονομολόγους και στον πραγματικό κόσμο οι παίκτες των παιχνιδιών τελειώνουν το παιχνίδι σε ένα πεπερασμένο πλήθος κινήσεων. Ο νικητής δεν είναι γνωστός παρά μόνο όταν όλες οι κινήσεις έχουν ολοκληρωθεί. Το επίκεντρο της προσοχής δεν αφορά συνήθως τον καλύτερο τρόπο για να παιχτεί ένα παιχνίδι, αλλά αν κάποιος παίκτης έχει μια στρατηγική νίκης. Η ύπαρξη αυτών των στρατηγικών για έξυπνα σχεδιασμένα παιχνίδια έχει σημαντικές συνέπειες στην περιγραφική θεωρία των συνόλων.

8) Διακριτά και συνεχή παιχνίδια

Ένα μεγάλο μέρος της θεωρίας των παιγνίων ασχολείται με πεπερασμένα, διακριτά παιχνίδια, που έχουν ένα πεπερασμένο αριθμό παικτών, κινήσεων, εκδηλώσεων, αποτελεσμάτων κτλ. Πολλές έννοιες μπορούν να παραταθούν, ωστόσο. Τα συνεχή παιχνίδια επιτρέπουν στους παίκτες να επιλέξουν μια στρατηγική από ένα σύνολο η οποία συνεχίζει τη στρατηγική που είναι να παιχτεί.

Το δίλημμα του φυλακισμένου που έχει εφαρμογές στο δίκαιο, την ψυχολογία, ακόμη και την βιολογία.

Ο Robert Axeldorf το 1970, βρήκε στο δίλημμα αυτό μια πιθανή απάντηση στο ερώτημα που τον απασχολούσε: υπό ποιες συνθήκες δύο θεμελιωδώς εγωιστικά όντα μπορούν να συνεργαστούν; Για να το απαντήσει δημιούργησε το “Επαναλαμβανόμενο Δίλημμα του Φυλακισμένου” όπου το παίγνιο παίζεται όχι μόνο μια φορά αλλά πολλές. Έτσι έχουν την δυνατότητα να μάθουν από τα λάθη τους και να επανορθώσουν. Το 1979 καλεί τους σημαντικότερους θεωρητικούς των παιγνίων να υποβάλλουν στρατηγικές, υπό την μορφή προγραμμάτων ηλεκτρονικών υπολογιστών. Υποβάλλονται 14 στρατηγικές από ψυχολόγους, μαθηματικούς, κοινωνιολόγους και πολιτικούς επιστήμονες.

Νικητής αναδεικνύεται ο Αμερικανοεβραίος μαθηματικός και ψυχολόγος Anatol Rapoport (1911-) με την στρατηγική Tit for Tat ή αλλιώς Μία Σου και Μία Μου. Ο παίκτης ξεκινά συνεργαζόμενος με τον αντίπαλο και κατόπιν πράττει ότι έπραξε και ο αντίπαλος στον προηγούμενο γύρο.

Ο Axeldorf διοργάνωσε και δεύτερο τουρνουά τον επόμενο χρόνο, πήρε άλλες 62 στρατηγικές. Η πιο πετυχημένη ήταν η ” Tit for Two Tats” ” Δύο σου και Μία Μου”. του Βρετανού εξελικτικού βιολόγου M.Smith (1920-2004), όπου ο παίκτης προδίδει μετά από δύο συνεχόμενες προδοσίες. Αλλά νικητής αναδείχτηκε πάλι ο Rapoport. Εφαρμογή του ίδιου διλήμματος, έγινε σε δυο ομάδες η μια αποτελούμενη από φοιτητές και η άλλη από αληθινούς κρατούμενους. Διαπιστώθηκε ότι μόνο το 37% των φοιτητών συνεργάστηκαν ενώ οι κρατούμενοι σε ποσοστό 56% όταν παίχτηκε μία φορά. Στο διαδοχικό παιχνίδι, πολύ περισσότεροι φοιτητές συνεργάστηκαν, 63%, ενώ στους κρατούμενους το ποσοστό παρέμεινε το ίδιο. Μία από τις πιο ενδιαφέρουσες αναλύσεις της Θεωρίας Παιγνίων αφορά καταστάσεις όπου, ενώ το κάθε άτομο λειτουργεί λογικά για την προώθηση του ατομικού του συμφέροντος, επειδή όλοι κάνουν το ίδιο, το ατομικό συμφέρον του καθενός -και τελικά όλων- πλήττεται περισσότερο. (Όταν όλοι πολεμούν συμφέρει να λιποτακτήσεις μόνο εσύ και να σωθείς. Αν όμως όλοι κάνουν το ίδιο, η μάχη θα χαθεί και δεν θα σωθεί κανένας). Όλοι θα ήταν καλύτερα αν ακολουθούσαν μια λογική συνεργασίας μιας ομάδας που προωθεί το κοινό καλό – κοινωνική συμπεριφορά. Το παράδοξο αυτών των καταστάσεων βρίσκεται στο ότι το κάθε άτομο έχει κίνητρο να «κάνει το δικό του» -αντικοινωνική συμπεριφορά- διαταράσσοντας αυτή τη συνεργασία που τελικά καταρρέει εις βάρος όλων.

Τα παραδείγματα από την καθημερινή μας ζωή είναι πολλά.

– Αγοράζοντας πειρατικά DVD ωφελούμαστε ατομικά από τη χαμηλότερη τιμή, αλλά τελικά ζημιωνόμαστε όλοι, επειδή με τον τρόπο αυτό περιορίζουμε τη ανταμοιβή της δημιουργικότητας, που θα μας λείψει αν δεν υπάρχει.

– Αφήνοντας τα σκουπίδια έξω τις ημέρες που η συλλογή τους δεν είναι εφικτή, κρατάμε καθαρό το σπίτι μας -ατομικό συμφέρον- αλλά, επειδή τελικά ο καθένας κάνει το ίδιο, λερώνουμε αφόρητα τον δρόμο του σπιτιού μας και βάζουμε σε κίνδυνο την υγεία μας.

– Διαφυλάσσοντας ατομικά ή συντεχνιακά οφέλη και προνόμια, κερδίζουμε, αλλά όταν η κάθε ομάδα κάνει το ίδιο, στο τέλος ζούμε σε μία οικονομία περιορισμένη και δυσκίνητη που δεν αφήνει περιθώρια προόδου σε κανέναν.

Το παράδοξο είναι ότι, ενώ όλοι κατ’ αρχήν θα συμφωνούσαν να λειτουργήσουν κοινωνικά και να τηρήσουν τη συνεργασία για το καλό όλων, πάντα θα είναι εκ των υστέρων προς το συμφέρον κάποιου να μην τηρήσει τη συμφωνία συνεργασίας.

Η ζωή στην Ελλάδα είναι δύσκολη και όλοι νιώθουν ότι τίποτα δεν δουλεύει σωστά, ενώ οι περισσότεροι περνάνε ατομικά καλά, διότι η Ελλάδα είναι η χώρα όπου η αντικοινωνική συμπεριφορά είναι παντού. Ενώ όλοι θα ήμασταν καλύτερα αν ακολουθούσαμε μια συμπεριφορά συνεργασίας, τελικά ο καθένας κοιτάει μόνο τον εαυτό του και είμαστε όλοι χειρότερα. Παρκάρουμε όπου θέλουμε, πετάμε τα σκουπίδια όπου βρούμε, κτίζουμε ό,τι μας βολεύει, δεν πληρώνουμε φόρους και προστατεύουμε τα μικροσυμφέροντά μας σε βάρος όλων των άλλων.

Όμως, σύμφωνα με τη Θεωρία Παιγνίων, η συμπεριφορά αυτή είναι απόλυτα λογική. Το κάθε άτομο χωριστά έχει το κίνητρο να «λιποτακτήσει», να εγκαταλείψει δηλαδή τη συνεργασία και να συμπεριφερθεί αντικοινωνικά, προωθώντας το ατομικό του συμφέρον. Δεν υπάρχει αυτονόητος τρόπος η συνεργασία να είναι διατηρήσιμη εκ των υστέρων. Η συνεργασία, όπως λέγεται στη Θεωρία, δεν αποτελεί σημείο ισορροπίας. Η Θεωρία δεν ασχολείται με τη φιλοσοφική διάσταση των παραπάνω συμπεριφορών, αλλά με την ανάλυση και τη δημιουργία συνθηκών ή μηχανισμών που θα περιορίσουν τα ατομικά κίνητρα και θα καταστήσουν τη συνεργασία σταθερή εκ των υστέρων, άρα διατηρήσιμη, επιτυγχάνοντας έτσι κέρδος για κάθε άτομο και για το σύνολο.

Την ταινία «Ένας υπέροχος άνθρωπος- A beautiful mind» που αναφέρεται στην ζωή του νομπελίστα μαθηματικού John Forbes Nash (13 Ιουνίου 1928 – 23 Μαΐου 2015) που ασχολήθηκε με την θεωρία παιγνίων μπορείτε να την δείτε κάνοντας κλικ στον παρακάτω υπερσύνδεσμο:

https://www.youtube.com/watch?v=_bESDxodGWE&t=8s

Πηγές:

*https://el.wikipedia.org/wiki/%CE%98%CE%B5%CF%89%CF%81%CE%AF%CE%B1_%CF%80%CE%B1%CE%B9%CE%B3%CE%BD%CE%AF%CF%89%CE%BD

* http://medlabgr.blogspot.com/2015/02/games-theory.html

 

Από το: http://teacherland.gr/news.php?article=163