Αρχεία για 'ARTIFICIAL INTELIGENCE' Κατηγορία

ΠΩΣ ΤΑ ΝΕΥΡΟΝΙΚΑ ΔΙΚΤΥΑ ΜΑΘΑΙΝΟΥΝ ΑΠΌ ΕΜΠΕΙΡΙΑ

Συγγραφέας: ΗΛΙΑΣ ΓΑΒΡΙΛΗΣ στις 2 Νοεμβρίου 2025

Θα μπορούσε ένας υπολογιστής να μάθει και να ανταποκριθεί με ανθρώπινο τρόπο, ενσωματώνοντας το βιονευρωνικό δίκτυο του ανθρώπινου σώματος σε ένα λειτουργικό σύστημα; Αυτή την ιδέα που πυροδότησε ο αντισυμβατικός της ΑΙ-Marvin Minsky, ρίζωσε και τώρα αποτελεί ένα σοβαρό πεδίο έρευνας στον τομέα. Αυτές οι έρευνες έχουν διευρύνει μια εντελώς νέα εκτίμηση του θαύματος της ανθρώπινης αντίληψης.

Ο εγκέφαλος είναι ένας αξιοσημείωτος υπολογιστής. Ερμηνεύει ανακριβείς πληροφορίες από τις αισθήσεις με απίστευτα γρήγορο ρυθμό. Διακρίνει έναν ψίθυρο σε ένα θορυβώδες δωμάτιο, ένα πρόσωπο σε ένα αμυδρά φωτισμένο σοκάκι και μια κρυφή ατζέντα σε μια πολιτική δήλωση. Το πιο εντυπωσιακό από όλα είναι ότι ο εγκέφαλος μαθαίνει χωρίς σαφείς οδηγίες – για να δημιουργήσει τις εσωτερικές αναπαραστάσεις που καθιστούν δυνατές αυτές τις δεξιότητες.

Πολλά είναι ακόμα άγνωστα για το πώς ο εγκέφαλος εκπαιδεύεται να επεξεργάζεται πληροφορίες, επομένως οι θεωρίες αφθονούν. Για να δοκιμάσουμε αυτές τις υποθέσεις, οι συνάδελφοί μου και εγώ προσπαθήσαμε να μιμηθούμε τις διαδικασίες μάθησης του εγκεφάλου δημιουργώντας δίκτυα τεχνητών νευρώνων. Κατασκευάζουμε αυτά τα νευρωνικά δίκτυα προσπαθώντας πρώτα να συναγάγουμε τα βασικά χαρακτηριστικά των νευρώνων και τις διασυνδέσεις τους. Στη συνέχεια, συνήθως προγραμματίζουμε έναν υπολογιστή για να προσομοιώσει αυτά τα χαρακτηριστικά.

Επειδή η γνώση μας για τους νευρώνες είναι ελλιπής και η υπολογιστική μας ισχύς περιορισμένη, τα μοντέλα μας είναι αναγκαστικά χονδροειδείς εξιδανικεύσεις πραγματικών δικτύων νευρώνων. Φυσικά, συζητάμε με ενθουσιασμό ποια χαρακτηριστικά είναι πιο σημαντικά στην προσομοίωση των νευρώνων. Δοκιμάζοντας αυτά τα χαρακτηριστικά σε τεχνητά νευρωνικά δίκτυα, έχουμε καταφέρει να αποκλείσουμε κάθε είδους θεωρίες σχετικά με το πώς ο εγκέφαλος επεξεργάζεται πληροφορίες. Τα μοντέλα αρχίζουν επίσης να αποκαλύπτουν πώς ο εγκέφαλος μπορεί να επιτύχει τα αξιοσημείωτα κατορθώματά του στη μάθηση.

Στον ανθρώπινο εγκέφαλο, ένας τυπικός νευρώνας συλλέγει σήματα από άλλους μέσω μιας σειράς λεπτών δομών που ονομάζονται δενδρίτες. Ο νευρώνας στέλνει αιχμές ηλεκτρικής δραστηριότητας μέσω μιας μακριάς, λεπτής αλυσίδας γνωστής ως άξονας, η οποία διαιρείται σε χιλιάδες κλάδους. Στο τέλος κάθε κλάδου, μια δομή που ονομάζεται σύναψη μετατρέπει τη δραστηριότητα από τον άξονα σε ηλεκτρικά φαινόμενα που αναστέλλουν ή διεγείρουν τη δραστηριότητα στους συνδεδεμένους νευρώνες. Όταν ένας νευρώνας λαμβάνει διεγερτική είσοδο που είναι αρκετά μεγάλη σε σύγκριση με την ανασταλτική του είσοδο, στέλνει μια αιχμή ηλεκτρικής δραστηριότητας κατά μήκος του άξονα του. Η μάθηση συμβαίνει αλλάζοντας την αποτελεσματικότητα των συνάψεων, έτσι ώστε η επίδραση ενός νευρώνα σε έναν άλλο να αλλάζει

Τα τεχνητά νευρωνικά δίκτυα συνήθως αποτελούνται από διασυνδεδεμένες «μονάδες», οι οποίες χρησιμεύουν ως νευρώνες-μοντέλα. Η λειτουργία της σύναψης μοντελοποιείται από ένα τροποποιήσιμο βάρος, το οποίο σχετίζεται με κάθε σύνδεση. Τα περισσότερα τεχνητά δίκτυα δεν αντικατοπτρίζουν τη λεπτομερή γεωμετρία των δενδριτών και των αξόνων και εκφράζουν την ηλεκτρική έξοδο ενός νευρώνα ως έναν μόνο αριθμό που αντιπροσωπεύει τον ρυθμό ενεργοποίησης της δραστηριότητάς του.

Το δίκτυο νευρώνων στον εγκέφαλο παρέχει στους ανθρώπους τη δυνατότητα να αφομοιώνουν πληροφορίες. Θα αποκαλύψουν οι προσομοιώσεις τέτοιων δικτύων τους υποκείμενους μηχανισμούς μάθησης;

Κάθε μονάδα μετατρέπει το μοτίβο των εισερχόμενων δραστηριοτήτων που λαμβάνει σε μία μόνο εξερχόμενη δραστηριότητα που μεταδίδει σε άλλες μονάδες. Εκτελεί αυτή τη μετατροπή σε δύο στάδια. Πρώτον, πολλαπλασιάζει κάθε εισερχόμενη δραστηριότητα με το βάρος στη σύνδεση και προσθέτει όλες αυτές τις σταθμισμένες εισόδους για να λάβει μια ποσότητα που ονομάζεται συνολική είσοδος. Δεύτερον, μια μονάδα χρησιμοποιεί μια συνάρτηση εισόδου-εξόδου που μετασχηματίζει τη συνολική είσοδο στην εξερχόμενη δραστηριότητα.

Η συμπεριφορά ενός τεχνητού νευρωνικού δικτύου εξαρτάται τόσο από τις σταθμίσεις όσο και από τη συνάρτηση εισόδου-εξόδου που καθορίζεται για τις μονάδες. Αυτή η συνάρτηση συνήθως εμπίπτει σε μία από τις τρεις κατηγορίες: γραμμική, κατωφλίου ή σιγμοειδούς. Για τις γραμμικές μονάδες, η δραστηριότητα εξόδου είναι ανάλογη με τη συνολική σταθμισμένη είσοδο. Για τις μονάδες κατωφλίου, η έξοδος ορίζεται σε ένα από τα δύο επίπεδα, ανάλογα με το αν η συνολική είσοδος είναι μεγαλύτερη ή μικρότερη από κάποια τιμή κατωφλίου. Για τις σιγμοειδείς μονάδες, η έξοδος μεταβάλλεται συνεχώς, αλλά όχι γραμμικά καθώς αλλάζει η είσοδος. Οι σιγμοειδείς μονάδες έχουν μεγαλύτερη ομοιότητα με τους πραγματικούς νευρώνες από ό,τι οι γραμμικές ή οι κατωφλίου μονάδες, αλλά και οι τρεις πρέπει να θεωρούνται πρόχειρες προσεγγίσεις.

Για να δημιουργήσουμε ένα νευρωνικό δίκτυο που εκτελεί κάποια συγκεκριμένη εργασία, πρέπει να επιλέξουμε τον τρόπο με τον οποίο οι μονάδες συνδέονται μεταξύ τους και πρέπει να ορίσουμε τα βάρη στις συνδέσεις κατάλληλα. Οι συνδέσεις καθορίζουν αν είναι δυνατόν μια μονάδα να επηρεάσει μια άλλη. Τα βάρη καθορίζουν την ισχύ της επιρροής

Ο πιο συνηθισμένος τύπος τεχνητού νευρωνικού δικτύου αποτελείται από τρεις ομάδες, ή επίπεδα, μονάδων: ένα επίπεδο μονάδων εισόδου συνδέεται με ένα επίπεδο «κρυφών» μονάδων, το οποίο συνδέεται με ένα επίπεδο μονάδων εξόδου. Η δραστηριότητα των μονάδων εισόδου αντιπροσωπεύει τις ακατέργαστες πληροφορίες που τροφοδοτούνται στο δίκτυο. Η δραστηριότητα κάθε κρυφής μονάδας καθορίζεται από τις δραστηριότητες των μονάδων εισόδου και τα βάρη στις συνδέσεις μεταξύ των μονάδων εισόδου και των κρυφών μονάδων. Ομοίως, η συμπεριφορά των μονάδων εξόδου εξαρτάται από τη δραστηριότητα των κρυφών μονάδων και τα βάρη μεταξύ των κρυφών μονάδων και των μονάδων εξόδου.

Αυτός ο απλός τύπος δικτύου είναι ενδιαφέρων επειδή οι κρυφές μονάδες είναι ελεύθερες να κατασκευάσουν τις δικές τους αναπαραστάσεις της εισόδου. Τα βάρη μεταξύ των μονάδων εισόδου και των κρυφών μονάδων καθορίζουν πότε κάθε κρυφή μονάδα είναι ενεργή, και έτσι τροποποιώντας αυτά τα βάρη, μια κρυφή μονάδα μπορεί να επιλέξει τι αντιπροσωπεύει.

Μπορούμε να διδάξουμε σε ένα δίκτυο τριών επιπέδων να εκτελεί μια συγκεκριμένη εργασία χρησιμοποιώντας την ακόλουθη διαδικασία. Πρώτον, παρουσιάζουμε το δίκτυο με παραδείγματα εκπαίδευσης, τα οποία αποτελούνται από ένα μοτίβο δραστηριοτήτων για τις μονάδες εισόδου μαζί με το επιθυμητό μοτίβο δραστηριοτήτων για τις μονάδες εξόδου. Στη συνέχεια, καθορίζουμε πόσο στενά ταιριάζει η πραγματική έξοδος του δικτύου με την επιθυμητή έξοδο. Στη συνέχεια, αλλάζουμε το βάρος κάθε σύνδεσης, έτσι ώστε το δίκτυο να παράγει μια καλύτερη προσέγγιση της επιθυμητής εξόδου.

Για παράδειγμα, ας υποθέσουμε ότι θέλουμε ένα δίκτυο να αναγνωρίζει χειρόγραφα ψηφία. Θα μπορούσαμε να χρησιμοποιήσουμε μια σειρά από, ας πούμε, 256 αισθητήρες, καθένας από τους οποίους θα καταγράφει την παρουσία ή την απουσία μελανιού σε μια μικρή περιοχή ενός μοναδικού ψηφίου. Το δίκτυο θα χρειαζόταν επομένως 256 μονάδες εισόδου (μία για κάθε αισθητήρα), 10 μονάδες εξόδου (μία για κάθε είδος ψηφίου) και έναν αριθμό κρυφών μονάδων. Για κάθε είδος ψηφίου που καταγράφεται από τους αισθητήρες, το δίκτυο θα πρέπει να παράγει υψηλή δραστηριότητα στην κατάλληλη μονάδα εξόδου και χαμηλή δραστηριότητα στις άλλες μονάδες εξόδου

Για να εκπαιδεύσουμε το δίκτυο, παρουσιάζουμε μια εικόνα ενός ψηφίου και συγκρίνουμε την πραγματική δραστηριότητα των 10 μονάδων εξόδου με την επιθυμητή δραστηριότητα. Στη συνέχεια, υπολογίζουμε το σφάλμα, το οποίο ορίζεται ως το τετράγωνο της διαφοράς μεταξύ των πραγματικών και των επιθυμητών δραστηριοτήτων. Στη συνέχεια, αλλάζουμε το βάρος κάθε σύνδεσης, ώστε να μειώσουμε το σφάλμα. Επαναλαμβάνουμε αυτή τη διαδικασία εκπαίδευσης για πολλές διαφορετικές εικόνες κάθε είδους ψηφίου μέχρι το δίκτυο να ταξινομήσει σωστά κάθε εικόνα.

Για να εφαρμόσουμε αυτήν τη διαδικασία, πρέπει να αλλάξουμε κάθε βάρος κατά ένα ποσό που είναι ανάλογο με τον ρυθμό με τον οποίο αλλάζει το σφάλμα καθώς αλλάζει το βάρος. Αυτή η ποσότητα – που ονομάζεται παράγωγος σφάλματος για το βάρος, ή απλώς EW – είναι δύσκολο να υπολογιστεί αποτελεσματικά. Ένας τρόπος για να υπολογίσουμε το EW είναι να διαταράξουμε ελαφρώς ένα βάρος και να παρατηρήσουμε πώς αλλάζει το σφάλμα.

Αλλά αυτή η μέθοδος είναι αναποτελεσματική επειδή απαιτεί ξεχωριστή διαταραχή για καθένα από τα πολλά βάρη.

Γύρω στο 1974, ο Paul J. Werbos εφηύρε μια πολύ πιο αποτελεσματική διαδικασία για τον υπολογισμό του EW ενώ εργαζόταν για διδακτορικό στο Πανεπιστήμιο του Χάρβαρντ. Η διαδικασία, γνωστή πλέον ως αλγόριθμος ανατροφοδότησης, έχει γίνει ένα από τα πιο σημαντικά εργαλεία για την εκπαίδευση νευρωνικών δικτύων.

Ο αλγόριθμος ανατροφοδότησης είναι πιο εύκολος στην κατανόηση εάν όλες οι μονάδες στο δίκτυο είναι γραμμικές. Ο αλγόριθμος υπολογίζει κάθε EW υπολογίζοντας πρώτα την EA, τον ρυθμό με τον οποίο αλλάζει το σφάλμα καθώς αλλάζει το επίπεδο δραστηριότητας μιας μονάδας. Για τις μονάδες εξόδου, η EA είναι απλώς η διαφορά μεταξύ της πραγματικής και της επιθυμητής εξόδου. Για να υπολογίσουμε την EA για μια κρυφή μονάδα στο επίπεδο ακριβώς πριν από το επίπεδο εξόδου, προσδιορίζουμε πρώτα όλα τα βάρη μεταξύ αυτής της κρυφής μονάδας και των μονάδων εξόδου με τις οποίες είναι συνδεδεμένη. Στη συνέχεια, πολλαπλασιάζουμε αυτά τα βάρη με τις EA αυτών των μονάδων εξόδου και προσθέτουμε τα γινόμενα. Αυτό το άθροισμα ισούται με την EA για την επιλεγμένη κρυφή μονάδα. Αφού υπολογίσουμε όλες τις EA στο κρυφό επίπεδο ακριβώς πριν από το επίπεδο εξόδου, μπορούμε να υπολογίσουμε με παρόμοιο τρόπο τις EA για άλλες στρώσεις, κινούμενοι από στρώμα σε στρώμα σε μια κατεύθυνση αντίθετη από τον τρόπο με τον οποίο οι δραστηριότητες διαδίδονται μέσω του δικτύου. Αυτό είναι που δίνει στην ανατροφοδότηση το όνομά της Μόλις υπολογιστεί η EA για μια μονάδα, είναι εύκολο να υπολογιστεί η EW για κάθε εισερχόμενη σύνδεση της μονάδας. Η EW είναι το γινόμενο της EA και της δραστηριότητας μέσω της εισερχόμενης σύνδεσης.

Για μη γραμμικές μονάδες, ο αλγόριθμος ανατροφοδότησης περιλαμβάνει ένα επιπλέον βήμα. Πριν από την ανατροφοδότηση, η EA πρέπει να μετατραπεί σε EI, τον ρυθμό με τον οποίο αλλάζει το σφάλμα καθώς αλλάζει η συνολική είσοδος που λαμβάνεται από μια μονάδα.

Ο αλγόριθμος ανατροφοδότησης αγνοήθηκε σε μεγάλο βαθμό για χρόνια μετά την εφεύρεσή του, πιθανώς επειδή η χρησιμότητά του δεν είχε εκτιμηθεί πλήρως. Στις αρχές της δεκαετίας του 1980, ο David E. Rumelhart, τότε στο Πανεπιστήμιο της Καλιφόρνια στο San Diego, και ο David B. Parker, τότε στο Πανεπιστήμιο του Stanford, ανακάλυψαν ξανά ανεξάρτητα τον αλγόριθμο. Το 1986, ο Rumelhart, ο Ronald J. Williams και εγώ διαδώσαμε τον αλγόριθμο αποδεικνύοντας ότι μπορούσε να διδάξει τις κρυφές μονάδες να παράγουν ενδιαφέρουσες αναπαραστάσεις σύνθετων μοτίβων εισόδου.

Ο αλγόριθμος ανατροφοδότησης έχει αποδειχθεί εκπληκτικά καλός στην εκπαίδευση δικτύων με πολλαπλά επίπεδα για την εκτέλεση μιας ευρείας ποικιλίας εργασιών. Είναι ιδιαίτερα χρήσιμο σε περιπτώσεις όπου η σχέση μεταξύ εισόδου και εξόδου είναι μη γραμμική και τα δεδομένα εκπαίδευσης είναι άφθονα. Εφαρμόζοντας τον αλγόριθμο, οι ερευνητές έχουν δημιουργήσει νευρωνικά δίκτυα που αναγνωρίζουν χειρόγραφα ψηφία, προβλέπουν συναλλαγματικές ισοτιμίες και μεγιστοποιούν τις αποδόσεις των χημικών διεργασιών. Έχουν χρησιμοποιήσει ακόμη και τον αλγόριθμο για να εκπαιδεύσουν δίκτυα που αναγνωρίζουν προκαρκινικά κύτταρα σε τεστ Παπανικολάου και που προσαρμόζουν τον καθρέφτη ενός τηλεσκοπίου έτσι ώστε να ακυρώνουν τις ατμοσφαιρικές παραμορφώσεις.

Στον τομέα της νευροεπιστήμης, οι Richard Andersen και David Zipser έδειξαν ότι ο αλγόριθμος ανατροφοδότησης είναι ένα χρήσιμο εργαλείο για την εξήγηση της λειτουργίας ορισμένων νευρώνων στον φλοιό του εγκεφάλου. Εκπαίδευσαν ένα νευρωνικό δίκτυο να ανταποκρίνεται σε οπτικά ερεθίσματα χρησιμοποιώντας ανατροφοδότηση. Στη συνέχεια, διαπίστωσαν ότι οι αποκρίσεις των κρυφών μονάδων ήταν αξιοσημείωτα παρόμοιες με εκείνες των πραγματικών νευρώνων που είναι υπεύθυνοι για τη μετατροπή των οπτικών πληροφοριών από τον αμφιβληστροειδή σε μια μορφή κατάλληλη για βαθύτερες οπτικές περιοχές του εγκεφάλου

Ωστόσο, η αντίστροφη διάδοση έχει λάβει μάλλον ανάμεικτες αντιδράσεις ως θεωρία για το πώς μαθαίνουν οι βιολογικοί νευρώνες. Από τη μία πλευρά, ο αλγόριθμος αντίστροφης διάδοσης έχει κάνει μια πολύτιμη συμβολή σε αφηρημένο επίπεδο. Ο αλγόριθμος είναι αρκετά καλός στη δημιουργία λογικών αναπαραστάσεων στις κρυφές μονάδες. Ως αποτέλεσμα, οι ερευνητές απέκτησαν εμπιστοσύνη στις διαδικασίες μάθησης στις οποίες τα βάρη προσαρμόζονται σταδιακά για τη μείωση των σφαλμάτων. Προηγουμένως, πολλοί ερευνητές υπέθεταν ότι τέτοιες μέθοδοι θα ήταν άνευ ελπίδας, επειδή αναπόφευκτα θα οδηγούσαν σε τοπικά βέλτιστες αλλά παγκοσμίως κακές λύσεις. Για παράδειγμα, ένα δίκτυο αναγνώρισης ψηφίων μπορεί να εστιάζει σταθερά σε ένα σύνολο βαρών που κάνει το δίκτυο να συγχέει μονάδες και εφτάρια, παρόλο που υπάρχει ένα ιδανικό σύνολο βαρών που θα επέτρεπε στο δίκτυο να διακρίνει μεταξύ των ψηφίων. Αυτός ο φόβος υποστήριζε μια ευρέως διαδεδομένη πεποίθηση ότι μια διαδικασία μάθησης ήταν ενδιαφέρουσα μόνο εάν ήταν εγγυημένο ότι θα συγκλίνει τελικά στη συνολικά βέλτιστη λύση.

Η ανατροφοδότησης έδειξε ότι για πολλές εργασίες η ολική σύγκλιση δεν ήταν απαραίτητη για την επίτευξη καλής απόδοσης.

Από την άλλη πλευρά, η ανατροφοδότηση φαίνεται βιολογικά απίθανη. Η πιο προφανής δυσκολία είναι ότι οι πληροφορίες πρέπει να ταξιδεύουν μέσω των ίδιων συνδέσεων προς την αντίστροφη κατεύθυνση, από το ένα επίπεδο στο προηγούμενο. Σαφώς, αυτό δεν συμβαίνει σε πραγματικούς νευρώνες. Αλλά αυτή η αντίρρηση είναι στην πραγματικότητα μάλλον επιφανειακή. Ο εγκέφαλος έχει πολλές οδούς από τα μεταγενέστερα επίπεδα πίσω στα προηγούμενα, και θα μπορούσε να χρησιμοποιήσει αυτές τις οδούς με πολλούς τρόπους για να μεταφέρει τις πληροφορίες που απαιτούνται για τη μάθηση.

Ένα πιο σημαντικό πρόβλημα είναι η ταχύτητα του αλγορίθμου αντίστροφης διάδοσης. Εδώ το κεντρικό ζήτημα είναι πώς ο χρόνος που απαιτείται για τη μάθηση αυξάνεται καθώς το δίκτυο μεγαλώνει. Ο χρόνος που απαιτείται για τον υπολογισμό των παραγώγων σφάλματος για τα βάρη σε ένα δεδομένο παράδειγμα εκπαίδευσης είναι ανάλογος με το μέγεθος του δικτύου, επειδή η ποσότητα υπολογισμού είναι ανάλογη με τον αριθμό των βαρών. Αλλά τα μεγαλύτερα δίκτυα συνήθως απαιτούν περισσότερα παραδείγματα εκπαίδευσης, και πρέπει να ενημερώνουν τα βάρη περισσότερες φορές. Ως εκ τούτου, ο χρόνος εκμάθησης αυξάνεται πολύ πιο γρήγορα από ό,τι το μέγεθος του δικτύου

Η πιο σοβαρή αντίρρηση στην αντίστροφη διάδοση ως μοντέλο πραγματικής μάθησης είναι ότι απαιτεί από έναν δάσκαλο να παρέχει το επιθυμητό αποτέλεσμα για κάθε παράδειγμα εκπαίδευσης. Αντίθετα, οι άνθρωποι μαθαίνουν τα περισσότερα πράγματα χωρίς τη βοήθεια ενός δασκάλου. Κανείς δεν μας παρουσιάζει μια λεπτομερή περιγραφή των εσωτερικών αναπαραστάσεων του κόσμου που πρέπει να μάθουμε να εξάγουμε από την αισθητηριακή μας είσοδο. Μαθαίνουμε να κατανοούμε προτάσεις ή οπτικές σκηνές χωρίς άμεσες οδηγίες.

Πώς μπορεί ένα δίκτυο να μάθει κατάλληλες εσωτερικές αναπαραστάσεις αν ξεκινά χωρίς γνώση και χωρίς δάσκαλο; Αν σε ένα δίκτυο παρουσιάζεται ένα μεγάλο σύνολο μοτίβων αλλά δεν του δίνονται πληροφορίες για το τι να κάνει με αυτά, προφανώς δεν έχει ένα σαφώς καθορισμένο πρόβλημα να λύσει. Παρ’ όλα αυτά, οι ερευνητές έχουν αναπτύξει αρκετές γενικού σκοπού, χωρίς επίβλεψη, διαδικασίες που μπορούν να προσαρμόσουν τα βάρη στο δίκτυο κατάλληλα.

Όλες αυτές οι διαδικασίες μοιράζονται δύο κοινά χαρακτηριστικά: βασίζονται, έμμεσα ή ρητά, σε κάποια έννοια της ποιότητας μιας αναπαράστασης και λειτουργούν αλλάζοντας τα βάρη για να βελτιώσουν την ποιότητα της αναπαράστασης που εξάγεται από τις κρυφές μονάδες.

Γενικά, μια καλή αναπαράσταση είναι αυτή που μπορεί να περιγραφεί πολύ οικονομικά, αλλά παρόλα αυτά περιέχει αρκετές πληροφορίες για να επιτρέψει μια στενή προσέγγιση των ακατέργαστων δεδομένων εισόδου που πρόκειται να ανακατασκευαστούν. Για παράδειγμα, σκεφτείτε μια εικόνα που αποτελείται από αρκετές ελλείψεις. Ας υποθέσουμε ότι μια συσκευή μεταφράζει την εικόνα σε μια σειρά από ένα εκατομμύριο μικροσκοπικά τετράγωνα, καθένα από τα οποία είναι είτε ανοιχτό είτε σκοτεινό. Η εικόνα θα μπορούσε να αναπαρασταθεί απλώς από τις θέσεις των σκοτεινών τετραγώνων. Αλλά είναι επίσης δυνατές και άλλες, πιο αποτελεσματικές αναπαραστάσεις. Οι ελλείψεις διαφέρουν μόνο με πέντε τρόπους: προσανατολισμό, κατακόρυφη θέση, οριζόντια θέση, μήκος και πλάτος. Η εικόνα μπορεί επομένως να περιγραφεί χρησιμοποιώντας μόνο πέντε παραμέτρους ανά έλλειψη

Παρόλο που η περιγραφή μιας έλλειψης με πέντε παραμέτρους απαιτεί περισσότερα bit από την περιγραφή ενός μόνο σκοτεινού τετραγώνου με δύο συντεταγμένες, επιτυγχάνουμε μια συνολική εξοικονόμηση επειδή χρειάζονται πολύ λιγότερες παράμετροι από τις συντεταγμένες. Επιπλέον, δεν χάνουμε καμία πληροφορία περιγράφοντας τις ελλείψεις με βάση τις παραμέτρους τους: δεδομένων των παραμέτρων της έλλειψης, θα μπορούσαμε να ανακατασκευάσουμε την αρχική εικόνα, αν το επιθυμούσαμε.

Σχεδόν όλες οι διαδικασίες μάθησης χωρίς επίβλεψη μπορούν να θεωρηθούν ως μέθοδοι ελαχιστοποίησης του αθροίσματος δύο όρων, ενός κόστους κώδικα και ενός κόστους ανακατασκευής. Το κόστος κώδικα είναι ο αριθμός των bit που απαιτούνται για την περιγραφή των δραστηριοτήτων των κρυφών μονάδων. Το κόστος ανακατασκευής είναι ο αριθμός των bit που απαιτούνται για την περιγραφή της ασυμφωνίας μεταξύ της ακατέργαστης εισόδου και της καλύτερης προσέγγισης σε αυτήν που θα μπορούσε να ανακατασκευαστεί από τις δραστηριότητες των κρυφών μονάδων. Το κόστος ανακατασκευής είναι ανάλογο με την τετραγωνική διαφορά μεταξύ της ακατέργαστης εισόδου και της ανακατασκευής της.

Δύο απλές μέθοδοι για την ανακάλυψη οικονομικών κωδίκων επιτρέπουν την αρκετά ακριβή ανακατασκευή της μάθησης κύριων στοιχείων εισόδου και της ανταγωνιστικής μάθησης. Και στις δύο προσεγγίσεις, πρώτα αποφασίζετε πόσο οικονομικός πρέπει να είναι ο κώδικας και στη συνέχεια τροποποιήστε τα βάρη στο δίκτυο για να ελαχιστοποιήσετε το σφάλμα ανακατασκευής.

Μια στρατηγική μάθησης κύριων στοιχείων βασίζεται στην ιδέα ότι εάν οι δραστηριότητες ζευγών μονάδων εισόδου συσχετίζονται με κάποιο τρόπο, είναι σπατάλη bit να περιγραφεί κάθε δραστηριότητα εισόδου ξεχωριστά. Μια πιο αποτελεσματική προσέγγιση είναι η εξαγωγή και η περιγραφή των κύριων στοιχείων – δηλαδή, των στοιχείων μεταβολής που μοιράζονται πολλές μονάδες εισόδου. Αν θέλουμε να ανακαλύψουμε, ας πούμε, 10 από τα κύρια στοιχεία, τότε χρειαζόμαστε μόνο ένα επίπεδο 10 κρυφών μονάδων.

Επειδή τέτοια δίκτυα αναπαριστούν την είσοδο χρησιμοποιώντας μόνο έναν μικρό αριθμό στοιχείων, το κόστος κώδικα είναι χαμηλό. Και επειδή η είσοδος μπορεί να ανακατασκευαστεί αρκετά καλά από τα κύρια στοιχεία, το κόστος ανακατασκευής είναι μικρό.

Ένας τρόπος για να εκπαιδεύσετε αυτό το είδος δικτύου είναι να το αναγκάσετε να ανακατασκευάσει μια προσέγγιση στην είσοδο σε ένα σύνολο μονάδων εξόδου.

Στη συνέχεια, η αντίστροφη διάδοση μπορεί να χρησιμοποιηθεί για να ελαχιστοποιηθεί η διαφορά μεταξύ της πραγματικής εξόδου και της επιθυμητής εξόδου. Αυτή η διαδικασία μοιάζει με εποπτευόμενη μάθηση, αλλά επειδή η επιθυμητή έξοδος είναι ακριβώς η ίδια με την είσοδο, δεν απαιτείται δάσκαλος

Πολλοί ερευνητές, συμπεριλαμβανομένων των Ralph Linsker και Erkki Oja, έχουν ανακαλύψει εναλλακτικούς αλγόριθμους για την εκμάθηση κύριων συνιστωσών. Αυτοί οι αλγόριθμοι είναι πιο βιολογικά εύλογοι επειδή δεν απαιτούν μονάδες εξόδου ή αντίστροφη διάδοση. Αντίθετα, χρησιμοποιούν τη συσχέτιση μεταξύ της δραστηριότητας μιας κρυφής μονάδας και της δραστηριότητας μιας μονάδας εισόδου για να προσδιορίσουν την αλλαγή στο βάρος.

Όταν ένα νευρωνικό δίκτυο χρησιμοποιεί εκμάθηση κύριων συνιστωσών, ένας μικρός αριθμός κρυφών μονάδων συνεργάζεται στην αναπαράσταση του μοτίβου εισόδου. Αντίθετα, στην ανταγωνιστική μάθηση, ένας μεγάλος αριθμός κρυφών μονάδων ανταγωνίζεται έτσι ώστε μια μόνο κρυφή μονάδα να χρησιμοποιείται για την αναπαράσταση οποιουδήποτε συγκεκριμένου μοτίβου εισόδου. Η επιλεγμένη κρυφή μονάδα είναι αυτή της οποίας τα εισερχόμενα βάρη είναι πιο παρόμοια με το μοτίβο εισόδου.

Ας υποθέσουμε τώρα ότι έπρεπε να ανακατασκευάσουμε το μοτίβο εισόδου αποκλειστικά από τη γνώση μας για το ποια κρυφή μονάδα επιλέχθηκε. Η καλύτερη επιλογή μας θα ήταν να αντιγράψουμε το μοτίβο των εισερχόμενων βαρών της επιλεγμένης κρυφής μονάδας. Για να ελαχιστοποιήσουμε το σφάλμα ανακατασκευής, θα πρέπει να μετακινήσουμε το μοτίβο βαρών της νικήτριας κρυφής μονάδας ακόμη πιο κοντά στο μοτίβο εισόδου. Αυτό κάνει η ανταγωνιστική μάθηση. Εάν στο δίκτυο παρουσιαστούν δεδομένα εκπαίδευσης που μπορούν να ομαδοποιηθούν σε συστάδες παρόμοιων μοτίβων εισόδου, κάθε κρυφή μονάδα μαθαίνει να αντιπροσωπεύει μια διαφορετική συστάδα και τα εισερχόμενα βάρη της συγκλίνουν στο κέντρο της συστάδας.

Όπως και ο αλγόριθμος κύριων στοιχείων, η ανταγωνιστική μάθηση ελαχιστοποιεί το κόστος ανακατασκευής διατηρώντας παράλληλα το κόστος κώδικα χαμηλό. Μπορούμε να χρησιμοποιήσουμε πολλές κρυφές μονάδες, επειδή ακόμη και με ένα εκατομμύριο μονάδες χρειάζονται μόνο 20 bit για να πούμε ποια κέρδισε

Στις αρχές της δεκαετίας του 1980, ο Teuvo Kohonen εισήγαγε μια σημαντική τροποποίηση του αλγορίθμου ανταγωνιστικής μάθησης. Ο Kohonen έδειξε πώς να κάνουμε τις φυσικά γειτονικές κρυφές μονάδες να μαθαίνουν να αναπαριστούν παρόμοια μοτίβα εισόδου. Ο αλγόριθμος του Kohonen προσαρμόζει όχι μόνο τα βάρη της νικήτριας κρυφής μονάδας, αλλά και τα βάρη των γειτόνων του νικητή. Η ικανότητα του αλγορίθμου να αντιστοιχίζει παρόμοια μοτίβα εισόδου σε κοντινές κρυφές μονάδες υποδηλώνει ότι μια διαδικασία αυτού του τύπου μπορεί να είναι αυτό που χρησιμοποιεί ο εγκέφαλος για να δημιουργήσει τους τοπογραφικούς χάρτες που βρίσκονται στον οπτικό φλοιό

Οι αλγόριθμοι μη επιβλεπόμενης μάθησης μπορούν να ταξινομηθούν ανάλογα με τον τύπο αναπαράστασης που δημιουργούν. Στις μεθόδους κύριων στοιχείων, οι κρυφές μονάδες συνεργάζονται και η αναπαράσταση κάθε μοτίβου εισόδου κατανέμεται σε όλες. Στις ανταγωνιστικές μεθόδους, οι κρυφές μονάδες ανταγωνίζονται και η αναπαράσταση του μοτίβου εισόδου εντοπίζεται στη μία μόνο κρυφή μονάδα που επιλέγεται. Μέχρι πρόσφατα, οι περισσότερες εργασίες για τη μη επιβλεπόμενη μάθηση επικεντρώνονταν σε μία ή την άλλη από αυτές τις δύο τεχνικές, πιθανώς επειδή οδηγούν σε απλούς κανόνες για την αλλαγή των βαρών. Αλλά οι πιο ενδιαφέροντες και ισχυροί αλγόριθμοι πιθανότατα βρίσκονται κάπου ανάμεσα στα άκρα των καθαρά κατανεμημένων και των καθαρά τοπικών αναπαραστάσεων.

Ο Horace B. Barlow πρότεινε ένα μοντέλο στο οποίο κάθε κρυφή μονάδα είναι σπάνια ενεργή και η αναπαράσταση κάθε μοτίβου εισόδου κατανέμεται σε έναν μικρό αριθμό επιλεγμένων κρυφών μονάδων. Αυτός και οι συνεργάτες του έχουν δείξει ότι αυτός ο τύπος κώδικα μπορεί να μαθευτεί αναγκάζοντας τις κρυφές μονάδες να μην συσχετίζονται, διασφαλίζοντας παράλληλα ότι ο κρυφός κώδικας επιτρέπει την καλή ανακατασκευή της εισόδου.

Δυστυχώς, οι περισσότερες σύγχρονες μέθοδοι ελαχιστοποίησης του κόστους κώδικα τείνουν να εξαλείφουν όλο τον πλεονασμό μεταξύ των δραστηριοτήτων των κρυφών μονάδων. Ως αποτέλεσμα, το δίκτυο είναι πολύ ευαίσθητο στη δυσλειτουργία μίας μόνο κρυφής μονάδας. Αυτό το χαρακτηριστικό δεν είναι χαρακτηριστικό του εγκεφάλου, ο οποίος γενικά δεν επηρεάζεται σημαντικά από την απώλεια μερικών νευρώνων

Ο εγκέφαλος φαίνεται να χρησιμοποιεί αυτό που είναι γνωστοί ως κώδικες πληθυσμού, στους οποίους οι πληροφορίες αντιπροσωπεύονται από έναν ολόκληρο πληθυσμό ενεργών νευρώνων. Αυτό το σημείο αποδείχθηκε άψογα στα πειράματα του David L. Sparks και των συναδέλφων του. Ενώ ερευνούσαν πώς ο εγκέφαλος ενός πιθήκου δίνει οδηγίες στα μάτια του πού να κινηθούν, διαπίστωσαν ότι η απαιτούμενη κίνηση κωδικοποιείται από τις δραστηριότητες ενός ολόκληρου πληθυσμού κυττάρων, καθένα από τα οποία αντιπροσωπεύει μια κάπως διαφορετική κίνηση. Η κίνηση των ματιών που πραγματικά γίνεται αντιστοιχεί στον μέσο όρο όλων των κινήσεων που κωδικοποιούνται από τα ενεργά κύτταρα. Εάν ορισμένα εγκεφαλικά κύτταρα αναισθητοποιηθούν, το μάτι μετακινείται στο σημείο που σχετίζεται με τον μέσο όρο των υπόλοιπων ενεργών κυττάρων. Οι κώδικες πληθυσμού μπορούν να χρησιμοποιηθούν για την κωδικοποίηση όχι μόνο των κινήσεων των ματιών αλλά και των προσώπων, όπως έδειξαν οι Malcolm P. Young και Shigeru Yamane στο Ινστιτούτο RIKEN στην Ιαπωνία σε πρόσφατα πειράματα στον κατώτερο κροταφικό φλοιό πιθήκων

Τόσο για τις κινήσεις των ματιών όσο και για τα πρόσωπα, ο εγκέφαλος πρέπει να αντιπροσωπεύει οντότητες που ποικίλλουν σε πολλές διαφορετικές διαστάσεις. Στην περίπτωση μιας κίνησης των ματιών, υπάρχουν μόνο δύο διαστάσεις, αλλά για κάτι σαν το πρόσωπο, υπάρχουν διαστάσεις όπως η ευτυχία, η τριχοφυΐα ή η οικειότητα, καθώς και χωρικές παράμετροι όπως η θέση, το μέγεθος και ο προσανατολισμός. Αν συσχετίσουμε το καθένα με

Ανεξάρτητα από τις παραμέτρους του προσώπου που το καθιστούν πιο ενεργό, μπορούμε να υπολογίσουμε τον μέσο όρο αυτών των παραμέτρων σε έναν πληθυσμό ενεργών κυττάρων για να ανακαλύψουμε τις παραμέτρους του προσώπου που αντιπροσωπεύονται από αυτόν τον κώδικα πληθυσμού. Με αφηρημένους όρους, κάθε κύτταρο προσώπου αντιπροσωπεύει ένα συγκεκριμένο σημείο σε έναν πολυδιάστατο χώρο πιθανών προσώπων και οποιοδήποτε πρόσωπο μπορεί στη συνέχεια να αναπαρασταθεί ενεργοποιώντας όλα τα κύτταρα που κωδικοποιούν πολύ παρόμοιες όψεις, έτσι ώστε να εμφανίζεται μια αύξηση δραστηριότητας στον πολυδιάστατο χώρο πιθανών προσώπων.

Η κωδικοποίηση πληθυσμού είναι ελκυστική επειδή λειτουργεί ακόμα και αν ορισμένοι από τους νευρώνες έχουν υποστεί βλάβη. Μπορεί να το κάνει αυτό επειδή η απώλεια ενός τυχαίου υποσυνόλου νευρώνων έχει μικρή επίδραση στον μέσο όρο πληθυσμού. Η ίδια συλλογιστική ισχύει εάν ορισμένοι νευρώνες παραβλέπονται όταν το σύστημα βιάζεται. Οι νευρώνες επικοινωνούν στέλνοντας διακριτές αιχμές που ονομάζονται δυναμικά δράσης και σε πολύ σύντομο χρονικό διάστημα πολλοί από τους «ενεργούς» νευρώνες μπορεί να μην έχουν χρόνο να στείλουν μια αιχμή. Παρ’ όλα αυτά, ακόμη και σε τόσο σύντομο χρονικό διάστημα, ένας κώδικας πληθυσμού σε ένα μέρος του εγκεφάλου μπορεί να δημιουργήσει έναν κατά προσέγγιση σωστό κώδικα πληθυσμού σε ένα άλλο μέρος του εγκεφάλου

Με την πρώτη ματιά, ο πλεονασμός στους κώδικες πληθυσμού φαίνεται ασύμβατος με την ιδέα της κατασκευής εσωτερικών αναπαραστάσεων που ελαχιστοποιούν το κόστος κώδικα. Ευτυχώς, μπορούμε να ξεπεράσουμε αυτή τη δυσκολία χρησιμοποιώντας ένα λιγότερο άμεσο μέτρο κόστους κώδικα. Εάν η δραστηριότητα που κωδικοποιεί μια συγκεκριμένη οντότητα είναι ένα ομαλό εξόγκωμα στο οποίο η δραστηριότητα αποκλίνει με έναν τυπικό τρόπο καθώς απομακρυνόμαστε από το κέντρο, μπορούμε να περιγράψουμε πλήρως το εξόγκωμα δραστηριότητας απλώς καθορίζοντας το κέντρο του. Έτσι, ένα πιο δίκαιο μέτρο του κόστους κώδικα είναι το κόστος περιγραφής του κέντρου του εξογκώματος δραστηριότητας συν το κόστος περιγραφής του πώς οι πραγματικές δραστηριότητες των μονάδων αποκλίνουν από το επιθυμητό ομαλό εξόγκωμα δραστηριότητας.

Χρησιμοποιώντας αυτό το μέτρο του κόστους κώδικα, διαπιστώνουμε ότι οι κώδικες πληθυσμού είναι ένας βολικός τρόπος εξαγωγής μιας ιεραρχίας προοδευτικά πιο αποτελεσματικών κωδικοποιήσεων της αισθητηριακής εισόδου. Αυτό το σημείο παρουσιάζεται καλύτερα με ένα απλό παράδειγμα. Σκεφτείτε ένα νευρωνικό δίκτυο που παρουσιάζεται με μια εικόνα ενός προσώπου. Ας υποθέσουμε ότι το δίκτυο περιέχει ήδη ένα σύνολο μονάδων αφιερωμένων στην αναπαράσταση των μύτων, ένα άλλο σύνολο για τα στόματα και ένα άλλο σύνολο για τα μάτια. Όταν εμφανίζεται ένα συγκεκριμένο πρόσωπο, θα υπάρχει ένα εξόγκωμα δραστηριότητας στις μονάδες μύτης, ένα στις μονάδες στόματος και δύο στις μονάδες ματιών. Η θέση καθενός από αυτά τα εξογκώματα δραστηριότητας αντιπροσωπεύει τις χωρικές παραμέτρους του χαρακτηριστικού που κωδικοποιείται από το εξόγκωμα. Η περιγραφή των τεσσάρων εξογκωμάτων δραστηριότητας είναι φθηνότερη από την περιγραφή της ακατέργαστης εικόνας, αλλά προφανώς θα ήταν ακόμα φθηνότερο να περιγραφεί ένα μόνο εξόγκωμα δραστηριότητας σε ένα σύνολο μονάδων προσώπου, υποθέτοντας φυσικά ότι η μύτη, το στόμα και τα μάτια βρίσκονται στις σωστές χωρικές σχέσεις για να σχηματίσουν ένα πρόσωπο.

Αυτό εγείρει ένα ενδιαφέρον ζήτημα: Πώς μπορεί το δίκτυο να ελέγξει ότι τα μέρη σχετίζονται σωστά μεταξύ τους για να δημιουργήσουν ένα πρόσωπο; Πριν από λίγο καιρό, η Dana H. Ballard εισήγαγε μια έξυπνη τεχνική για την επίλυση αυτού του είδους προβλήματος που λειτουργεί καλά με κώδικες πληθυσμού

Αν γνωρίζουμε τη θέση, το μέγεθος και τον προσανατολισμό μιας μύτης, μπορούμε να προβλέψουμε τη θέση, το μέγεθος και τον προσανατολισμό του προσώπου στο οποίο ανήκει, επειδή η χωρική σχέση μεταξύ μύτης και προσώπου είναι περίπου σταθερή. Επομένως, ορίζουμε τα βάρη στο νευρωνικό δίκτυο έτσι ώστε μια αύξηση δραστηριότητας στις μονάδες της μύτης να προσπαθεί να προκαλέσει μια κατάλληλα συσχετισμένη αύξηση δραστηριότητας στις μονάδες του προσώπου. Αλλά ορίζουμε επίσης τα κατώφλια των μονάδων του προσώπου έτσι ώστε οι μονάδες της μύτης από μόνες τους να μην επαρκούν για να ενεργοποιήσουν τις μονάδες του προσώπου. Αν, ωστόσο, η αύξηση δραστηριότητας στις μονάδες του στόματος προσπαθήσει επίσης να προκαλέσει μια αύξηση στο ίδιο σημείο στις μονάδες του προσώπου, τότε τα κατώφλια μπορούν να ξεπεραστούν. Στην πραγματικότητα, έχουμε ελέγξει ότι η μύτη και το στόμα σχετίζονται σωστά μεταξύ τους, ελέγχοντας ότι και τα δύο προβλέπουν τις ίδιες χωρικές παραμέτρους για ολόκληρο το πρόσωπο.

Σχήμα:Πώς μπορεί ένα νευρωνικό δίκτυο να αναγνωρίσει ένα πρόσωπο; Εάν το δίκτυο γνωρίζει τη γενική χωρική σχέση μεταξύ των ματιών, της μύτης και του στόματος σε σχέση με το πρόσωπο, οι μονάδες αθροίζονται για να δημιουργήσουν μια αναγνώριση. Στην περίπτωση που το στόμα και η μύτη είναι εκτός φάσης με τις προγραμματισμένες παραμέτρους του προσώπου (στήλη στα δεξιά), η μηχανή δεν θα αναγνωρίσει το μοτίβο ως πρόσωπο.

Αυτή η μέθοδος ελέγχου χωρικών σχέσεων είναι ενδιαφέρουσα επειδή χρησιμοποιεί το είδος της πλεονασματικότητας μεταξύ των διαφορετικων μερών μιας εικόνας που η μη επιβλεπόμενη μάθηση θα πρέπει να είναι καλή στο να τα βρει. Επομένως, φαίνεται φυσικό να προσπαθήσουμε να χρησιμοποιήσουμε μη επιβλεπόμενη μάθηση για να ανακαλύψουμε ιεραρχικούς κώδικες πληθυσμού για την εξαγωγή σύνθετων σχημάτων. Το 1986, ο Eric Saund του M.I.T. επέδειξε μια μέθοδο εκμάθησης απλών κωδίκων πληθυσμού για σχήματα. Φαίνεται πιθανό ότι με έναν σαφή ορισμό του κόστους κώδικα, ένα μη επιβλεπόμενο δίκτυο θα είναι σε θέση να ανακαλύψει πιο σύνθετες ιεραρχίες προσπαθώντας να ελαχιστοποιήσει το κόστος κωδικοποίησης της εικόνας. Ο Richard Zemel και εγώ διερευνούμε τώρα αυτή τη δυνατότητα.

Χρησιμοποιώντας μη επιβλεπόμενη μάθηση για την εξαγωγή μιας ιεραρχίας διαδοχικά πιο οικονομικών αναπαραστάσεων, θα πρέπει να είναι δυνατό να βελτιωθεί σημαντικά η ταχύτητα εκμάθησης σε μεγάλα πολυεπίπεδα δίκτυα. Κάθε επίπεδο του δικτύου προσαρμόζει τα εισερχόμενα βάρη του για να κάνει την αναπαράστασή του καλύτερη από την αναπαράσταση στο προηγούμενο επίπεδο, έτσι ώστε τα βάρη σε ένα επίπεδο να μπορούν να μαθευτούν χωρίς αναφορά στα βάρη στα επόμενα επίπεδα. Αυτή η στρατηγική εξαλείφει πολλές από τις αλληλεπιδράσεις μεταξύ βαρών που καθιστούν τη μάθηση με οπισθοδιάδοση πολύ αργή σε βαθιά πολυεπίπεδα δίκτυα

Όλες οι διαδικασίες μάθησης που συζητήθηκαν μέχρι στιγμής εφαρμόζονται σε νευρωνικά δίκτυα στα οποία η δραστηριότητα ρέει μόνο προς τα εμπρός από την είσοδο στην έξοδο, παρόλο που οι παράγωγοι σφάλματος μπορεί να ρέουν προς τα πίσω. Μια άλλη σημαντική πιθανότητα που πρέπει να ληφθεί υπόψη είναι τα δίκτυα στα οποία η δραστηριότητα ρέει γύρω από κλειστούς βρόχους. Τέτοια επαναλαμβανόμενα δίκτυα μπορεί να σταθεροποιηθούν σε σταθερές καταστάσεις ή μπορεί να εμφανίσουν σύνθετη χρονική δυναμική που μπορεί να χρησιμοποιηθεί για την παραγωγή διαδοχικής συμπεριφοράς. Εάν σταθεροποιηθούν σε σταθερές καταστάσεις, οι παράγωγοι σφάλματος μπορούν να υπολογιστούν χρησιμοποιώντας μεθόδους πολύ απλούστερες από την αντίστροφη διάδοση.

Παρόλο που οι ερευνητές έχουν επινοήσει μερικούς ισχυρούς αλγόριθμους μάθησης που έχουν μεγάλη πρακτική αξία, ακόμα δεν γνωρίζουμε ποιες αναπαραστάσεις και διαδικασίες μάθησης χρησιμοποιούνται στην πραγματικότητα από τον εγκέφαλο. Αλλά αργά ή γρήγορα, οι υπολογιστικές μελέτες μάθησης σε τεχνητά νευρωνικά δίκτυα θα συγκλίνει με τις μεθόδους που ανακαλύφθηκαν από την εξέλιξη. Όταν συμβεί αυτό, πολλά ποικίλα εμπειρικά δεδομένα σχετικά με τον εγκέφαλο θα αποκτήσουν ξαφνικά νόημα και πολλές νέες εφαρμογές τεχνητών νευρωνικών δικτύων θα καταστούν εφικτές.

Κατηγορία ARTIFICIAL INTELIGENCE | Δεν υπάρχουν σχόλια »

ΕΠΙΛΥΣΗ ΠΡΟΒΛΗΜΑΤΩΝ ΜΕΣΩ ΑΝΑΖΗΤΗΣΗΣ

Συγγραφέας: ΗΛΙΑΣ ΓΑΒΡΙΛΗΣ στις 2 Νοεμβρίου 2025

4-Επίλυση Προβλημάτων μέσω Αναζήτησης

Η αναζήτηση αποτελεί τον πιο καθολικό τρόπο επίλυσης προβλημάτων στην Τεχνητή Νοημοσύνη. Τόσο οι μεσολαβητές (agents) επίλυσης προβλημάτων όσο και οι λογικοί agents χρησιμοποιούν αλγόριθμους και στρατηγικές αναζήτησης για να λύσουν ένα συγκεκριμένο πρόβλημα και να δώσουν το καλύτερο αποτέλεσμα. Οι πράκτορες επίλυσης προβλημάτων είναι πράκτορες που βασίζονται σε στόχους και βασίζονται στην ατομική αναπαράσταση. Αυτό το κεφάλαιο είναι μια συζήτηση για τους διάφορους αλγόριθμους αναζήτησης.

Ιδιότητες Αλγορίθμων Αναζήτησης

Οι ιδιότητες μας βοηθούν να συγκρίνουμε την αποτελεσματικότητα των αλγορίθμων αναζήτησης. Περιλαμβάνουν τα ακόλουθα:

1. Πληρότητα – λέμε ότι ένας αλγόριθμος αναζήτησης είναι πλήρης εάν μπορεί να επιστρέψει μια λύση εάν υπάρχει τουλάχιστον μία λύση για οποιαδήποτε μεμονωμένη είσοδο στον χώρο αναζήτησης.

2. Βέλτιστη – μια λύση λέγεται βέλτιστη εάν της εγγυάται η καλύτερη λύση (το χαμηλότερο κόστος διαδρομής) που βρίσκεται μεταξύ όλων των άλλων λύσεων.

3. Χρονική Πολυπλοκότητα – αυτό είναι ένα μέτρο του χρόνου που απαιτείται για την ολοκλήρωση μιας εργασίας.

4. Χωρική Πολυπλοκότητα – αυτό υποδηλώνει τη μέγιστη ποσότητα χώρου που απαιτείται σε οποιοδήποτε συγκεκριμένο σημείο κατά τη διάρκεια της αναζήτησης.

Τύποι Αλγορίθμων Αναζήτησης

Οι αλγόριθμοι αναζήτησης μπορούν να χωριστούν σε δύο κατηγορίες:

Αλγόριθμοι αναζήτησης με ενημέρωση.
Αλγόριθμοι αναζήτησης χωρίς ενημέρωση

Άτυπη/Τυφλή Αναζήτηση

Μια άτυπη αναζήτηση είναι ένας τύπος αναζήτησης που δεν έχει γνώση πεδίου, όπως η τοποθεσία και η εγγύτητα του στόχου. Η λειτουργία της βασίζεται σε μια μέθοδο ωμής βίας, καθώς έχει μόνο πληροφορίες για το πώς να διασχίσει το δέντρο και πώς να αναγνωρίσει το φύλλο και τους κόμβους στόχου.

Στην άτυπη αναζήτηση, το δέντρο αναζήτησης αναζητείται χωρίς πληροφορίες σχετικά με τον χώρο αναζήτησης, όπως οι αρχικοί τελεστές κατάστασης και ο έλεγχος για τον στόχο, επομένως αναφέρεται ως τυφλή αναζήτηση. Κάθε κόμβος του δέντρου εξετάζεται μέχρι να βρεθεί ο κόμβος στόχου.

Υπάρχουν 5 τύποι άτυπων στρατηγικών αναζήτησης:

Αναζήτηση κατά πλάτος
Ομοιόμορφη αναζήτηση κόστους
Αναζήτηση κατά βάθος
Επαναληπτική αναζήτηση κατά βάθος
Αμφίδρομη αναζήτηση

Ας συζητήσουμε μερικούς από αυτούς τους αλγόριθμους:

Αναζήτηση κατά πλάτος

Αυτή είναι μια κοινή στρατηγική που χρησιμοποιείται για τη διασχιση δέντρων και γραφημάτων. Η αναζήτηση σε αυτόν τον αλγόριθμο ακολουθεί μια προσέγγιση κατά πλάτος, επομένως είναι γνωστή ως αναζήτηση κατά πλάτος

Ο αλγόριθμος ξεκινά τη διαδικασία αναζήτησης από τον κόμβο ρίζας του δέντρου και στη συνέχεια επεκτείνει τον διάδοχο κόμβο στο τρέχον επίπεδο πριν μπορέσει να μετακινηθεί στους κόμβους στο επόμενο επίπεδο. Ο αλγόριθμος κατά πλάτος είναι ένα καλό παράδειγμα αλγορίθμου αναζήτησης γενικού γραφήματος.

Για την υλοποίηση αυτού του αλγορίθμου, χρησιμοποιούμε τη δομή δεδομένων ουράς FIFO (First In First Out).

Ακολουθούν ορισμένα από τα πλεονεκτήματα που σχετίζονται με αυτόν τον αλγόριθμο:

1. Εγγυάται την εύρεση μιας λύσης, εάν υπάρχει.

2. Εάν το πρόβλημα έχει πολλές λύσεις, ο αλγόριθμος θα επιστρέψει τη λύση που μπορεί να επιτευχθεί μέσω ενός ελάχιστου αριθμού βημάτων

Αναζήτηση κατά πλάτος

Ακολουθούν τα μειονεκτήματα που σχετίζονται με τον αλγόριθμο:

1. Απαιτείται τεράστια ποσότητα μνήμης για την εκτέλεση του αλγορίθμου. Αυτό συμβαίνει επειδή κάθε επίπεδο δέντρου πρέπει να αποθηκευτεί στη μνήμη πριν από την επέκταση στο επόμενο επίπεδο.

2. Ο αλγόριθμος χρειάζεται πολύ χρόνο εάν η λύση βρίσκεται μακριά από τον κόμβο ρίζας του δέντρου

Αναζήτηση κατά βάθος

Αυτός είναι ένας τύπος αναδρομικού αλγορίθμου που μας βοηθά να διασχίσουμε ένα δέντρο ή ένα γράφημα. Ο αλγόριθμος ξεκινά την αναζήτηση από τον κόμβο ρίζας του δέντρου και ακολουθεί κάθε διαδρομή προς τον κόμβο μέγιστου βάθους πριν μπορέσει να μετακινηθεί στην επόμενη διαδρομή. Γι’ αυτό αναφέρεται ως αναζήτηση κατά βάθος.

Η υλοποίηση του αλγορίθμου χρησιμοποιεί τη δομή δεδομένων στοίβας.

Ακολουθούν τα πλεονεκτήματα που σχετίζονται με τον αλγόριθμο DFS:

1. Ο αλγόριθμος απαιτεί μόνο μια μικρή ποσότητα μνήμης, καθώς αποθηκεύει μόνο τη στοίβα των κόμβων στη διαδρομή από τον κόμβο ρίζας στο τρέχον επίπεδο.

2. Ο αλγόριθμος χρειάζεται πολύ λίγο χρόνο για να βρει τη λύση ή να φτάσει στον κόμβο στόχο σε σύγκριση με τον αλγόριθμο BFS. Αυτό συμβαίνει επειδή κάνει τη διέλευση στη σωστή διαδρομή.

Ακολουθούν τα μειονεκτήματα που σχετίζονται με τον αλγόριθμο DFS:

1. Οι καταστάσεις μπορεί να επανεμφανιστούν και δεν υπάρχει εγγύηση ότι θα βρεθεί η λύση.

2. Ο αλγόριθμος πηγαίνει πρώτα σε βάθος και αυτό μπορεί να οδηγήσει σε έναν άπειρο βρόχο.

Αλγόριθμος Αναζήτησης Περιορισμένου Βάθους

Αυτός ο τύπος αλγορίθμου είναι παρόμοιος με τον αλγόριθμο DFS, αλλά λειτουργεί με ένα προκαθορισμένο βάθος. Δηλώσαμε ότι ο αλγόριθμος DFS μπορεί να δημιουργήσει μια άπειρη διαδρομή. Αυτό το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας την αναζήτηση περιορισμένου βάθους. Όταν χρησιμοποιείται η αναζήτηση περιορισμένου βάθους, ο κόμβος στο όριο βάθους θα αντιμετωπίζεται σαν να μην έχει άλλους διαδοχικούς κόμβους.

Υπάρχουν δύο συνθήκες αποτυχίας που μπορούν να τερματίσουν την αναζήτηση περιορισμένου βάθους:

Τυπική τιμή αποτυχίας – αυτή δηλώνει ότι δεν υπάρχει λύση στο πρόβλημα.
Τιμή αποκοπής αποτυχίας – αυτή υποδεικνύει ότι δεν υπάρχει λύση στο πρόβλημα εντός ενός δεδομένου ορίου βάθους.

Το κύριο πλεονέκτημα που σχετίζεται με την αναζήτηση περιορισμένου βάθους είναι ότι η αναζήτηση είναι αποτελεσματική στη μνήμη.

Η αναζήτηση περιορισμένου βάθους σχετίζεται με τα ακόλουθα μειονεκτήματα:

Η αναζήτηση περιορισμένου βάθους έχει το πρόβλημα της πληρότητας.
Εάν υπάρχουν περισσότερες από μία λύσεις, μπορεί να μην είναι βέλτιστες.

Αλγόριθμος Αναζήτησης Ομοιόμορφου Κόστους

Αυτός είναι ένας αλγόριθμος αναζήτησης που χρησιμοποιείται για την διέλευση ενός σταθμισμένου δέντρου ή ενός γραφήματος. Ο αλγόριθμος είναι κατάλληλος όταν υπάρχει διαφορετικό κόστος για κάθε ακμή. Ο κύριος στόχος αυτού του τύπου αναζήτησης είναι να βρει ποιοι οδηγοί από τον κόμβο ρίζας στον κόμβο-στόχο με το χαμηλότερο αθροιστικό κόστος. Η αναζήτηση ομοιόμορφου κόστους επεκτείνει τους κόμβους με βάση το κόστος διαδρομής από τον κόμβο ρίζας. Αυτός ο τύπος αναζήτησης μπορεί να χρησιμοποιηθεί για την επίλυση οποιουδήποτε δέντρου/γραφήματος όπου υπάρχει ζήτηση για βέλτιστο κόστος.

Ο αλγόριθμος αναζήτησης ομοιόμορφου κόστους υλοποιείται χρησιμοποιώντας τη δομή δεδομένων ουράς προτεραιότητας. Στο χαμηλότερο αθροιστικό κόστος δίνεται προτεραιότητα. Εάν όλες οι ακμές έχουν παρόμοιο κόστος διαδρομής, η αναζήτηση ομοιόμορφου κόστους γίνεται η ίδια με την αναζήτηση ομοιόμορφου κόστους (BFS).

Το κύριο πλεονέκτημα που σχετίζεται με την αναζήτηση ομοιόμορφου κόστους

Ο αλγόριθμος είναι βέλτιστος, καθώς επιλέγεται η διαδρομή με το μικρότερο κόστος σε κάθε κατάσταση.

Το κύριο μειονέκτημα που σχετίζεται με αυτόν τον τύπο αναζήτησης είναι ότι δεν ενδιαφέρεται για τον αριθμό των βημάτων που εμπλέκονται στην αναζήτηση, αλλά μόνο για το κόστος της διαδρομής. Αυτό μπορεί να οδηγήσει τον αλγόριθμο σε μια άπειρη διαδρομή.

Επαναληπτική Αναζήτηση Εμβάθυνσης με Πρώτο το Βάθος

Αυτός ο τύπος αλγορίθμου συνδυάζει τους αλγόριθμους BFS και DFS. Στόχος του αλγορίθμου είναι να βρει το καλύτερο όριο βάθους, το οποίο γίνεται αυξάνοντας σταδιακά το όριο μέχρι να βρεθεί ο στόχος.

Η επαναληπτική αναζήτηση εμβάθυνσης με Πρώτα το Βάθος επωφελείται από την γρήγορη αναζήτηση του BFS και την αποδοτικότητα μνήμης του DFS. Αυτός ο τύπος αναζήτησης είναι ένας πολύ χρήσιμος αλγόριθμος αναζήτησης χωρίς πληροφορίες, πολύ κατάλληλος όταν ο χώρος αναζήτησης είναι μεγάλος και το βάθος του κόμβου στόχου δεν είναι γνωστό.

Το κύριο πλεονέκτημα αυτού του αλγορίθμου είναι ότι συνδυάζει τους αλγόριθμους BFS και DFS, επωφελούμενος τόσο από την γρήγορη αναζήτηση όσο και από την αποδοτικότητα μνήμης.

Το κύριο μειονέκτημα του αλγορίθμου είναι ότι επαναλαμβάνει όλη την εργασία που έγινε στην προηγούμενη φάση.

Ενημερωμένη Αναζήτηση

Οι ενημερωμένοι αλγόριθμοι αναζήτησης βασίζονται στη γνώση του πεδίου κατά την αναζήτηση. Οι αλγόριθμοι έχουν πληροφορίες σχετικά με το πρόβλημα, επομένως τις χρησιμοποιούν κατά την αναζήτηση. Αυτό σημαίνει ότι οι ενημερωμένες στρατηγικές αναζήτησης είναι σε θέση να βρουν τη λύση πιο αποτελεσματικά σε σύγκριση με τις μη ενημερωμένες στρατηγικές αναζήτησης. Η ενημερωμένη αναζήτηση είναι επίσης γνωστή ως ευρετική αναζήτηση.

Μια ευρετική αναφέρεται σε έναν τρόπο που μπορεί να μην εγγυάται πάντα την εύρεση των καλύτερων λύσεων, αλλά εγγυάται την εύρεση μιας καλής λύσης σε εύλογο χρονικό διάστημα. Με μια ενημερωμένη αναζήτηση, μπορεί κανείς να λύσει ένα σύνθετο πρόβλημα που δεν μπορεί να λυθεί με κανέναν άλλο τρόπο. Το πρόβλημα του περιοδεύοντος πωλητή είναι ένα παράδειγμα μιας ενημερωμένης στρατηγικής αναζήτησης. Η άπληστη αναζήτηση και η αναζήτηση A* ανήκουν επίσης σε αυτήν την κατηγορία.

Ας συζητήσουμε τώρα τους διάφορους ενημερωμένους αλγόριθμους αναζήτησης:

Ο βέλτιστος πρώτος Αλγόριθμος Αναζήτησης (Άπληστη Αναζήτηση).

Ο άπληστος αλγόριθμος αναζήτησης με το Καλύτερο Πρώτα λειτουργεί επιλέγοντας τη διαδρομή που φαίνεται να είναι η καλύτερη τη δεδομένη στιγμή. Συνδυάζει τους αλγόριθμους BFS και DFS. Βασίζεται στην αναζήτηση και σε μια ευρετική συνάρτηση. Η αναζήτηση με το Καλύτερο Πρώτα μας βοηθά να συνδυάσουμε τα οφέλη των αλγορίθμων BFS και DFS. Το BFS μας βοηθά να επιλέξουμε τον πιο υποσχόμενο κόμβο σε κάθε βήμα. Επεκτείνουμε τον κόμβο που είναι πολύ κοντά στον κόμβο-στόχο και η ευρετική συνάρτηση χρησιμοποιείται για την εκτίμηση του πλησιέστερου κόστους.

Για να εφαρμόσουμε την άπληστη αναζήτηση με το Καλύτερο Πρώτα, χρησιμοποιούμε την ουρά προτεραιότητας.

Ακολουθούν τα πλεονεκτήματα που σχετίζονται με τον αλγόριθμο:

Ο αλγόριθμος μπορεί να απολαύσει τα οφέλη και των αλγορίθμων BFS και DFS.
Είναι ένας πιο αποτελεσματικός αλγόριθμος σε σύγκριση με τους αλγόριθμους DFS και BFS.

Τα ακόλουθα είναι τα μειονεκτήματα που σχετίζονται με τον αλγόριθμο:

Στη χειρότερη περίπτωση, αυτός ο αλγόριθμος μπορεί να λειτουργήσει ως μη καθοδηγούμενη αναζήτηση με βάση το βάθος.
Δεν είναι ένας βέλτιστος αλγόριθμος.
Μπορεί να δημιουργήσει έναν άπειρο βρόχο όπως ο αλγόριθμος DFS.

Αναζήτηση A*

Η αναζήτηση A* είναι η πιο δημοφιλής μορφή αναζήτησης με βάση το καλύτερο. Βασίζεται στο κόστος και σε μια ευρετική συνάρτηση h(n) για να φτάσει στον κόμβο-στόχο n από την αρχική κατάσταση g(n). Συνδυάζει τα χαρακτηριστικά μιας άπληστης αναζήτησης με βάση το καλύτερο πρώτα και του UCS, καθιστώντας δυνατή την πιο αποτελεσματική επίλυση προβλημάτων. Η αναζήτηση A* χρησιμοποιεί μια ευρετική συνάρτηση για να βρει τη συντομότερη διαδρομή μέσα στον χώρο αναζήτησης. Ο αλγόριθμος είναι γνωστό ότι επεκτείνει ένα μικρότερο δέντρο αναζήτησης και παρέχει μια βέλτιστη λύση πιο γρήγορα.

Στον A*, χρησιμοποιούμε τόσο την ευρετική αναζήτησης όσο και το κόστος για να φτάσουμε στον κόμβο-στόχο. Τα ακόλουθα είναι τα πλεονεκτήματα που σχετίζονται με αυτόν τον αλγόριθμο:

Είναι ένας βέλτιστος και πλήρης αλγόριθμος.
Είναι ο καλύτερος αλγόριθμος αναζήτησης από όλους τους αλγόριθμους αναζήτησης.
Ο αλγόριθμος είναι εφαρμόσιμος σε σύνθετα προβλήματα.

Τα ακόλουθα είναι τα μειονεκτήματα του αλγορίθμου A*:

Ο αλγόριθμος έχει ορισμένα προβλήματα που σχετίζονται με την πολυπλοκότητα.
Λειτουργεί με βάση ευρετικές και προσεγγίσεις και δεν παράγει πάντα τη συντομότερη διαδρομή.
Απαιτεί τεράστια ποσότητα μνήμης και διατηρεί όλους τους κόμβους στη μνήμη. Αυτό το καθιστά μη πρακτικό για μια σειρά από προβλήματα μεγάλης κλίμακας.

Συμπέρασμα

Η αναζήτηση είναι ο καθολικός τρόπος επίλυσης προβλημάτων στην Τεχνητή Νοημοσύνη
Οι πράκτορες επίλυσης προβλημάτων και οι ορθολογικοί πράκτορες χρησιμοποιούν αλγόριθμους αναζήτησης για να λύσουν προβλήματα και να επιστρέψουν το καλύτερο αποτέλεσμα.
Οι πράκτορες επίλυσης προβλημάτων είναι πράκτορες που βασίζονται σε στόχους και βασίζονται στην ατομική αναπαράσταση.
Οι ιδιότητες των αλγορίθμων αναζήτησης μας βοηθούν να συγκρίνουμε την αποτελεσματικότητα των αλγορίθμων αναζήτησης
Περιλαμβάνουν την πληρότητα, τη βελτιστοποίηση, τη χρονική πολυπλοκότητα και τη χωρική πολυπλοκότητα
Οι μη ενημερωμένες στρατηγικές αναζήτησης δεν έχουν γνώση του τομέα, όπως η τοποθεσία και η εγγύτητα του στόχου που αναζητούν.
Οι ενημερωμένοι αλγόριθμοι αναζήτησης χρησιμοποιούν τη γνώση του τομέα κατά την αναζήτηση. Οι αλγόριθμοι έχουν πληροφορίες σχετικά με το πρόβλημα, επομένως, τις χρησιμοποιούν κατά την αναζήτηση.

Κατηγορία ARTIFICIAL INTELIGENCE | Δεν υπάρχουν σχόλια »

ΑΣΑΦΗΣ ΛΟΓΙΚΗ – FUZZY LOGIC

Συγγραφέας: ΗΛΙΑΣ ΓΑΒΡΙΛΗΣ στις 29 Οκτωβρίου 2025

Η κλασική τεχνητή νοημοσύνη απαιτεί τεράστια υπολογιστική ισχύ. Ένας τρόπος για να μειωθούν οι υπολογιστικοί κύκλοι και, ως εκ τούτου, να επιταχυνθεί η καμπύλη μάθησης είναι να χρησιμοποιηθεί μια μεθοδολογία που ονομάζεται ασαφής λογική. Βρίσκοντας κοινά σημεία μέσα σε δηλώσεις και χρησιμοποιώντας μια ακολουθία “τότε/αν”, οι μηχανές μπορούν, κατά κάποιο τρόπο, να προγραμματιστούν ώστε να σκέφτονται μόνες τους.

Οι υπολογιστές δεν συλλογίζονται όπως οι εγκέφαλοι. Οι υπολογιστές «συλλογίζονται» όταν χειρίζονται ακριβή γεγονότα που έχουν αναχθεί σε σειρές από μηδέν και ένα και προτασιακές δηλώσεις που είναι είτε αληθείς (Α) είτε ψευδείς (Ψ). Ο ανθρώπινος εγκέφαλος μπορεί να συλλογιστεί με αόριστους ισχυρισμούς ή ισχυρισμούς που περιλαμβάνουν αβεβαιότητες ή αξιολογικές κρίσεις: «Ο αέρας είναι δροσερός» ή «Αυτή η ταχύτητα είναι γρήγορη» ή «Είναι νέα». Σε αντίθεση με τους υπολογιστές, οι άνθρωποι έχουν κοινή λογική που τους επιτρέπει να συλλογίζονται σε έναν κόσμο όπου τα πράγματα είναι μόνο εν μέρει αληθινά.

Η ασαφής λογική είναι ένας κλάδος της μηχανικής νοημοσύνης που βοηθά τους υπολογιστές να ζωγραφίζουν γκρίζες, λογικές εικόνες ενός αβέβαιου κόσμου. Οι λογικοί τη δεκαετία του 1920 έθιξαν για πρώτη φορά τη βασική της έννοια: όλα είναι θέμα βαθμού.

Η ασαφής λογική χειρίζεται αόριστες έννοιες όπως «ζεστό» ή «ακόμα βρώμικο» και έτσι βοηθά τους μηχανικούς να κατασκευάσουν κλιματιστικά, πλυντήρια ρούχων και άλλες συσκευές που κρίνουν πόσο γρήγορα πρέπει να λειτουργούν ή να μεταβαίνουν από τη μία ρύθμιση στην άλλη, ακόμη και όταν τα κριτήρια για την πραγματοποίηση αυτών των αλλαγών είναι δύσκολο να καθοριστούν. Όταν οι μαθηματικοί δεν διαθέτουν συγκεκριμένους αλγόριθμους που να υπαγορεύουν πώς ένα σύστημα θα ανταποκρίνεται σε δεδομένα εισόδου, η ασαφής λογική μπορεί να ελέγξει ή να περιγράψει το σύστημα χρησιμοποιώντας κανόνες «κοινής λογικής» που αναφέρονται σε αόριστες ποσότητες. Κανένα γνωστό μαθηματικό μοντέλο δεν μπορεί να οδηγήσει ένα φορτηγό με ρυμουλκούμενο από ένα πάρκινγκ σε μια αποβάθρα φόρτωσης όταν το όχημα ξεκινά από ένα τυχαίο σημείο. Τόσο οι άνθρωποι όσο και τα ασαφή συστήματα μπορούν να εκτελέσουν αυτήν τη μη γραμμική εργασία καθοδήγησης χρησιμοποιώντας πρακτικούς αλλά ανακριβείς κανόνες όπως «Εάν το ρυμουλκούμενο στρίψει λίγο αριστερά, τότε στρίψτε το λίγο δεξιά». Τα ασαφή συστήματα συχνά συλλέγουν τους κανόνες τους από ειδικούς. Όταν κανένας ειδικός δεν δίνει τους κανόνες, τα προσαρμοστικά ασαφή συστήματα μαθαίνουν τους κανόνες παρατηρώντας πώς οι άνθρωποι ρυθμίζουν τα πραγματικά συστήματα.

Ένα πρόσφατο κύμα εμπορικών ασαφών προϊόντων, τα περισσότερα από τα οποία προέρχονται από την Ιαπωνία, έχει διαδώσει την ασαφή λογική. Το 1980, η εργολαβική εταιρεία F.L. Smidth & Company στην Κοπεγχάγη χρησιμοποίησε για πρώτη φορά ένα ασαφές σύστημα για να επιβλέψει τη λειτουργία ενός κλιβάνου τσιμέντου. Το 1988, η Hitachi παρέδωσε τον έλεγχο ενός μετρό στο Σεντάι της Ιαπωνίας σε ένα ασαφές σύστημα. Έκτοτε, οι ιαπωνικές εταιρείες έχουν χρησιμοποιήσει την ασαφή λογική για να κατευθύνουν εκατοντάδες οικιακές συσκευές και ηλεκτρονικά προϊόντα. Το Υπουργείο Διεθνούς Εμπορίου και Βιομηχανίας εκτιμά ότι το 1992 η Ιαπωνία παρήγαγε ασαφή προϊόντα αξίας περίπου 2 δισεκατομμυρίων δολαρίων. Οι αμερικανικές και ευρωπαϊκές εταιρείες εξακολουθούν να υστερούν πολύ.

Οι εφαρμογές της ασαφούς λογικής εκτείνονται πέρα από τα συστήματα ελέγχου. Πρόσφατα θεωρήματα δείχνουν ότι κατ’ αρχήν η ασαφής λογική μπορεί να χρησιμοποιηθεί για τη μοντελοποίηση οποιουδήποτε συνεχούς συστήματος, είτε βασίζεται στη μηχανική είτε στη φυσική είτε στη βιολογία είτε στα οικονομικά. Ερευνητές σε πολλούς τομείς μπορεί να διαπιστώσουν ότι τα ασαφή, βασισμένα στην κοινή λογική μοντέλα είναι πιο χρήσιμα ή ακριβή από τα τυπικά μαθηματικά

Στην καρδιά της διαφοράς μεταξύ κλασικής και ασαφούς λογικής βρίσκεται κάτι που ο Αριστοτέλης ονόμασε νόμο του αποκλεισμένου μέσου. Στη θεωρία τυπικών συνόλων, ένα αντικείμενο είτε ανήκει είτε όχι σε ένα σύνολο. Δεν υπάρχει μέση οδός: ο αριθμός πέντε ανήκει πλήρως στο σύνολο των περιττών αριθμών και καθόλου στο σύνολο των άρτιων αριθμών. Σε τέτοια δισθενή σύνολα, ένα αντικείμενο δεν μπορεί να ανήκει και στα δύο: δηλ και σ’ ένα σύνολο και στο συμπληρωματικό του σύνολο ή σε κανένα από τα σύνολα. Αυτή η αρχή διατηρεί τη δομή της λογικής και αποφεύγει την αντίφαση ενός αντικειμένου που είναι και δεν είναι πράγμα ταυτόχρονα.

Τα σύνολα που είναι ασαφή ή πολυδύναμα, παραβιάζουν τον νόμο του αποκλεισμένου μέσου – σε κάποιο βαθμό. Τα στοιχεία ανήκουν μόνο εν μέρει σε ένα ασαφές σύνολο. Μπορεί επίσης να ανήκουν σε περισσότερα από ένα σύνολα. Ακόμα και σε ένα μόνο άτομο, ο αέρας μπορεί να φαίνεται δροσερός, ακριβώς όπως πρέπει και ζεστός σε ποικίλους βαθμούς. Ενώ τα όρια των τυπικών συνόλων είναι ακριβή, αυτά των ασαφών συνόλων είναι καμπυλωμένα ή λεπταίνουν, και αυτή η καμπυλότητα δημιουργεί μερικές αντιφάσεις. Ο αέρας μπορεί να είναι 20% δροσερός και ταυτόχρονα, 80% όχι δροσερός

Οι ασαφείς βαθμοί δεν είναι οι ίδιοι με τα ποσοστά πιθανότητας, ένα σημείο που έχει διαφύγει της προσοχής ορισμένων επικριτών του πεδίου. Οι πιθανότητες μετρούν αν κάτι θα συμβεί ή όχι. Η ασάφεια μετράει τον βαθμό στον οποίο συμβαίνει κάτι ή υπάρχει κάποια συνθήκη. Η δήλωση «Υπάρχει 30% πιθανότητα ο καιρός να είναι δροσερός» μεταφέρει την πιθανότητα δροσερού καιρού. Αλλά «Το πρωί φαίνεται 30% δροσερό» σημαίνει ότι ο αέρας φαίνεται δροσερός σε κάποιο βαθμό και ταυτόχρονα, ακριβώς όπως πρέπει και ζεστός σε ποικίλους βαθμούς.

Ο μόνος περιορισμός στην ασαφή λογική είναι ότι οι βαθμοί συμμετοχής ενός αντικειμένου σε συμπληρωματικές ομάδες πρέπει να αθροίζονται σε μονάδα. Αν ο αέρας φαίνεται 20% δροσερός, πρέπει επίσης να είναι 80% μη δροσερός. Με αυτόν τον τρόπο, η ασαφής λογική απλώς παρακάμπτει τη δισθενή αντίφαση – ότι κάτι είναι 100% δροσερό και 100% μη δροσερό – που θα κατέστρεφε την τυπική λογική. Ο νόμος του αποκλεισμένου μέσου ισχύει απλώς ως ειδική περίπτωση στην ασαφή λογική, δηλαδή όταν ένα αντικείμενο ανήκει 100% σε μία ομάδα

Η σύγχρονη μελέτη της ασαφούς λογικής και των μερικών αντιφάσεων ξεκίνησε στις αρχές του αιώνα μας, όταν ο Μπέρτραντ Ράσελ βρήκε το αρχαίο ελληνικό παράδοξο στον πυρήνα της σύγχρονης θεωρίας συνόλων και λογικής. Σύμφωνα με το παλιό αίνιγμα, ένας Κρητικός ισχυρίζεται ότι όλοι οι Κρητικοί λένε ψέματα. Πας Κρης Ψεύτης: Άρα, λέει ψέματα; Αν λέει ψέματα, τότε λέει την αλήθεια και δεν λέει ψέματα. Αν δεν λέει ψέματα, τότε λέει την αλήθεια και άρα ψεύδεται. Και οι δύο περιπτώσεις οδηγούν σε αντίφαση, επειδή η πρόταση είναι ταυτόχρονα αληθής και ψευδής. Ο Russell βρήκε το ίδιο παράδοξο στη θεωρία συνόλων. Το σύνολο όλων των συνόλων είναι ένα σύνολο, άρα είναι μέλος του εαυτού του. Ωστόσο, το σύνολο όλων των μήλων δεν είναι μέλος του εαυτού του, επειδή τα μέλη του είναι μήλα και όχι σύνολα. Αντιλαμβανόμενος την υποκείμενη αντίφαση, ο Russell ρώτησε στη συνέχεια: «Είναι το σύνολο όλων των συνόλων που δεν είναι μέλη του εαυτού τους μέλος του εαυτού του;» Αν ναι, δεν είναι· αν δεν είναι, είναι.

Αντιμέτωπη με ένα τέτοιο αίνιγμα, η κλασική λογική παραδίδεται Αλλά η ασαφής λογική λέει ότι η απάντηση είναι μισή αληθής και μισή ψευδής, μια αναλογία 50-50. Το 50% των δηλώσεων του Κρητικού είναι αληθείς και το 50% ψευδείς. Ο Κρητικός ψεύδεται το 50% των περιπτώσεων και δεν ψεύδεται το άλλο μισό. Όταν η συμμετοχή είναι μικρότερη από το συνολικό, ένα δισθενές σύστημα μπορεί να απλοποιήσει το πρόβλημα στρογγυλοποιώντας το προς τα κάτω στο μηδέν ή μέχρι το 100%. Ωστόσο, το 50% δεν στρογγυλοποιεί προς τα πάνω ή προς τα κάτω.

Τη δεκαετία του 1920, ανεξάρτητα από τον Russell, ο Πολωνός λογικός Jan Wukasiewicz επεξεργάστηκε τις αρχές της πολυτιμικής λογικής, στην οποία οι δηλώσεις μπορούν να λάβουν κλασματικές τιμές αλήθειας μεταξύ των μονάδων και των μηδενικών της δυαδικής λογικής. Σε ένα άρθρο του 1937 στο Philosophy of Science, ο κβαντικός φιλόσοφος Max Black εφάρμοσε την πολυτιμική λογική σε λίστες ή σύνολα αντικειμένων και με αυτόν τον τρόπο σχεδίασε τις πρώτες καμπύλες ασαφών συνόλων. Ακολουθώντας το παράδειγμα του Russell, ο Black ονόμασε τα σύνολα «ασαφή».

Σχεδόν 30 χρόνια αργότερα, ο Lotfi A. Zadeh, τότε πρόεδρος του τμήματος ηλεκτρολόγων μηχανικών στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϊ, δημοσίευσε το “Fuzzy Sets”, μια ιστορική εργασία που έδωσε στον τομέα το όνομά του. Ο Zadeh εφάρμοσε τη λογική του Wukasiewicz σε κάθε αντικείμενο ενός συνόλου και ανέπτυξε μια πλήρη άλγεβρα για ασαφή σύνολα. Παρόλα αυτά, τα ασαφή σύνολα δεν χρησιμοποιήθηκαν μέχρι τα μέσα της δεκαετίας του 1970, όταν ο Ebrahim H. Mamdani του Queen Mary College στο Λονδίνο σχεδίασε έναν ασαφή ελεγκτή για μια ατμομηχανή. Έκτοτε, ο όρος “ασαφής λογική” έχει καταστεί γνωστός ως οποιοδήποτε μαθηματικό ή υπολογιστικό σύστημα που συλλογίζεται με ασαφή σύνολα.

Η ασαφής λογική βασίζεται σε κανόνες της μορφής «αν… τότε» που μετατρέπουν τις εισόδους σε εξόδους – ένα ασαφές σύνολο σε ένα άλλο. Ο ελεγκτής του κλιματιστικού ενός αυτοκινήτου μπορεί να περιλαμβάνει κανόνες όπως «Εάν η θερμοκρασία είναι χαμηλή, τότε ρυθμίστε την ταχύτητα του κινητήρα σε αργή» και «Εάν η θερμοκρασία είναι ακριβώς η σωστή, τότε ρυθμίστε την ταχύτητα του κινητήρα σε μέτρια». Οι θερμοκρασίες (κρύα, ακριβώς η σωστή) και οι ταχύτητες του κινητήρα (αργή, μέτρια) ονομάζουν ασαφή σύνολα και όχι συγκεκριμένες τιμές.

Για να κατασκευάσει ένα ασαφές σύστημα, ένας μηχανικός μπορεί να ξεκινήσει με ένα σύνολο ασαφών κανόνων από έναν ειδικό. Ένας μηχανικός μπορεί να ορίσει τους βαθμούς συμμετοχής σε διάφορα ασαφή σύνολα εισόδου και εξόδου με σύνολα καμπυλών. Η σχέση μεταξύ των συνόλων εισόδου και εξόδου θα μπορούσε στη συνέχεια να απεικονιστεί γραφικά. Δεδομένου του κανόνα «Εάν ο αέρας είναι δροσερός, τότε ρυθμίστε τον κινητήρα σε αργή», οι είσοδοι (θερμοκρασία) θα παρατίθεντο κατά μήκος ενός άξονα ενός γραφήματος και οι έξοδοι (ταχύτητα κινητήρα) κατά μήκος ενός δεύτερου άξονα. Το γινόμενο αυτών των ασαφών συνόλων σχηματίζει ένα ασαφές τμήμα, μια περιοχή που αντιπροσωπεύει το σύνολο όλων των συσχετίσεων που σχηματίζει ο κανόνας μεταξύ αυτών των εισόδων και εξόδων

Το μέγεθος του patch αντανακλά την ασάφεια ή την αβεβαιότητα του κανόνα. Όσο πιο ακριβές είναι το ασαφές σύνολο, τόσο μικρότερο γίνεται. Αν η θερμοκρασία “cool” είναι ακριβώς 19 βαθμοί Φαρενάιτ, το ασαφές σύνολο καταρρέει σε μια αιχμή. Αν τόσο το cool όσο και το slow fuzzy σύνολα είναι αιχμές, το patch του κανόνα είναι ένα σημείο.

Οι κανόνες ενός ασαφούς συστήματος ορίζουν ένα σύνολο επικαλυπτόμενων patch που συσχετίζουν ένα πλήρες εύρος εισόδων με ένα πλήρες εύρος εξόδων. Υπό αυτή την έννοια, το ασαφές σύστημα προσεγγίζει κάποια μαθηματική συνάρτηση ή εξίσωση αιτίας και αποτελέσματος. Αυτές οι συναρτήσεις μπορεί να είναι νόμοι που λένε σε έναν μικροεπεξεργαστή πώς να ρυθμίσει την ισχύ ενός κλιματιστικού ή την ταχύτητα ενός πλυντηρίου ρούχων σε απόκριση σε κάποια νέα μέτρηση.

Τα ασαφή συστήματα μπορούν να προσεγγίζουν οποιαδήποτε συνεχή μαθηματική συνάρτηση. Απέδειξα αυτό το θεώρημα ομοιόμορφης σύγκλισης δείχνοντας ότι αρκετά μικρά ασαφή patches μπορούν να καλύψουν επαρκώς το γράφημα οποιασδήποτε συνάρτησης ή σχέσης εισόδου/εξόδου. Το θεώρημα δείχνει επίσης ότι μπορούμε να επιλέξουμε εκ των προτέρων το μέγιστο σφάλμα της προσέγγισης και να είμαστε σίγουροι ότι υπάρχει ένας πεπερασμένος αριθμός ασαφών κανόνων που το επιτυγχάνουν. Ένα ασαφές σύστημα συλλογίζεται ή συνάγει συμπεράσματα με βάση τις ενημερώσεις κώδικα κανόνων του. Δύο ή περισσότεροι κανόνες μετατρέπουν οποιονδήποτε εισερχόμενο αριθμό σε κάποιο αποτέλεσμα επειδή οι ενημερώσεις κώδικα επικαλύπτονται. Όταν τα δεδομένα ενεργοποιούν τους κανόνες, οι επικαλυπτόμενες ενημερώσεις κώδικα ενεργοποιούνται παράλληλα – αλλά μόνο σε κάποιο βαθμό.

Φανταστείτε ένα ασαφές κλιματιστικό που βασίζεται σε πέντε κανόνες και επομένως σε πέντε ενημερώσεις κώδικα για να αντιστοιχίσει τις θερμοκρασίες με τις ταχύτητες του κινητήρα. Τα σύνολα θερμοκρασίας (κρύο, δροσερό, ακριβώς σωστό, ζεστό και ζεστό) καλύπτουν όλες τις πιθανές ασαφείς εισόδους. Τα σύνολα ταχύτητας του κινητήρα (πολύ αργή, αργή, μέτρια, γρήγορη και πολύ γρήγορη) περιγράφουν όλες τις ασαφείς εξόδους. Μια θερμοκρασία, ας πούμε, 19°C μπορεί να είναι 20% δροσερή (80% όχι δροσερή) και 70% ακριβώς σωστή (30% όχι ακριβώς σωστή). Ταυτόχρονα, ο αέρας είναι επίσης 0% κρύος, ζεστός και ζεστός. Οι κανόνες «αν είναι δροσερός» και «αν είναι ακριβώς σωστός» θα ενεργοποιηθούν και θα ενεργοποιήσουν τόσο την αργή όσο και την μεσαία ταχύτητα του κινητήρα.

Οι δύο κανόνες συμβάλλουν αναλογικά στην τελική ταχύτητα του κινητήρα. Επειδή η θερμοκρασία ήταν 20% δροσερή, η καμπύλη που περιγράφει την αργή ταχύτητα του κινητήρα πρέπει να συρρικνωθεί στο 20% του ύψους της. Η καμπύλη «μέτρια» πρέπει να συρρικνωθεί στο 70%. Το άθροισμα αυτών των δύο μειωμένων καμπυλών παράγει την τελική καμπύλη για το σύνολο ασαφούς εξόδου

Στην ασαφή της μορφή, μια τέτοια καμπύλη εξόδου δεν βοηθά τους ελεγκτές που ενεργούν με βάση δυαδικές εντολές. Έτσι, το τελικό βήμα είναι μια διαδικασία αποασαφοποίησης, στην οποία η ασαφής καμπύλη εξόδου μετατρέπεται σε μία μόνο αριθμητική τιμή. Η πιο συνηθισμένη τεχνική είναι ο υπολογισμός του κέντρου μάζας, ή κεντροειδούς, της περιοχής κάτω από την καμπύλη. Σε αυτήν την περίπτωση, το κεντροειδές της ασαφούς καμπύλης εξόδου μπορεί να αντιστοιχεί σε μια ταχύτητα κινητήρα 47 στροφών ανά λεπτό. Έτσι, ξεκινώντας με μια ποσοτική είσοδο θερμοκρασίας, ο ηλεκτρονικός ελεγκτής μπορεί να κάνει συλλογισμούς από ασαφή σύνολα θερμοκρασίας και ταχύτητας κινητήρα και να καταλήξει σε μια κατάλληλη και ακριβή έξοδο ταχύτητας.

Όλα τα ασαφή συστήματα συλλογίζονται με αυτήν την τεχνική «fire-and-sum» ή κάτι παρόμοιο. Καθώς τα συστήματα γίνονται πιο περίπλοκα, τα προηγούμενα των κανόνων μπορεί να περιλαμβάνουν οποιονδήποτε αριθμό όρων που συνδέονται με το «και» ή αποσυνδέονται με το «ή». Ένα προηγμένο ασαφές κλιματιστικό μπορεί να χρησιμοποιήσει έναν κανόνα που λέει: «Εάν ο αέρας είναι δροσερός και η υγρασία είναι υψηλή, τότε ρυθμίστε τον κινητήρα σε μέτρια».

Τα ασαφή προϊόντα χρησιμοποιούν μικροεπεξεργαστές που εκτελούν αλγόριθμους ασαφούς συμπερασμού και αισθητήρες που μετρούν τις μεταβαλλόμενες συνθήκες εισόδου. Τα ασαφή τσιπ είναι μικροεπεξεργαστές σχεδιασμένοι να αποθηκεύουν και να επεξεργάζονται ασαφείς κανόνες. Το 1985, οι Masaki Togai και Hiroyuki Watan-abe, οι οποίοι εργάζονταν τότε στα εργαστήρια AT&T Bell, κατασκεύασαν το πρώτο ψηφιακό ασαφές τσιπ. Επεξεργάστηκε 16 απλούς κανόνες σε 12,5 μικροδευτερόλεπτα, με ρυθμό 0,08 εκατομμυρίων ασαφών λογικών συμπερασμάτων ανά δευτερόλεπτο. Η Togai InfraLogic, Inc., προσφέρει πλέον τσιπ που βασίζονται σε υλικό Fuzzy Computational Acceleration που επεξεργάζεται έως και δύο εκατομμύρια κανόνες ανά δευτερόλεπτο. Οι περισσότερες εταιρείες μικροεπεξεργαστών έχουν επί του παρόντος ερευνητικά έργα ασαφών τσιπ. Τα ασαφή προϊόντα βασίζονται σε μεγάλο βαθμό σε τυπικούς μικροεπεξεργαστές που οι μηχανικοί έχουν προγραμματίσει με λίγες γραμμές κώδικα ασαφούς συμπερασμού. Αν και η αγορά για αποκλειστικά ασαφή τσιπ είναι ακόμα μικρή, η αξία των μικροεπεξεργαστών που περιλαμβάνουν ασαφή λογική υπερβαίνει ήδη το 1 δισεκατομμύριο δολάρια

Η πιο διάσημη ασαφής εφαρμογή είναι ο ελεγκτής βαγονιών του μετρό που χρησιμοποιείται στο Σεντάι, ο οποίος έχει ξεπεράσει σε απόδοση τόσο τους ανθρώπινους χειριστές όσο και τους συμβατικούς αυτοματοποιημένους ελεγκτές. Οι συμβατικοί ελεγκτές ξεκινούν ή σταματούν ένα τρένο αντιδρώντας σε δείκτες θέσης που δείχνουν πόσο μακριά βρίσκεται το όχημα από έναν σταθμό. Επειδή οι ελεγκτές είναι αυστηρά προγραμματισμένοι, η διαδρομή μπορεί να είναι σπασμωδική: ο αυτοματοποιημένος ελεγκτής θα εφαρμόσει την ίδια πίεση πέδησης όταν ένα τρένο βρίσκεται, ας πούμε, 100 μέτρα από έναν σταθμό, ακόμα κι αν το τρένο κινείται σε ανηφόρα ή κατηφόρα.

Στα μέσα της δεκαετίας του 1980, μηχανικοί της Hitachi χρησιμοποίησαν ασαφείς κανόνες για να επιταχύνουν, να επιβραδύνουν και να φρενάρουν τα τρένα του μετρό πιο ομαλά από ό,τι θα μπορούσε ένας επιδέξιος ανθρώπινος χειριστής. Οι κανόνες περιλάμβαναν ένα ευρύ φάσμα μεταβλητών σχετικά με τη συνεχή απόδοση του τρένου, όπως πόσο συχνά και κατά πόσο άλλαζε η ταχύτητά του και πόσο κοντά ήταν η πραγματική ταχύτητα στη μέγιστη ταχύτητα. Σε προσομοιωμένες δοκιμές, ο ασαφής ελεγκτής ξεπέρασε μια αυτοματοποιημένη έκδοση σε μετρήσεις άνεσης των επιβατών, μείωσε τους χρόνους οδήγησης και μάλιστα πέτυχε μείωση 10% στην κατανάλωση ενέργειας του τρένου. Σήμερα, το ασαφές σύστημα λειτουργεί το μετρό Σεντάι κατά τις ώρες αιχμής και λειτουργεί και ορισμένα τρένα του Τόκιο.

Οι άνθρωποι χειρίζονται το μετρό κατά τις ώρες εκτός αιχμής για να διατηρήσουν τις δεξιότητές τους

Εταιρείες στην Ιαπωνία και την Κορέα κατασκευάζουν μια σειρά από ασαφή καταναλωτικά αγαθά που προσφέρουν πιο ακριβή έλεγχο από τα συμβατικά. Τα ασαφή πλυντήρια ρούχων προσαρμόζουν τον κύκλο πλύσης σε κάθε σετ ρούχων, αλλάζοντας στρατηγικές καθώς τα ρούχα καθαρίζονται. Ένα ασαφές πλυντήριο ρούχων προσφέρει πιο λεπτό πλύσιμο από ένα «χαζό» πλυντήριο με σταθερές εντολές. Στο απλούστερο από αυτά τα πλυντήρια, ένας οπτικός αισθητήρας μετρά τη θολότητα ή τη διαύγεια του νερού πλύσης και ο ελεγκτής εκτιμά πόσο χρόνο θα χρειαζόταν ένας λεκές για να διαλυθεί ή να κορεστεί στο νερό πλύσης. Ορισμένα πλυντήρια χρησιμοποιούν έναν αισθητήρα φορτίου για να ενεργοποιήσουν αλλαγές στον ρυθμό ανάδευσης ή τη θερμοκρασία του νερού. Άλλα εκτοξεύουν φυσαλίδες στο πλύσιμο για να βοηθήσουν στη διάλυση της βρωμιάς και του απορρυπαντικού. Ένα πλυντήριο ρούχων μπορεί να χρησιμοποιήσει μόλις 10 ασαφείς κανόνες για να καθορίσει μια μεγάλη ποικιλία στρατηγικών πλύσης

Στις κάμερες και τις βιντεοκάμερες, η ασαφής λογική συνδέει τα δεδομένα εικόνας με διάφορες ρυθμίσεις φακού. Μία από τις πρώτες ασαφείς βιντεοκάμερες, η φορητή Canon H800, η οποία παρουσιάστηκε το 1990, ρυθμίζει την αυτόματη εστίαση με βάση 13 ασαφείς κανόνες. Οι αισθητήρες μετρούν την καθαρότητα των εικόνων σε έξι περιοχές. Οι κανόνες καταλαμβάνουν περίπου ένα κιλομπάιτ μνήμης και μετατρέπουν τα δεδομένα του αισθητήρα σε νέες ρυθμίσεις φακού.

Η Matsushita βασίζεται σε περισσότερους κανόνες για να ακυρώσει το τρέμουλο της εικόνας που προκαλεί ένα τρέμουλο χεριού στις μικρές βιντεοκάμερες Panasonic. Οι ασαφείς κανόνες υπονοούν πού θα μετατοπιστεί η εικόνα. Οι κανόνες λαμβάνουν υπόψη τις τοπικές και καθολικές αλλαγές στην εικόνα και στη συνέχεια τις αντισταθμίζουν. Αντίθετα, οι ελεγκτές βιντεοκάμερας που βασίζονται σε μαθηματικά μοντέλα μπορούν να αντισταθμίσουν μόνο μερικούς τύπους τρεμουλιάσματος της εικόνας.

Τα συστήματα με ασαφείς ελεγκτές είναι συχνά πιο ενεργειακά αποδοτικά, επειδή υπολογίζουν με μεγαλύτερη ακρίβεια πόση ισχύς απαιτείται για να ολοκληρωθεί μια εργασία. Η Mitsubishi και η Samsung της Κορέας αναφέρουν ότι οι ασαφείς ηλεκτρικές σκούπες τους επιτυγχάνουν εξοικονόμηση ενέργειας άνω του 40% σε σχέση με τις μη ασαφείς ηλεκτρικές σκούπες. Τα ασαφή συστήματα χρησιμοποιούν διόδους εκπομπής υπέρυθρου φωτός για να μετρήσουν τις αλλαγές στη ροή σκόνης και έτσι να κρίνουν εάν ένα δάπεδο είναι γυμνό. Ένας μικροεπεξεργαστής τεσσάρων bit μετρά τη ροή σκόνης για να υπολογίσει την κατάλληλη ισχύ αναρρόφησης και άλλες ρυθμίσεις κενού.

Τα αυτοκίνητα επωφελούνται επίσης από την ασαφή λογική. Η General Motors χρησιμοποιεί ένα ασαφές κιβώτιο ταχυτήτων στο Saturn της. Η Nissan έχει κατοχυρώσει με δίπλωμα ευρεσιτεχνίας ένα ασαφές αντιολισθητικό σύστημα πέδησης, ένα ασαφές σύστημα μετάδοσης κίνησης και ένα ασαφές μπεκ ψεκασμού καυσίμου. Ένα σύνολο ασαφών κανόνων σε έναν ενσωματωμένο μικροεπεξεργαστή ρυθμίζει τη ροή καυσίμου. Οι αισθητήρες μετρούν τη ρύθμιση του γκαζιού, την πίεση της πολλαπλής, τη θερμοκρασία του νερού του ψυγείου και τις στροφές του κινητήρα ανά λεπτό. Ένα δεύτερο σύνολο ασαφών κανόνων χρονομετρά την ανάφλεξη του κινητήρα με βάση τις στροφές ανά λεπτό, τη θερμοκρασία του νερού και τη συγκέντρωση οξυγόνου

Ένα από τα πιο σύνθετα ασαφή συστήματα είναι ένα μοντέλο ελικοπτέρου, σχεδιασμένο από τον Michio Sugeno του Τεχνολογικού Ινστιτούτου του Τόκιο. Τέσσερα στοιχεία του σκάφους – ο ανελκυστήρας, το πηδάλιο κλίσης, το γκάζι και το πηδάλιο – ανταποκρίνονται σε 13 ασαφείς φωνητικές εντολές, όπως “πάνω”, “προσγείωση” και “αιώρηση”. Ο ασαφής ελεγκτής μπορεί να κάνει το σκάφος να αιωρείται στη θέση του, ένα δύσκολο έργο ακόμη και για ανθρώπινους πιλότους.

Μερικά ασαφή συστήματα διαχειρίζονται πληροφορίες αντί για συσκευές.

Με κανόνες ασαφούς λογικής, ο ιαπωνικός όμιλος Omron επιβλέπει πέντε βάσεις ιατρικών δεδομένων σε ένα σύστημα διαχείρισης υγείας για μεγάλες εταιρείες. Τα ασαφή συστήματα χρησιμοποιούν 500 κανόνες για τη διάγνωση της υγείας περίπου 10.000 ασθενών και για την εκπόνηση εξατομικευμένων σχεδίων που θα τους βοηθήσουν να αποτρέψουν ασθένειες, να παραμείνουν σε φόρμα και να μειώσουν το άγχος.

Άλλες εταιρείες, συμπεριλαμβανομένων των Hitachi και Yamaichi Securities, έχουν δημιουργήσει προγράμματα συναλλαγών για ομόλογα ή μετοχικά κεφάλαια που χρησιμοποιούν ασαφείς κανόνες για να αντιδρούν στις αλλαγές στα οικονομικά δεδομένα.

Η αχίλλειος πτέρνα ενός ασαφούς συστήματος είναι οι κανόνες του. Σχεδόν όλα τα ασαφή καταναλωτικά προϊόντα που κυκλοφορούν σήμερα στην αγορά βασίζονται σε κανόνες που παρέχονται από έναν ειδικό. Οι μηχανικοί στη συνέχεια εμπλέκονται σε μια μακρά διαδικασία ρύθμισης αυτών των κανόνων και των ασαφών συνόλων. Για να αυτοματοποιήσουν αυτήν τη διαδικασία, ορισμένοι μηχανικοί κατασκευάζουν προσαρμοστικά ασαφή συστήματα που χρησιμοποιούν νευρωνικά δίκτυα ή άλλα στατιστικά εργαλεία για να βελτιώσουν ή ακόμα και να διαμορφώσουν αυτούς τους αρχικούς κανόνες.

Τα νευρωνικά δίκτυα είναι συλλογές «νευρώνων» και «συνάψεων» που αλλάζουν τις τιμές τους σε απόκριση σε εισόδους από τους περιβάλλοντες νευρώνες και συνάψεις. Το νευρωνικό δίκτυο λειτουργεί σαν υπολογιστής επειδή αντιστοιχίζει εισόδους σε εξόδους. Οι νευρώνες και οι συνάψεις μπορεί να είναι στοιχεία πυριτίου ή εξισώσεις σε λογισμικό που προσομοιώνουν τη συμπεριφορά τους. Ένας νευρώνας προσθέτει όλα τα εισερχόμενα σήματα από άλλους νευρώνες και στη συνέχεια εκπέμπει τη δική του απόκριση με τη μορφή ενός αριθμού. Τα σήματα ταξιδεύουν στις συνάψεις, οι οποίες έχουν αριθμητικές τιμές που σταθμίζουν τη ροή των νευρωνικών σημάτων.

Όταν νέα δεδομένα εισόδου ενεργοποιούν τους νευρώνες ενός δικτύου, οι συναπτικές τιμές μπορούν να αλλάξουν ελαφρώς. Ένα νευρωνικό δίκτυο «μαθαίνει» όταν αλλάζει την τιμή των συνάψεών του

Ανάλογα με τα διαθέσιμα δεδομένα, τα δίκτυα μπορούν να μάθουν μοτίβα με ή χωρίς επίβλεψη. Ένα εποπτευόμενο δίκτυο μαθαίνει με δοκιμή και λάθος, καθοδηγούμενο από έναν δάσκαλο. Ένας άνθρωπος μπορεί να επισημάνει πότε το δίκτυο έχει κάνει λάθος – πότε έχει εκπέμψει μια απόκριση που διαφέρει από την επιθυμητή έξοδο. Ο δάσκαλος θα διορθώσει τις απαντήσεις σε δείγματα δεδομένων μέχρι το δίκτυο να ανταποκριθεί σωστά σε κάθε είσοδο.

Τα εποπτευόμενα δίκτυα ρυθμίζουν τους κανόνες ενός ασαφούς συστήματος σαν να ήταν συνάψεις. Ο χρήστης παρέχει το πρώτο σύνολο κανόνων, το οποίο το νευρωνικό δίκτυο βελτιώνει εκτελώντας εκατοντάδες χιλιάδες εισόδους, μεταβάλλοντας ελαφρώς τα ασαφή σύνολα κάθε φορά για να δει πόσο καλά αποδίδει το σύστημα. Το δίκτυο τείνει να διατηρεί τις αλλαγές που βελτιώνουν την απόδοση και να αγνοεί τις άλλες.

Μια χούφτα προϊόντα στην Ιαπωνία χρησιμοποιούν πλέον εποπτευόμενη νευρωνική μάθηση για να ρυθμίσουν τους ασαφείς κανόνες που ελέγχουν τη λειτουργία τους. Μεταξύ αυτών είναι ο φούρνος μικροκυμάτων της Sanyo και αρκετές εταιρείες πλυντηρίων ρούχων. Η Sharp χρησιμοποιεί αυτήν την τεχνική για να τροποποιήσει τους κανόνες του ασαφούς ψυγείου της, έτσι ώστε η συσκευή να μαθαίνει πόσο συχνά είναι πιθανό να ανοίξει την πόρτα ο πεινασμένος πελάτης της και να προσαρμόζει ανάλογα τον κύκλο ψύξης. Μέχρι στιγμής, το νευρωνικό δίκτυο πρέπει να μαθαίνει “εκτός σύνδεσης” στο εργαστήριο, από μικρά δείγματα συμπεριφοράς από μέσους πελάτες. Με την πάροδο του χρόνου, ερευνητές σε ομάδες όπως το Ιαπωνικό Εργαστήριο Διεθνούς Ασαφούς Μηχανικής και το Ινστιτούτο Ασαφών Λογικών Συστημάτων ελπίζουν να κατασκευάσουν ασαφή συστήματα που θα προσαρμόζονται στις ανάγκες κάθε καταναλωτή.

Τα εποπτευόμενα δίκτυα έχουν μειονεκτήματα. Η ρύθμιση τέτοιων συστημάτων μπορεί να διαρκέσει ώρες ή ημέρες υπολογιστικού χρόνου, επειδή τα δίκτυα ενδέχεται να συγκλίνουν σε μια ακατάλληλη λύση ή κανόνα ή μπορεί να μην συγκλίνουν καθόλου. Οι νευρωνικοί ερευνητές έχουν προτείνει εκατοντάδες σχέδια για την αντιμετώπιση αυτού του προβλήματος, αλλά κανένα δεν το έχει εξαλείψει. Ακόμα και μετά από μια μακρά συνεδρία ρύθμισης, οι τελικοί κανόνες μπορεί να μην είναι πολύ καλύτεροι από το πρώτο σύνολο

Αντί να βασίζονται σε έναν ειδικό για την παροχή ενός συνόλου δεδομένων εκπαίδευσης και τη διόρθωση ενός δικτύου κατά τη διαδικασία μάθησης, τα μη επιβλεπόμενα νευρωνικά δίκτυα μαθαίνουν απλώς παρατηρώντας τις αποφάσεις ενός ειδικού. Με αυτόν τον τρόπο, ένα προσαρμοστικό ασαφές σύστημα μπορεί να μάθει να εντοπίζει μοτίβα κανόνων στα εισερχόμενα δεδομένα. Ευρείες ενημερώσεις κανόνων σχηματίζονται γρήγορα, με βάση λίγες εισόδους. Αυτές οι ενημερώσεις βελτιώνονται με την πάροδο του χρόνου.

Τα μη επιβλεπόμενα νευρωνικά δίκτυα ομαδοποιούν τυφλά τα δεδομένα σε ομάδες, τα μέλη των οποίων μοιάζουν μεταξύ τους. Μπορεί να μην υπάρχει δεδομένη σωστή ή λάθος απάντηση ή τρόπος οργάνωσης των δεδομένων. Οι αλγόριθμοι είναι απλούστεροι και, τουλάχιστον θεωρητικά, το δίκτυο χρειάζεται να επεξεργάζεται τα δεδομένα μόνο μία φορά. (Σε ορισμένες περιπτώσεις, όταν τα δεδομένα είναι αραιά, το νευρωνικό δίκτυο πρέπει να τα επεξεργάζεται επανειλημμένα.) Η μη επιβλεπόμενη μάθηση είναι επομένως πολύ πιο γρήγορη από την επιβλεπόμενη μάθηση. Με αριθμητικές εισόδους και εξόδους που παρέχονται από έναν ειδικό ή μια φυσική διαδικασία ή ακόμα και έναν αλγόριθμο, ένα μη επιβλεπόμενο νευρωνικό δίκτυο μπορεί να βρει το πρώτο σύνολο κανόνων για ένα ασαφές σύστημα. Η ποιότητα των κανόνων εξαρτάται από την ποιότητα των δεδομένων και, επομένως, τις δεξιότητες του ειδικού που τα παράγει. Σε αυτό το σημείο, υπάρχουν λιγότερα μη επιβλεπόμενα από τα επιβλεπόμενα προσαρμοστικά ασαφή συστήματα. Επειδή τα μη επιβλεπόμενα δίκτυα χρησιμοποιούνται καλύτερα για τη δημιουργία κανόνων και τα επιβλεπόμενα δίκτυα είναι καλύτερα στη βελτίωση τους, τα υβριδικά προσαρμοστικά ασαφή συστήματα περιλαμβάνουν και τα δύο.

Τα περισσότερα ασαφή συστήματα ήταν συστήματα ελέγχου με λίγες μεταβλητές. Αυτή η τάση προέκυψε επειδή οι περισσότεροι από τους πρώτους μηχανικούς ασαφούς λογικής ήταν θεωρητικοί ελέγχου και επειδή ένας βρόχος ελέγχου ρυθμίζει τα περισσότερα καταναλωτικά προϊόντα. Η πρόκληση για την επόμενη γενιά ασαφούς έρευνας θα είναι η αντιμετώπιση μεγάλης κλίμακας, μη γραμμικών συστημάτων με πολλές μεταβλητές. Αυτά τα προβλήματα μπορεί να προκύψουν όταν οι άνθρωποι προσπαθούν να επιβλέπουν εργοστάσια παραγωγής ή να προγραμματίζουν αεροπορικές πτήσεις ή να μοντελοποιούν την οικονομία. Κανένας ειδικός μπορεί να μην είναι σε θέση να περιγράψει τέτοια συστήματα. Η κοινή λογική μπορεί να αποτύχει ή να μην εφαρμοστεί. Τα νευρωνικά δίκτυα που πρέπει να μάθουν τους κανόνες για τη μοντελοποίηση αυτών των δύσκολων προβλημάτων μπορεί να έχουν λίγα ή καθόλου δεδομένα

Ένα περαιτέρω πρόβλημα είναι ότι, όπως κάθε άλλο μαθηματικό ή υπολογιστικό μοντέλο, η ασαφής λογική πέφτει θύμα της «κατάρας της διαστατικότητας»: ο αριθμός των ασαφών κανόνων τείνει να αυξάνεται εκθετικά καθώς αυξάνεται ο αριθμός των μεταβλητών του συστήματος. Τα ασαφή συστήματα πρέπει να αντιμετωπίσουν μια αντιστάθμιση. Τα μεγάλα μπαλώματα κανόνων σημαίνουν ότι το σύστημα είναι πιο διαχειρίσιμο αλλά και λιγότερο ακριβές.

Ακόμα και με αυτή την αντιστάθμιση, η ασαφής λογική μπορεί συχνά να μοντελοποιήσει καλύτερα την ασάφεια του κόσμου από ό,τι οι ασπρόμαυρες έννοιες της θεωρίας συνόλων. Για αυτόν τον λόγο, τα συστήματα ασαφούς λογικής μπορεί κάλλιστα να βρουν τον δρόμο τους σε έναν συνεχώς αυξανόμενο αριθμό υπολογιστών, οικιακών συσκευών και θεωρητικών μοντέλων. Ο επόμενος αιώνας μπορεί να είναι πιο ασαφής από ό,τι νομίζουμε.

Κατηγορία ARTIFICIAL INTELIGENCE | Δεν υπάρχουν σχόλια »

ΕΥΦΥΕΙΣ ΜΕΣΟΛΑΒΗΤΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ

Συγγραφέας: ΗΛΙΑΣ ΓΑΒΡΙΛΗΣ στις 29 Οκτωβρίου 2025

3-Ευφυείς Μεσολαβητές και Περιβάλλοντα

Αυτό το άρθρο αφορά τους ευφυείς μεσολαβητές. Οι ευφυείς μεσολαβητές (agents) έχουν ερευνηθεί λεπτομερώς. Έχουν εξεταστεί επίσης οι διάφοροι τύποι περιβαλλόντων (environments) στα οποία δρουν αυτοί.

Τι είναι ένας Μεσολαβητής Τεχνητής Νοημοσύνης; (Artificial Intelligence Agent);

Ένα σύστημα τεχνητής νοημοσύνης αποτελείται τόσο από τον μεσολαβητή (agent) όσο και από το περιβάλλον (environment). Κάθε ΑΙ-agent δρα στο δικό του περιβάλλον και αυτό το περιβάλλον μπορεί να έχει και άλλους μεσολαβητές (agents).

Ένας μεσολαβητής αναφέρεται σε οτιδήποτε είναι ικανό να αντιλαμβάνεται από το περιβάλλον του μέσω αισθητήρων και να δρα στο ίδιο περιβάλλον μέσω τελεστών. Για παράδειγμα, ένας ανθρώπινος έχει αισθητήρια όργανα όπως αυτιά, μάτια, γλώσσα, μύτη και όργανα που είναι παράλληλα με τους αισθητήρες, όπως το δέρμα, τα χέρια, τα πόδια κ.λπ. Ένας ρομποτικός έχει μια κάμερα και υπέρυθρους ανιχνευτές απόστασης ως αισθητήρες και κινητήρες και ενεργοποιητές ως τελεστές.

Τύποι Μεσολαβητών (Agents) Τεχνητής Νοημοσύνης

Οι μεσολαβητές (agents) Τεχνητής Νοημοσύνης μπορούν να ομαδοποιηθούν σε πέντε κατηγορίες με βάση τον βαθμό αντιληπτής νοημοσύνης και ικανότητάς τους. Όλοι αυτοί οι μεσολαβητές (agents) είναι ικανοί να επιδεικνύουν βελτίωση στην απόδοση με την πάροδο του χρόνου και να λαμβάνουν καλύτερες αποφάσεις. Οι μεσολαβητές (agents) κατηγοριοποιούνται ως εξής:

Απλός Ανακλαστικός μεσολαβητής (Simple Reflex Agent).
Ανακλαστικός μεσολαβητής βασισμένος σε μοντέλο (Mondel-Based Reflex Agent).
Μεσολαβητές βασισμένοι σε στόχο (Goal-Based Agents).
Μεσολαβητής βασισμένος σε χρησιμότητα (Utility-Based Agents).
Μεσολαβητής μάθησης (Learning-Agent).

Ας τα συζητήσουμε ένα προς ένα:

1. Απλός Αντανακλαστικός Μεσολαβητής (Simple Reflex Agent).

Αυτές είναι οι απλούστερες μορφές agents. Οι αποφάσεις τους βασίζονται στις τρέχουσες αντιλήψεις και αγνοούν το ιστορικό των αντιλήψεων.

Αυτοί οι τύποι agents μπορούν να επιβιώσουν μόνο σε ένα πλήρως παρατηρήσιμο περιβάλλον. Ωστόσο, κατά τη λήψη αποφάσεων ή την ανάληψη ενεργειών, δεν λαμβάνουν υπόψη το ιστορικό των αντιλήψεων. Λειτουργούν με βάση τον κανόνα συνθήκης-δράσης, που σημαίνει ότι απλώς αντιστοιχίζουν την τρέχουσα κατάσταση στην αντίστοιχη ενέργειά τους.

Οι απλοί αντανακλαστικοί agents έχουν πολύ περιορισμένη γνώση και δεν προσαρμόζονται στο περιβάλλον. Είναι επίσης πολύ μεγάλοι για να δημιουργηθούν και να αποθηκευτούν. Αυτό συμβαίνει επειδή πρέπει να δημιουργήσουμε συνθήκες και τις αντίστοιχες ενέργειές τους.

2. Αντανακλαστικοί Μεσολαβητές που βασίζονται σε μοντέλα (Mondel-Based Reflex Agent).

Αυτός ο τύπος agent είναι ικανός να εργάζεται σε ένα μερικώς παρατηρήσιμο περιβάλλον και να παρακολουθεί την κατάσταση. Ο αντανακλαστικός agent που βασίζεται σε μοντέλα αποτελείται από τους ακόλουθους δύο σημαντικούς παράγοντες:

Μοντέλο – Αυτή είναι η γνώση σχετικά με το πώς γίνονται τα πράγματα στον κόσμο, επομένως, αναφέρεται ως μεσολαβητής – agent που βασίζεται σε μοντέλα.
Εσωτερική κατάσταση – αυτή αντιπροσωπεύει την εσωτερική κατάσταση που βασίζεται στο ιστορικό των αντιλήψεων.

Οι agents έχουν ένα μοντέλο που αντιπροσωπεύει τη γνώση του κόσμου. Οι ενέργειες εκτελούνται με βάση αυτό το μοντέλο. Για να ενημερωθεί η κατάσταση του μεσολαβητή, απαιτούνται οι ακόλουθες πληροφορίες:

Πώς εξελίσσεται ο κόσμος.
Η επίδραση των ενεργειών του agent στον κόσμο.

3. Μεσολαβητές που βασίζονται σε στόχους (Goal-Based Agents).

Η γνώση σχετικά με την τρέχουσα κατάσταση του περιβάλλοντος δεν είναι αρκετή για να αποφασίσει ένας agent τι θα κάνει. Ο agent θα πρέπει να γνωρίζει τον στόχο του, ο οποίος δηλώνει τις επιθυμητές καταστάσεις του.

Ένας agent που βασίζεται σε στόχους επεκτείνει την ικανότητα ενός agent που βασίζεται σε μοντέλα, συμπεριλαμβάνοντας τις πληροφορίες στόχου. Επιλέγει την ενέργεια που θα εκτελέσει με βάση την ανάγκη επίτευξης ενός στόχου.

Σε ορισμένες περιπτώσεις, αυτοί οι τύποι agents πρέπει να αξιολογήσουν μια μακρά ακολουθία ενεργειών, ώστε να γνωρίζουν εάν ένας στόχος θα επιτευχθεί ή όχι. Πρέπει να ληφθούν υπόψη διαφορετικά σενάρια, και αυτή η διαδικασία είναι γνωστή ως αναζήτηση και σχεδιασμός και καθιστά έναν agent προληπτικό.

4. Μεσολαβητές που βασίζονται στη χρησιμότητα (Utility-Based Agents).

Αυτοί οι τύποι μεσολαβητών (Utility-Based Agents) είναι παρόμοιοι με τους Model Based Agents, αλλά παρέχουν ένα επιπλέον στοιχείο μέτρησης της χρησιμότητας. Αυτό τους καθιστά μοναδικούς, καθώς έχουν έναν τρόπο μέτρησης της επιτυχίας σε οποιαδήποτε δεδομένη κατάσταση.

Αυτό σημαίνει ότι οι μεσολαβητές – agents που βασίζονται στη χρησιμότητα βασίζουν τις ενέργειές τους στο πώς να επιτευχθεί ένας στόχος, καθώς και στον καλύτερο τρόπο επίτευξης του στόχου. Είναι καλό να κατηγοριοποιούμε τον μεσολαβητή – agent όταν υπάρχουν πολλές εναλλακτικές λύσεις και ο agent πρέπει να κάνει μια επιλογή για να εκτελέσει την καλύτερη ενέργεια. Η συνάρτηση χρησιμότητας λειτουργεί αντιστοιχίζοντας κάθε κατάσταση σε έναν πραγματικό αριθμό, προκειμένου να ελέγξει πόσο αποτελεσματικά κάθε ενέργεια επιτυγχάνει τον στόχο.

5. Μεσολαβητές Μάθησης (Learning-Agent).

Στην τεχνητή νοημοσύνη, ένας Learning-Agent αναφέρεται σε έναν agent ικανό να μαθαίνει από την εμπειρία του ή έχει μαθησιακές ικανότητες. Ο μεσολαβητής αρχίζει να ενεργεί με βάση βασικές γνώσεις και στη συνέχεια αρχίζει να μαθαίνει και να ενεργεί με βάση τη μάθηση. Αποτελείται από τα ακόλουθα εννοιολογικά στοιχεία:

Στοιχείο μάθησης – αυτό είναι το στοιχείο που είναι υπεύθυνο για την επίτευξη βελτιώσεων μαθαίνοντας από το περιβάλλον.
Στοιχείο Κρίσεως – Το στοιχείο μάθησης πρέπει να λαμβάνει ανατροφοδότηση μέσω κρίσης, το οποίο είναι το στοιχείο που λέει πόσο καλά τα πάει το στοιχείο σε σχέση με ένα συγκεκριμένο καθορισμένο πρότυπο απόδοσης.
Στοιχείο Απόδοσης – αυτό είναι το στοιχείο που επιλέγει την εξωτερική δράση.
Γεννήτρια Προβλημάτων (Problem Generator) – αυτό είναι το στοιχείο που προτείνει ενέργειες που μπορούν να δημιουργήσουν νέες εμπειρίες.

Από την παραπάνω συζήτηση, είναι πολύ σαφές ότι οι μαθησιακοί μεσολαβητές (agents) μπορούν να τρέχουν, να αναλύουν την απόδοσή τους και να βρίσκουν νέους τρόπους για να βελτιώσουν την απόδοσή τους.

Περιβάλλον Μεσολαβητή

Ένα περιβάλλον αναφέρεται σε οτιδήποτε στον κόσμο περιβάλλει έναν agent, αλλά δεν αποτελεί μέρος του. Ένα περιβάλλον είναι μια κατάσταση στην οποία ένας agent είναι παρών. Είναι το μέρος όπου ζει, που λειτουργεί και παρέχει σ’ αυτόν κάτι για να αισθανθεί και να ενεργήσει. Ακολουθούν τα χαρακτηριστικά των περιβαλλόντων των agents:

1. Πλήρως παρατηρήσιμο έναντι (vs) Μερικώς παρατηρήσιμο

2. Στατικό έναντι (vs) Δυναμικό

3. Διακριτό έναντι (vs)vs Συνεχές

4. Ντετερμινιστικό έναντι (vs) Στοχαστικό

5. Single-agent έναντι (vs) Multi-agent

6. Επεισοδιακό έναντι (vs) Διαδοχικού

7. Γνωστό έναντι (vs) Άγνωστο

8. Προσβάσιμο έναντι (vs) Μη Προσβάσιμο

Ας τα συζητήσουμε ένα προς ένα:

1. Πλήρως παρατηρήσιμο vs Μερικώς παρατηρήσιμο

Ένα πλήρως παρατηρήσιμο περιβάλλον είναι αυτό στο οποίο ένας μεσολαβητής – agent μπορεί να έχει πρόσβαση ή να αντιλαμβάνεται την πλήρη κατάσταση του περιβάλλοντος σε κάθε χρονική στιγμή. Διαφορετικά, το περιβάλλον είναι μερικώς παρατηρήσιμο.

Ένα πλήρως παρατηρήσιμο περιβάλλον είναι εύκολο, καθώς δεν υπάρχει ανάγκη να διατηρείται η εσωτερική κατάσταση και να παρακολουθείται το ιστορικό του κόσμου.

Εάν ένας agent δεν έχει αισθητήρες σε όλα τα περιβάλλοντα, το περιβάλλον λέγεται μη παρατηρήσιμο.

2. Ντετερμινιστικό έναντι (vs) Στοχαστικού

Ένα ντετερμινιστικό περιβάλλον είναι αυτό στο οποίο η τρέχουσα κατάσταση και η επιλεγμένη ενέργεια ενός agent μπορεί να καθορίσει πλήρως την αρχική κατάσταση του περιβάλλοντος.

Αυτό δεν ισχύει για ένα στοχαστικό περιβάλλον, καθώς είναι τυχαίο και δεν εξαρτάται πλήρως από έναν agent.

Εάν το περιβάλλον είναι ντετερμινιστικό και πλήρως παρατηρήσιμο, ο agent δεν χρειάζεται να ανησυχεί για την αβεβαιότητα.

3. Επεισοδιακό έναντι (vs) Διαδοχικού

Ένα επεισοδιακό περιβάλλον αποτελείται από μια σειρά από μεμονωμένες ενέργειες και ο agent χρειάζεται μόνο την τρέχουσα αντίληψη για την ενέργεια.

Σε ένα διαδοχικό περιβάλλον, ο agent χρειάζεται τη μνήμη των προηγούμενων ενεργειών του για να καθορίσει τις επόμενες ενέργειές του.

4. Single-agent έναντι (vs) Multi-agent

Ένα περιβάλλον ενός agent είναι αυτό στο οποίο έχουμε μόνο έναν agent που λειτουργεί μόνος του.

Ένα περιβάλλον πολλαπλών agents είναι αυτό στο οποίο έχουμε πολλαπλούς agents που λειτουργούν στο περιβάλλον.

Τα προβλήματα σχεδιασμού agents είναι διαφορετικά στα δύο περιβάλλοντα.

5. Στατικό έναντι (vs) Δυναμικό

Ένα δυναμικό περιβάλλον είναι αυτό που μπορεί να αλλάξει τον εαυτό του ενώ ο agent συζητά. Διαφορετικά, το περιβάλλον αναφέρεται ως στατικό

Είναι εύκολο να αντιμετωπίσετε στατικά περιβάλλοντα, επειδή ένας agent δεν απαιτείται να κοιτάζει ή να παρατηρεί το περιβάλλον κατά την επιλογή μιας ενέργειας.

Ωστόσο, στην περίπτωση δυναμικών περιβαλλόντων, ο agent θα πρέπει να συνεχίζει να κοιτάζει το περιβάλλον σε κάθε ενέργεια.

Ένα παράδειγμα στατικού περιβάλλοντος είναι το σταυρόλεξο. Ένα παράδειγμα δυναμικού περιβάλλοντος είναι η οδήγηση ταξί.

6. Διακριτό έναντι (vs) Συνεχές

Ένα διακριτό περιβάλλον είναι ένα περιβάλλον στο οποίο υπάρχει ένας πεπερασμένος αριθμός αντιλήψεων και ενεργειών που μπορούν να εκτελεστούν μέσα σε αυτό. Διαφορετικά, ονομάζεται συνεχές περιβάλλον.

Για παράδειγμα, ένα παιχνίδι σκακιού είναι ένα παράδειγμα διακριτού περιβάλλοντος, καθώς υπάρχει μόνο ένας πεπερασμένος αριθμός κινήσεων που μπορούμε να κάνουμε.

Ωστόσο, ένα αυτόνομο αυτοκίνητο είναι ένα καλό παράδειγμα συνεχούς περιβάλλοντος.

7. Γνωστό έναντι (vs) Άγνωστο

Αυτά τα δύο δεν είναι χαρακτηριστικά του περιβάλλοντος, αλλά αναφέρονται στην κατάσταση γνώσης του agent για την εκτέλεση μιας συγκεκριμένης ενέργειας.

Σε ένα γνωστό περιβάλλον, ο μεσολαβητής – agent γνωρίζει τα αποτελέσματα κάθε ενέργειας. Σε ένα άγνωστο περιβάλλον, ο agent αναμένεται να μάθει πώς να εργάζεται για να εκτελέσει μια ενέργεια.

Είναι πιθανό ένα γνωστό περιβάλλον να είναι μερικώς παρατηρήσιμο και ένα άγνωστο περιβάλλον να είναι πλήρως παρατηρήσιμο.

8. Προσβάσιμο έναντι (vs) Μη Προσβάσιμο

Ένα προσβάσιμο περιβάλλον είναι αυτό στο οποίο ένας μεσολαβητής – agent είναι ικανός να λάβει πλήρεις και ακριβείς πληροφορίες σχετικά με την κατάσταση του περιβάλλοντος. Διαφορετικά, το περιβάλλον είναι γνωστό ως μη προσβάσιμο.

Ένα καλό παράδειγμα προσβάσιμου περιβάλλοντος είναι ένα άδειο δωμάτιο του οποίου την κατάσταση μπορούμε να ορίσουμε από τη θερμοκρασία του

Ένα καλό παράδειγμα ενός μη προσβάσιμου περιβάλλοντος είναι οι πληροφορίες σχετικά με ένα συμβάν στη Γη.

Συμπέρασμα

Ένα σύστημα τεχνητής νοημοσύνης αποτελείται τόσο από τον μεσολαβητή – agent όσο και από το περιβάλλον environment.
Κάθε ευφυής agent ενεργεί στο δικό του περιβάλλον και το περιβάλλον μπορεί να έχει και άλλους agents.
Οι ευφυείς agents αντιλαμβάνονται το περιβάλλον τους μέσω αισθητήρων και δρουν στο ίδιο περιβάλλον μέσω τελεστών.
Οι Μεσολαβητές (Agents) Τεχνητής Νοημοσύνης κατηγοριοποιούνται σε πέντε κατηγορίες ανάλογα με τον βαθμό αντιληπτής νοημοσύνης και ικανότητάς τους.
Ένας απλός αντανακλαστικός μεσολαβητής είναι η απλούστερη μορφή ενός ευφυούς μεσολαβητή.
Ένα περιβάλλον μεσολαβητή είναι οτιδήποτε στον κόσμο περιβάλλει έναν μεσολαβητή, αλλά δεν αποτελεί μέρος του.
Τα περιβάλλοντα των μεσολαβητών παρουσιάζει διαφορετικά χαρακτηριστικά.

Κατηγορία ARTIFICIAL INTELIGENCE | Δεν υπάρχουν σχόλια »

ΕΥΦΥΗ ΣΥΣΤΗΜΑΤΑ

Συγγραφέας: ΗΛΙΑΣ ΓΑΒΡΙΛΗΣ στις 29 Οκτωβρίου 2025

2-Ευφυή Συστήματα

Αυτό το άρθρο αφορά στους ευφυείς μεσολαβητές (inteligent agents). Θα περιγράψουμε τι είναι και πού εφαρμόζονται. Θα γνωρίσουμε επίσης τις προκλήσεις που αντιμετωπίζουν οι ευφυείς αυτοί agents όταν λειτουργούν στο περιβάλλον τους.

Τι είναι τα Ευφυή Συστήματα;

Τα ευφυή συστήματα είναι μηχανές τεχνολογικά προηγμένες ώστε να αντιλαμβάνονται και να ανταποκρίνονται στο περιβάλλον τους. Τα ευφυή συστήματα έχουν φέρει επανάσταση σε διάφορους κλάδους όπως η ασφάλεια, η κατασκευή, οι μεταφορές και η εφοδιαστική. Έχουν βοηθήσει στη βελτίωση της ποιότητας, της ενεργειακής απόδοσης και της ευελιξίας των συστημάτων.

Ένας από τους τρόπους με τους οποίους τα ευφυή συστήματα αντιλαμβάνονται το περιβάλλον τους είναι μέσω της όρασης. Η μελέτη του πώς οι υπολογιστές μπορούν να ερμηνεύσουν τις οπτικές πληροφορίες ξεκίνησε τη δεκαετία του 1950. Έκτοτε, έχει γίνει μια πολύ ισχυρή τεχνολογία και έχει εφαρμοστεί σε εμπορικούς, βιομηχανικούς και κυβερνητικούς τομείς. Μερικοί από τους παράγοντες που έχουν συμβάλει σε αυτήν την ανάπτυξη περιλαμβάνουν τη βελτιωμένη ταχύτητα του επεξεργασίας πληροφοριών, τους προηγμένους αλγόριθμους και την αυξημένη χωρητικότητα μνήμης.

Ο τομέας των ευφυών συστημάτων ασχολείται επίσης με τη μελέτη του τρόπου με τον οποίο τα συστήματα αλληλεπιδρούν με τους ανθρώπους για να επιφέρουν αλλαγές στο δυναμικό κοινωνικό και φυσικό περιβάλλον. Τα πρώτα ρομπότ είχαν πολύ μικρή αυτονομία στη λήψη αποφάσεων, δηλαδή υπέθεταν ότι ο κόσμος είναι προβλέψιμος και βασίζονταν στις ίδιες ενέργειες επανειλημμένα υπό παρόμοιες συνθήκες.

Εφαρμογές των Ευφυών Συστημάτων

Τα ευφυή συστήματα εφαρμόζονται στους ακόλουθους τομείς:

Αυτοματισμός εργοστασίων
Υποστηρικτική ρομποτική
Ρομποτική πεδίου και υπηρεσίας
Στρατιωτικές εφαρμογές
Εκπαίδευση
Ψυχαγωγία
Ιατρική περίθαλψη
Οπτική επιθεώρηση
Αναγνώριση χαρακτήρα
Οπτική επιτήρηση
Ανθρώπινη ταυτοποίηση με βιομετρικές μεθόδους όπως το πρόσωπο, η ίριδα, το δακτυλικό αποτύπωμα, το χέρι.
Ευφυείς μεταφορές.

Προκλήσεις που αντιμετωπίζουν τα Ευφυή Συστήματα

Υπάρχουν ορισμένες προκλήσεις που αντιμετωπίζουν τα ευφυή συστήματα.

Αυτές περιλαμβάνουν τις ακόλουθες:

1. Αβεβαιότητα – Οι φυσικοί αισθητήρες/ενεργοποιητές παρέχουν μόνο περιορισμένες, ανακριβείς και θορυβώδεις πληροφορίες/ενέργειες. Αυτό σημαίνει ότι ορισμένες από τις ενέργειες που λαμβάνει το σύστημα μπορεί να είναι ανακριβείς ως αποτέλεσμα του θορύβου στους αισθητήρες και των περιορισμών κατά την εκτέλεση των ενεργειών.

2. Δυναμικό κόσμο – ο κόσμος στον οποίο ζούμε αλλάζει δυναμικά. Αυτό σημαίνει ότι οι αποφάσεις πρέπει να λαμβάνονται σε γρήγορες χρονικές κλίμακες, ώστε να μπορούν να ληφθούν υπόψη οι αλλαγές στο περιβάλλον.

3. Χρονοβόρους υπολογισμούς – η διαδικασία αναζήτησης της βέλτιστης διαδρομής που οδηγεί στον στόχο περιλαμβάνει μια εκτεταμένη αναζήτηση που γίνεται σε έναν μεγάλο χώρο. Πρόκειται για μια υπολογιστικά δαπανηρή διαδικασία. Αυτό δημιουργεί μια πρόκληση, καθώς ο δυναμικός κόσμος μπορεί να αλλάξει κατά τη διάρκεια του υπολογισμού και το υπολογισμένο αποτέλεσμα μπορεί να είναι άχρηστο.

4. Χαρτογράφηση – πολλές πληροφορίες χάνονται κατά τη μετατροπή από έναν τρισδιάστατο σε έναν δισδιάστατο κόσμο. Η υπολογιστική όραση πρέπει να αντιμετωπίσει προβλήματα όπως οι αλλαγές στην προοπτική της όρασης, θόρυβος ή κίνηση φόντου, φωτισμός και κλίμακα, και ομαδοποιήσεις αντικειμένων με βάση την ενδοκλασική/διακλαδική διακύμανση.

Συμπέρασμα

Τα ευφυή συστήματα είναι μηχανές τεχνολογικά προηγμένες ώστε να αντιλαμβάνονται και να ανταποκρίνονται στο περιβάλλον τους.
Αρκετοί τομείς, όπως η ασφάλεια και η κατασκευή, έχουν επωφεληθεί πολύ από τα ευφυή συστήματα.
Τα ευφυή συστήματα αντιλαμβάνονται το περιβάλλον τους χρησιμοποιώντας αισθητήρες και ενεργούν στο ίδιο περιβάλλον μέσω τελεστών.
Τα ευφυή συστήματα εφαρμόζονται σε μια μεγάλη ποικιλία βιομηχανιών, συμπεριλαμβανομένων των μεταφορών, της ασφάλειας, της κατασκευής και άλλων, της υγειονομικής περίθαλψης.
Μία από τις μεγαλύτερες προκλήσεις που αντιμετωπίζουν τα ευφυή συστήματα είναι η δυναμική φύση του περιβάλλοντος στο οποίο ενεργούν.

Κατηγορία ARTIFICIAL INTELIGENCE | Δεν υπάρχουν σχόλια »

« Παλιότερα άρθρα

elgavrilis's blog

ΕΝΑ ΙΣΤΟΛΟΓΙΟ ΓΙΑ ΤΙΣ ΦΥΣΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Blogs.sch.gr

Κατηγορίες

Αρχεία

Εγγραφή στη λίστα

Μετα-πληροφορίες

Πρόσφατα άρθρα

Σύνδεσμοι

Αρχεία για 'ARTIFICIAL INTELIGENCE' Κατηγορία

ΠΩΣ ΤΑ ΝΕΥΡΟΝΙΚΑ ΔΙΚΤΥΑ ΜΑΘΑΙΝΟΥΝ ΑΠΌ ΕΜΠΕΙΡΙΑ

ΕΠΙΛΥΣΗ ΠΡΟΒΛΗΜΑΤΩΝ ΜΕΣΩ ΑΝΑΖΗΤΗΣΗΣ

ΑΣΑΦΗΣ ΛΟΓΙΚΗ – FUZZY LOGIC

ΕΥΦΥΕΙΣ ΜΕΣΟΛΑΒΗΤΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ

ΕΥΦΥΗ ΣΥΣΤΗΜΑΤΑ