Όταν τα data γίνονται μεγάλες… μπίζνες

dataΠώς οι πληροφορίες που καταγράφονται στο διαδίκτυο από πολυεθνικές εταιρίες οδηγούν σε έξυπνες «λύσεις» για τους καταναλωτές. Οι εφαρμογές στην ιατρική και στα αντικλεπτικά συστήματα αυτοκινήτων. Η περίπτωση της Google και της IBM.

Και όμως, οι επιλογές μας στο διαδίκτυο αλλά και στην καθημερινότητα καταγράφονται, ταξινομούνται και αναλύονται με σκοπό να αποτελέσουν τη βάση για την κατασκευή βάσεων δεδομένων τα οποία μεταμορφώνονται σε επιχειρηματική δραστηριότητα αλλά και σε εργαλείο άσκησης πολιτικής.

Ήδη εταιρίες κολοσσοί αξιοποιούν πληροφορίες που έχουν από τη δραστηριότητά τους και δημιουργούν έξυπνες εφαρμογές.

Παράδειγμα η UPS, η εταιρεία παράδοσης δεμάτων. Τοποθετεί αισθητήρες σε εξαρτήματα των οχημάτων της οι οποίοι δείχνουν αν δημιουργείται θερμότητα ή αναταράξεις που στο παρελθόν είχαν συνδεθεί με την καταστροφή τους. Με τον τρόπο αυτό, η εταιρεία μπορεί να προβλέψει μια βλάβη πριν αυτή προκύψει και να προβεί στην όποια αντικατάσταση όταν είναι η καταλληλότερη στιγμή και όχι στην άκρη του δρόμου. Τα δεδομένα δεν αποκαλύπτουν την ακριβή σχέση ανάμεσα στη θερμότητα ή τις αναταράξεις και στη βλάβη κάποιου τμήματος. Δεν λένε στη UPS γιατί ένα μέρος του οχήματος έχει πρόβλημα. Αλλά λένε τόσα ώστε η εταιρεία να ξέρει τι να κάνει στο άμεσο μέλλον, και για να καθοδηγήσει την έρευνά της σε οποιοδήποτε λανθάνων πρόβλημα μπορεί να υπάρχει είτε στο εν λόγω εξάρτημα είτε στο όχημα.

Παρόμοια προσέγγιση χρησιμοποιείται και στην ιατρική. Ερευνητές στον Καναδά αναπτύσσουν μια προσέγγιση μεγάλων δεδομένων για να εντοπίσουν λοιμώξεις σε πρόωρα μωρά, προτού εμφανιστούν τα συμπτώματα.

Εντοπίζοντας 16 ζωτικά σημάδια, συμπεριλαμβανομένων και των καρδιακών παλμών, της πίεσης του αίματος, της αναπνοής και των επιπέδων του οξυγόνου του αίματος, σε μια ροή πληροφόρησης άνω των 1.000 δεδομένων ανά δευτερόλεπτο, έχουν καταφέρει να βρουν συσχετίσεις ανάμεσα σε πολύ μικρές αλλαγές και σε πολύ σοβαρά προβλήματα.

Προφανώς, αυτή η τεχνική θα δώσει τη δυνατότητα στους γιατρούς να ενεργήσουν νωρίτερα και να σώσουν ζωές. Συν τω χρόνω, η καταγραφή αυτών των παρατηρήσεων μπορεί επίσης να επιτρέψει στους γιατρούς να καταλάβουν τι είναι αυτό που ουσιαστικά προκαλεί τέτοια προβλήματα.

Η ιατρική παρέχει ένα ακόμη καλό παράδειγμα ως προς το γιατί με τα μεγάλα δεδομένα, το να βλέπεις συσχετίσεις είναι τρομερά σημαντικό, ακόμη κι όταν οι λανθάνουσες αιτίες παραμένουν στο σκοτάδι. Τον Φεβρουάριο του 2009, η Google δημιούργησε αναστάτωση στους κύκλους των επαγγελμάτων υγείας. Ερευνητές της εταιρείας έκαναν μια επιστημονική δημοσίευση στο Nature που έδειξε ότι ήταν δυνατόν να προβλέψουν τις επιδημίες της εποχικής γρίπης, χρησιμοποιώντας μόνο τις αρχειοθετημένες καταγραφές των αναζητήσεων στην Google.

Η Google διαχειρίζεται πάνω από 1 δισ. αναζητήσεις στις ΗΠΑ καθημερινά, και τις φυλάσσει όλες. Η εταιρεία πήρε τα 50 εκατομμύρια από τις πιο κοινές αναζητήσεις ανάμεσα στο 2003 και το 2008 και τις συνέκρινε με ιστορικά δεδομένα γρίπης από τα Κέντρα Ελέγχου και Πρόληψης Ασθενειών (CDC).

Η ιδέα ήταν να ανακαλύψουν αν το γεγονός ορισμένων αναζητήσεων αντιστοιχούσε με επιδημίες γρίπης – με άλλα λόγια, κατά πόσον η αύξηση στη συχνότητα ορισμένων αναζητήσεων στο Google, σε μια συγκεκριμένη γεωγραφική περιοχή, συσχετιζόταν με τα δεδομένα του CDC ως προς τις τοπικές επιδημίες της γρίπης. Το CDC καταγράφει τις τρέχουσες επισκέψεις ασθενών στα νοσοκομεία και στις κλινικές όλης της χώρας, αλλά η πληροφόρηση που δίνει υπολείπεται της πραγματικότητας κατά μια-δύο εβδομάδες. Το σύστημα της Google, αντιθέτως, θα μπορούσε να δουλέψει σε σχεδόν πραγματικό χρόνο.

Η Google δεν έφθασε στο σημείο να πει ποια ερωτήματα θα ήταν οι καλύτεροι δείκτες. Αντιθέτως, έτρεξε όλους τους όρους μέσω ενός αλγόριθμου που φτιάχνει μια κατάταξη ως προς τον βαθμό συσχέτισής τους με τις επιδημίες γρίπης. Ακολούθως, το σύστημα προσπάθησε να συνδυάσει τους όρους για να δει αν αυτό θα βελτίωνε το μοντέλο.

Εν τέλει, αφού πρώτα έτρεξε σχεδόν μισό δισεκατομμύριο υπολογισμούς και τους συνδύασε με τα δεδομένα, η Google εντόπισε 45 όρους -λέξεις όπως «πονοκέφαλος» και «καταρροή μύτης»- που είχαν ισχυρό βαθμό συσχέτισης με τα δεδομένα του CDC αναφορικά με τις επιδημίες γρίπης.

Άπαντες οι 45 όροι σχετίζονταν, με κάποιον τρόπο, με τη γρίπη. Αλλά με 1 δισεκατομμύριο αναζητήσεις την ημέρα, θα ήταν αδύνατον για ένα πρόσωπο να μαντέψει ποιοι μπορούν να δουλέψουν καλύτερα, και να δοκιμάσει μόνο αυτούς.

Επιπλέον, τα δεδομένα ήταν ατελή. Από τη στιγμή που τα δεδομένα δεν προορίζονταν να χρησιμοποιηθούν κατ’ αυτόν τον τρόπο, η ανορθογραφία και οι μισοτελειωμένες φράσεις ήταν κάτι σύνηθες. Αλλά το μεγάλο μέγεθος των δεδομένων αντιστάθμιζε την ακαταστασία του. Το αποτέλεσμα, βεβαίως, ήταν απλώς μια συσχέτιση. Δεν έλεγε τίποτα για τους λόγους για τους οποίους κάποιος έκανε μια ορισμένη αναζήτηση. Ήταν άραγε διότι το πρόσωπο ένιωθε άρρωστο ή γιατί άκουγε κάποιον να φταρνίζεται στο διπλανό δωμάτιο ή γιατί ανησύχησε ακούγοντας τις ειδήσεις; Το σύστημα της Google ούτε το ξέρει και ούτε το νοιάζει να το μάθει. Πράγματι, το σύστημα της Google πρέπει να υπερεκτίμησε τον αριθμό των περιπτώσεων επιδημίας στις ΗΠΑ. Αυτό συνιστά μια υπενθύμιση ότι οι προβλέψεις είναι μόνο πιθανότητες και ότι δεν είναι πάντα σωστές, ειδικά όταν η βάση για την πρόβλεψη -οι αναζητήσεις στο Διαδίκτυο- βρίσκεται σε σταθερή κατάσταση αλλαγής και είναι ευάλωτη σε εξωτερικές επιρροές, όπως οι αναφορές των ΜΜΕ.

Παρά ταύτα, τα «μεγάλα δεδομένα» μπορούν να υπαινιχθούν ποια είναι η γενική κατεύθυνση μιας εν εξελίξει κατάστασης, και το σύστημα της Google έκανε ακριβώς αυτό.

Λίγοι θα σκέφτονταν ότι ο τρόπος που κάθεται ένας άνθρωπος αποτελεί πληροφορία, αλλά ισχύει. Όταν ένα άτομο είναι καθισμένο, η καμπύλη του σώματος, η στάση του και η κατανομή του βάρους του μπορούν όλα να ποσοτικοποιηθούν και να πινακογραφηθούν. Μηχανικοί μετατρέπουν τους γλουτούς σε δεδομένα μετρώντας, με αισθητήρες τοποθετημένους στο κάθισμα του αυτοκινήτου, την πίεση που ασκούν αυτοί σε 360 διαφορετικά σημεία, και καταγραφούν κάθε σημείο σε μια κλίμακα από το 0 ως το 256. Το αποτέλεσμα είναι ένας ψηφιακός κώδικας που είναι μοναδικός για το κάθε άνθρωπο. Σε μια δοκιμή, το σύστημα ήταν ικανό να ξεχωρίσει μεταξύ αρκετών ανθρώπων με ακρίβεια της τάξης του 98%.

Η έρευνα δεν είναι άνευ νοήματος. Το σχέδιο είναι να προσαρμοστεί η τεχνολογία σε ένα αντικλεπτικό σύστημα αυτοκινήτων. Ένα όχημα με αυτόν τον μηχανισμό θα μπορούσε να αναγνωρίσει πότε κάποιος άλλος εκτός από τον εγκεκριμένο οδηγό κάθισε μπροστά στο τιμόνι, και θα μπορούσε να ζητήσει ένα συνθηματικό κωδικό για να λειτουργήσει.

Ο μετασχηματισμός των τρόπων που καθόμαστε σε ψηφιακά δεδομένα δημιουργεί μια σημαντική υπηρεσία και μια εν δυνάμει επικερδή επιχείρηση. Και η χρησιμότητά της μπορεί να επεκταθεί πολύ πέρα από τον εντοπισμό ενός κλέφτη αυτοκινήτων. Για παράδειγμα, τα συγκεντρωθέντα δεδομένα μπορούν να αποκαλύψουν στοιχεία για τη σχέση ανάμεσα στη θέση του οδηγού και την οδική ασφάλεια, όπως αποκαλυπτικές μετατοπίσεις θέσεων πριν από ένα ατύχημα. Το σύστημα μπορεί επίσης να είναι ικανό να αισθανθεί πότε ένας οδηγός κάμπτεται ελαφρώς λόγω κούρασης, και να στέλνει σήμα κινδύνου ή να πατάει αυτομάτως τα φρένα.

Μόλις φτιάξουμε δεδομενα μέσα από τα πράγματα, μπορούμε να αλλάξουμε τον σκοπό της ύπαρξής τους και να μετατρέψουμε την πληροφορία σε μορφές άλλης αξίας. Για παράδειγμα, η ΙΒΜ κατοχύρωσε μια αμερικανική πατέντα το 2012 «για να ασφαλίσει χώρους που χρησιμοποιούν τεχνολογία υπολογιστών πάνω σε επιφάνειες» -ένας τεχνικός όρος να περιγράψεις ένα πάτωμα αφής, κάτι σαν μια γιγάντια οθόνη έξυπνου τηλεφώνου. Τα δεδομένα που προέρχοναται από το πάτωμα  μπορούν να ανοίξουν κάθε είδους δυνατότητες.

Το πάτωμα θα μπορούσε να ταυτοποιήσει τα αντικείμενα που είναι πάνω σε αυτό, έτσι ώστε να ξέρει πότε να ανοίξει τα φώτα ή να ανοίξει τις πόρτες όταν μπαίνει κάποιος άνθρωπος. Επιπλέον, μπορεί να ταυτοποιεί πρόσωπα με βάση το βάρος τους ή με βάση το πώς στέκονται και περπατούν. Θα μπορούσε να πει αν κάποιος έπεσε και δεν ξανασηκώθηκε, σημαντικό στοιχείο για τους ηλικιωμένους. Οι πωλητές θα μπορούσαν να αποτυπώνουν τη ροή δεδομένων των πελατών τους από τα μαγαζιά τους.

Όταν θα έχει γίνει εφικτό να μετατραπούν δραστηριότητες αυτού του είδους σε δεδομένα που μπορούν να αποθηκευτούν και να αναλυθούν, θα μπορούμε να μάθουμε περισσότερα για τον κόσμο – πράγματα που δεν γνωρίζαμε προηγουμένως επειδή δεν μπορούσαμε να τα μετρήσουμε εύκολα και φθηνά.

Πηγή: EURO2day

 

Αφήστε μια απάντηση

Η διεύθυνση του email σας δεν θα δημοσιευθεί.

Αλλαγή μεγέθους γραμματοσειράς
Αντίθεση