Ανάλυση δεδομένων –που λέει ο λόγος

Ανάλυση δεδομένων –που λέει ο λόγος

Όπως έχω γράψει επανειλημμένα στο παρελθόν, είμαι πολύ επιφυλακτικός απέναντι στο χείμαρρο καταστροφολογίας που σαρώνει κατά κύματα τα ΜΜΕ και που σχετίζεται με τη συλλογή και την επεξεργασία των δεδομένων μας από τον… Άξονα του Κακού όπως αυτός υλοποιείται από τη Facebook, την Google και τους άλλους μικρούς και μεγάλους καβαλάρηδες της τεχνολογικής αποκάλυψης. Και αυτό γιατί έχω μεγάλη εμπιστοσύνη στην ανθρώπινη βλακεία: καθώς ο όγκος των δεδομένων γίνεται καθημερινά όλο και μεγαλύτερος είναι απολύτως βέβαιο ότι οι εταιρείες θα καταφεύγουν για την ανάλυσή τους σε προγράμματα τα οποία –προς το παρόν τουλάχιστον- δε διαθέτουν αρκετή ευφυΐα ώστε να γίνουν επικίνδυνα.

Διάβαζα για παράδειγμα ένα άρθρο στο TIME, γραμμένο μάλιστα και από έγκριτο και σαφώς σχετικό με τα τεχνολογικά συντάκτη, τον Κρις Ουΐλσον το οποίο έχει τίτλο «Βρείτε ποιοι από τους φίλους σας στο Facebook σας κάνουν χαρούμενους»∙ ξεκινώντας από το πόρισμα μιας έρευνας που αποφαίνεται ότι τα συναισθήματα που εκφράζουν οι φίλοι μας στα social media έχουν επίπτωση και στα δικά μας, το άρθρο χρησιμοποιεί μια εφαρμογή στηριγμένη σε ένα πρόγραμμα που ονομάζεται «Γλωσσική Διερεύνυση και Καταμέτρηση Λέξεων» (ή Linguistic Inquiry and Word Count/LIWC) για να μετρήσει αυτό ακριβώς που λέει ο τίτλος του.

Τα αποτελέσματα ήταν πραγματικά ξεκαρδιστικά: μέσα στην κορυφαία (κατά την εφαρμογή) 20άδα των φίλων «που με κάνουν χαρούμενο» υπάρχουν τουλάχιστον τέσσερις καταθλιπτικοί οι οποίοι σπάνια εκφράζουν κάτι θετικό στα status updates τους, ένας άνθρωπος τον οποίο έχω μπλοκάρει από καιρό λόγω σοβαρών θεωρητικών (και όχι μόνο) διαφωνιών και ένας ακόμα άνθρωπος ο οποίος ξέρω ότι με απεχθάνεται και ο οποίος έτσι κι αλλιώς ποστάρει κατά 95% γύρω από ένα θέμα το οποίο μου είναι απολύτως αδιάφορο. Στον αντίποδα εμφανίζονται μόνο δύο (2) άνθρωποι τα status updates των οποίων μου προκαλούν πραγματική χαρά.

Τι μας λένε τα παραπάνω –πέραν του ότι μάλλον πρέπει να κάνω ένα ξεκαθάρισμα στους φίλους μου στο FB; Ότι η σοβαρότητα του επιστημονικού υπόβαθρου ενός μηχανισμού φιλτραρίσματος δεδομένων δεν αποτελεί εγγύηση ότι ο μηχανισμός θα είναι ακριβής και ότι θα φέρει αξιόπιστα αποτελέσματα. Και παρότι είμαι σίγουρος ότι οι μεγάλες εταιρείες θα έχουν καλύτερο και ακριβότερο λογισμικό ανάλυσης (το προαναφερθέν LIWC κοστίζει περί τα 100 δολάρια), διατηρώ τις επιφυλάξεις μου ακόμα και γι αυτό –ας μην ξεχνάμε ότι η μεγάλη Facebook δεν είχε λογισμικό που μπορούσε να διακρίνει τη διαφορά μεταξύ μιας σελίδας πορνό και μιας σελίδας για τον καρκίνο του μαστού!

 

ΔΕΔΟΜΕΝΑ,ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ,Big Data,

Σχόλια

ΠΑΡΑΚΑΛΩ ΠΕΡΙΜΕΝΕΤΕ. ΦΟΡΤΩΝΟΝΤΑΙ ΠΕΡΙΣΣΟΤΕΡΑ...

Home