1) Το παρακάτω σύνολο δεδομένων περιλαμβάνει 1000 εγγραφές ασθενών, καθεμία από τις οποίες περιγράφει το προφίλ γονιδιακής έκφρασης καθώς και σχετικών κλινικών χαρακτηριστικών τους. Τα δεδομένα αποτελούνται από ένα μείγμα αριθμητικών και κατηγορηματικών (διακριτών) δεδομένων, επιτρέποντας την εφαρμογή ποικίλων μεθόδων μηχανικής μάθησης και στατιστικής ανάλυσης.
https://grafis.sch.gr/index.php/s/RYgBxpkktcQF53E
Αφού κατεβάσουμε το αρχείο θα το επεξεργαστούμε στην τάξη και θα προσπαθήσουμε να αναλύσουμε την σχέση μεταξύ των γονιδίων και της πάθησης.
2) Σε δεύτερη φάση θα χρησιμοποιήσουμε το αρχείο python https://grafis.sch.gr/index.php/s/CPAfgt6c8fziMjk για να μπορέσουμε να αναλύσουμε μεγαλύτερο όγκο δεδομένων χρησιμοποιώντας τις γραφικές παραστάσεις της python. Τα δεδομένα που θα χρησιμοποιήσουμε βρίσκονται στα αρχεία: https://grafis.sch.gr/index.php/s/T6m6tB2eMxLDa7J και https://grafis.sch.gr/index.php/s/XZ7NEx4aWMoPgA9.
Μετά το μάθημα μπορείτε να στείλετε την ανατροφοδότηση σας στον παρακάτω σύνδεσμο:
Πηγή δεδομένων: https://www.kaggle.com/datasets/ylmzasel/gene-expression-analysis-and-disease-relationship