Μαλλιαρίδης Κωνσταντίνος (Υποψήφιος Διδάκτορας)

Τίτλος διατριβής: Εργαλεία AutoML για την εύκολη ανάλυση δεδομένων
Επιβλέπων: Ουγιάρογλου Στέφανος
Μέλη Συμβουλευτικής Επιτροπής:
Κωνσταντίνος Διαμαντάρας, Καθηγητής, Τμήμα Μηχανικών Πληροφορικής & Ηλεκτρονικών Συστημάτων, ΔΙΠΑΕ
Αντώνης Σιδηρόπουλος, Αναπ. Καθηγητής, Τμήμα Μηχανικών Πληροφορικής & Ηλεκτρονικών Συστημάτων, ΔΙΠΑΕ
Περίληψη:

Η παρούσα πρόταση διδακτορικής έρευνας στοχεύει στην προώθηση του πεδίου της Εξόρυξης Γνώσης και της Μηχανικής Μάθησης μέσω της ανάπτυξης χρηστικών, διαδικτυακών εφαρμογών και υπηρεσιών που αυτοματοποιούν τις διαδικασίες της Εξόρυξης Γνώσης και της εκπαίδευσης μοντέλων Μηχανικής Μάθησης. Η έλλειψη εξειδικευμένου ανθρώπινου δυναμικού στην ανάλυση δεδομένων σε σύγκριση με την αυξανόμενη ζήτηση για τέτοια ειδίκευση αποτελεί πρόκληση. Για να αντιμετωπιστεί αυτό το κενό, προτείνεται η δημιουργία διαδικτυακών εργαλείων που είναι εύκολα προσβάσιμα, εξαλείφοντας την ανάγκη για εξειδικευμένες γνώσεις στην μηχανική μάθηση, τον προγραμματισμό και εξειδικευμένα λογισμικά. Το κύριο ενδιαφέρον επικεντρώνεται στην αυτοματοποίηση της μάθησης κανόνων συσχέτισης (association rules learning) και της εξόρυξης συχνών στοιχειοσυνόλων (frequent item sets mining), που θα είναι προσβάσιμη σε μη-ειδικούς χρήστες. Οι στόχοι περιλαμβάνουν την υλοποίηση αλγορίθμων, την αξιολόγηση της απόδοσης τους και σύγκριση τους σε διαφορετικού τύπου σύνολα δεδομένων, την αυτόματη χαρακτηριστικοποίηση συνόλων δεδομένων, την αυτόματη επιλογή αλγορίθμου για κάθε σύνολο δεδομένων, τον αυτόματο προσδιορισμό υπερπαραμέτρων, την αυτόματη εξάλειψη πλεονασματικών κανόνων συσχέτισης, και εν τέλη, ανάπτυξη διαδικτυακών εφαρμογών και υπηρεσιών μέσω των οποίων μη-ειδικοί χρήστες θα μπορούν να εκτελούν εξόρυξη κανόνων συσχέτισης στα δεδομένα τους. Επιπλέον, θα διερευνηθεί η δυνατότητα ανάπτυξης καινοτόμων διαδικτυακών εργαλείων αυτόματης μη εποπτευόμενης μάθησης και αυτοματοποιημένων τεχνικών προ-επεξεργασίας δεδομένων. Συνολικά, η έρευνα επιδιώκει να “δημοκρατίσει” τον τομέα της εξόρυξης δεδομένων και της μηχανικής μάθησης, προωθώντας την προσβασιμότητα του σε ένα ευρύ κοινό.