Το έργο

Περιγραφή - Στόχοι

Το HAR.S.H. στοχεύει στην αντιμετώπιση σημαντικών προκλήσεων στην επεξεργασία μεγάλης κλίμακας συλλογών σειρών δεδομένων που προκύπτουν από πραγματικές εφαρμογές. Οι συλλογές σειρών δεδομένων μεγάλης κλίμακας συναντώνται πλέον σχεδόν σε κάθε επιστημονικό και κοινωνικό τομέα. Το HAR.S.H. θα σχεδιάσει και θα υλοποιήσει μια εκτενή συλλογή αλγορίθμων, δομών δεδομένων και μηχανισμών για την αντιμετώπιση του προβλήματος κλιμακωσιμότητας στην ανάλυση μεγάλου όγκου σειρών δεδομένων, χρησιμοποιώντας σύγχρονες και αναδυόμενες τεχνολογίες υλικού. Οι αλγόριθμοι, οι δομές δεδομένων και οι μηχανισμοί που θα αναπτυχθούν, θα αποτελέσουν μια ισχυρή βιβλιοθήκη, διασφαλίζοντας έτσι τη δυνατότητα της εύκολης και αποτελεσματικής τους χρήσης από ευρεία συλλογή εφαρμογών. Συγκεκριμένα, το HAR.S.H. αποσκοπεί στα εξής:

  • θα σχεδιάσει και θα αναπτύξει μια νέα γενιά αλγορίθμων και δομών δεδομένων που θα επιτρέπουν την αποδοτική παράλληλη/κατανεμημένη αναζήτηση ομοιότητας σε μεγάλες συλλογές σειρών δεδομένων,
  • θα αξιοποιήσει σύγχρονες τεχνολογίες υλικού, μελετώντας τις επιπτώσεις τους στην απόδοση και την κλιμακωσιμότητα τέτοιου είδους λογισμικού,
  • θα καταστήσει δυνατή την ανάλυση σε πολυτροπικά δεδομένα, συμπεριλαμβανομένων κειμένων, εικόνων και βίντεο, μέσω ενσωματώσεων με χρήση μοντέλων βαθιάς μηχανικής μάθησης.

Πιλοτικές Εφαρμογές

Το HAR.S.H. θα αποδείξει την αξία της τεχνολογίας που θα παράγει μέσω των εξής τριών πιλοτικών εφαρμογών:

Πιλοτική Εφαρμογή 1 – Αναζήτηση παρόμοιων εγγράφων και αρχείων. Η εφαρμογή εστιάζει στην ανεύρεση παρόμοιων εγγράφων σε ογκώδεις βάσεις δεδομένων εγγράφων.

Πιλοτική Εφαρμογή 2 – Ανάλυση φωτογραφιών για βελτίωση ταξιδιωτικών προφίλ. Η εφαρμογή εστιάζει στην ανάλυση φωτογραφικού περιεχομένου για τον εμπλουτισμό ταξιδιωτικών προφίλ για εξατομικευμένα συστήματα ταξιδιωτικών συστάσεων. Ο βασικός στόχος είναι η μεγιστοποίηση της ικανοποίησης του επισκέπτη από έναν τουριστικό προορισμό.

Πιλοτική Εφαρμογή 3 – Εφαρμογή ανάλυσης της κοινής γνώμης. Η εφαρμογή αποσκοπεί στη διαχείριση της πολυπλοκότητας και του κόστους που συνεπάγεται η παρακολούθηση και η κατηγοριοποίηση περιεχομένου από τα μέσα κοινωνικής δικτύωσης, παρέχοντας πολύτιμες πληροφορίες για τη γνώμη των πολιτών σε διάφορα πλαίσια.

Για να ανταπεξέλθει στις ανάγκες των παραπάνω εφαρμογών, το HAR.S.H. θα καινοτομήσει στους ακόλουθους τομείς:

  1. Συμπαγής και περιγραφική αναπαράσταση πολυτροπικών δεδομένων. Το HAR.S.H. αποσκοπεί στην ανάπτυξη αποδοτικών τεχνικών για το χειρισμό πολυτροπικών δεδομένων. Το έργο θα εξερευνήσει διαφορετικές πηγές δεδομένων, ειδικότερα εικόνες, βίντεο, και κείμενο φυσικής γλώσσας, τα οποία μπορούν να ενσωματωθούν από άκρο σε άκρο.
  2. Εύρωστοι μηχανισμοί για υψηλής απόδοσης επεξεργασία συλλογών σειρών δεδομένων μεγάλης κλίμακας. Το HAR.S.H. θα αυξήσει την απόδοση και την ευρωστία στην απάντηση ερωτημάτων ομοιότητας πάνω σε συλλογές σειρών δεδομένων μεγάλης κλίμακας 1) αξιοποιώντας την πλήρη υπολογιστική ισχύ των σύγχρονων πλατφορμών, 2) αναπτύσσοντας μηχανισμούς επεξεργασίας που θα συνυπολογίζουν το υλικό για να ελαχιστοποιήσουν το κόστος και να επιτρέψουν γρήγορη παράλληλη και κατανεμημένη επεξεργασία και 3) επινοώντας εύρωστες τεχνικές που θα υποστηρίζουν αποτυχίες νημάτων και θα επιτρέπουν γρήγορη ανάκτηση του υπολογισμού μετά από συνολικές αποτυχίες του συστήματος. Το HAR.S.H. θα επικεντρωθεί κύρια σε αναδυόμενες τεχνολογίες μνήμης, συγχρονισμού και επικοινωνίας και θα μελετήσει πώς η αξιοποίηση τέτοιων τεχνολογιών μπορεί να επηρεάσει την επεξεργασία σειρών δεδομένων.

Τεχνικά Πακέτα Εργασίας

Η εργασία στο HAR.S.H. θα πραγματοποιηθεί μέσω των εξής τεσσάρων τεχνικών πακέτων εργασίας:

Το Πακέτο Εργασίας 2 (ΠΕ2) θα επιτρέψει τον μετασχηματισμό διαφορετικών συνόλων δεδομένων, συμπεριλαμβανομένων εικόνων, βίντεο και κειμένου, σε ενοποιημένες ενσωματώσεις, χρησιμοποιώντας αλγορίθμους και μοντέλα βαθιάς μηχανικής μάθησης.

Το Πακέτο Εργασίας 3 (ΠΕ3) θα παρέχει ενότητες λογισμικού χαμηλού επιπέδου για επεξεργασία σειρών δεδομένων σε μοντέρνες υπολογιστικές πλατφόρμες, συνυπολογίζοντας τόσο την υπολογιστική δύναμη της ίδιας της πλατφόρμας, αλλά και σύγχρονων επιμέρους τεχνολογιών υλικού.

Το Πακέτο Εργασίας 4 (ΠΕ4) θα καθορίσει τα σύνολα δεδομένων του έργου, τις ανάγκες των πιλοτικών (και άλλων σύγχρονων) εφαρμογών  και θα σχεδιάσει την διεπαφή χρήσης του HAR.S.H..

Το Πακέτο Εργασίας 5 (ΠΕ5) θα ενσωματώσει το λογισμικό που θα παραχθεί στην πλατφόρμα του HAR.S.H. και θα το χρησιμοποιήσει για την ανάπτυξη των πιλοτικών εφαρμογών.

Διάγραμμα Έργου HAR.S.H.

Ισότητα Φύλων

H προτεινόμενη έρευνα είναι ουδέτερη ως προς τη διάσταση του φύλου και, ως εκ τούτου, δεν θίγει διαστάσεις που είναι ευαίσθητες ως προς αυτό το θέμα. Η ερευνητική ομάδα, συμπεριλαμβανομένων όλων των μελών της ομάδας εργασίας των διαφόρων δικαιούχων του έργου, αναγνωρίζει τη σημασία των ζητημάτων του φύλου, ιδίως στους τεχνολογικούς τομείς που σχετίζονται με τις θετικές επιστήμες και τη μηχανική. Τα μέλη του έργου δεσμεύονται να εργαστούν για την επίτευξη ουδετερότητας ως προς το φύλο σε όλες τις διαστάσεις αυτού (και των μελλοντικών) έργου/ων.

Η Κύρια Ερευνήτρια (PI), Καθ. Παναγιώτα Φατούρου, είναι γυναίκα που ασχολείται ενεργά με την προώθηση της ισότητας των φύλων στην επιστήμη των υπολογιστών. Είναι η ιδρύτρια και πρώτη πρόεδρος του Ελληνικού Παραρτήματος της ACM για τις γυναίκες στην Επιστήμη και έχει συμβάλει σημαντικά σε πρωτοβουλίες για την ισότητα των φύλων, μεταξύ άλλων ως πρόεδρος της επιτροπής αξιολόγησης για το βραβείο ισότητας Minerva Informatics το 2018. Έχει επίσης διατελέσει μέλος της Διαχειριστικής Επιτροπής της δράσης COST EUGAIN: European Network For Gender Balance in Informatics και μέλος της συμβουλευτικής επιτροπής για το χρηματοδοτούμενο από την Ευρωπαϊκή Επιτροπή έργο RESET: Redesigning Equality and Scientific Excellence Together.

Η Π. Φατούρου έχει συνδιοργανώσει και προεδρεύσει στα εξής δύο Summits on Gender Equality in Computing (GEC 2019, GEC 2020) και έχει διατελέσει επιστημονική διευθύντρια και πρόεδρος της οργανωτικής επιτροπής του 1ου Θερινού Σχολείου για τις Γυναίκες στην Επιστήμη, την Τεχνολογία, τη Μηχανική και τα Μαθηματικά (WISTEM 2019). Έχει επίσης συμβάλει στη διοργάνωση του ACM-W Europe Celebration of Women in Computing (womENcourage) τα έτη 2015, 2016 και 2017.

Η Π. Φατούρου έχει δημοσιεύσει τις ακόλουθες σχετικές εργασίες:

  1. Panagiota Fatourou, Yota Papageorgiou, Vasiliki Petousi, “Women are needed in STEM: European policies and incentives”, Communications of the ACM (CACM), pp. 52-57, Vol. 62, No. 4, 2019.
  2. Panagiota Fatourou, Chris Hankin, and Bran Knowles, “Gender Bias in Automated Decision Making Systems”, Endorsed by the ACM Europe Technology Policy Committee, pp. 1-28, March 2021.
  3. The EU Mutual Learning Programme in Gender Equality – Artificial Intelligence and Gender Biases in Recruitment and Selection Processes. 12-13 November 2020. Comments paper – Greece, by P. Fatourou.

Η Π. Φατούρου θα κάνει κάθε δυνατή ενέργεια για την υποστήριξη των γυναικών στην επιστήμη και θα συνεχίσει να συμβάλλει στην επίτευξη ουδετερότητας των φύλων στην επιστήμη της.

Αναζήτηση Ομοιότητας σε Μεγάλες Συλλογές Σειρών Δεδομένων συνυπολογίζοντας το Yλικό

HAR.S.H.: Hardware-Aware extReme-scale Similarity search

  • Κωδικός Έργου: ΥΠ3ΤΑ-0560901
  • Ημερομηνία Έναρξης Έργου: 15 Απριλίου 2025
  • Ημερομηνία Λήξης Έργου: 31 Μαΐου 2026
  • Διαχειριστική Αρχή: Επιτελική Δομή ΕΣΠΑ Τομέα Παιδείας του Υπουργείου Παιδείας και Θρησκευμάτων, ΕΛΛΑΔΑ 2.0, ΕΘΝΙΚΟ ΣΧΕΔΙΟ ΑΝΑΚΑΜΨΗΣ και ΑΝΘΕΚΤΙΚΟΤΗΤΑΣ
  • Συντονιστής Σύμπραξης: Πανεπιστήμιο Κρήτης (ΠΚ), Ειδικος Λογαριαμός Κονδυλίων Ερευνας (ΕΛΚΕ)
Κύλιση στην κορυφή