Ποιες είναι οι μεγαλύτερες ανησυχίες των επιστημόνων δεδομένων;  Η έκθεση State of Data Science 2022 έχει τις απαντήσεις

Ποιες είναι οι μεγαλύτερες ανησυχίες των επιστημόνων δεδομένων; Η έκθεση State of Data Science 2022 έχει τις απαντήσεις

Dezember 4, 2022 0 Von admin

Για να ενισχύσουμε περαιτέρω τη δέσμευσή μας να παρέχουμε κορυφαία στον κλάδο κάλυψη της τεχνολογίας δεδομένων, η VentureBeat είναι ενθουσιασμένη που καλωσορίζει τον Andrew Brust και τον Tony Baer ως τακτικούς συνεισφέροντες. Παρακολουθήστε τα άρθρα τους στο Data Pipeline.

Η επιστήμη των δεδομένων είναι μια ταχέως αναπτυσσόμενη τεχνολογία, καθώς οι οργανισμοί όλων των μεγεθών αγκαλιάζουν την τεχνητή νοημοσύνη (AI) και τη μηχανική μάθηση (ML), και μαζί με αυτήν την ανάπτυξη δεν έλειψαν οι ανησυχίες.

Η έκθεση State of Data Science για το 2022, που κυκλοφόρησε σήμερα από τον προμηθευτή της πλατφόρμας επιστήμης δεδομένων Ανακόνδας, προσδιορίζει βασικές τάσεις και ανησυχίες για τους επιστήμονες δεδομένων και τους οργανισμούς που τους απασχολούν. Μεταξύ των τάσεων που εντόπισε το Anaconda είναι το γεγονός ότι η γλώσσα προγραμματισμού Python ανοιχτού κώδικα συνεχίζει να κυριαρχεί στο τοπίο της επιστήμης δεδομένων.

Μεταξύ των βασικών ανησυχιών που εντοπίστηκαν στην έκθεση ήταν τα εμπόδια στην υιοθέτηση της επιστήμης δεδομένων συνολικά.

«Ένας τομέας που με εξέπληξε ήταν ότι τα 2/3 των ερωτηθέντων θεώρησαν ότι το μεγαλύτερο εμπόδιο για την επιτυχημένη επιχειρηματική υιοθέτηση της επιστήμης των δεδομένων είναι η ανεπαρκής επένδυση στη μηχανική δεδομένων και τα εργαλεία για να καταστεί δυνατή η παραγωγή καλών μοντέλων», δήλωσε ο Peter Wang, Διευθύνων Σύμβουλος και συνιδρυτής της Anaconda. είπε στο VentureBeat. «Γνωρίζαμε πάντα ότι η επιστήμη των δεδομένων και η μηχανική μάθηση μπορεί να υποφέρουν από κακά μοντέλα και εισροές, αλλά ήταν ενδιαφέρον να δούμε τους ερωτηθέντες μας να το κατατάσσουν ακόμη υψηλότερα από το χάσμα ταλέντων/αριθμού προσωπικού».

Εκδήλωση

Ευφυής Σύνοδος Ασφάλειας

Μάθετε τον κρίσιμο ρόλο του AI & ML στην ασφάλεια στον κυβερνοχώρο και τις ειδικές περιπτωσιολογικές μελέτες του κλάδου στις 8 Δεκεμβρίου. Εγγραφείτε για το δωρεάν πάσο σας σήμερα.

Κάνε εγγραφή τώρα

Η προκατάληψη της τεχνητής νοημοσύνης στην επιστήμη των δεδομένων απέχει πολύ από το να επιλυθεί

Το θέμα της μεροληψίας AI είναι γνωστό για την επιστήμη των δεδομένων. Αυτό που δεν είναι τόσο γνωστό είναι τι ακριβώς κάνουν οι οργανισμοί για να καταπολεμήσουν το ζήτημα.

Πέρυσι, το State of Data Science της Anaconda για το 2021 διαπίστωσε ότι το 40% των οργανισμών σχεδίαζαν ή έκαναν κάτι για να βοηθήσουν στο ζήτημα της μεροληψίας. Ο Anaconda δεν έκανε την ίδια ερώτηση φέτος, επέλεξε να ακολουθήσει μια διαφορετική προσέγγιση.

«Αντί να ρωτήσουμε εάν οι οργανισμοί σχεδίαζαν να αντιμετωπίσουν την προκατάληψη, θέλαμε να εξετάσουμε τα συγκεκριμένα βήματα που λαμβάνουν τώρα οι οργανισμοί για να εξασφαλίσουν δικαιοσύνη και να μετριάσουν την προκατάληψη», είπε ο Wang. «Συνειδητοποιήσαμε από τα ευρήματά μας πέρυσι ότι οι οργανισμοί είχαν σχέδια για να το αντιμετωπίσουν, έτσι για το 2022, θέλαμε να εξετάσουμε ποιες ενέργειες ανέλαβαν, εάν υπήρχαν, και πού βρίσκονται οι προτεραιότητές τους».

Ως μέρος των προσπαθειών πρόληψης της μεροληψίας της τεχνητής νοημοσύνης, το 31% των ερωτηθέντων σημείωσε ότι αξιολογεί τις μεθόδους συλλογής δεδομένων σύμφωνα με εσωτερικά καθορισμένα πρότυπα για δικαιοσύνη. Αντίθετα, το 24% σημείωσε ότι δεν έχει πρότυπα για τη δικαιοσύνη και τον μετριασμό της μεροληψίας σε σύνολα δεδομένων και μοντέλα.

Η επεξήγηση της τεχνητής νοημοσύνης είναι ένα θεμελιώδες στοιχείο που βοηθά στον εντοπισμό και την πρόληψη της μεροληψίας. Όταν ρωτήθηκαν ποια εργαλεία χρησιμοποιούνται για την επεξήγηση της τεχνητής νοημοσύνης, το 35% των ερωτηθέντων σημείωσε ότι οι οργανισμοί τους εκτελούν μια σειρά ελεγχόμενων δοκιμών για την αξιολόγηση της ερμηνευσιμότητας του μοντέλου, ενώ το 24% δεν διαθέτει μέτρα ή εργαλεία για να διασφαλίσει την επεξήγηση του μοντέλου.

«Ενώ κάθε μέτρο απόκρισης έχει λιγότερο από το 50% αυτών των προσπαθειών, τα αποτελέσματα εδώ μας λένε ότι οι οργανισμοί ακολουθούν μια ποικίλη προσέγγιση για τον μετριασμό της προκατάληψης», είπε ο Wang. «Τελικά, οι οργανισμοί αναλαμβάνουν δράση, είναι μόλις νωρίς στο ταξίδι τους για την αντιμετώπιση της μεροληψίας».

Πώς περνούν το χρόνο τους οι επιστήμονες δεδομένων

Οι επιστήμονες δεδομένων έχουν μια σειρά από διαφορετικά καθήκοντα που πρέπει να κάνουν ως μέρος της δουλειάς τους.

Ενώ στην πραγματικότητα η ανάπτυξη μοντέλων είναι ο επιθυμητός τελικός στόχος, οι επιστήμονες δεδομένων δεν περνούν εκεί πραγματικά τον περισσότερο χρόνο τους. Στην πραγματικότητα, η μελέτη διαπίστωσε ότι οι επιστήμονες δεδομένων ξοδεύουν μόνο το 9% του χρόνου τους στην ανάπτυξη μοντέλων. Ομοίως, οι ερωτηθέντες ανέφεραν ότι ξοδεύουν μόνο το 9% του χρόνου τους στην επιλογή μοντέλου.

Το μεγαλύτερο χρονικό διάστημα είναι η προετοιμασία και ο καθαρισμός δεδομένων, που αντιπροσωπεύει το 38% του χρόνου.

Η σχέση αγάπης και φόβου με ανοιχτό κώδικα

Η έκθεση ρώτησε επίσης επιστήμονες δεδομένων σχετικά με τον τρόπο χρήσης και προβολής λογισμικού ανοιχτού κώδικα.

Το ογδόντα επτά τοις εκατό απάντησε ότι οι οργανώσεις τους επέτρεψαν το λογισμικό ανοιχτού κώδικα. Ωστόσο, παρά τη χρήση αυτή, το 54% των ερωτηθέντων σημείωσε ότι ανησυχεί για την ασφάλεια ανοιχτού κώδικα.

«Σήμερα, ο ανοιχτός κώδικας είναι ενσωματωμένος σε σχεδόν κάθε κομμάτι λογισμικού και τεχνολογίας και δεν είναι μόνο επειδή είναι φθηνότερο μακροπρόθεσμα», είπε ο Wang. «Η καινοτομία που συμβαίνει γύρω από την τεχνητή νοημοσύνη, τη μηχανική μάθηση και την επιστήμη δεδομένων συμβαίνει στο οικοσύστημα ανοιχτού κώδικα με ταχύτητα που δεν μπορεί να συγκριθεί με ένα κλειστό σύστημα».

Τούτου λεχθέντος, ο Wang είπε ότι είναι κατανοητό για τους οργανισμούς να γνωρίζουν τους κινδύνους που ενέχει ο ανοιχτός κώδικας και να αναπτύξουν ένα σχέδιο για τον μετριασμό τυχόν πιθανών τρωτών σημείων.

«Ένα από τα πλεονεκτήματα του ανοιχτού κώδικα είναι ότι οι ενημερώσεις κώδικα και οι λύσεις δημιουργούνται ανοιχτά αντί πίσω από κλειστές πόρτες», είπε.

Η έκθεση Anaconda βασίστηκε σε έρευνα 3.493 ερωτηθέντων από 133 χώρες.

Η αποστολή του VentureBeat πρόκειται να αποτελέσει μια ψηφιακή πλατεία της πόλης για τους τεχνικούς λήπτες αποφάσεων ώστε να αποκτήσουν γνώσεις σχετικά με τη μετασχηματιστική επιχειρηματική τεχνολογία και να πραγματοποιήσουν συναλλαγές. Ανακαλύψτε τις Ενημερώσεις μας.