Ο αναπνευστήρας ασχολείται με τα μοντέλα τεχνητής νοημοσύνης για την επισήμανση δεδομένων και τα θεμέλια

Ο αναπνευστήρας ασχολείται με τα μοντέλα τεχνητής νοημοσύνης για την επισήμανση δεδομένων και τα θεμέλια

November 26, 2022 0 Von admin

Ρίξτε μια ματιά στις συνεδρίες κατ‘ απαίτηση από τη Σύνοδο Κορυφής Low-Code/No-Code για να μάθετε πώς να καινοτομείτε με επιτυχία και να επιτύχετε αποτελεσματικότητα, αναβαθμίζοντας και κλιμακώνοντας τους πολίτες προγραμματιστές. Παρακολουθήσετε τώρα.


Η επισήμανση δεδομένων είναι ένα κρίσιμο, αν και συχνά χρονοβόρο και πολύπλοκο, στοιχείο των σύγχρονων λειτουργιών μηχανικής μάθησης (ML).

Η επισήμανση δεδομένων θα μπορούσε επίσης να είναι το κλειδί για την απελευθέρωση του ευρύτερου επιχειρηματικού δυναμικού των μοντέλων θεμελίων. Ενώ τα μοντέλα θεμελίωσης όπως το GPT-3 και το DALL-E έχουν τεράστια χρησιμότητα για τη δημιουργία κειμένου και εικόνων, συχνά δεν διαθέτουν το πλαίσιο που απαιτείται για συγκεκριμένες περιπτώσεις εταιρικής χρήσης. Προκειμένου να βελτιστοποιηθεί ένα μοντέλο θεμελίωσης, απαιτείται συντονισμός και πρόσθετη εκπαίδευση, και αυτό απαιτεί συχνά δεδομένα με ετικέτα.

Τι θα γινόταν όμως αν ένα μοντέλο βάσης θα μπορούσε να χρησιμοποιηθεί για την εκκίνηση μιας διαδικασίας επισήμανσης δεδομένων για να γίνει ένα μικρότερο μοντέλο χρήσιμο για συγκεκριμένες περιπτώσεις εταιρικής χρήσης; Αυτή είναι η πρόκληση που ο προμηθευτής ετικετών δεδομένων Snorkel AI ισχυρίζεται τώρα ότι βοηθά στην επίλυση.

«Είναι ένα πράγμα αν προσπαθείτε να κάνετε δημιουργικές εργασίες παραγωγής όπου δημιουργείτε κάποιο κείμενο αντιγραφής ή μερικές δημιουργικές εικόνες, αλλά υπάρχει μεγάλο χάσμα μεταξύ αυτού και μιας περίπλοκης περίπτωσης χρήσης παραγωγής όπου πρέπει να αποδώσετε σε γραμμή υψηλής ακρίβειας για πολύ εξειδικευμένα δεδομένα και εργασίες», δήλωσε στο VentureBeat ο Alex Ratner, Διευθύνων Σύμβουλος και συνιδρυτής της Snorkel AI.

Εκδήλωση

Ευφυής Σύνοδος Ασφάλειας

Μάθετε τον κρίσιμο ρόλο του AI & ML στην ασφάλεια στον κυβερνοχώρο και τις ειδικές περιπτωσιολογικές μελέτες του κλάδου στις 8 Δεκεμβρίου. Εγγραφείτε για το δωρεάν πάσο σας σήμερα.

Κάνε εγγραφή τώρα

Για να βοηθήσετε στην επίλυση αυτής της πρόκλησης, Αναπνευστήρας AI ανακοίνωσε σήμερα μια προεπισκόπηση των νέων δυνατοτήτων Ανάπτυξης Μοντέλου Ιδρύματος με επίκεντρο τα δεδομένα. Ο στόχος είναι να βοηθηθούν οι χρήστες της πλατφόρμας Snorkel Flow της εταιρείας να προσαρμόσουν τα μοντέλα βάσης για περιπτώσεις εταιρικής χρήσης. Ο Ratner εξήγησε ότι η βασική έρευνα και οι ιδέες του Snorkel αφορούν την εύρεση πιο αποτελεσματικών τρόπων για την επισήμανση δεδομένων για την εκπαίδευση μοντέλων ή τη λεπτομέρεια.

Συνεχίζοντας τη ροή για να οικοδομήσουμε μια νέα βάση για την επιχειρηματική τεχνητή νοημοσύνη

Υπάρχουν και άλλοι πωλητές που προσπαθούν επίσης να δημιουργήσουν τεχνολογία για να βοηθήσουν στην πιο εύκολη ρύθμιση των μοντέλων θεμελίωσης. Μεταξύ αυτών είναι η Nvidia, η οποία τον Σεπτέμβριο ανακοίνωσε την Υπηρεσία NeMo LLM (μεγάλο μοντέλο γλώσσας).

Ένα από τα βασικά στοιχεία της υπηρεσίας Nvidia είναι η δυνατότητα των χρηστών να εκπαιδεύουν μεγάλα μοντέλα για συγκεκριμένες περιπτώσεις χρήσης με μια προσέγγιση γνωστή ως άμεση εκμάθηση. Με την προσέγγιση άμεσης εκμάθησης της Nvidia, ένα συνοδευτικό μοντέλο εκπαιδεύεται ώστε να παρέχει πλαίσιο στο προεκπαιδευμένο LLM, χρησιμοποιώντας ένα διακριτικό άμεσης επικοινωνίας.

Το Snorkel χρησιμοποιεί επίσης προτροπές ως μέρος της σουίτας διαχείρισης μοντέλων Enterprise Foundation με τη λειτουργία Foundation Model Prompt Builder. Ο Ratner τόνισε, ωστόσο, ότι οι προτροπές αποτελούν μόνο ένα μέρος ενός μεγαλύτερου συνόλου εργαλείων που απαιτούνται για τη βελτιστοποίηση των μοντέλων θεμελίωσης για περιπτώσεις εταιρικής χρήσης.

Ένα άλλο εργαλείο που προσφέρει το Snorkel είναι η δυνατότητα Θερμής Εκκίνησης Θεμελιώδους Μοντέλου, η οποία χρησιμοποιεί ένα υπάρχον μοντέλο βάσης για να βοηθήσει στην παροχή ετικετών δεδομένων.

«Οπότε, βασικά, όταν ανεβάζετε ένα σύνολο δεδομένων για να επισημάνετε στο Snorkel Flow, μπορείτε τώρα απλώς να λάβετε ένα είδος αυτόματης σήμανσης με το πάτημα του κουμπιού, χρησιμοποιώντας τη δύναμη των μοντέλων βάσης», είπε ο Ratner.

Ο Ράτνερ σημείωσε ότι το Warm Start δεν είναι μια λύση για όλες τις ετικέτες δεδομένων, αλλά θα έχει το „χαμηλό φρούτο“. Προτείνει ότι οι χρήστες πιθανότατα θα χρησιμοποιήσουν το Warm Start σε συνδυασμό με το prompt builder, καθώς και τη λειτουργία Foundation Model Fine-Tuning του Snorkel, για τη βελτιστοποίηση των μοντέλων. Η δυνατότητα μικρορύθμισης επιτρέπει στους οργανισμούς να αποστάξουν το θεμελιώδες μοντέλο σε ένα σύνολο εκπαίδευσης για συγκεκριμένο τομέα.

Περιπτώσεις επιχειρηματικής χρήσης γενετικής έναντι προγνωστικής τεχνητής νοημοσύνης

Η χρήση μοντέλων θεμελίωσης για πραγματικές περιπτώσεις εταιρικής χρήσης είναι ο στόχος για το Snorkel AI.

Καλώς ή κακώς, ο Ράτνερ είπε ότι τα άτομα είναι πιθανότατα πιο εξοικειωμένα με τη γενετική τεχνητή νοημοσύνη σήμερα, η οποία χρησιμοποιεί μοντέλα θεμελίωσης. Διέκρινε τα μοντέλα παραγωγής ως διαφορετικά από τα μοντέλα πρόβλεψης τεχνητής νοημοσύνης που βοηθούν στην πρόβλεψη ενός αποτελέσματος και χρησιμοποιούνται συνήθως από τις επιχειρήσεις σήμερα.

Ως ανέκδοτο, ο Ratner είπε ότι προσπαθούσε να δημιουργήσει μερικά λογότυπα Snorkel AI χρησιμοποιώντας το Stable Diffusion επειδή, «.. ήταν πολύ διασκεδαστικό». Είπε ότι πέρασε από περίπου 30 δείγματα και δεν πήρε ποτέ αυτό ακριβώς που ήθελε —ένα χταπόδι που φοράει αναπνευστήρα υποβρύχια— που είναι το πραγματικό εταιρικό λογότυπο.

„Υποθέτω ότι είναι πολύ περίεργη μια παράλογη εικόνα, αλλά πήρα μερικά πολύ ωραία λογότυπα μετά από περίπου 30 δείγματα ως μια παραγωγική, δημιουργική διαδικασία ανθρώπινου βρόχου“, είπε ο Ratner. „Αν το σκεφτείτε από την προοπτική του προγνωστικού αυτοματισμού, ωστόσο, οι 30 προσπάθειες για να επιτύχετε ένα επιτυχημένο αποτέλεσμα είναι ποσοστό επιτυχίας 3,3% και δεν μπορείτε ποτέ να στείλετε κάτι με τόσο κακό αποτέλεσμα.“

Ένας από τους πελάτες της Snorkel είναι ο προμηθευτής Pixability βελτιστοποίησης διαφημίσεων βίντεο στο διαδίκτυο. Ο Ratner εξήγησε ότι το Pixability έχει εκατομμύρια σημεία δεδομένων από βίντεο YouTube που πρέπει να ταξινομηθούν για ML. Χρησιμοποιώντας τις δυνατότητες του μοντέλου θεμελίωσης στο Snorkel Flow, είναι σε θέση να κάνουν την ταξινόμηση γρήγορα με επίπεδο ακρίβειας άνω του 90%.

Ο Ratner είπε ότι μια μεγάλη αμερικανική τράπεζα που είναι πελάτης του Snorkel μπόρεσε να βελτιώσει την ακρίβεια για την εξαγωγή κειμένου από πολύπλοκα νομικά έγγραφα χρησιμοποιώντας την προσέγγιση του θεμελιώδους μοντέλου.

„Βλέπουμε ότι αυτή η τεχνολογία εφαρμόζεται σε ολόκληρο το σύμπαν των εφαρμογών όπου προσπαθείτε να προσθέσετε ετικέτες, να ταξινομήσετε, να εξαγάγετε ή να επισημάνετε κάτι με πολύ υψηλή ακρίβεια για κάποιο είδος προγνωστικού αυτοματισμού σε κείμενο, PDF, εικόνα και βίντεο“, δήλωσε ο Ratner. . «Πιστεύουμε ότι θα επιταχύνει όλες τις περιπτώσεις χρήσης που υποστηρίζουμε αυτήν τη στιγμή, μαζί με την προσθήκη νέων που δεν θα ήταν εφικτές με τις υπάρχουσες προσεγγίσεις μας στο παρελθόν, επομένως είμαστε πολύ ενθουσιασμένοι».

Η αποστολή του VentureBeat πρόκειται να αποτελέσει μια ψηφιακή πλατεία της πόλης για τους τεχνικούς λήπτες αποφάσεων ώστε να αποκτήσουν γνώσεις σχετικά με τη μετασχηματιστική επιχειρηματική τεχνολογία και να πραγματοποιήσουν συναλλαγές. Ανακαλύψτε τις Ενημερώσεις μας.