Δεν είναι πια η μέρα του Back to the Future, αλλά το μέλλον έρχεται ακόμα είτε σας αρέσει είτε όχι, ώστε να μπορείτε είτε να κρυφτείτε μακριά από αυτό σαν δειλός είτε να διαβάσετε αυτό το άρθρο και να προετοιμαστείτε για αυτό που θα ακολουθήσει. Δεν είσαι δειλός;
…………………………………………….
Την τελευταία φορά, ρίξαμε μια ματιά στις τρέχουσες εξελίξεις στον τομέα της μηχανικής μάθησης και της τεχνητής νοημοσύνης, εστιάζοντας στον τρόπο με τον οποίο η Google, η Microsoft και η Apple χρησιμοποιούν την τεχνολογία στα κορυφαία προϊόντα τους. Αυτή τη φορά, θα εξετάσουμε λίγο περισσότερο τη θεωρία που τα περιβάλλει όλα και θα εξηγήσουμε πώς όλα αυτά ισχύουν για το μέλλον της διαδικτυακής αναζήτησης.
Ολοκληρώσαμε το τελευταίο μας άρθρο αναφέροντας την αγορά εκκίνησης τεχνητής νοημοσύνης από την Apple Αντίληψη που τους επέτρεψε να βελτιώσουν τις δυνατότητες μηχανικής εκμάθησης χωρίς να παραβιάζουν την αυστηρή πολιτική απορρήτου τους.
Η δεύτερη εξαγορά της Apple είναι μια άλλη start-up που ονομάζεται VocalIQαυτοαποκαλούμενος ως «Το πρώτο API διαλόγου αυτοεκμάθησης στον κόσμο – τοποθετώντας πραγματική, φυσική συνομιλία μεταξύ των ανθρώπων και των μηχανών τους».
Η Siri έχει προηγουμένως επικριθεί ότι είναι λίγο υπερβολικά τυπολατρική και (σχετικά) απλοϊκή. Αλλά με VocalIQ επί του σκάφους, αυτό πρόκειται να αλλάξει. Αυτομάθηση είναι το κλειδί εδώ.
Αυτό είναι το είδος της προόδου που αναφέραμε στην περιγραφή του Amit Singhal (στο Μέρος 1) όταν μίλησε για την ανάγκη «προσωπικότητες που βασίζονται στον υπολογιστή» που είναι “Πολύ ευαίσθητο στην ανθρώπινη αλληλεπίδραση”.
Σε αυτό το σημείο θα πρέπει πιθανώς να αναρωτηθούμε πόσο ευγενής είναι αυτός ο στόχος στην πραγματικότητα. Οι αρχαίοι μύθοι και οι ιστορίες επιστημονικής φαντασίας είναι γεμάτες με προειδοποιήσεις σχετικά με το τι μπορεί να συμβεί αν φτάσουμε λίγο πολύ μακριά – απλώς ρωτήστε τον Ίκαρο ή τον Γουίλ Σμιθ. Φυσικά, οι προειδοποιήσεις όπως αυτή είναι λίγο υπερβολικά δραματικές – ένας εξαιρετικά εξελιγμένος ψηφιακός βοηθός που μιλάει δεν είναι εντελώς ο Εξολοθρευτής, αλλά υπάρχει ωστόσο κάτι που πρέπει να ειπωθεί για προσοχή εδώ.

Το μέλλον
Αλλά εκτός από την ήπια προσοχή, αυτή η τεχνολογία εξακολουθεί να είναι απίστευτα συναρπαστική και έχει τη δυνατότητα για απεριόριστη χρήση, οπότε ας συνεχίσουμε.
Τώρα, για να προχωρήσουμε λίγο περισσότερο σε αυτήν την ιδέα των προγραμμάτων αυτομάθησης, ας μπούμε στην περίπλοκη και στριμμένη τρύπα του κουνελιού του βαθιά μάθηση.
Κράτα το ρολόι τσέπης σου…
Βαθιά Μάθηση
(Γρήγορη δήλωση αποποίησης ευθύνης εδώ: η δική μου κατανόηση της βαθιάς μάθησης και της μηχανικής μάθησης γενικά είναι περιορισμένη. Ως εκ τούτου, θα παραμείνω στις βασικές ιδέες πίσω από τη θεωρία, οι οποίες θα πρέπει να είναι αρκετές προς το παρόν)
Οι πιο βασικές μορφές τεχνητής νοημοσύνης βασίζονται στους ανθρώπους για να εισάγουν χειροκίνητα διάφορα διαφορετικά είδη οδηγιών που μπορεί να σημαίνουν το ίδιο πράγμα. Αυτό είναι πιο εύκολο να το καταλάβουμε από την άποψη της αναγνώρισης ομιλίας όπως έχουμε με το Siri. Ένα βασικό παράδειγμα θα ήταν ο προγραμματισμός διαφόρων φωνητικών εντολών όπως „κλήση Γιάννης“, „τηλέφωνο Γιάννης» και «μιλώ σε John» όλα οδηγούν στην ίδια λειτουργία – βασικά ένα περίπλοκο διάγραμμα ροής. Αυτή είναι μια απλοποιημένη εξήγηση αυτού που είναι γνωστό ως εξ ολοκλήρου εποπτευόμενη μάθηση. Η βαθιά μάθηση στοχεύει στη δημιουργία παρόμοιων αποτελεσμάτων χωρίς επίβλεψη.
Ο στόχος της βαθιάς μάθησης είναι να πάμε από μιμούνται τα αποτελέσματα των λειτουργιών ενός εγκεφάλου, να ψηφιακή προσομοίωση αυτών των πραγματικών λειτουργιών. Αυτό γίνεται χρησιμοποιώντας αυτό που είναι γνωστό ως τεχνητά νευρωνικά δίκτυα. Ουσιαστικά αυτό περιλαμβάνει τη μαθηματική αναδημιουργία βιολογικών εγκεφάλων, όπου οι νευρώνες και οι συνδέσεις τους προσομοιώνονται για τη δημιουργία ενός εξαιρετικά πολύπλοκου προγράμματος με δυνατότητες μάθησης και αυτοβελτίωσης.
Ας ρίξουμε μια ματιά στο λογισμικό αναγνώρισης εικόνων της Google ως παράδειγμα εδώ:
Τα εργαλεία αναγνώρισης εικόνων της Google έχουν σχεδιαστεί για να επιλέγουν και να περιγράφουν ορισμένα χαρακτηριστικά των εικόνων, όπως γάτες ή μπουκάλια ή… λαμβάνετε την εικόνα.
Για μια σύντομη εξήγηση για το πώς λειτουργεί στην πραγματικότητα, θα αναφερθώ στον χρήστη του Reddit Γκρεγκ Μπαμ:
„Δίνετε στον υπολογιστή εκατομμύρια φωτογραφίες και λέτε στον υπολογιστή ποιες είναι πουλιά και μετά λέτε «τώρα καταλάβετε τι κοινό έχουν όλες αυτές οι φωτογραφίες». Και ο υπολογιστής θα κάνει εκατομμύρια, δισεκατομμύρια και τρισεκατομμύρια τυχαίες εικασίες για το πώς θα μπορούσε να πει τη διαφορά μεταξύ ενός πουλιού ή όχι ενός πουλιού. Στη συνέχεια, ο υπολογιστής θα δοκιμάσει κάθε τυχαία εικασία, χρησιμοποιώντας το σε όλες τις φωτογραφίες που του δώσατε και στη συνέχεια συγκρίνοντας τις εικασίες του με τις απαντήσεις που δώσατε. Εάν τύχαινε να βρει κάποιο τυχαίο μοτίβο που του επιτρέπει να μαντέψει σωστά, ο υπολογιστής βασίζει τις επόμενες εικασίες από αυτό το προηγούμενο μοτίβο, βελτιώνοντάς το και βελτιώνοντάς το”
Έτσι ο υπολογιστής αποτελεσματικά μαθαίνει καθώς προχωρά, αναπτύσσοντας και βελτιώνοντας συνεχώς την ικανότητα αναγνώρισης προτύπων.
Εδώ μπορούμε να ακολουθήσουμε μια δροσερή (και αόριστα ενημερωτική) εκτροπή:
Πάρτε το Google Βαθύ Όνειρο πρόγραμμα χειρισμού εικόνας, ένα κομμάτι λογισμικού που παίρνει τα εργαλεία αναγνώρισης εικόνων της Google και τα τροφοδοτεί ξανά μέσα του, αντιστρέφοντας τη διαδικασία βαθιάς εκμάθησης για να δημιουργήσει περίεργα και συχνά απίστευτα ανατριχιαστικά αποτελέσματα.
Μερικοί από εσάς μπορεί να έχετε δει τα ίδια εφιαλτικά και σκυλίσια αποτελέσματα στο παρελθόν, αλλά αν δεν το έχετε δει, εδώ είναι μια εικόνα του ταπεινού συγγραφέα σας που έχει τροφοδοτηθεί από αυτό το υπέροχο πρόγραμμα παραμόρφωσης:

Ομορφη.
Βαθύ όνειρο παίρνει αυτό το λογισμικό αναγνώρισης εικόνας και το εισάγει σε ένα είδος βρόχου ανάδρασης. Έτσι, ουσιαστικά λέγεται να αναζητήσετε το πουλί σε μια εικόνα όπου δεν υπάρχει πουλί, και στη συνέχεια να εισάγετε το πουλί στην ίδια την εικόνα και να επαναλάβετε αυτή τη διαδικασία. Κάνει τάξη από το χάος.
Με μια φράση, έτσι μοιάζει όταν α το ψηφιακό νευρωνικό δίκτυο έχει παραισθήσεις ή, πιο ρομαντικά, όταν τα ρομπότ ονειρεύονται.
Και αποδεικνύεται ότι όταν το κάνουν, βλέπουν πολλά σκυλιά (ή στην περίπτωσή μου, κάτι που μοιάζει με πουλιά και τρωκτικά). Αυτό πιθανότατα έχει να κάνει με το είδος των δειγμάτων εικόνων που αρχικά τροφοδοτήθηκαν στο λογισμικό αναγνώρισης εικόνων.
Τώρα υπάρχουν λίγες πρακτικές συνέπειες για βαθύ όνειρο από μόνη της, αλλά ως άσκηση για να δείξει τι είδους πράγματα μπορούν να γίνουν δυνατά με τεχνικές βαθιάς μάθησης, είναι αρκετά ενδιαφέρον. Και η βασική ιδέα της αντιστροφής των μηχανισμών βαθιάς μάθησης για τη μετάβαση από την ανάλυση στη δημιουργία είναι κάτι που σίγουρα θα μπορούσε να έχει χιλιόμετρα.
Ας επιστρέψουμε όμως στο θέμα:
Τα νευρωνικά δίκτυα Deep Learning έχουν σχεδιαστεί για να λειτουργούν όπως και εμείς. Όταν προσδιορίζεις κάτι ως πουλί, δεν περνάς κυριολεκτικά από τον εγκέφαλό σου, διαλέγεις κάθε πιθανή προϋπόθεση που κάτι πρέπει να ικανοποιεί για να είσαι πουλί και μετά εφαρμόζοντάς τα συστηματικά σε αυτό που βλέπεις μπροστά σου, αντίθετα απλά περίπου ξέρω. Αυτό είναι το ιερό δισκοπότηρο της μηχανικής μάθησης.
Ο Stephen Levy, σε ένα δοκίμιο για τα νευρωνικά δίκτυα και το μέλλον της Google, έδωσε την ακόλουθη δραματική περιγραφή της ανάπτυξης νευρωνικών δικτύων ως:
«Η μαύρη τέχνη της οργάνωσης πολλών στρωμάτων τεχνητών νευρώνων έτσι ώστε ολόκληρο το σύστημα να μπορεί να εκπαιδευτεί ή ακόμα και να εκπαιδευτεί, στη θεϊκή συνοχή από τυχαίες εισροές, πολύ με τρόπο που ένα νεογέννητο μαθαίνει να οργανώνει τα δεδομένα που διαχέονται στις παρθενικές του αισθήσεις.»
Τι σημαίνουν λοιπόν όλα αυτά για τις μηχανές αναζήτησης;

Φαίνεται οικείο;
Το μέλλον της αναζήτησης
Λοιπόν, πρώτα απ ‚όλα, η μηχανική εκμάθηση γενικά δεν είναι κάτι νέο όσον αφορά το SEO. Οι ενημερώσεις Panda και Penguin της Google χρησιμοποίησαν τη μηχανική εκμάθηση με τον δικό τους τρόπο.
Αλλά το μέλλον της αναζήτησης υπόσχεται να ανοίξει πραγματικά νέους δρόμους.
Φανταστείτε έναν κόσμο όπου ακόμη και οι αρχιμηχανικοί της Google δεν θα μπορούσαν να σας πουν για τις ιδιαιτερότητες των αλγορίθμων κατάταξης τους. Εκεί οδηγούμαστε.
Πάρτε ξανά το Panda και τον Penguin. Και οι δύο αυτές ενημερώσεις έχουν σχεδιαστεί για να διαχωρίζουν τους ιστότοπους χαμηλής ποιότητας ή ανεπιθύμητης αλληλογραφίας από το πραγματικά καλό υλικό που θα έπρεπε να κατατάσσεται σε υψηλή κατάταξη στους SERP. Αλλά είναι αρκετά δύσκολο, στην πραγματικότητα αδύνατο, να θεσπίσετε ένα σύνολο αυστηρών και γρήγορων κανόνων για να αποφασίσετε τι ακριβώς μετράει ως «spammy».
Επί του παρόντος, οι αλγόριθμοι αναζήτησης της Google είναι απίστευτα περίπλοκοι και ενημερώνονται τακτικά από προγραμματιστές όταν παρατηρούν κάτι που θα μπορούσε να προστεθεί, κάνοντας τις αξιολογήσεις των τοποθεσιών σταθερά όλο και πιο ακριβείς. Πάρτε την ενημέρωση Hummingbird, για παράδειγμα, που βελτίωσε την κατανόηση του πλαισίου στις αναζητήσεις, πέρα από αυτά που είχαν ήδη κάνει (και συνεχίζουν να κάνουν) το Panda και ο Penguin.
Ωστόσο, αυτό μπορεί να φτάσει μόνο μέχρι τώρα.
Φανταστείτε το πλαίσιο που παρέχεται από GregBahm για την περιγραφή του λογισμικού αναγνώρισης εικόνων. Τώρα, φανταστείτε ότι αντί να κοιτάζει φωτογραφίες και να διαλέγει πουλιά, κοιτάζει ιστοσελίδες και επιλέγει αυτούς που ικανοποιούν τους ερευνητές. Θα το κάνει, και θα γίνεται όλο και καλύτερο όσο περνάει ο καιρός χωρίς καμία μη αυτόματη εισαγωγή από προγραμματιστές.
Αυτό σημαίνει για εμάς στη βιομηχανία SEO είναι ότι η τέχνη μας θα γίνεται όλο και πιο δημιουργική, πιο καλλιτεχνική παρά στην επιστήμη, καθώς οι σταθεροί κανόνες σχετικά με τις κατατάξεις γίνονται σταθερά λιγότερο καθολικοί. Θα αυξηθεί η πίεση στους SEO για να ενισχύσουν το παιχνίδι τους, οι spammers θα τρέμουν στις μπότες τους και αυτό μπορεί να είναι μόνο καλά νέα για το ευρύ κοινό.
Ωστόσο, υπάρχει ακόμα πολύς δρόμος, και η τεχνολογία μηχανικής εκμάθησης της Google απέχει πολύ από το να είναι τέλεια, όπως ακούσαμε από τον Amit Singhal, και είδαμε πότε το λογισμικό αναγνώρισης εικόνας προκάλεσε βαθιά προσβολή όταν μάλλον άβολα νόμιζε ότι έβλεπε γορίλες σε μια φωτογραφία που σίγουρα δεν ήταν από γορίλες:

Περιθωριο ΒΕΛΤΙΩΣΗΣ…
Βελτίωση όμως συμβαίνει. και η τεχνολογία της Google βελτιώνεται και βελτιώνεται συνεχώς και εργάζεται αδιάκοπα. Ως πραγματικοί πρωτοπόροι στον τομέα της μηχανικής μάθησης, ένα πράγμα είναι σίγουρο Skynet Google: το μέλλον υπόσχεται πραγματικά συναρπαστική και πρωτοποριακή καινοτομία.
…………………….
Θα τελειώσω με ένα άλλο απόσπασμα από το δοκίμιο του Stephen Levy, που απεικονίζει την πραγματική αλλαγή του παραδείγματος που έχουν επιφέρει οι εξελίξεις στη μηχανική μάθηση:
«Πριν από πολλά χρόνια, ο Λάρι Πέιτζ και ο Σεργκέι Μπριν μίλησαν, ίσως μισά αστεία, ότι η αναζήτηση είναι ένα εμφύτευμα στον εγκέφαλό μας. Κανείς δεν μιλάει για εμφυτεύματα τώρα. Αντί να χτυπάμε το μυαλό μας για να κάνουμε την αναζήτηση καλύτερη, Η Google χτίζει το δικό της μυαλό.»
Και για τα καλά, εδώ είναι ο ίδιος ο Doc Brown, με μερικά σοφά λόγια για το τι μπορεί να επιφυλάσσει το μέλλον: