Η αναζήτηση στο διαδίκτυο είναι μια περιπέτεια από μόνη της. Όταν ένας χρήστης αποφασίζει να ψάξει για κάτι συγκεκριμένο, οι δρόμοι που ακολουθεί μπορεί να είναι… αναπάντεχοι, για να μην πούμε αστείοι.
Η γλώσσα των αναζητήσεων μπορεί να είναι συνδυασμένη με παράξενες ορθογραφικές εκδοχές, που μας κάνουν να γελάμε και να αναρωτιόμαστε ταυτόχρονα. Ας εξετάσουμε μερικά παραδείγματα που αποδεικνύουν πως οι χρήστες του διαδικτύου έχουν τη δική τους γλώσσα και λογική!
Ας ξεκινήσουμε με την περίπτωση του απροσδόκητου “εσηοπ”, μία λανθασμένη γλώσσα μακριά από το επιθυμητό “eshop”. Στην ίδια κατηγορία είναι και η περίπτωση του “εσοπ”, ένα λανθασμένο γράμμα ή τα “ησοπ” και “ισοπ” που είναι ακόμα πιο μακριά από το “eshop” ή το “κατασκευή eshop”.
Και τι γίνεται όταν οι τόνοι λείπουν; Η απόπειρα να βρεθεί η “κατασκευη ιστοσελιδων” μπορεί να οδηγήσει σε μια αναζήτηση για κάτι εντελώς διαφορετικό από την αρχική σας πρόθεση για “κατασκευή ιστοσελίδων”. Και ας μην ξεχνάμε το παράδοξο “δημιουργία ιστοσελίδασ”, – ναι, με το “σ” στο τέλος, σαν φόρος τιμής στις αρχαίες ελληνικές διαλέκτους!
Η επιστήμη πίσω από την αναζήτηση
Το 2006, μια μελέτη που διεξήχθη από το Πανεπιστήμιο του Χονγκ Κονγκ διαπίστωσε ότι σε πρωτογενές επίπεδο, η πρόθεση αναζήτησης μπορεί να κατανεμηθεί σε δύο στόχους αναζήτησης.
- Ο χρήστης αναζητά συγκεκριμένα να βρει πληροφορίες που σχετίζονται με τη λέξη-κλειδί που έχει χρησιμοποιήσει.
- Ο χρήστης αναζητά γενικότερες πληροφορίες για τη λέξη που έχει πληκτρολογήσει.
Μπορούμε να το γενικεύσουμε περισσότερο και οι προθέσεις των χρηστών να χωριστούν στο πόσο συγκεκριμένος γίνεται ο χρήστης με την αναζήτησή του.
Όπως και να το δει κανείς, η αναζήτηση στο διαδίκτυο είναι μια απολαυστική περιπέτεια. Η ατζέντα των χρηστών του διαδικτύου μπορεί να είναι απρόβλεπτη και αστεία, αλλά αυτό κάνει την εμπειρία πιο ενδιαφέρουσα και μοναδική.
Γιατί τα ορθογραφικά λάθη στις Google αναζητήσεις στην πραγματικότητα κάνουν καλό
Τα τυχαία τυπογραφικά λάθη και η λανθασμένη ορθογραφία εκπαιδεύουν στην πραγματικότητα τον αλγόριθμο ορθογραφίας της Google. Μπορείτε να φανταστείτε πόσες φορές ο αλγόριθμος της Google έχει προσπαθήσει να αποκωδικοποιήσει τις αναζητήσεις του χρήστη, όταν αυτός προσπαθεί να βρει ένα “εσηοπ” αντί για ένα “eshop”.
Αναρωτηθήκατε ποτέ όμως πώς η Google γνωρίζει ως δια μαγείας τι ψάχνετε, ακόμη και όταν το ερώτημα αναζήτησης έχει τυπογραφικά λάθη ή είναι γραμμένο με τη σωστή ορθογραφία αλλά με λατινικούς χαρακτήρες;
Με ένα στα δέκα ερωτήματα αναζήτησης να είναι ανορθόγραφο και με τις νέες λέξεις να επισημαίνονται συνεχώς, η Google έχει έναν ολόκληρο αλγόριθμο αφιερωμένο στην πλοήγηση με ορθογραφικά λάθη.
Πώς η Google κατηγοριοποιεί τα ορθογραφικά λάθη
Το πρώτο πράγμα που κάνει η Τεχνητή Νοημοσύνη της Google όταν συναντά μια λέξη που πιστεύει ότι είναι ανορθόγραφη, είναι να την κατηγοριοποιήσει:
Λάθος με το δάχτυλο – Η Google βλέπει περισσότερες από 10.000 παραλλαγές λαθών “με το δάχτυλο” για αναζητήσεις όπως “eshop”. Οι χρήστες ξέρουν πώς να το γράψουν, αλλά ίσως ένα γράμμα να είναι λάθος. Για παράδειγμα, αντί να πατήσετε το “h” στο “eshop”, πατάτε το γράμμα “g” .
Εννοιολογικό λάθος – Γνωστό και ως “ορθογραφικά λάθη καλύτερης προσπάθειας”, αυτό συμβαίνει όταν ένας χρήστης δεν ξέρει πώς να γράψει μια λέξη και πληκτρολογεί την καλύτερη δυνατή εικασία του.
Παλαιότερα, η Google βασιζόταν στο σχεδιασμό του πληκτρολογίου για να αποκρυπτογραφήσει ποια λέξη ήθελε να πληκτρολογήσει ο χρήστης.
Σήμερα;
Ο αλγόριθμος της Google εκτελεί μοντέλα με πάνω από 680 εκατομμύρια παραμέτρους σε λιγότερο από δύο χιλιοστά του δευτερολέπτου.
Αντί να χρησιμοποιεί την παραπάνω προσέγγιση του πληκτρολογίου, ο νέος αλγόριθμος χρησιμοποιεί τα συμφραζόμενα για να καταλάβει τι ήθελε να πληκτρολογήσει ο χρήστης.
Αυτή η νέα προσέγγιση:
- Αξιολογεί ολόκληρο το ερώτημα, όχι μόνο τη λανθασμένη λέξη.
- Αναζητεί λέξεις αντικατάστασης που ταιριάζουν με το συνολικό ερώτημα.
- Παραδίδει τα αποτελέσματα αναζήτησης με βάση την “καλύτερη προσαρμογή”.
Όταν η Google εμφανίζει αποτελέσματα σχετικά με αυτό που νομίζει ότι εννοείτε, μια σημείωση θα επισημανθεί κάτω από τη γραμμή αναζήτησης για να σας ενημερώσει, καθώς και να σας δώσει τη δυνατότητα να δείτε τα αποτελέσματα αναζήτησης για το αρχικό ερώτημα.
Συμπεραίνουμε λοιπόν ότι η απρόβλεπτη φύση των αναζητήσεων στο διαδίκτυο είναι όχι μόνο διασκεδαστική, αλλά και επωφελής για την εξέλιξη της τεχνολογίας. Έτσι, ας συνεχίσουμε να πειραματιζόμαστε με τις αναζητήσεις μας και ας αφήσουμε τη Google να αποκωδικοποιεί τα μπερδέματά μας. Ποτέ δεν ξέρετε πού μπορεί να βοηθήσει ένα απλό ορθογραφικό λάθος!