Google: Οι μηχανές θα μας καταλαβαίνουν καλύτερα από τους ανθρώπους

Η Google φιλοδοξεί να αναπτύξει τεχνολογίες αναγνώρισης ομιλίας και ορθής απόκρισης σε φωνητικές εντολές τόσο ισχυρές ώστε να καταστεί εφικτή η χρήση υπολογιστών χωρίς οθόνη.

Google: Οι μηχανές θα μας καταλαβαίνουν καλύτερα από τους ανθρώπους
4'

Μάλιστα, ο γίγαντας του Διαδικτύου θα επιστρατεύει όλες τις πληροφορίες που μπορεί να ανακαλέσει για να εκτιμήσει σωστά τι μπορεί να ζητάει ο εντολέας του συστήματος -ίσως καλύτερα απ'ότι ένα ανθρώπινο ον.

Πληροφορίες όπως η θέση του χρήστη, ό,τι έχει πει στον υπολογιστή του στο παρελθόν και ό,τι βρίσκεται στο ιστορικό των παλαιότερων περιπλανήσεών του στο Ίντερνετ ή από την χρήση των δεκάδων διαδικτυακών υπηρεσιών της Google, θα συνδράμουν την προσπάθεια ώστε ο υπολογιστής χωρίς οθόνη να ανταποκρίνεται με την ίδια ακρίβεια που επιτυγχάνει σήμερα η δημοφιλής μηχανή αναζήτησης.

Η Google απασχολεί ολόκληρη στρατιά από ειδικούς σε θέματα speech recognition και είναι φανερό ότι η προοπτική της χρήσης της τεχνολογίας κάθε άλλο παρά αδιάφορη αφήνει την εταιρεία. Τα Γυαλιά της Google βασίζονται στην τεχνολογία αυτή και χωρίς αυτήν δεν θα υπήρχαν. Πρόσφατα, η Motorola, θυγατρική πλέον της Google, λάνσαρε ένα smartphone υποσχόμενη έλεγχο της συσκευής χωρίς άγγιγμα, με ανοικτό μικρόφωνο, που κάνει το Moto X να υπακούει μόνο όταν ακούει «Ok, Google Now» από την φωνή του μοναδικού του εντολέα. Στις αρχές του 2013, η Google έκανε τις απαραίτητες ενέργειες για να υποστηρίξει την ανάπτυξη διαδικτυακών εφαρμογών που ελέγχονται με την ομιλία τουλάχιστον στον δικό της Chrome browser, δίνοντας το πρώτο παράδειγμα (υπαγορεύστε ένα e-mail στον Chrome).

Ακόμα, από τα τέλη Απριλίου, εννέα μήνες μετά την διάθεση της υπηρεσίας στην υπηρεσία των χρηστών κινητών με Android, η Google διέθεσε το Google Now και στους χρήστες iPhone. Το Google Now είναι ο ψηφιακός βοηθός της Google που φιλοδοξεί να τεθεί στην υπηρεσία των χρηστών iPhone και iPad, υποκαθιστώντας το ενσωματωμένο Siri της Apple. Το Google Now μπορεί να απαντά με φωνή σε προφορικές ερωτήσεις, όπως κάνει και το Siri. Επίσης, χρήστες και των δύο λειτουργικών συστημάτων έχουν την δυνατότητα να κάνουν αναζήτηση με τη φωνή.

Παρ'όλα αυτά, η χρήση υπολογιστών χωρίς οθόνη, μόνο με την ομιλία, αποτελεί πρόκληση -καμία από τις προαναφερόμενες υπηρεσίες δεν είναι σε θέση να υποκαταστήσει πλήρως την οθόνη αφής σε smartphone και tablet ή, το πληκτρολόγιο και το mouse στο PC. Τα λάθη στην «κατανόηση» είναι ανεπίτρεπτα πολλά, η εξάρτηση από την σύνδεση online περιορίζει την χρηστικότητα και υπάρχουν πολλά ακόμα που κάνει κανείς με τον υπολογιστή ή το smartphone του που δεν έχουμε ακόμα φανταστεί πως θα μπορούσαν να υλοποιηθούν με φωνητικές εντολές.

Η ισχύς ενός πανίσχυρου σήμερα smartphone δεν αρκεί για να εκτελεστεί η απαιτούμενη επεξεργασία για την αναγνώριση της ανθρώπινης ομιλίας και ό,τι λέει ο χρήστης μεταφέρεται στους διακομιστές της υπηρεσίας για αυτό το σκοπό. Εξάλλου, ο ρόλος του cloud είναι σημαντικός για έναν ακόμα λόγο: υποστηρίζεται από την γνώση που αποκτά η υπηρεσία από την χρήση άλλων υπηρεσιών της Google, έτσι ώστε να συνυπολογίζει προηγούμενες αναζητήσεις, ενδιαφέροντα και προτιμήσεις για να «κατανοήσει» σωστά τι μπορεί να ζητάει. Ακόμα, η θέση του χρήστη που μαρτυρά το GPS συνδράμει επίσης την προσπάθεια για καλύτερα αποτελέσματα, αφού όχι μόνο ο εντολέας αλλά και οι «γείτονές» του μιλούν την ίδια γλώσσα.

Πρόσφατα, ο επικεφαλής του τμήματος με την χαρακτηριστική ονομασία Google Conversations Search αναφέρθηκε εκτενώς στο θέμα και δήλωσε πως η αναγνώριση της ανθρώπινης ομιλίας αλλά και η ορθή απόκριση συστημάτων ακόμα και χωρίς οθόνη αποτελεί προτεραιότητα για την εταιρεία, όπως μεταδίδει το διαδικτυακό περιοδικό Quartz.com. Στο μέλλον, είπε χαρακτηριστικά ο Σκοτ Χάφμαν, επικεφαλής του τμήματος, οι μηχανές θα μπορούν να μας καταλαβαίνουν καλύτερα από τα ανθρώπινα όντα, χάρη σε όσα περισσότερα από εκείνα μπορούν να γνωρίζουν, να θυμούνται και να ανακαλούν για μας.

Ροή Ειδήσεων Δημοφιλή