Εκατοντάδες χιλιάδες δείγματα φωνής έχει συγκεντρώσει το έργο Common Voice του Mozilla

Στόχος του Mozilla είναι, μέσα από τη συλλογή των δειγμάτων αυτών, να εκπαιδεύσει μια νέα εφαρμογή ανοιχτού κώδικα για την αναγνώριση της ομιλίας.

Εκατοντάδες χιλιάδες δείγματα φωνής έχει συγκεντρώσει το έργο Common Voice του Mozilla
1'

Πρόκειται για ένα σύστημα αναγνώρισης ομιλίας ανοιχτού κώδικα, το οποίο βασίζεται σε εθελοντές που υποβάλλουν δείγματα της ομιλίας τους. Η συλλογή δειγμάτων φωνής ξεκίνησε πριν λίγους μήνες και μέχρι σήμερα το Common Voice έχει συγκεντρώσει περίπου 400.000 εγγραφές από 20.000 διαφορετικούς ανθρώπους, συνολικά περίπου 500 ώρες ομιλίας. Διάφορα συστήματα τεχνητής νοημοσύνης, όπως της Google, εκπαιδεύονται στην αναγνώριση ομιλίας χρησιμοποιώντας δεδομένα των χρηστών. Στην περίπτωση του Mozilla (δημιουργού, μεταξύ άλλων, του δημοφιλούς προγράμματος διαδικτυακής περιήγησης Firefox), ο μηχανισμός αναγνώρισης της ομιλίας είναι ανοιχτός κώδικας, κάτι που θα επιτρέψει την επαναχρησιμοποίηση αυτής της τεχνολογίας.

Έως πρόσφατα, οι προγραμματιστές, επιχειρήσεις και ερευνητές που ήθελαν να πειραματιστούν και να αναπτύξουν νέες τεχνολογίες φωνής, είχαν πρόσβαση σε μια περιορισμένη συλλογή δεδομένων φωνής. Η συλλογή Common Voice είναι ήδη το δεύτερο μεγαλύτερο γνωστό δημόσιο φωνητικό σύνολο δεδομένων, καθώς άνθρωποι σε όλο τον κόσμο προσθέτουν σταδιακά και τη δική τους φωνή (σε πρώτη φάση μόνο στα αγγλικά). Με τη δημιουργία του νέου δημόσιου συνόλου δεδομένων, το Mozilla Foundation συμβάλλει να ξεπερασθούν τα εμπόδια και να διευκολυνθεί η ανάπτυξη καλύτερων συστημάτων αναγνώρισης ομιλίας. Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική.

Σχετικές ειδήσεις

Ροή Ειδήσεων Δημοφιλή