Τεχνολογία

Εφαρμογή της Google μιμείται απόλυτα την ανθρώπινη φωνή

Εφαρμογή της Google μιμείται απόλυτα την ανθρώπινη φωνή
ViberViber MessengerMessenger WhatsAppWhatsApp
Ακούστε το άρθρο

Σύστημα εκφώνησης κειμένου που διεκδικεί σχεδόν απόλυτη ομοιότητα με την ανθρώπινη φωνή, περιγράφει ένα επιστημονικό άρθρο που δημοσίευσε η Google.

Το σύστημα ονομάζεται Tacotron 2 και αποτελεί τη δεύτερη επίσημη “γενιά” της συγκεκριμένης τεχνολογίας, η οποία βασίζεται σε δύο νευρωνικά δίκτυα. Το πρώτο δίκτυο “μεταφράζει” το κείμενο σε φασματογράφημα, οπτικοποιώντας έτσι την εξέλιξη των ακουστικών συχνοτήτων συναρτήσει του χρόνου.

Στη συνέχεια, το φασματογράφημα “φορτώνεται” στο WaveNet, ένα σύστημα από το ερευνητικό εργαστήριο DeepMind της Alphabet, το οποίο “διαβάζει” το γράφημα και αναπαράγει τα αντίστοιχα ηχητικά στοιχεία.

Το σύστημα τα καταφέρνει εξίσου καλά με ονόματα και λέξεις που προφέρονται, όπως επίσης και να προσαρμόζει τη χροιά του ανάλογα με τα σημεία στίξης. Μάλιστα, είναι άμεσα αξιοποιήσιμο από την Google, αφού το Google Assistant “χρωστά” τη φωνή του στο WaveNet, το οποίο πρωτοανακοινώθηκε το 2016. Επομένως, όταν είναι εντελώς έτοιμο για χρήση, το Tacotron 2 θα βελτιώσει κατακόρυφα τις δυνατότητες της υπηρεσίας.

Ολες οι Ειδήσεις

Ειδήσεις Top Stories
X