Το Voicebox είναι ένα δωρεάν και open-source πρόγραμμα τεχνητής νοημοσύνης για φωνή, που τρέχει τοπικά στον υπολογιστή σου. Με απλά λόγια, σου επιτρέπει να δημιουργείς ομιλία από κείμενο, να κάνεις voice cloning από μικρό δείγμα ήχου, αλλά και να χρησιμοποιείς υπαγόρευση φωνής σε εφαρμογές του υπολογιστή σου.
Το βασικό του πλεονέκτημα είναι ότι δεν βασίζεται αποκλειστικά σε cloud υπηρεσίες. Τα μοντέλα, τα ηχητικά δείγματα και οι μετατροπές γίνονται στο δικό σου μηχάνημα, κάτι που το κάνει πιο ενδιαφέρον για όσους θέλουν περισσότερο έλεγχο στα δεδομένα τους. Το ίδιο το project το παρουσιάζει ως δωρεάν και τοπική εναλλακτική σε υπηρεσίες όπως το ElevenLabs και το WisprFlow.
Με το Voicebox μπορείς να γράψεις ένα κείμενο και να το μετατρέψεις σε φυσική ομιλία. Υποστηρίζει διάφορες μηχανές TTS, δηλαδή μηχανές μετατροπής κειμένου σε φωνή, όπως Qwen3-TTS, Chatterbox, LuxTTS, Kokoro και άλλες. Κάθε μηχανή έχει διαφορετικά χαρακτηριστικά, άλλες είναι πιο γρήγορες, άλλες δίνουν καλύτερη ποιότητα, ενώ κάποιες υποστηρίζουν περισσότερες γλώσσες.
Ένα από τα πιο εντυπωσιακά χαρακτηριστικά του είναι το voice cloning. Μπορείς να δώσεις στο πρόγραμμα ένα μικρό δείγμα ήχου και αυτό να προσπαθήσει να δημιουργήσει μια φωνή που μοιάζει με το δείγμα. Αυτό μπορεί να φανεί χρήσιμο για δημιουργούς περιεχομένου, βίντεο, podcasts, αφηγήσεις, παιχνίδια ή πειραματισμούς με AI ήχο. Εννοείται πως πρέπει να χρησιμοποιείται μόνο με δική σου φωνή ή με φωνές για τις οποίες έχεις ξεκάθαρη άδεια.
Το Voicebox δεν περιορίζεται μόνο στη δημιουργία φωνής. Διαθέτει και λειτουργία υπαγόρευσης, όπου μιλάς στο μικρόφωνο και το πρόγραμμα μετατρέπει την ομιλία σου σε κείμενο. Για αυτή τη λειτουργία χρησιμοποιεί μοντέλα Whisper, τα οποία υποστηρίζουν πολλές γλώσσες και μπορούν να τρέξουν τοπικά στον υπολογιστή.
Υπάρχει επίσης editor για ιστορίες και διαλόγους, ώστε να δημιουργείς περιεχόμενο με περισσότερες από μία φωνές. Αυτό είναι χρήσιμο αν θέλεις να φτιάξεις μια μικρή αφήγηση, έναν διάλογο χαρακτήρων ή ένα ηχητικό σενάριο χωρίς να χρειάζεται να ηχογραφήσεις κάθε φωνή ξεχωριστά.
Το πρόγραμμα υποστηρίζει Windows, macOS και Linux. Για Windows υπάρχει αρχείο εγκατάστασης MSI, για macOS υπάρχουν εκδόσεις για Apple Silicon και Intel, ενώ για Linux παρέχεται τρόπος εγκατάστασης από τον πηγαίο κώδικα ή μέσω Docker.
Το Voicebox απευθύνεται κυρίως σε όσους θέλουν να πειραματιστούν με AI φωνές χωρίς συνδρομές, API keys ή χρεώσεις ανά χαρακτήρα. Δεν είναι απαραίτητα το πιο απλό πρόγραμμα για έναν εντελώς αρχάριο χρήστη, επειδή ορισμένες λειτουργίες εξαρτώνται από το hardware του υπολογιστή σου και από τα μοντέλα που θα κατεβάσεις. Παρ’ όλα αυτά, είναι ένα από τα πιο ενδιαφέροντα δωρεάν εργαλεία για όποιον θέλει να δοκιμάσει τοπική παραγωγή φωνής με τεχνητή νοημοσύνη.
Έκδοση: 0.5.0Μέγεθος: 518 MB
Λειτουργικό σύστημα: Windows, Mac, Linux
Κατασκευαστής: voicebox.sh
Πηγή: voicebox.sh
Συντάκτης του άρθρου: Κυριάκος Οικονομίδης
Αν θέλεις να υποστηρίξεις την προσπάθεια μας και να βλέπεις καθημερινά νέα άρθρα με δωρεάν υλικό, μπορείς να το κάνεις με μια δωρεά στο Paypal
