clone-voice(CV聲音克隆工具)是一個強大的聲音模擬工具,它能夠精準捕捉并復制任何人類音色特征,并基于此將文本內容轉化為相應音色的語音輸出,甚至能夠實現不同人聲之間的相互轉換。對于那些在聲音創作上有特殊需求,如需要合成多種音色、進行音頻制作或者個性化定制聲音的用戶來說,Clone-Voice無疑是一個理想的選擇。
軟件說明
Clone-Voice是一款利用網頁界面技術進行聲音克隆的尖端工具。它能夠使用任何人類音色,將一段文字合成為使用該音色說話的聲音,或者將一個聲音使用該音色轉換為另一個聲音。此工具支持包括中文、英語、日語、韓語、法語、德語和意大利語在內的 16 種語言。它提供了文字到語音和聲音到聲音轉換的功能,以易用性、多語言支持和在線錄制聲音的靈活性而著稱。目前,該產品免費使用。
該技術廣泛應用于聲音合成領域,為用戶提供無與倫比的聲音再造能力。無論是為視頻項目配音、制作播客節目,還是創造具有獨特個性的聲音元素,Clone-Voice都能發揮重要作用,極大地豐富了聲音藝術的表現形式和應用范圍。
使用說明
使用非常簡單,沒有N卡GPU也可以使用,下載預編譯版本,雙擊 app.exe 打開一個web界面,鼠標點點就能用。
支持中、英、日、韓、法、德、意等16種語言,可在線從麥克風錄制聲音。
為保證合成效果,建議錄制時長5秒到20秒,發音清晰準確,不要存在背景噪聲。
英文效果很棒,中文效果還湊合。
window預編譯版使用方法(其他系統可源碼部署)
下載預編譯版主文件和模型
下載后解壓到某處,比如 E:/clone-voice 下
雙擊 app.exe ,等待自動打開web窗口,請仔細閱讀cmd窗口的文字提示,如有錯誤,均會在此顯示
模型下載后解壓到軟件目錄下的 tts 文件夾內,解壓后效果如圖
轉換操作步驟
選擇【文字->聲音】按鈕,在文本框中輸入文字、或點擊導入srt字幕文件,然后點擊“立即開始”。
選擇【聲音->聲音】按鈕,點擊或拖拽要轉換的音頻文件(mp3/wav/flac),然后從“要使用的聲音文件”下拉框中選擇要克隆的音色,如果沒有滿意的,也可以點擊“本地上傳”按鈕,選擇已錄制好的5-20s的wav/mp3/flac聲音文件?;蛘唿c擊“開始錄制”按鈕,在線錄制你自己的聲音5-20s,錄制完成點擊使用。然后點擊“立即開始”按鈕
如果機器擁有N卡GPU,并正確配置了CUDA環境,將自動使用CUDA加速
實際應用
Clone-Voice的實際應用多種多樣:
內容創作:對于視頻配音和播客,Clone-Voice可以節省時間、精力和金錢,同時允許即時修改。
音頻編輯:簡化錯誤情況下的音頻記錄修改。
提高可及性:將書面內容轉換為音頻格式,增加視覺障礙聽眾或偏好音頻的用戶的可及性。
個性化:為企業或創作者提供在與客戶或粉絲互動中加入個性化內容的機會。
功能說明
AI聲音克隆的關鍵功能
自然之聲:AI克隆的聲音聽起來自然,能模仿口音和情緒。
多種語言可供選擇:提供用數百種語言克隆聲音的選項,不僅限于英語。
改變設置的能力:允許更改音調和速度等設置以更接近原聲。
更新說明
增加語音速度調節選項,0.1-2.0
split_sentences參數默認改為 False,以取得更好合成效果
增加 .env 代理設置