Гайд Заменяем свой голос на чужой в реальном времени с помощью нейросети

wlux.net · 08.08.2023

Так как это нейросеть, то что бы добиться приемлемого качества голоса, необходимо долго "учить" её, на основе разных голосовых записей человека
это занимает сотни часов и десятки гигабайт файлов.

Приступим:
1)Переходим по ссылке на github проект клонирования голоса:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

и сразу скачаем проект на пк

2)Скачиваем заранее натренированные модели:

3) Если ваш ПК и интернет это позволяет, рекомендуется также скачать готовый сет для клонирования голоса:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

Дальше разберемся что куда кидать.

4)Если вы устанавливали Avatarify(подмена лица), то у вас должен быть установленная Anaconda prompt.

Если у вас её нет, то скачиваем по ссылке:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

Нужно выбрать Python 3.7 версию

5) Нужно также скачать и установить тулкит CUDA 10.0, если конечно до этого не устанавливали.

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

6)После всего этого, запускаем Anaconda prompt(miniconda3) и прописываем следующие команды:
conda create -n clone python=3.6

осле всего этого, запускаем Anaconda prompt(miniconda3) и прописываем следующие команды.png

Далее нас попросят нажать y и продолжить(enter):

Готово,теперь нам нужно активировать виртуальную среду, которую мы только что сделали
Для этого прописываем там же:
conda activate clone

После этого, нужно устанавливать необходимые пакеты
прописываем в консоле Anaconda:
conda install pytorch

Также подтверждаем

Теперь распаковываем архив с github, и копируем его путь.
Далее в консоли анаконды
прописываем:
cd (ВАШ ПУТЬ К ФАЙЛАМ С АРХИВА)

Теперь прописываем:
pip install -r requirements.txt

пошла установка необходимых модулей,нужно дождаться конца установки.
ещё пропишем одну команду:
conda install numba

Теперь нужно распаковать те доп. архивы,которые вы скачивали ранее
архив pretrained.zip распаковываем прямо в папку с программой Real-TimeVoice-Cloning-master, а второй архив если скачивали:создаём в папке с программой подпапку LibriSpeech
в ней создаём папку train-clean-100 и туда скидываем данные с распакованного архива.

Так же,что бы не было ошибок, закидываем в папку утилиты dll файлы CUDA:
cudart64_100.dll
cudnn64_7.dll

Их можно найти в папке: C:\ProgramData\Miniconda3\pkgs\pytorch-1.0.0-py3.7_cuda100_cudnn7_1\Lib\site-packages\torch\lib
Если устанавливали avatarify, то тут:
ProgramData\Miniconda3\envs\avatarify\Lib\site-packages\torch\lib

Теперь попробуем запустить:

Вводим в анаконде следующее:
python demo_toolbox.py

Процесс много жрёт! на системе с 16 гб ОЗУ пришлось закрыть почти все программы, имейте ввиду

У нас откроется главное окно

Вверху по кнопке Browse мы загружаем нужный нам образец голоса в формате wav.
Либо можно записать фрагмент своего голоса, нажав на кнопку record.

Вы должны понимать, что речь должна быть нормальной, состоящей из 9-10 слов,обладать чёткостью.
Натренированные данные заточены под английский текст, так что с русским тут не выйдет(англ. более менее)

Натренированные данные заточены под английский текст, так что с русским тут не выйдет(англ. более менее)2.png

После того, как загрузили голос, пишем нужный текст на английском вверху справа, и нажимаем кнопку Synthesize and vocode.
После чего, мы услышим полученный вариант голоса

Если несколько раз проводить эту процедуру, то качество голоса может самостоятельно улучшаться.
Вот пример голоса Игоря, до и через несколько проходов:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

Если хотите сохранить результат:

Редактируем изначально файл demo_cli.py, прописываем нужный текст и имя исх.файла:

Сохраняем, и в анаконде вместо python demo_toolbox.py прописываем: python demo_cli.py
И всё, пойдёт процесс генерации.
По завершению вы получите в той же папке готовый вариант.
Что же,вариант очень интересный, но занимает много времени,ресурсов и сил

victorpetrovoff · 09.08.2023

Неплохо, вроде с этим приколом, или подобным, на ютубе уже есть каверы от разных ру селебрити xd

etre78 · 02.11.2023

Спасибо, когда-нибудь это понадобится

Eflunce · 21.12.2024

Хорошая статья, воспользуюсь)) Пасиба

RRRb · 21.12.2024

Интересная тема, спасибо. Надеюсь комп потянет..

lddkas1234214 · 22.12.2024

Неплохо, попробую воспользоваться этим

bestie3 · 06.02.2025

Как раз то, что искал, спасибо, попробую)

Efimushka · 07.02.2025

wlux.net сказал(а):
Так как это нейросеть, то что бы добиться приемлемого качества голоса, необходимо долго "учить" её, на основе разных голосовых записей человека
это занимает сотни часов и десятки гигабайт файлов.

Приступим:
1)Переходим по ссылке на github проект клонирования голоса:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

и сразу скачаем проект на пк
Посмотреть вложение 11285

2)Скачиваем заранее натренированные модели:

3) Если ваш ПК и интернет это позволяет, рекомендуется также скачать готовый сет для клонирования голоса:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

Дальше разберемся что куда кидать.

4)Если вы устанавливали Avatarify(подмена лица), то у вас должен быть установленная Anaconda prompt.

Если у вас её нет, то скачиваем по ссылке:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

Нужно выбрать Python 3.7 версию

5) Нужно также скачать и установить тулкит CUDA 10.0, если конечно до этого не устанавливали.

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

6)После всего этого, запускаем Anaconda prompt(miniconda3) и прописываем следующие команды:
conda create -n clone python=3.6

Посмотреть вложение 11286

Далее нас попросят нажать y и продолжить(enter):
Посмотреть вложение 11287

Готово,теперь нам нужно активировать виртуальную среду, которую мы только что сделали
Для этого прописываем там же:
conda activate clone

После этого, нужно устанавливать необходимые пакеты
прописываем в консоле Anaconda:
conda install pytorch

Посмотреть вложение 11288

Также подтверждаем

Теперь распаковываем архив с github, и копируем его путь.
Далее в консоли анаконды
прописываем:
cd (ВАШ ПУТЬ К ФАЙЛАМ С АРХИВА)

Посмотреть вложение 11289
Посмотреть вложение 11290

Теперь прописываем:
pip install -r requirements.txt

Посмотреть вложение 11291

пошла установка необходимых модулей,нужно дождаться конца установки.
ещё пропишем одну команду:
conda install numba

Теперь нужно распаковать те доп. архивы,которые вы скачивали ранее
архив pretrained.zip распаковываем прямо в папку с программой Real-TimeVoice-Cloning-master, а второй архив если скачивали:создаём в папке с программой подпапку LibriSpeech
в ней создаём папку train-clean-100 и туда скидываем данные с распакованного архива.

Так же,что бы не было ошибок, закидываем в папку утилиты dll файлы CUDA:
cudart64_100.dll
cudnn64_7.dll

Их можно найти в папке: C:\ProgramData\Miniconda3\pkgs\pytorch-1.0.0-py3.7_cuda100_cudnn7_1\Lib\site-packages\torch\lib
Если устанавливали avatarify, то тут:
ProgramData\Miniconda3\envs\avatarify\Lib\site-packages\torch\lib

Теперь попробуем запустить:

Вводим в анаконде следующее:
python demo_toolbox.py

Процесс много жрёт! на системе с 16 гб ОЗУ пришлось закрыть почти все программы, имейте ввиду

У нас откроется главное окно

Посмотреть вложение 11292

Вверху по кнопке Browse мы загружаем нужный нам образец голоса в формате wav.
Либо можно записать фрагмент своего голоса, нажав на кнопку record.

Вы должны понимать, что речь должна быть нормальной, состоящей из 9-10 слов,обладать чёткостью.
Натренированные данные заточены под английский текст, так что с русским тут не выйдет(англ. более менее)

Посмотреть вложение 11293

После того, как загрузили голос, пишем нужный текст на английском вверху справа, и нажимаем кнопку Synthesize and vocode.
После чего, мы услышим полученный вариант голоса

Если несколько раз проводить эту процедуру, то качество голоса может самостоятельно улучшаться.
Вот пример голоса Игоря, до и через несколько проходов:

Пожалуйста, войдите или зерегистрируйтесь, чтобы увидеть скрытый текст.

Если хотите сохранить результат:

Редактируем изначально файл demo_cli.py, прописываем нужный текст и имя исх.файла:

Посмотреть вложение 11294

Сохраняем, и в анаконде вместо python demo_toolbox.py прописываем: python demo_cli.py
И всё, пойдёт процесс генерации.
По завершению вы получите в той же папке готовый вариант.
Что же,вариант очень интересный, но занимает много времени,ресурсов и сил

Спасибо, когда-нибудь это понадобится

Jodu · 07.02.2025

Вот тут благодарочка, за гайд отдельный респект <3

luzik · 07.02.2025

у меня пишет файл не обнаружен(

japankassssss · 08.02.2025

Очень полезная статья, сохранил себе

ixneliness · 08.02.2025

Спасибо, очень полезно, буду пользоваться

Hikikan · 16.02.2025

Есть и куда более простые решения, но и за этот спасибо)

Kioeoelelee · 24.02.2025

до чего дошел прогресс, спасибо

Добро пожаловать! Форум WLUX.NET - Игры, Читы, Скрипты, Статьи, Софт, Курсы.

Добро пожаловать гость!

Система наград, ежедневное пополнения тем!

Статьи, гайды, софт

FAQ по форуму

Гайд Заменяем свой голос на чужой в реальном времени с помощью нейросети

wlux.net

Последние темы в этом разделе:

victorpetrovoff

etre78

Eflunce

RRRb

lddkas1234214

bestie3

Efimushka

Jodu

luzik

japankassssss

ixneliness

Hikikan

Kioeoelelee

Поиск по форуму

Похожие темы:

О нас:

Жалоба на материал(DMCA/РКН):

Полезные ссылки:

Онлайн статистика