В сегодняшней статье вы узнаете, как создавать дипфейки с помощью Easy-Wav2Lip для плотного пролива в TikTok.
Что нужно?
Аккаунт Google + Время
Приступаем к созданию
1 шаг
Переходим по
и нажимаем в правом верхнем углу "Подключиться"
2 шаг
После того как дождались выделения для вас видеокарты приступаем к первой ячейке кода дальше следуем по скринам ниже:
3 шаг
После того как вы выполнили 2 шаг приступаем к добавлению исходников, в моем случаи это будет ведущий FoxNews
Видео должно быть в формате .mp4, а аудио в .wav
4 шаг
Загружаем свои исходники на Google Disk который вы подключили к ячейке
5 шаг
Далее следуем скриншотами:
6 шаг
Указываем путь к файлам в ячейках
video - video_file
audio - vocal_file
7 шаг
Выбираем качество
Советую выбирать Enhanced
8 шаг
Выбираем версию нейронки
Тут уже индивидуально, пробуйте для каждого дипа 2 версии сразу, я советую Wav2Lip
Разница между ними
Wav2Lip
Плюсы: Более точная синхронизация губ + Закрывает рот когда нет звука
Минусы: Иногда приводит к отсутствию зубов
Wav2Lip_GAN
Плюсы: Выглядит приятнее + Сохраняет оригинальные выражения говорящего
Минусы: Менее точная синхронизация губ + Сохраняет рот похожим на оригинал когда нет звука
9 шаг
Запускаем генерацию дипфейка
10 шаг
После получения результата смотрим есть ли какие нибудь артефакты
Если все нравится скачиваем полученный результат
А если все таки артефакты есть
Если наблюдаются проблемы с подбородком, а именно видно полосу рамки где проходила генерация движений, повторяем за мной
Переходим к этим ползу
Ставим ползунок D на 5-10 и смотрим на результат
Этим действием мы добавили к нижней части лица еще пикселей которые будут тоже генерироваться нейронкой
R - Право
L - Лево
U - Верх
D - Низ
Можете играться с этими настройками, тоже норм тема если у человека странная форма головы например
Качество зависит только от того какое исходное видео вы выбрали
Выбирать надо видео где человек желательно смотрит в камеру, а самое главное не прыгает и не дергается
Полученный мною результат