Noriega Posted Sunday at 09:04 PM Report Posted Sunday at 09:04 PM (edited) RVC / Applio - voice cloner / stem extractor / speech to speech (Applio is compatible with RTX 50** series) RVC si Applio sunt unelte foarte utile pentru cei care vor sa cloneze vocea cuiva si sa o foloseasca in conversatii online, sau pentru a modifica o alta voce inregistrata anterior. Spre deosebire de clasicele modele TTS (text-to-speech), cu ajutorul acestor modele puteti vorbi LIVE la telefon sau pe platformele online. Puteti schimba in doar cateva secunde vocea originala de pe o melodie cu vocea voastra. Puteti folosi cu succes atat vocile de femei cat si de barbati pe care le-ati clonat. Rezultatele pot iesi IMPECABIL. RVC este modelul original, insa nu ruleaza corespunzator pe noile placi grafice. Applio functioneaza fara probleme. Recomand sa testati direct Applio. Tutorialul video pentru RVC se aplica in mare parte si pentru Applio si poate fi gasit aici: https://www.youtube.com/watch?v=PYQnzIwa4mA Wan2GP - photo / video / lip sync models for GPU Poor (ruleaza si pe placile video nVidia de 6GB). Wan2GP are integrate mai multe modele ce pot fi folosite cu succes pentru a genera imagini de calitate, sau clipuri la o rezolutie mai mult decat decenta. Printre modelele "vedeta" se numara: Wan 2.1 (necenzurat), Wan 2.2 (necenzurat), Hunyuan 1.5 (necenzurat), Flux 1 (cenzurat), Flux 2 (cenzurat), Qwen Image (necenzurat), si noul model Z-Image (necenzurat), care genereaza poze extrem de credibile in doar cateva secunde. Majoritatea acestor modele de baza vin la pachet cu alte modele care permit crearea si editarea clipurilor si pozelor in toate felurile posibile. Pentru lip sync se pot folosi modelele Wan 2.1>Infinitetalk 14B sau Wan 2.1>Multitalk 14B. Infinitetalk are un lip sync bun, insa are o problema cu degetele (in cazul in care Multe dintre modelele gasite in Wan2GP permit sa clonati infatisarea altor persoane. Stiu sa pastreze caracteristicile fizice (chip, tatuaje, cercei), dar si hainele din imaginile pe care le folositi in generarea clipurilor. Cred ca stiti cine le abuzeaza foarte mult in ultimii ani. Tot in pachetul Wan2GP gasiti modele care va permit sa schimbati cu totul infatisarea unor personaje din clipuri video deja existente. Mai exact, puteti lua un clip cu Ion Iliescu in timp ce face anumite actiuni, sa il bagati intr-un model de pe Wan2GP si sa il inlocuiti cu Nicolae Ceausescu facand aceleasi miscari, in acelasi mediu. Nu necesita prea multa munca, doar sa lasati calculatorul sa proceseze pana isi termina taskul. Tot ce am postat mai mult foloseste interfata Gradio care este mult mai intuitiva decat flowurile din ComfyUI. Aveti nevoie de o placa video capabila "sa duca" aceste modele, de la producatorul nVidia. Dupa cum spuneam, Wan2GP functioneaza si pe placi video cu 6 Gb vram. Cu cat aveti mai mult vram cu atat isi termina mai repede joburile. O placa video cu doar 6 Gb vram poate sa proceseze cateva ore un video, pe cand o placa video cu 32 Gb vram termina acelasi job in cateva minute. Cu cat mai multa memorie RAM cu atat mai bine. Toate modelele de mai sus au nevoie de RAM. Wan2GP are profile diferite care va permit sa il folositi si cu mult mai putin de 128 Gb RAM (viteza de procesare va fi afectata). Am postat la pachet RVC / Applio si Wan2GP pentru ca puteti sa combinati vocile clonate cu Applio cu videourile generate de modelele din Wan2GP. Sunt foarte utile in scopuri "bune" si devastatoare cand sunt folosite in scopuri "malefice". Pentru a instala cat mai usor modelele (poate fi o uriasa bataie de cap sa le instalati), recomand sa folositi Applio (parte a aplicatiei Dione), iar in cazul Wan2GP sa folositi One-click installation - Redtash1 sau Pinokio Computer sau chiar Dione. In cazul in care intampinati probleme atunci cand doriti sa folositi unul dintre aceste modele puteti lasa un mesaj in comentarii si va ajut daca stiu rezolvarea. Edited Sunday at 09:30 PM by Noriega Quote