Å skille forskjellige deler av en sang uten å ha den faktiske stammen er vanskelig, men det er et verktøy som heter LALAL.AI det er ganske i stand til å håndtere prosessen. Den deler sanger mellom vokal og instrumental med minimal innsats og ingen lydtekniske ferdigheter kreves.
Og mens LALAL.AI allerede var ganske solid, tok det nylig et stort skritt fremover takket være introduksjonen av den nye nevrale nettverksarkitekturen kalt Cassiopeia. Det tar Rocknet, tjenestens tidligere generasjons nevrale nettverk, og gjør det bedre på omtrent alle måter.
Hva bringer LALAL.AIs Cassiopeia til bordet?
For å si det veldig enkelt: Cassiopeia gir forbedrede delingsresultater med betydelig færre lydartefakter. Hele formålet med LALAL.AI er å trekke og skille vokal og instrumenter fra et spor, så å ha en funksjon som kan forbedre evnen er fantastisk.
Med det nye nevrale nettverket vil LALAL.AI ta litt lengre tid å generere splittede spor, men det er en liten kompromiss for den enorme kvalitetsforbedringen.
Så hva er annerledes? I utgangspunktet vurderer Rocknet, som fortsatt er brukbart på LALAL.AI, bare amplitude-komponenten mens den ignorerer fasekomponenten. Det nyere Cassiopeia nevrale nettverket vurderer inngangssignalets fasekomponent og genererer fasen for utgangssignalet. Gjennom denne prosessen vil de delte sporene inneholde færre lydartefakter.
For å sette alt dette i enkle termer, går den nye algoritmen dypere til å analysere sangen for å skape en bedre splittelse.
For å bevise at tjenesten fungerer mer effektivt, testet LALAL.AI den mot Spleeter, OpenUnmix og Extended Unmix. Den sammenlignet også resultatene med sitt eget Rocknet nevrale nettverk. Du kan se de fulle resultatene av testen på LALAL.AIs blogg, men i utgangspunktet overgikk Cassiopeia alle de andre i de fleste kategorier på tvers av forskjellige tilfeldig utvalgte sjangre som jazz, soft rock, pop og så videre.
Interessant, Rocknet presterer fortsatt bedre i vokalkanalen. Cassiopeia har litt mer infiltrasjon fra instrumentalene inn i vokalen. Imidlertid påpekte LALAL.AI at tall ikke alltid forteller hele historien, og noen ganger kan lydkvaliteten faktisk være annerledes enn det testene viser.
Her er hva selskapet sa om saken:
Selv om Cassiopeia henger etter Rocknet når det gjelder formelle beregninger for vokal, er både den instrumentale delen og spesielt vokalstammen atskilt med Cassiopeia høres mye mer naturlig og mykere ut enn Rocknet, uten de metallisk lydende gjenstandene som er så karakteristiske for den andre løsninger.
Jeg testet resultatene for meg selv, og jeg fant ut at Cassiopeia nevrale nettverk resulterte i renere lydsplitt. Vokalsporet hadde nesten ingen merkbar infiltrasjon fra instrumentalene, og det er akkurat det du vil ha fra et verktøy som LALAL.AI
Når det er sagt, var resultatene fra Rocknet fortsatt ganske gode, og de var absolutt brukbare for å isolere vokalsporet fra instrumentalene.
Hvordan prøver du LALAL.AIs nye Cassiopeia-funksjon?
Hvis du vil gi det nye nevrale nettverket et skudd, kan du gå til LALAL.AI og sørg for at Bruk den nye algoritmen boksen er merket av nederst på skjermen når du laster opp en sang.
Du kan også velge aggresjonsnivået som algoritmen bruker for å dele sporene. Normal er bra for de fleste spor, men du kan eksperimentere med Mild og Aggressive for å se hva som skaper et bedre spor for deg.
I stedet for å bruke timer på å lage stilker, bruker LALAL.AI kunstig intelligens til å gjøre det på få sekunder.
Les Neste
- Forfremmet
- Musikkproduksjon
Dave LeClair skriver Google / Android-nyheter, administrerer sosiale medier og vises i videoer.
Abonner på vårt nyhetsbrev
Bli med på nyhetsbrevet vårt for tekniske tips, anmeldelser, gratis e-bøker og eksklusive tilbud!
Ett steg til…!
Bekreft e-postadressen din i e-posten vi nettopp sendte deg.