Anders Hesselboms blogg (politik och filosofi)

En liten uppdatering om AI inom musiken

2023-05-18

Artificiell intelligens (AI) kan idag generera ny musik. Generellt sett handlar det om två typer av musik. Den första är notation (MIDI), där AI används för själva kompositionen. Vilka noter ska spelas när? Den andra är ljudimpulser. Här finns ännu inget användbart att hämta, för resultatet är både kaotiskt och har låg ljudkvalitet. Men på både YouTube och Spotify dyker det idag upp musik som genererats med hjälp av AI, som öppnar helt nya dörrar. På YouTube kan du t.ex. höra Freddie Mercury sjunga Elvis Presleys gamla hit Viva Las Vegas. Hur gick det till?

Kanadensaren Marc Martel är en fantastisk sångare som dessutom har en förmåga att imitera Freddie Mercury någorlunda väl. Han har bl.a. sjungit i cover-bandet Queen Extravaganza och har gjort röstinspelningar till filmen Bohemian Rhapsody.

Idag finns AI som någorlunda väl kan ändra ljudet av en röst till att låta som någon annan. En sådan AI kan tränas på Freddie Mercury, och sedan bearbeta en ljudimpuls så att den låter som om den kommit från Mercurys röst. Detta har folk börjat använda sig av för att få sin favoritartist att framföra någon låt som de absolut inte har spelat in. Vad det gäller Viva Las Vegas så finns en live-inspelning av just Marc Martel där han framför den låten. Här imiterar han alltså inte Freddie Mercury, utan sjunger den som sig själv. Ändå är Mercury-versionen ganska intressant, ur vissa aspekter.

Till att börja med är den input som AI:n får från Martel i full hi-fi. Ljudkvalitén är klanderfri. Men Mercury-versionen låter som att den är inspelad över en telefonledning.

Något som AI:n misslyckas med, är att leverera Mercurys typiska, ganska okontrollerade vibrato. Martel har ett sparsamt och medvetet vibrato, vilket den konstgjorda Mercury tar över, trots att det inte alls rimmar med hur Mercury brukar sjunga.

Något som förvånar även mig är att AI:n verkar ha koll på Mercurys röstomfång, som ligger några toner lägre än Martels. Martel tar sista tonen i sitt normala röstläge, medan AI:n återger Mercurys falestt-röst. Jag som analyserat Mercurys sång, gissar att han förmodligen hade valt en lägre ton att gå ut på, eftersom detta hamnar aningen utanför det register han normalt använder. Det är väldigt tydligt i både The show must go on och The great pretender att mercury gärna inte går ut i falsett, och i Gimme the prize så väljer han en rent musikaliskt mindre logisk ton som utgång, som tillåter att falsettsång kan undvikas.

Vi har en bit kvar innan vi kan låta en AI vara inhoppare för riktiga musiker, men vi är på god väg. Men med tanke på hur pass långt utvecklingen gått på så pass kort tid, så tror jag att det är en tidsfråga innan en konstgjord intelligens kan låta så pass trovärdig att gemene man kan spela in Freddie Mercurys tredje soloalbum.

Kategorier: AI

Lämna ett svar Avbryt svar

Du som kommenterar för första gången: Det kan dröja en stund innan kommentaren syns på sidan, eftersom den modereras manuellt. Har du kommenterat här förr, syns din kommentar direkt.

En kopp kaffe!

Bjud mig på en kopp kaffe (20:-) som tack för bra innehåll!

Bjud på en kopp kaffe!

Om...

Kontaktuppgifter, med mera, finns här.

Följ mig

Public Service

Folkbildning om public service.