Pintapohdintaa – Äänimanipulaatio. Nyt.

Pintapohdintaa, Politiikka

Audition

Menemättä turhan syvälle aiheeseen, tässä ensimmäiset ajatukseni pinnallisen pohdinnan muodossa liittyen Adoben uuteen VoCo-projektiin:

Tällä viikolla näin ensimmäistä kertaa Adoben ”ihmisäänen PhotoShopiksi” kutsutun VoCo-projektin esittelyvideon. Pähkinänkuoressa uusi teknologia toimii siis niin, että ohjelma analysoi tietyn äänileikkeen, oppii ihmisäänen eri nyanssit ja lauseessa käytetyn sanaston. Sitten tietokone ruksuttaa lausetta tovin, minkä jälkeen sanoja voi muokata perinteisen tekstieditorin tavoin, eikä kerran analysoidun ja rakennetun äänen enää tarvitse noudattaa alkuperäisen lauseen käsikirjoitusta. Tässä välissä suosittelen katsomaan alta löytyvän videon ennen kuin jatkaa blogaukseni lukemista pidemmälle:

 

 

Audiofiilinä ensi reaktioni oli lähinnä haltioitunutta hurmosta – ai, miten siistii! Mutta sitten intoon sulautuivat myös pelko ja ahdistus. Tällä teknologialla kuka tahansa voisi saada suhteellisen pienellä vaivannäöllä kenet tahansa puhumaan mitä tahansa. Samalla tajuntaani pärähti ajatus – koska photoshoppaaminen on tehnyt valokuvatodisteista jokseenkin kyseenalaistettavia, tunnistettavaa ääntä sisältävästä materiaalista (esimerkiksi vuodetuista ääni- ja videonauhoista) tuli samalla valokuvaa painavampaa todistusaineistoa.

Ja kyllä, äänen manipulointi on kuvamanipulaation tavoin vanha konsepti, ja sitä on käytetty jo vuosikymmeniä erinäisiin tarkoituksiin, joita muun muassa agenttielokuvat ovat meille taviksille esitelleet. Tämän mahdollisuuden tuominen helposti taviskuluttajien saataville avaa kuitenkin aivan uuden purkillisen matoja (hyi, anglismi).

Vaikka taannoinen Trump-vuoto ”pukuhuonepuheesta” olikin videomuodossa, kuultiin raskauttavimmaksi koettu ”grab her by the pussy” -hetki vain äänimuodossa. Eikö tämän äänileikkeen olisi voinut sisällyttää videoon vain Adoben kuvailemaa teknologiaa hyödyntäen?

Jo nyt YouTubesta löytyy lukuisia amatöörimäisesti kuvattuja videoita, joissa heikkoa ääninauhaa selventämään on lisätty valheelliset tekstitykset. Tästä esimerkkinä alta löytyvä videopari Floridan senaattorin Marco Rubion kommenteista koskien Raamattua: Cruzin kampanjan videopaljastus Rubion vähättelevillä kommenteilla tekstitetty versio ja ilmeisesti alkuperäisiä sanomisia mukaillen tekstitetty versio.

 

Sekavaa, eikös? Huonolaatuisesta videosta on hankala lukea huulilta, ja äänenlaatu on suorastaan kelvoton. Adoben Voco-projekti sen sijaan tarjoaa mahdollisuuden luoda selkeä, alkuperäiseltä kuulostava ja vapaasti muokattava versio imitioitavasta kohteesta.

Myönnettäköön, että Adoben esittelyvideolla uudelleenmuodostettu teksti ei kuulostanut niin luonnolliselta kuin olisi voinut toivoa, mutta tarkkaan valitun, suhteellisen tasapaksulla äänenpainolla puhutun puheotteen muuntaminen mielivaltaisesti kertomaan mitä tahansa on VoCo-projektin tarjoamin keinoin suorastaan naurettavan helppoa. Löydän heti mielessäni käyttöä tälle muun muassa poliittisen satiirin saralla. Pilapuhelu presidentti Trumpilta? Onnistuu. Elvis on elossa ja viettää eläkepäiviään Havaijilla? Tietysti, ja toivottaa vielä hyvää syntymäpäivää vastaajassasi.

Mutta entäpä, jos sitä alettaisiin käyttämään tekosyynä? Nyt kun tämä teknologia kerran on olemassa ja yleisesti tiedossa, eikö jokainen (englantia puhuva, aluksi) poliitikko voi tästä lähtien väittää vuodetun äänimateriaalin olevan peräisin Adoben VoCon kaltaisista äänimanipulaatiosovelluksista? Edes video ei pelasta tätä tekosyytä, sillä videomateriaalin ääniraitaa on tietysti myös mahdollista muokata.

Jos kenet tahansa on mahdollista laittaa sanomaan mitä tahansa, romahtaa tallenteiden uskottavuus täysin. Feikkiuutisten aikakaudella jäljelle jää enää todistetusti suorat lähetykset, joihin muokkausteknologia ei ehdi pääsemään väliin. Vielä.

Mikäli tämä ilmiö räjähtää suurempaan valtavirtaan, alkavatko ihmiset suojella omaa ääntään? Mitä, jos kaikki, mitä tarvitaan henkilön äänen varastamiseen ja väärinkäyttöön onkin radiossa annettu kahden minuutin haastattelu?

Äärimmäisen lahjakkaita photoshoppaajia on netissä jo pilvin pimein. Mikäli (ja kuten todennäköistä on) Adobe julkaisee VoCo-projektinsa teknologian osaksi kuluttajatuotesarjaansa (esimerkiksi Adobe Auditionin ominaisuutena), alamme kuulemaan aivan uudenlaisia äänimaailman tuotteita, joissa esimerkiksi podcastit toimivat raakamateriaalina ja niistä remixataan aivan uudenlaista sisältöä, aivan uudenlaisilla käsikirjoituksilla. Pelonsekaisin tuntein odotan tämän teknologian tuloa.

Tulevaisuus on nyt.