Tehnologija podatkovne vizualizacije, pet primerov

William Playfai: grafikon škotskega uvoza in izvoza med božičem leta 1780 in božičem leta 1781. Vir: https://en.wikipedia.org/wiki/William_Playfair

1. r/dataisbeatiful

Pospešeno množenje in zlaganje tehnopodob, ki po mnenju Viléma Flusserja predstavljajo kodiranje informacij v postliterarni dobi, med pretakajočimi vsebinami sodobnih ekranskih kultur v ospredje postavlja tudi množico oblik podatkovnega vizualiziranja iz najrazličnejših virov in področij. Poleg avtohtonih digitalnih vizualnih medijev, kot so memi, gifi in tiktokovski videi, so infografike, podatkovne animacije, tier listi in iceberg seznami pomemben in popularen segment vizualne internetne kulture, hkrati pa učinkovita metoda razširjanja znanja. Subreddit r/dataisbeatiful ima v tem trenutku skoraj 19 milijonov naročnikov.

Zgodovino podatkovnega vizualiziranja se v wikipedijskih in klasičnih zgodovinskih vnosih pogosto začne beležiti že kar pri prazgodovinskih grafičnih inskripcijah, status prvega resnega formata pa pripada izdelovanju zemljevidov. Če izpustimo geometrijo in tehnično risbo je veliko bolj smiselno in pravilno razvoj podatkovnega vizualiziranja uskladiti z začetki znanstvenega vizualiziranja statističnih izračunov v 18. stoletju. Leta 1765 je angleški multiznanstvenik Joseph Priestley izrisal diagram, s katerim je s pomočjo črtic primerjal življenjske dobe in obdobja življenja različnih državnikov in učenjakov. Ta pomemben dogodek v zgodovini vizualnih in kognitivnih tehnologij je dobil nadaljevanje dvajset let kasneje, ko je škotski inženir, ekonomist in tajni agent William Playfair položil temelje statistične vizualizacije. Najprej je zasnoval stolpični in črtni diagram, kasneje pa še tortni in krožni grafikon.

Poleg statistikov, kot je Francis Galton, ki je proti koncu 19. stoletja začel uporabljati graf raztrosa (scatter plot) in omogočil grafično reprezentacijo bivariatnih in multivariatnih statističnih analiz, med vplivneže podatkovnega vizualiziranja v predelektronski in predračunalniški dobi zagotovo sodita tudi John Snow, angleški zdravnik in začetnik moderne epidemiologije, in pa Florence Nightingale, začetnica moderne zdravstvene nege. Po izbruhu kolere v Londonu leta 1854 je Snow izdelal zemljevid distribucije okužb okoli črpalke za vodo v Sohu in s tem prispeval k razumevanju izbruha in širjenja epidemije. Med  številnimi grafičnimi reprezentacijami statističnih izračunov o stanju javnega zdravstva, ki jih je izdelala Florence Nightingale, pa je morda najbolj znan polarni diagram vzrokov smrtnosti med vojaki v krimski vojni med letoma 1854 in 1855.

Florence Nightingale: diagram vzrokov smrtnosti vojakov v krimski vojni. Vir: https://www.atlasobscura.com/articles/florence-nightingale-infograp

V času ko so iz znanstvenih in laboratorijskih procesov (na primer iz radijskega elektromagnetnega valovanja) nastajali elektronski avdiovizualni mediji, da bi zabavali in informirali vse bolj proletarizirano ljudstvo, je tudi podatkovna vizualizacija našla svoje mesto v medijski javnosti. Po dizajnerskem rushu, ki so ga konec 19. stoletja pognale inovacije v tiskarski tehnologiji, so v 20. stoletju infografike (vključno z vizualizacijo neštevilčnih podatkov) in sorodne piktorialne invencije postale pomemben segment periodičnega tiska. Podatkovna vizualizacija je v tridesetih letih 20. stoletja dobila tudi standardizirano obliko, imenovano Isotype (International System of Typographic Picture Education). Simbole in piktograme podatkovne vizualizacije, ki so zasnovali razvoj publicističnih infografik, je pred drugo svetovno vojno v dunajskem družbeno-ekonomskem muzeju s sodelavci razvijal Otto Neurath (tudi član dunajskega filozofskega krožka logičnega pozitivizma). Zato se je tovrstna metoda podatkovne vizualizacije najprej imenovala dunajska metoda slikovne statistike.

V nadaljnji zgodovini, ki jo šele zares popularizira, je bila podatkovna vizualizacija, tako znanstveno kot informacijsko vizualiziranje in oblikovanje, tesno zvezana z razvojem računalniških podatkovnih znanosti (poleg rabe v vojaške in vojne namene so bili računalniki so najprej uporabljani za podatkoven menedžement) in računalniško generiranega vizualiziranja. Še posebej pomemben je bil razvoj računalniške grafike in specializiranih programskih jezikov, programskih knjižnic ter dostopne programske opreme za vizualizacijo.

Vendar je podatkovna vizualizacija več kot grafična in vizualna reprezentacija podatkovnih zbirk v obliki infografik in znanstvenega vizualiziranja. Podatkovna vizualizacija je operativen princip informacijskih in računalniških sistemov, ki s kodiranjem in zbiranjem podatkov določajo in upravljajo tehnične, družbene, fizične in naravne procese, od finančnih trendov do podnebnih sprememb.

2. Nadzorna plošča

Digitalne nadzorne plošče (dashboard) so grafični uporabniški vmesniki in kognitivne tehnologije (intelligence) za nadzor podatkov, predvsem v obliki metrik in grafov. Kot grafični uporabniški vmesniki so dobro integrirani v sodobno življenje: WordPress, Google Analytics, covid-19.sledilnik.org, Kraken in drugi dashboard sistemi za nadzor kriptoinvesticij …  pa tudi nadzorne plošče za krmiljenje zunanjih procesov in naprav. Z mikročasovnim internetnim pritokom informacij, ki omogoča konstantno osveževanje, dashboardi zaznavajo regularnosti in napovedujejo obnašanje pojavov v prihodnosti.

Kraken dashboard. Vir: https://support.kraken.com/hc/en-us/articles/360022627732-Trading-interface-guide

Dashboardi so primer operativne moči podatkovne vizualizacije, ki  izhaja iz razvoja višjih programskih jezikov in grafičnih uporabniških vmesnikov, ki so začeli bistveno spreminjati (kar so kasneje medijski arheologiji in kritični medijski teoretiki sprejeli s poznanim negodovanjem o izgubljeni alternativi) pomen računalnika v družbi in ga z bajnim korporativnim izplenom prinašati v vsak dom in v vse sfere življenja. Grafične uporabniške vmesnike, ki so temeljito spremenili razvoj računalništva in operativnosti podatkovne vizualizacije, so v sedemdesetih letih prejšnjega stoletja najprej razvijali v Xeroxovem raziskovalnem centru, leta 1984 pa je Apple lansiral Macintosh, osebni računalnik z user-friendly grafičnim uporabniškim vmesnikom: namizje, okna, ikone, opravilna vrstica in tako naprej. Grafični uporabniški vmesniki so omogočili uporabo računalnika z operativno vizualizacijo, brez besedilnega vnašanja ukazov in recimo temu minimalnega programiranja.

Tehnološka redefinicija mišljenja, ki jo je pognalo računalništvo po drugi svetovni vojni (prve nevronske mreže so nastale v petdesetih letih), je temeljila tudi na redefiniciji vizualnosti in vizualnih medijev. Pri tem ima podatkovna vizualizacija primarno kognitivno in interpretativno funkcijo: je način spoznavanja in zaznavanja vzorcev in struktur v podatkovnih zbirkah, brez katerega  danes ni mogoče upravljati (ali posegati v avtomatizirano upravljanje) masovnih arhivov velikega podatkovja. V knjigi Beautifil Data: A History of Vision and Reason since 1945, v kateri lahko v zgoščeni obliki beremo o redefiniciji mišljenja in vizualnosti po drugi svetovni vojni, avtorica Orit Halpern hkrati pokaže, da je podatkovna vizualizacija ključna tudi za spremembo družbenega upravljanja, predvsem biopolitičnega upravljanja s populacijo, ki poteka na konstantnem prepoznavanju regularnosti. Družbeno okolje se končno razkrije kot to, kar se je kazalo že v sociologiji 19. stoletja: kot neznansko število malih vzorcev oziramo regularnosti, ki jih lahko grupiramo dalje v višje regularnosti in si jih predstavljamo s podatkovno vizualizacijo. Vendar operativnost podatkovne vizualizacije predstavlja globlje spremembe v medijski in tehnološki evoluciji mišljenja in modeliranja realnosti. Vizualna reprezentacija podatkov in njihovih razmerij v dvo- ali trodimenzionalnem prostoru je nelinearna in multidimenzionalna. Že zato ima določeno prednost pred linearnim sklepanjem in razmišljanjem, ki izhaja iz večtisočletne kulture pisave in naravnega jezika.

3. xeno.graphics

Na blogu xeno.graphics se nahaja repozitorij nenavadnih in inovativnih grafikonov in infografik. Blog vzdržuje belgijski podatkovni novinar, oblikovalec in (tako pravi)  podatkovni konzultant Maarten Lambrechts. Namen bloga je boj proti »ksenografikonofobiji in popularizacija novih tipov grafikonov«. Med primeri, ki predstavljajo eksperimentalne oblike vizualizacije kompleksnih podatkovnih relacij, najdemo tudi takšne za širše ljudstvo, kot je grafični prikaz realnočasovne verjetnosti zmage vseh tekem od osmine finala dalje na zadnjem svetovnem prvenstvu v nogometu leta 2018 v Rusiji. Na primer: Belgija je v tekmo osmina finala z Japonsko vstopila z več kot 80-odstotno verjetnostjo zmage, vendar je po treh četrtinah tekme Japonska zaradi vodstva z 2–0 dosegla približno 90-odstotno verjetnost zmage (Belgija je z golom v podaljšku na koncu zmagala 3–2).

Bracket probabilities. Vir: https://xeno.graphics/bracket-probabilities/

Če je v podatkovni vizualizaciji res kaj tujega, kot trdi kurator bloga, potem ta ne glede na eksperimentalno obliko izvira iz tujosti številk in statistike, ki so jo računalniki začeli avtomatizirati že med drugo svetovno vojno, v zadnjih desetletjih pa pospešili z multidimenzionalno in mikročasovno optiko strojnega učenja – inteligence, ki ne le, da vidi več, ampak vidi drugače. Podatkovna vizualizacija je način vizualiziranja, ki je lasten številkam in številčno kodiranim informacijam ter matematičnim izračunom in komputaciji. Transformacija (pogosto nelinearnih in multidimenzionalnih) številčnih podatkov iz nevizualnih domen v prostorsko vizualno obliko, ki jo človek zaznava kot podobo, se temeljno razlikuje od oblik in tehnik vizualizacije, ki pripadajo zgodovini človeške vizualne kulture. Podatki so nosilci lastnih vizualnih oblik in estetik, ki temeljijo na izračunavanju in prepoznavanju razmerij in regularnosti v podatkih.

Podatkovna vizualizacija se razlikuje od tehnične ekstenzije očesa, ki se manifestira v fotografskem mediju. Kljub temu da je izrisovanje podatkovnih vizualnih oblik uprizorjeno za človeške kognitivne in kulturne zmožnosti, je pogled, na katerem temelji podatkovna vizualizacija, nečloveški. V resnici podatkovna vizualizacija ni optičen, ampak entoptičen medij, kot situacijo sodobnega računalniško oblikovanega medijskega sveta v reviji Šum #16 opiše Jesse Josua Benjamin. Fiziološko so entoptični pojavi vizualni učinki, ki jih proizvede oko in niso del zunanjega vidnega sveta – na primer plavajoči madeži, ki tu in tam zdrsijo prek ekrana (čeprav niso njegov proizvod), medtem ko pišem tole besedilo. Entoptični mediji tako označujejo računalniško prepoznavanje vzorcev, ki je komputacijska podlaga delovanja digitalnih podatkovnih procesov. Kot piše Benjamin, »paradigmatski premik iz optičnih v entoptične medije« vključuje dejstvo, da »sodobni medijski aparati uporabljajo obliko notranjih optik (na primer izpeljani vzorci podatkov, vzorci vzorcev)«.

Film Anon iz leta 2018 na primer predstavlja znanstvenofantastično vizijo entoptičnih medijev in ksenografik. Zgoraj omenjeni dashboardi so v filmu integrirani v človeške možgane, loadanje datotek in kartotek vidno zaznanih oseb se pred človekovimi očmi prikazujejo tako rekoč od znotraj.

Prizor iz filma Anon. Vir: https://writingstudio.co.za/anon-a-meditation-on-the-fraught-relationship-between-technology-and-humanit

4. Selfiecity

Selfiecity je raziskovalni projekt Cultural Analytics Lab-a pod vodstvom rusko-ameriškega medijskega teoretika Leva Manovicha in sodelavcev. Manovich je v ameriškem akademskem medijskoteoretskem svetu zaslovel s knjigo The Language of New Media iz leta 2001. Kasneje je z računalniškimi in podatkovnimi znanstveniki ustanovil laboratorij za računalniško analizo kulture, ki temelji na velikopodatkovnih zbirkah in razvijanju lastne programske opreme za analizo in vizualizacijo.

Selfiecity predstavlja analizo in vizualizacijo 3200 selfijev, ki so bili med 5. in 12. decembrom leta 2013 v Bangkoku, Moskvi, New Yorku in São Paulu javno objavljeni na Instagramu. Namen raziskave je bila primerjalna analiza selfijev v petih metropolah glede na stil in demografske značilnosti. Raziskovalci so na podlagi 656.000 Instagramovih fotografij najprej osnovali naključni vzorec 120.000 fotografij, iz katerega so potem platformni delavci Amazonovega Mechanical Turk označili tiste, ki jih lahko klasificiramo kot selfi, kasneje pa glede na lastno presojo (prepoznavo) določili še spol in okvirno starost človeka na fotografiji. Na tej podlagi je bil oblikovan končni vzorec, na katerem je potem potekala algoritmična prepoznava obraza, ki je med drugim izračunavala razpoloženje in naklon glave.

Rezultati so pokazali, da so najbolj razposajeni in nasmejani selfiji v Bangkoku, najmanj pa v Moskvi, najbolj ekstremne poze (nagibi) pa so značilne za ženske selfije v São Paulu in najmanj za moške selfije v Moskvi. Sicer pa je morda najbolj zanimiva ugotovitev, da je iz analiziranega vzorca Instagramovih fotografij zgolj 3–5 odstotkov selfijev; selfiji očitno niso tako pogosta metoda Instagramove vizualne komunikacije, kot si nemara mislimo. Tovrstne velikopodatkovne računalniške raziskave pa ne predstavljajo le realnopodatkovnih in v tem primeru stilskih analiz internetne in platformne kulture, ampak tudi možnosti njihove vizualizacije. Raziskovalci so namreč pridobljene rezultate vizualizirali na način, da so grafikone oblikovali iz vzorčenih selfijev: vsak graf, ki predstavlja distribucijo določene vrednosti v določenem mestu, na primer razpoloženja, je sestavljen iz 640 digitalnih podob oziroma selfijev.

Selfiecity. Vir: http://lab.culturalanalytics.info/2014/08/selfiecity-investigates-style-of.html

To je primer medijske vizualizacije, ki se po mnenju Manovicha temeljno razlikuje od ustaljenih oblik podatkovne vizualizacije. V knjigi Cultural Analytics Manovich piše: »Tipična podatkovna vizualizacija najprej prevede svet v številke in potem vizualizira razmerja med njimi. Nasprotno pa medijska vizualizacija prevaja množico podob v novo podobo, ki lahko razkrije vzorce v množici. Na kratko, slike so prevedene v slike. Medijsko vizualizacijo lahko formalno definiramo kot ustvarjanje nove vizualne reprezentacije iz vizualnih objektov v zbirki ali iz delov teh objektov. V primeru zbirke posameznih podob medijska vizualizacija pomeni prikazovanje vseh podob ali njihovih delov glede na pestrost konfiguracij v metapodatkih (datumi, prostori, avtorji), vsebinskih lastnostih (npr. prisotnost obrazov) in/ali vizualnih lastnostih (npr. prevladujoče barve, količina teksture, število potez).«

Natančneje, izhodišče medijske vizualizacije je digitalna ali digitalizirana podoba s človeško ali računalniško določenimi vrednostmi, ne pa digitalne podatkovne zbirke. Na podlagi posamezne spremenljivke ali multivariatnih kombinacij se potem podobe grupira na način, da tvorijo višjo enoto, ki razkriva določeno regularnost, ki je lastna določenemu repozitoriju (kot je na primer Instagram) digitalnih podob. Medijska vizualizacija omogoča ustvarjanje še nepoznanih oblik vizualizacije, kot tudi izrisovanje spremenljivk v dvodimezionalnem prostoru, kjer os x predstavlja čas, os y pa svetlost črnobelih kompozicij ali saturacijo barvnih kompozicij, kot to velja še za en primer iz fonda Cultural Analytics Lab-a, analizo 4535 naslovnic revije Time med leti 1923 in 2009.

Time: 4535 Time Magazine Covers, 1923–2009. Vir: http://lab.culturalanalytics.info/2016/04/timeline-4535-time-magazine-covers-1923.html

5. ,ločene vrednosti

Med 26. majem in 5. junijem (ali med 18. oktobrom in 30. novembrom v Xcentru v Novi Gorici) 2022 so v popolnoma zatemnjenih prostorih 8. nadstropja stolpnice Avtotehna v Ljubljani »lebdeli« 3D stiskani fosforescentni objekti. Oblikovani so bili s serijo pretvorb prostodostopnih digitalnih podatkov iz CSV (comma-separated values) datotek, ki je izjemno popularen in funkcionalen format zapisovanja podatkovnih zbirk, v katerem so vrednosti ločene z vejico.

,ločene vrednosti je umetniški projekt Staša Vrenka, katerega naslov se lahko nanaša tako na CSV datoteke kot na diskretne vrednosti, ki so temelj digitalnih tehnologij in digitalnih podatkovnih modelov. Vrenko s pomočjo analogno-digitalnega procesnega orodja, ki ga je razvil, digitalne podatke najprej pretvori v analogne električne signale in jih projicira na osciloskopskem zaslonu, ki je tudi del razstavne instalacije. Osciloskop je medij analogne podatkovne vizualizacije, značilen predvsem za elektrotehnični inženiring. Variabilnost signala se na osciloskopu manifestira kot fosforna linija (zaslon osciloskopa je prevlečen s fosforjem), ki zaradi faznega zamika ustvarja videz tridimenzionalnosti. V programskem okolju za videogrametrijo, ki s pomočjo videoposnetkov iz različnih kotov ustvarja tridimenzionalne objekte, so bili potem iz posnetih fosfornih linij (avtomatično) oblikovani modeli za končne razstavne predmete.

Staš Vrenko: ,ločene vrednosti. Vir: https://wiki.ljudmila.org/Sta%C5%A1_Vrenko:_,lo%C4%8Dene_vrednosti

Kot je zapisano v spremnem tekstu, ,ločene vrednosti namesto semantične ali funkcionalne vrednosti podatkovnih modelov »v ospredje postavljajo njihovo plastičnost in formativno moč, obenem pa modelirajo tudi potencialnosti analogno-digitalnih prepletov, ki jih podatki in impulzi prečijo v procesu.« Projekt je do vsebine podatkovnih zbirk indiferenten, podatki so razvezani stika z realnimi pojavi, ki jih registrirajo in vrednotijo. Vrenko v ospredje tako ne postavlja operativnost in informacijsko funkcionalnost podatkovnega vizualiziranja, ampak njeno zmožnost generiranja oblik, ki je odvisna od materialnosti digitalnih in analognih tehnologij. ,ločene vrednosti v medijskoarheološki natančnosti izolirajo podatkovno vizualizacijo in njeno odvisnost od tehnologije.

Po eni strani je v primeru ,ločenih vrednosti podatkovna vizualizacija vrnjena zgodovini. Toda ne razvoju vizualnih oblik in operativnosti podatkovne vizualizacije, niti razvoju vizualnih tehnologij, ampak digitalni in analogni tehničnosti, ki na različne načine zajemata in modulirata podatkovno realnost. V seriji digitalno-analognih pretvorb, na katerem temelji Vrenkov projekt, se razkrivajo tako tehnološki postopki, ki šele omogočajo vizualizacijo, kot formativna moč in plastičnost podatkovnih modelov – lahko se pretvorijo v zvok, podobo ali 3D tiskane fosforescentne objekte, za kar se je v tem primeru odločil Vrenko.

Po drugi strani pa je plastičnost podatkovnih modelov prepuščena tehnološki generativnosti. Tehnološki postopki (v postopku videogrametrije je vključena tudi umetna inteligenca) so tisti, ki omogočijo, da se podatki tako rekoč vizualizirajo in v končni fazi tudi materializirajo v razstavljenih objektih tako rekoč sami iz sebe. Formativna moč digitalnih podatkovnih modelov, ki so že postali tudi model zgodovine (zgodovina se ne zapisuje v narativne besedilne oblike, ampak v podatkovne zbirke, ki jih zares lahko razume in osmišlja računalnik), je v oblikovanju tako virtualnega kot fizično realnega sveta – stran od ,ločenih vrednosti in 3D tiskanja se lahko spomnimo tudi na hologramsko vstajanje od mrtvih, kot je bil Tupacov nastop na festivalu Coachella leta 2012.