Deze zomer las ik de stad en zijn onvaste muren, het nieuwe boek van Haruki Murakami. Ik vind zijn boeken een plezier om te lezen. Ze voelen aan als sprookjes voor volwassenen. En ook zijn laatste boek is een heerlijk sprookje om in te verdwijnen.

De zomer is ook een periode waarin ideeën ontstaan. En zo besloot ik deze zomer om twee dingen die me plezier brengen samen te brengen: boeken en datavisualisatie.


Het idee: de hoofdstuklengte visualiseren

Ik kreeg het idee om een visuele weergave te maken van een simpele, behapbare dataset: het aantal pagina’s per hoofdstuk. De stad en zijn onvaste muren is ruim 630 pagina’s dik en bevat 70 hoofdstukken die verdeeld zijn over drie delen.

Het gaat dus om eenvoudige data:

  • 3 delen
  • 70 hoofdstukken
  • Aantal pagina’s per hoofdstuk

Ik vat deze data samen in tabel die bijna net zo eenvoudig is:

En daarmee ga ik aan de slag.


De visualisaties die het niet werden

Een datavisualisatie maak je niet 1-2-3, dat heeft tijd nodig. En in die tijd maak ik verschillende versies. Ik begin met een simpele visualisatie, zoiets als een balkgrafiek. Het doel is niet om iets moois te maken, maar om te checken of de data er goed uitzien.

murakami - de stad en zijn onvaste muren - balkgrafiek met hoofdstuklengte

En dat lijkt het geval.

Vanuit deze functionele test maak ik visuele verkenningen. Omdat het om een persoonlijk project gaat zoek hierbij ik naar een beeld dat me aanspreekt, een beeld dat prettig is om naar te kijken. Ik zet hiervoor vaak de assen uit, zodat enkel het beeld van de grafiek kan spreken.

Ik begin met een gestapelde balkgrafiek die de lengte per deel van het boek laat zien en voeg een witregel toe wanneer een nieuw deel begint:

murakami - de stad en zijn onvaste muren - stacked bar chart

Leuk, maar ik hier word niet gelukkig van. Dus ik zoek door.

Poging twee is een grafiek die ik zou willen beschrijven als een zonnestraalgrafiek. Hierin is ieder hoofdstuk een zonnestraal. Ik bereken de verhouding tussen het aantal pagina’s van een hoofdstuk en het langste hoofdstuk. Deze verhouding (bijv. 30%) bepaalt intensiteit van de kleur.

murakami - de stad en zijn onvaste muren - zonnestraalgrafiek

Interessanter, maar ook dit is het niet voor mij.


De datavisualisatie die het wel werd

Uiteindelijk kwam ik bij onderstaande visualisatie uit.

murakami - de stad en zijn onvaste muren - hoofdstuklengte viz

Hierin staat ieder vierkant voor een hoofdstuk en gebruik ik dezelfde verhouding als voorheen (pagina’s per hoofdstuk t.o.v. het langste hoofdstuk) om een vierkant te vullen. Hoe voller het vierkant, hoe meer pagina’s het hoofdstuk telt. Verder kies ik ervoor om de informatie van de drie delen niet te gebruiken om zo meer eenheid in het beeld te krijgen.

Het resulteert in een sterk grafisch beeld dat me doet denken aan ramen die opengaan. Alsof de lange hoofdstukken me een beter inkijkje geven in de wereld dan de korte hoofdstukken.

Dit beeld spreekt me aan.

Hier kan ik wat mee.


Mijn drie favoriete Murakami’s vergelijken

Het leuke is dat deze manier van visualiseren me op een nieuwe manier naar een paar van mijn favoriete boeken laat kijken.

Hieronder zie je een visuele weergaven van 1Q84, kafka op het strand en de stad en zijn onvaste muren.

Hierin valt me wat op: het laatste boek wat ik las heeft een ander ritme. Waar zowel 1Q84 en kafka op het strand veel open ramen kennen (relatief lange hoofdstukken), zijn de ramen bij de stad en zijn onvaste muren vaker deels dicht.

Om na te gaan of dit enige betekenis heeft, bereken ik de maximale hoofdstuklengte per boek. Zo ga ik na of de andere twee boeken geen kortere maximale lengte hebben, waardoor een raam snel open staat.

Laten we even kijken:

  • 1Q84: max = 25
  • Kafka op het strand: max = 19
  • De stad en zijn onvaste muren: max = 23

Niet exact gelijk, maar we werken wel met dezelfde orde van grootte wat mij betreft. Er zitten dus echt meer lange hoofdstukken en de twee boeken die ik eerder las.

Voor mijn gevoel vloog ik dan ook door het laatste boek heen. En dit keer niet alleen door het mooie verhaal, maar waarschijnlijk ook door de kortere hoofdstukken!


Nieuwsgierig?

Tijdens het maken van deze visualisatie wordt ik nieuwsgierig: hoe zou dit eruit zien als een print? (En het zou natuurlijk ook zonde zijn om zo’n grafisch beeld als bestand op mijn computer te laten rusten.)

Daarom breng het de wereld in. Ik druk het af.

Zie hier mijn eerste eigen data-gedreven op een boek gebaseerde print:

haruki murakami - de stand en zijn onvaste muren - book met dataprint

Best wel cool toch?