Het digitale muziekarchief werd verrijkt met gegevens betreffende muzikale parameters tempo en toonhoogte. Daarvoor werd gebruik gemaakt van Music Information Retrieval (MIR). Dit is een computeranalysemethode die uit digitale audio informatie kan extraheren. De gebruikte technieken werden uitgebreid getest en geëvalueerd, maar daar alle gegevens bekomen werden via een geautomatiseerd proces en wegens de omvang van het archief niet manueel konden gecontroleerd worden moet gemeld worden dat de MIR niet onfeilbaar is.
Voor de toonhoogteanalyse werd gebruik gemaakt van de software
Pitchdetection die gerealiseerd werd door IPEM en ELIS tijdens het
MAMI-project. Deze software
suggereert voor elke 1/100 seconde een aantal (maximaal 6)
toonhoogtekandidaten. Voor elke kandidaat wordt ook een evidentie
bepaald, dit is een door de software toegekende waarschijnlijkheid
van correctheid. De software voerde de annotatie uit in Hertz en
voor de verwerking van de meetresultaten werden zowel de
Hertzwaarden (logaritmisch) als de herrekende Centswaarden
(niet-logaritmisch) gehanteerd voor de grafieken. Belangrijk om
weten is dat de geannoteerde toonhoogtes niet gekwantiseerd werden
naar Westerse concepten. De gekende 12 tonen van de ons 100 cents
gebaseerde Westerse toonladder worden dus niet gebruikt om de
toonschaal uit te drukken. Er werd geopteerd om de kwalitatieve
analyse van de exacte toonhoogtes te bewaren, om precieze
intervalsaftanden te respecteren. Dergelijke aanpak heeft het grote
voordeel dat Afrikaanse (etnische) muziek volgens diens
oorspronkelijke kenmerken geannoteerd kan worden, maar net daardoor
wordt het ook veel moeilijker om de toonschaal te
'verwoorden'. Dat vergt systematisch en diepgaand
onderzoek, hetgeen niet mogelijk was binnen de werking van het
oorspronkelijke dekkmma-project, maar mogelijk wordt gemaakt door
de aangeboden resultaten van de annotaties.
De annotaties worden op meerdere manieren gevisualiseerd: Er zijn per lied 4 grafieken ivm
de toonhoogteanalyse:
In de eerste grafiek worden alle geannoteerde toonhoogtes, die de
toonschaal vormen, getoond over alle octaven gespreid (de
tessituur), en in de tweede grafiek gereduceerd naar 1 octaaf.
Beide voorstellingen hanteren Centswaarden om de logaritmische
eigenschapen van trillingen uitgedrukt in Hertz, te vermijden. De
benamingen van de octaven berust op het Amerikaanse notatiesysteem
(440Hz = a' ). Beide grafieken zijn een clustering van alle
geannoteerde toonhoogtes. Via een histogram kon immers op een
duidelijke manier gevisualiseerd worden welke de vaakst voorkomende
tonen zijn en waardoor de gehele toonschaal zichtbaar wordt.
De derde grafiek toont alle annotaties van de Pitchdetection die aan
een zekere drempelwaarde voldeden, uitgezet bovenop de tijdsas.
Zoals reeds vermeld, voorzag de software immers bij elke annotatie
een evidentie; een getalswaarde die de zekerheid uitdrukt van
correctheid van de annotatie. Een minimale drempel haalt veel
onzekere annotaties weg, en levert een interessante kijk op het
verloop van het muziekstuk. De annotaties die gelinkt worden aan
elkaar worden in eenzelfde kleur weergegeven. De blauwe en rode
stippen zijn de belangrijkste annotaties (regio zang), de gele en
groene bevinden zich eerder lager, en verwijzen meestal naar
begeleidende instrumenten. Cyaan en paars vertellen niet veel, maar
verwijzen eerder naar harmonischen en subharmonischen. Focus jezelf
niet te veel op de kleuren: het zijn geautomatiseerde annotaties en
zijn niet sluitend! Het geheel geeft wel een goed beeld weer van
het verloop van muziekstuk, enkele mogelijkheden: lokaliseren van
de start, bvb halverwege de opname, van een nieuw lied a.d.h.v. een
totaal andere organisatie van de pixels, en zo wordt de inzet van
een instrument duidelijk zichtbaar. De vorm van het lied kan
makkelijk in kaart gebracht worden, zowel op macro- als op
microniveau zo bvb kan je goed zien op de grafiek van een
responsoriaal gezang wanneer de solist en koor elkaar afwisselen.
De grafiek visualiseert ook goed of de toonhoogtes doorheen het
stuk stabiel blijven, stijgen of dalen. Als een instrument erg
dominant doorklinkt op de opname, zal deze een hogere evidentie
meekrijgen door de software. Dit valt goed af te lezen op de
grafieken, en geeft zo de visuele mogelijkheid om de kwaliteit van
de analyse te evalueren. De vierde grafiek toont een deeltje van
het audiofragment, steeds van de 30e tot de 50e seconde, waarbij
enkel de annotatie met de hoogste evidentie van de 6 kandidaten
werd weerhouden. Deze afbeelding visualiseert vaak de zang in een
lyrische lijn, maar zal bij minder duidelijke annotaties een
weinigzeggende chaos aan stipjes opleveren (meerstemmige muziek,
geen zang aanwezig, meerdere instrumenten, luide percussie).
De 5 grafieken samen (tempo en toonhoogte) visualiseren kenmerken uit de muziek die moeilijk in begrippen uit te
drukken zijn. Soms schieten de Westerse concepten tekort, soms zijn in de tijd variërende kenmerken makkelijker
grafisch voor te stellen. Een meerwaarde bezorgt het zeker en vast.
Moge het verder onderzoek stimuleren.