Toonhoogteanalyse

Het digitale muziekarchief werd verrijkt met gegevens betreffende muzikale parameters tempo en toonhoogte. Daarvoor werd gebruik gemaakt van Music Information Retrieval (MIR). Dit is een computeranalysemethode die uit digitale audio informatie kan extraheren. De gebruikte technieken werden uitgebreid getest en geëvalueerd, maar daar alle gegevens bekomen werden via een geautomatiseerd proces en wegens de omvang van het archief niet manueel konden gecontroleerd worden moet gemeld worden dat de MIR niet onfeilbaar is.

Voor de toonhoogteanalyse werd gebruik gemaakt van de software Pitchdetection die gerealiseerd werd door IPEM en ELIS tijdens het MAMI-project. Deze software suggereert voor elke 1/100 seconde een aantal (maximaal 6) toonhoogtekandidaten. Voor elke kandidaat wordt ook een evidentie bepaald, dit is een door de software toegekende waarschijnlijkheid van correctheid. De software voerde de annotatie uit in Hertz en voor de verwerking van de meetresultaten werden zowel de Hertzwaarden (logaritmisch) als de herrekende Centswaarden (niet-logaritmisch) gehanteerd voor de grafieken. Belangrijk om weten is dat de geannoteerde toonhoogtes niet gekwantiseerd werden naar Westerse concepten. De gekende 12 tonen van de ons 100 cents gebaseerde Westerse toonladder worden dus niet gebruikt om de toonschaal uit te drukken. Er werd geopteerd om de kwalitatieve analyse van de exacte toonhoogtes te bewaren, om precieze intervalsaftanden te respecteren. Dergelijke aanpak heeft het grote voordeel dat Afrikaanse (etnische) muziek volgens diens oorspronkelijke kenmerken geannoteerd kan worden, maar net daardoor wordt het ook veel moeilijker om de toonschaal te 'verwoorden'. Dat vergt systematisch en diepgaand onderzoek, hetgeen niet mogelijk was binnen de werking van het oorspronkelijke dekkmma-project, maar mogelijk wordt gemaakt door de aangeboden resultaten van de annotaties.
De annotaties worden op meerdere manieren gevisualiseerd: Er zijn per lied 4 grafieken ivm de toonhoogteanalyse:

tessituur, cluster van de opgemeten toonhoogtes (tess.jpg)
toonhoogtes herleid tot één octaaf (scale.jpg) (0 = Do of c)
alle toonhoogtes (boven drempel) in de tijd (allpitch.jpg)
melodisch fragment (toonhoogte met de hoogste evidentie van de 6 kandidaten)(melo.jpg)

In de eerste grafiek worden alle geannoteerde toonhoogtes, die de toonschaal vormen, getoond over alle octaven gespreid (de tessituur), en in de tweede grafiek gereduceerd naar 1 octaaf. Beide voorstellingen hanteren Centswaarden om de logaritmische eigenschapen van trillingen uitgedrukt in Hertz, te vermijden. De benamingen van de octaven berust op het Amerikaanse notatiesysteem (440Hz = a' ). Beide grafieken zijn een clustering van alle geannoteerde toonhoogtes. Via een histogram kon immers op een duidelijke manier gevisualiseerd worden welke de vaakst voorkomende tonen zijn en waardoor de gehele toonschaal zichtbaar wordt.
De derde grafiek toont alle annotaties van de Pitchdetection die aan een zekere drempelwaarde voldeden, uitgezet bovenop de tijdsas. Zoals reeds vermeld, voorzag de software immers bij elke annotatie een evidentie; een getalswaarde die de zekerheid uitdrukt van correctheid van de annotatie. Een minimale drempel haalt veel onzekere annotaties weg, en levert een interessante kijk op het verloop van het muziekstuk. De annotaties die gelinkt worden aan elkaar worden in eenzelfde kleur weergegeven. De blauwe en rode stippen zijn de belangrijkste annotaties (regio zang), de gele en groene bevinden zich eerder lager, en verwijzen meestal naar begeleidende instrumenten. Cyaan en paars vertellen niet veel, maar verwijzen eerder naar harmonischen en subharmonischen. Focus jezelf niet te veel op de kleuren: het zijn geautomatiseerde annotaties en zijn niet sluitend! Het geheel geeft wel een goed beeld weer van het verloop van muziekstuk, enkele mogelijkheden: lokaliseren van de start, bvb halverwege de opname, van een nieuw lied a.d.h.v. een totaal andere organisatie van de pixels, en zo wordt de inzet van een instrument duidelijk zichtbaar. De vorm van het lied kan makkelijk in kaart gebracht worden, zowel op macro- als op microniveau zo bvb kan je goed zien op de grafiek van een responsoriaal gezang wanneer de solist en koor elkaar afwisselen. De grafiek visualiseert ook goed of de toonhoogtes doorheen het stuk stabiel blijven, stijgen of dalen. Als een instrument erg dominant doorklinkt op de opname, zal deze een hogere evidentie meekrijgen door de software. Dit valt goed af te lezen op de grafieken, en geeft zo de visuele mogelijkheid om de kwaliteit van de analyse te evalueren. De vierde grafiek toont een deeltje van het audiofragment, steeds van de 30e tot de 50e seconde, waarbij enkel de annotatie met de hoogste evidentie van de 6 kandidaten werd weerhouden. Deze afbeelding visualiseert vaak de zang in een lyrische lijn, maar zal bij minder duidelijke annotaties een weinigzeggende chaos aan stipjes opleveren (meerstemmige muziek, geen zang aanwezig, meerdere instrumenten, luide percussie).

De 5 grafieken samen (tempo en toonhoogte) visualiseren kenmerken uit de muziek die moeilijk in begrippen uit te drukken zijn. Soms schieten de Westerse concepten tekort, soms zijn in de tijd variërende kenmerken makkelijker grafisch voor te stellen. Een meerwaarde bezorgt het zeker en vast.
Moge het verder onderzoek stimuleren.