Spotify e a medida “valence”

Por indicação do feed do Quincy Larson, li o texto “Finding the most depressing Radiohead song with R, using the Spotify and Genius Lyrics APIs“, do data scientist Charlie Thompson, que motivou esse post.

O autor usou dados do Spotify sobre todas as músicas do Radiohead e também analisou as letras das músicas (usando o Genius) para chegar a conclusão de que a mais triste seria “True Love waits” do álbum “A moon shaped pool”.

A etapa de análise de letras não é difícil de se imaginar: você cria uma tabela de palavras ou sentenças que podem ser consideradas tristes e busca por elas em cada uma das letras de músicas. As canções com maior quantidade de “palavras tristes” serão consideradas, nesta etapa, como as menos alegres.

Já a parte “musical” da análise considerou a medida “valence“:

You might remember “valence” from high school chemistry. It has to do with how many electrons an atom will lose, gain, or share when it joins with another atom.

Psychologists put a spin on that concept, using the word “valence” to describe whether something is likely to make someone feel happy (positive valence) or sad (negative valence). It’s sort of like the electron sense of the word. Is an event, situation, or experience going to add to your mood, or detract from it? That’s how you can calculate its emotional valence.

Our reaction to music is also emotional. Some of it makes us happy, and some of it makes us sad, with songs falling all across the spectrum between happy and sad.

It’s no easy feat to have a computer listen to a song in three seconds and determine its emotional valence, but we’ve figured out how to do it. (One key aspect: We have a music expert classify some sample songs by valence, then use machine-learning to extend those rules to all of the rest of the music in the world, fine tuning as we go.) (Fonte: Eliot Van Buskirk “Plotting Music’s Emotional Valence, 1950-2013“)

As poucas informações que encontrei sobre a construção dessa medida “valence” (como o trecho acima ou como o do Mood for Music) não me disseram muito. Imagino que essa medida seja uma combinação da opinião dos especialistas somada a características extraídas das músicas como:

tonalidade: tons menores normalmente indicam temas soturnos. Quem conhece a banda norte-americana Metallica pode dar uma sacada na diferença que faz a tonalidade de uma música nesse vídeo. Trocar a tonalidade menor por maior para todas as músicas do álbum Kill ‘em All fez o álbum parecer algo do Blink 182 ou Green Day…

andamento: basicamente, batidas por minuto (BPM) da faixa. Quanto mais BPM, maior a velocidade e, provavelmente, a sensação de “energia” passada pela música.

altura: provavelmente consideram a altura (mais grave ou mais aguda) da música ou de parte (melodia, provavelmente). Certa vez li num artigo (to com preguiça de procurá-lo) que, para se extrair automaticamente a melodia de uma música, você deve procurar as notas nas oitavas mais altas (agudas)…

percussão: percussão diz muito sobre a música, e acho que seja um elemento muito importante para aferir sua energia e escala tristeza-alegria. Não consigo imaginar como automatizar o reconhecimento da quantidade e intensidade da percussão, pois ela carece da característica tonal (uma nota afinada terá uma frequência mais ou menos fixa [a nota lá padrão seria 440hz], mas e uma caixa da bateria???)

O projeto “AcousticBrainz” dá uma amostra dos aspectos que são aferidos numa música para gerar uma base de dados sobre música (fonte):

Metadata value
MBID: b7f37e3e-3225-4118-9319-ed7893e00aa6
title: We Can Run Away Now They’re All Dead and Gone
artist: Snow Patrol
release: Final Straw
track number: 13 / 14
track length: 03:15

Low-level information
Tonal & Rhythm: value
key: D major (73.0%)
chords key: A minor
danceability: 1.2092872858
bpm: 115.893730164
beat count: 377

High-level information
Voice, timbre, gender, etc. value probability
Voice voice 64.8%
Gender female 98.6%
Danceability danceable 99.7%
Tonal tonal 86.1%
Timbre bright 93.5%
ISMIR04 Rhythm unsure 37.8%
Moods value probability
Electronic unsure 59.8%
Party not party 80.3%
Aggressive not aggressive 99.3%
Acoustic not acoustic 98.7%
Happy not happy 64.9%
Sad not sad 63.7%
Relaxed relaxed 76.9%
Genres value probability
Tzanetakis model unsure 30.1%
Electronic classification unsure 48.3%
Dortmund model unsure 56.3%
Rosamerica model unsure 46.0%

Deixe um comentário