Alcuni anni fa, i social media sono scoppiati increduli sul colore di un vestito. Circa una settimana fa, l’analogico uditivo di “the dress” è stato pubblicato su Reddit, Instagram e Twitter. È una clip audio in cui il nome viene detto dipende dall’ascoltatore: alcuni ascoltano “Laurel”, altri “Yanny” (o qualcos’altro interamente).
Ascolta la clip audio originale qui.
Presumibilmente, è stato registrato da un motore di sintesi vocale da un sito web di vocabolario (vocabulary.com), pronunciando il nome “laurel”, ma giocando attraverso gli altoparlanti. Ma come mai alcune persone sentono “Yanny”, quando dovrebbe essere “Laurel”?
Questo potrebbe avere a che fare con le proprietà “tecniche” del suono. L’analisi delle frequenze nel suono suggerisce che le frequenze più alte (> 1000 Hz) sono più simili a “Yanny”, ma le frequenze più basse (<1000 Hz) sono più simili a "Laurel". Potrebbe essere che suonare "lauro" sopra gli altoparlanti e re-registrando ha introdotto il rumore ad alta frequenza nella registrazione, che ha enfatizzato le frequenze più alte. Ora alcuni ascoltatori (ad esempio, giovani adulti o adulti più anziani) sono semplicemente più bravi a sentire queste frequenze più alte, o li pesano più pesantemente nella percezione di altri, portando le persone "ad alta frequenza" a riferire Yanny, dove "a bassa frequenza" la gente sente Laurel.
È interessante notare che questo hype sui social media è un grande esempio del tipo di stimoli che psicolinguisti e fonetici usano nei loro esperimenti. Il suono è ambiguo: non è proprio Yanny e non è abbastanza Laurel; è una specie di mezzo. Serie di suoni vocali ambigui sono usati molto spesso in psicolinguistica per capire gli indizi acustici che le persone usano per percepire le “lettere di parola”. Spesso i ricercatori prendono una parola (una chiara Yanny) e un’altra parola (una chiara Laurel) e creano artificialmente suoni che si collocano tra questi due punti finali. Questo è chiamato un continuum fonetico, tipicamente variando una particolare dimensione acustica (ad esempio, l’intensità di alcune frequenze, la durata dei segmenti, ecc.).
Ecco come funziona per il suono Laurel / Yanny: prima ridurre le frequenze più alte e poi gradualmente step-by-step enfatizzando le frequenze più alte porta a un continuum da più Laurel-like (passo 1, frequenze più alte ridotte) a più Yanny -like (passaggio 6, ha sottolineato le frequenze più alte).
Ascolta il punto 1 qui (quasi come Laurel).
Ascolta il passaggio 2 qui.
Ascolta il passaggio 3 qui.
Ascolta il punto 4 qui.
Ascolta il punto 5 qui.
Ascolta il punto 6 qui (la maggior parte di Yanny).
Un simile continuum può essere creato per molti suoni di discorso. Per dimostrarlo in particolare per la famiglia reale britannica, ecco un continuum in 3 fasi da Harry a Meghan. Combina le frequenze più alte di Harry con le frequenze più basse di Meghan. Il punto 1 è più simile ad Harry perché la maggior parte delle alte frequenze proviene da Harry. Il passaggio 2 è in una sorta di intermedio, e il passaggio 3 è più simile a Meghan, con le alte frequenze per lo più da Meghan.
Ascolta il punto 1 qui (quasi come Harry).
Ascolta il punto 2 qui (ambiguo).
Ascolta il punto 3 qui (più simile a Meghan).
Ma possiamo effettivamente fare in modo che lo stesso suono venga percepito in modo diverso in diverse situazioni? Sì possiamo. Sappiamo che la percezione dei suoni del parlato è influenzata dal contesto acustico circostante. Lo stesso suono può essere percepito in modo diverso quando, ad esempio, viene modificata l’acustica di una frase precursore.
Per dimostrarlo con il suono Laurel / Yanny, è stato eseguito un breve esperimento online in cui gli ascoltatori hanno ascoltato lo stesso continuum Laurel-to-Yanny di prima, ma questa volta preceduto da un numero telefonico di 7 cifre (496-0356). Quindi la gente ha sentito cose come: “496-0356 Laurel”. A volte le frequenze più alte nella sequenza di cifre (> 1000 Hz) erano attenuate (filtrate, filtro passa-basso alla frequenza di taglio di 1000 Hz), a volte le frequenze più basse venivano attenuate (filtro passa-alto alla frequenza di taglio di 1000 Hz). Clicca qui per provare tu stesso questo test online.

Proporzione delle risposte Yanni in funzione del passo continuo (1 = più Laurel-like, 6 = più Yanni-like), diviso per condizione precursore. I passi più alti sul continuum portano a più risposte Yanni e attenuano le frequenze più alte nel precursore (discorso filtrato passa-basso, linea blu) e portano a più risposte Yanni.
Fonte: Hans Rutger Bosker
I risultati di 62 ascoltatori sono mostrati qui in termini di proporzione delle risposte Yanny. Vediamo che sul lato sinistro del continuum, la maggior parte delle persone riporta Laurel (risposte Yanny a bassa proporzione), e sul lato destro del continuum, la maggior parte delle persone riporta Yanny – in linea con quanto è stato discusso sul continuum. Tuttavia, l’acustica del numero di telefono lead-in può effettivamente influenzare la percezione dei partecipanti (confermata dall’analisi statistica GLMER, dall’effetto precursore, p <0,001): quando il precursore introduttivo ha le frequenze più elevate attenuate, ciò rende le frequenze più alte in il continuum Laurel / Yanny si distingue maggiormente, portando a un numero leggermente maggiore di risposte Yanny nella condizione di passa-basso (cioè, la linea blu è sopra la linea rossa). Allo stesso modo, quando il precursore di ingresso ha attenuato le frequenze più basse, questo fa risaltare maggiormente le frequenze più basse nel continuum Laurel / Yanny, portando a più risposte di Laurel nella condizione di passa-alto.
Quindi cosa possiamo concludere? Bene, enfatizzare artificialmente le frequenze più alte porta a più risposte Yanny (come evidenziato dal continuum). Inoltre, rendere le orecchie delle persone più sensibili alle frequenze più alte nella parola Laurel / Yanny attenuando prima le frequenze più alte in un precursore lead-in porta anche a più risposte Yanny (basate sull’effetto precursore). Ma forse la conclusione più sorprendente dell’intera campagna pubblicitaria Laurel / Yanny è che dimostra che anche la fonetica può essere un argomento di tendenza su Twitter.
Immagine Facebook: marienalien / Shutterstock