Può essere misurata la sofisticazione nella scrittura?

Per decenni, abbiamo avuto strumenti per misurare la complessità della scrittura che sopravvive ancora in alcuni software di scrittura come "Analisi del testo". Ad esempio, il punteggio di Flesch Reading Ease ei punteggi di Flesch-Kincaid contano sillabe e parole in frasi. Tuttavia, il punteggio è tutt'altro che trasparente. Per ottenere un punteggio di Flesch, tu o, più probabilmente, il tuo software, fai affidamento sulla formula:

206.835- (1.015 x lunghezza media della frase) – (84.6 x sillabe medie per parola).

In alternativa, puoi usare il Flesch-Kincaid più user-friendly che mette in correlazione il punteggio di Flesch con la percentuale di stima degli americani che possono comprendere il contenuto misurato da Flesch Reading Ease. Se un articolo segna tra 0 e 30, solo i laureati possono comprendere appieno il contenuto. Al contrario, un quinto selezionatore può comprendere qualsiasi paragrafo nell'intervallo 90-100, comprensibile a oltre il 93% degli americani. Più basso è il punteggio, più facile è la lettura. Puoi provare questa formula per te stesso. Ho eseguito Green Eggs e Ham del Dr. Seuss attraverso le formule Flesch-Kincaid e ho scoperto che il libro segna un improbabile -1,3. Questo punteggio suggerisce che il lettore ideale di Green Eggs and Ham è un feto.

Formule opache e risultati bizzarri a parte, le formule di leggibilità rivelano qualcosa di prezioso su come misuriamo la complessità delle frasi: il conteggio ti porterà solo lontano. Ad oggi, gli studi degli studenti della scuola primaria e secondaria hanno correlato una crescente sofisticazione nella scrittura con lunghezze di frasi e frasi. Questa correlazione ha senso, dal momento che frasi più lunghe si basano su frasi e frasi, un marcatore per il comando di uno scrittore sulla struttura della frase. Ma contare da soli è problematico. Ad esempio, il conteggio delle sillabe in una parola per determinarne la difficoltà può drasticamente modificare le misure di complessità. Anche una parola di due sillabe può variare notevolmente nelle richieste che pone alla comprensione del lettore. Prendi in considerazione la prassi e il baseball , entrambe le parole in due sillabe. Mentre il tuo terzo selezionatore medio può leggere il baseball con facilità, la parola prassi può inviare anche alcuni dottorati che si preoccupano dei loro dizionari.

Inserisci il Lexile® Framework, software disponibile in commercio che utilizza la lunghezza della frase combinata con la frequenza con cui i lettori incontrano comunemente le parole. Oltre a contenere un corpus di oltre 100 milioni di libri, articoli e siti Web in tutto il mondo, Lexile è anche molto influente nel determinare i livelli di lettura dei materiali nell'istruzione primaria e secondaria. Inoltre, le partiture Lexile appaiono accanto agli articoli nei database delle biblioteche, fornendo punteggi su tutto, da un articolo su un giornale locale o The New Yorker ai libri. Ma i ricercatori si sono ampiamente concentrati sulla capacità di Lexile di determinare la lettura adatta all'età per gli studenti dell'istruzione elementare e secondaria. Questa omissione ha indotto la studentessa Samantha Miller e io a misurare la validità di Lexile nel valutare la sofisticazione complessiva di frasi e paragrafi in un articolo pubblicato su The International Journal of Business Administration .

Abbiamo scoperto che Lexile era altamente correlato con tre robuste misure di sofisticazione testuale, che abbiamo misurato usando un software che misurava diciannove misure della complessità della struttura della frase. Il lessile si correlava molto bene con le tre misure più robuste della complessità delle frasi: la lunghezza mediana delle frasi e delle frasi, così come l'uso di nominali complessi o frasi di sostantivi. Lexile correlato più altamente con l'uso del complesso nominale per frase o frase (p = <0,0001) e con lunghezze mediane di clausole (p = <0,0002) e lunghezze mediane della frase (p = 0,0013).

Il takeaway? Gli algoritmi di Lexile determinano con forza la sofisticazione delle parole abbinando le parole che gli scrittori usano contro un corpo in continua crescita di 100 milioni di testi, prezioso se abbinato ad altre misure per valutare la complessità a livello di frase. Il risultato? Quegli enigmatici punteggi di Lexile che spuntano quando accedi a un articolo da un database di una biblioteca predicono in modo affidabile la difficoltà del contenuto che stai per leggere.