Similitud lèxica

En lingüística la similitud lèxica és la mesura de grau de semblança entre sèries de paraules pertanyents a dos llenguatges diferents. Una similitud lèxica d'1 (o 100 %) correspondria a un recurrent total entre els vocabularis, mentre que 0 significa que no hi ha paraules comunes.

Hi ha diverses maneres de definir la simitud lèxica i els resultats varien conseqüentment. Per exemple, el mètode de Ethnologue consisteix a comparar un conjunt estandarditzat de llistes de paraules i a explicar les formes que presenten una similitud alhora en la forma i en el significat. Utilitzant un tal mètode, l'anglès ha estat avaluat, presentant una similitud lèxica del 60 % amb l'alemany i del 27 % amb el francès.

La similitud lèxica pot ser utilitzada per avaluar el grau de relació genètica entre dos llenguatges. Percentatges superiors al 85 % indiquen habitualment que els idiomes comparats són probablement dialectes emparentats. Est ocorre entre l'castellà i el portuguès, la similitud lèxica del qual supera el 89 %.[1]

La similitud lèxica constitueix només una indicació de la intel·ligibilitat mútua dels dos llenguatges, atès que aquesta última depèn també del grau de similitud, fonètica, morfològica i sintàctica. Per exemple, la similitud lèxica entre el francès i l'anglès és considerable en els camps lèxics relatius a la cultura, mentre que la seva similitud és més restringida quan es trata de paraules de base (en termes de funció). Contra la interinteligibilidad, la similitud lèxica no pot ser simètrica.

Llengües indoeuropeesModifica

En el següent quadre es presenten alguns valors de similitud lèxica donades entre algunes llengües, publicades per Ethnologue.[2]

Codi de llengua Llengua 1
Coeficients de similitud lèxica
Català Anglès Francès Alemany Italià Portuguès Romanès Romanx Rus Sard Espanyol
cat Català 1 - - - 0.87 0.85 0.73 0.76 - 0.75 0.85
eng Anglès - 1 0.27 0.60 - - - - 0.24 - -
fra Francès - 0.27 1 0.29 0.89 0.75 0.75 0.78 - 0.80 0.75
deu Alemany - 0.60 0.29 1 - - - - - - -
ita Italià 0.87 - 0.89 - 1 - 0.77 0.78 - 0.85 0.82
por Portuguès 0.85 - 0.75 - - 1 0.72 0.74 - - 0.89
ron Romanès 0.73 - 0.75 - 0.77 0.72 1 0.72 - 0.74 0.71
roh Romanx 0.76 - 0.78 - 0.78 0.74 0.72 1 - 0.74 0.74
rus Rus - 0.24 - - - - - - 1 - -
srd Sard 0.75 - 0.80 - 0.85 - 0.74 0.74 - 1 0.76
spa Espanyol 0.85 - 0.75 - 0.82 0.89 0.71 0.74 - 0.76 1
Català Anglès Francès Alemany Italià Portuguès Romanès Romanx Rus Sard Espanyol
Llengua 2 → cat eng fra deu ita por ron roh rus srd spa
  • Els codis llengua són aquells de la norma ISO 639-3
  • El Ethnologue no precisa amb quina variant de la llengua sarda ha estat calculada la similitud lèxica
  • "-" indica que les dades de comparació no són disponibles

ReferènciesModifica