Back to top

Desenvolupen un model a la URV per avaluar el sentiment dels textos de les xarxes

Un equip investigador de la URV ha desenvolupat un sistema que identifica el sentiment en el llenguatge avaluatiu

Paraules que utilitzem cada dia en qualsevol àmbit com ràpid, lent, bonic, calent o normal porten implícita una càrrega d’informació que cada vegada importa més a empreses i organitzacions. L’anàlisi de sentiment és un àmbit que ha rebut gran atenció en els darrers anys degut a l’ús massiu de les xarxes socials. L’ús d’aquestes comunitats virtuals ha generat grans quantitats de text avaluatiu produït pels usuaris al voltant de tot tipus de productes i serveis.

Davant l’interès que ha despertat l’anàlisi d’aquests textos, un equip investigador del Departament de Filologies Romàniques de la URV ha desenvolupat una tècnica que inclou diferents mètodes matemàtics i lingüístics i que aconsegueix modelar formalment els enunciats avaluatius i captar o extreure el sentiment (o la valoració) que hi ha darrere d’aquestes expressions lingüístiques de naturalesa difusa. El resultat de la seva recerca, que s’ha fet en col·laboració amb el centre d’excel·lència IRAFM de la República Txeca, s’ha publicat a la revista científica Mathematics.

Com funciona? 

Per analitzar el sentiment s’utilitzen eines computacionals que classifiquen automàticament els textos en funció de la connotació positiva o negativa del llenguatge utilitzat. Amb aquesta anàlisi s’intenta determinar l’actitud d’una persona respecte a un tema. L’actitud pot ser un judici o avaluació, el seu estat afectiu (estat emocional de l’autor quan escriu), o la intenció comunicativa emocional (l’efecte emocional que l’autor intenta causar en el lector). El desenvolupament d’aquestes eines d’anàlisi de sentiment requereix models formals que puguin descriure el llenguatge avaluatiu en termes que una màquina sigui capaç de processar.

Es diu que el llenguatge avaluatiu és difús o vague, ja que és molt difícil delimitar-ne el significat de paraules quotidianes com bé, malament, gran, petit, estimar, odiar, etc. Aquesta recerca està encapçalada per Adrià Torrens i María Dolores Jiménez, del Grup de Recerca en Lingüística Matemàtica del Departament de Filologies Romàniques de la URV, juntament amb Vilém Novák, de la Universitat d’Ostrava, a la República Txeca.

equip investigador

Modelar formalment els enunciats avaluatius i captar o extreure el sentiment (o la valoració) que hi ha darrere d’aquestes expressions lingüístiques és un repte. Normalment, per a aquestes tasques s’utilitzen tant algorismes d’aprenentatge automàtic com tècniques de diccionari (conegudes com a “bossa de paraules”).

Els algoritmes d’aprenentatge se centren en aspectes de rendiment computacional. En general, aquestes tècniques no aporten prou característiques des del punt de vista dels processos lingüístics. Amb aquesta recerca es pretén presentar un nou enfocament basat en un model formal interdisciplinari que identifiqui i analitzi la naturalesa difusa i la informació vaga de les expressions avaluatives abordant molts dels seus matisos i oferint una idiosincràsia “explicativa”.

El model que proposa aquest equip investigador combina una gramàtica de propietats i un model de lògica difusa. La gramàtica de propietats estableix les restriccions/condicions que una estructura lingüística ha de complir per ser adequada. El model difús permet captar la vaguetat d’aquestes expressions (“alt” pot significar 130 cm o 220 cm), així com determinar el grau de positivitat i/o negativitat d’una expressió. Es preveu que aquest model tingui múltiples aplicacions i un impacte important en àmbits com la mineria de dades, eines d’autoaprenentatge de llengües, detectors automàtics d’autoria, etc.

Continuar amb la recerca

La recerca no s’acaba aquí. Segons l’equip investigador, el següent pas és dur a terme un projecte interdisciplinari amb professionals de la psicologia, enginyeria computacional, lingüística i lexicografia per a la construcció d’un conjunt de nuclis avaluatius que es puguin aplicar en les anàlisis de sentiment.

Paraules clau:

Notícies relacionades