Een dringend mailtje sturen naar je collega, surfen naar je favoriete site om de laatste nieuwtjes te lezen, een handvol grappige Facebook-statussen liken… Tekst en digitale media zijn onlosmakelijk met elkaar verbonden. En toch zijn er binnen Europa naar schatting tussen de twee en vijf miljoen mensen voor wie communicatie gemakkelijker zou zijn als deze niet via tekst, maar via pictogrammen of plaatjes zou verlopen. Text2Picto helpt deze mensen actief deel uit te maken van de hedendaagse maatschappij, inclusief de sociale media.

Het Centrum voor Computerlinguïstiek van de KU Leuven werkt aan een systeem voor het automatisch omzetten van geschreven tekstjes naar pictogrammen en omgekeerd.

Hierbij wordt gebruikgemaakt van Sclera en Beta, twee sets die beide uit enkele duizenden pictogrammen bestaan. Text2Picto vertaalt automatisch geschreven tekst naar een reeks Sclera- of Beta-pictogrammen. Eerst wordt de tekst automatisch taalkundig geanalyseerd met behulp van een aantal basistechnologieën, waaronder spellingcorrectie, herkenning van de woordsoorten (bv. om te ontdekken of “bij” een voorzetsel of een zelfstandig naamwoord is in een bepaalde context) en lemmatisering (het vinden van de “woordenboekvorm”, bv. de infinitief bij werkwoorden en het enkelvoud bij zelfstandige naamwoorden).

De Beta- en Sclera-pictogrammen zijn gekoppeld aan “betekenissen” in een grote databank van woorden. Zo hebben “poes”, “kater” en “kat” bijvoorbeeld dezelfde betekenis. Indien er een link gevonden wordt tussen een pictogram en de betekenis van het geschreven woord, wordt het pictogram als boodschap afgebeeld.

Text2Picto won in 2016 een LIA in de categorie ‘Best Language Service 2015’.

 

Ontdek Text2Picto

 

Interview

Beluister hier het interview met Leen Sevens, lid van de Onderzoeksgroep Formele en Computationele Linguïstiek (ComForT) van de KU Leuven: