Undanfarið hefur verið unnið að því á Stofnun Árna Magnússonar í íslenskum fræðum að setja saman safn texta sem má nýta fyrir málrannsóknir og máltækniverkefni. Textasafnið er kallað Risamálheild og inniheldur að mestu leyti texta fréttamiðla, en einnig t.d. alþingisræður, lög, blogg og dóma.

Stór textasöfn eru mikilvægur efniviður fyrir gerð margs kyns máltæknibúnaðar eins og t.d. búnaðar fyrir málfarsleiðbeiningar, þýðingarkerfi, talgreina og talgervla.

Eyjafréttir gerðu nýlega samkomulag sem heimilar Stofnun Árna Magnússonar í íslenskum fræðum að nýta texta af vef eyjafrettir.is, fyrir rannsóknir, orðabókargerð og máltækniverkefni.

“Það er okkur mikils virði að fá sem allra mest af textum í Risamálheildina. Þannig nýtist hún enn betur í sérhæfðar málfræðirannsóknir og við gerð ýmiss konar máltæknibúnaðar, t.d. fyrir talgreiningu, talgervingu og þróun hjálparforrita með ritvinnslu. Máltæknibúnaður af þessu tagi getur til dæmis verið sérlega nytsamlegur fyrir blinda, heyrnarskerta og hreyfihamlaða og einnig þá sem glíma við skriftar- og lestrarörðugleika,” sagði Hildur Hafsteinsdóttir verkefnastjóri hjá Stofnun Árna Magnússonar í samtali við Eyjafréttir.