Gjuhet Indoeuropiane

Gjuhet Indoeuropiane

Gjuha Shqipe ka pesuar ndryshime te medha ne vitet e fundit. Duke qene nje gjuhe e pazhvilluar ne nen-dege dhe duke qene e kufizuar ne nje popullsi relativisht te vogel ne krahasim me gjuhet e tjera, aplikimet qe ndihmojne ne percaktimin e saktesise se termave te saj, apo qe sensibilizojne per trajtat e duhura mungojne ne mediume publike sic eshte interneti.

Me poshte paraqesim nje projekt (i diskutuar me ne detaje ne dokumentin PDF te bashkangjitur, shih me poshte) i cili do te mundesoje informatizimin e rregullave kryesore të gjuhës shqipe dhe shfaqjen e fjaleve shqip bazuar mbi keto rregulla. Projekti do te zgjidhe dhe problemin e percaktimit te rrenjeve te fjaleve shqipe nepermjet nje algoritmi. Ky algoritem mund te perdoret ne fushen e kerkimit dhe aplikime te tjera informatike.  Më tej qëllimi është të angazhohet komunitetin shqiptar në internet për pasurimin me përshkrim, shembuj dhe sinonimi të termave dhe fjalëve të gjuhës shqipe.
Projekti është kryesisht i mbështetur në një praktikë pune informatike në shërbim të studiuesve apo studentëve të Gjuhës Shqipe. Ai do të bazohet më shumë ne pasurinë tradicionale se në përshkrime akademik të termave. Projekti do të ofrojë përkthimin e fjalëve shqip-shqip, por me mundësi përkthimi dhe në gjuhë të tjera. Çdo fjalë do të përmbajë një ose disa shpjegime, përshkrim të trajtave që ajo merr gjatë lakimit/zgjedhimit në shqip, sinonimitë, rrënjën etj.

(pjese nga dokumenti pershkrues)
Metodika

SUBJEKTI
Projekti do të mbledhë fjalët shqipe në një fjalor. Fjalët do të jenë të përshkrueshme mbi kuptimin, rregullat nën të cilat përdoren në gjuhën shqipe dhe të gjitha trajtat e tij.
Përveç fjalëve fjalori do të përmbajë të gjitha rregullat nën të cilin trajtohen fjalët e shqipes, shembuj përshkrimor etj.
STRUKTURA INFORMATIKE
Informacioni  do të përshkruhet semantikisht në ontologji duke krijuar njëkohësisht dhe një fjalor semantik të termve shqip .
GRUMBULLIMI I INFORMACIONIT
Për grumbullimin e informacionit do të përdoren metoda informatike. Një fjalor me të gjithë termat unikë do të gjenerohet nga baza të dhënash informacioni si ato informative (mediatike) (ShqiperiaCom ka mbi 400 000 artikuj me mijëra fjalë të përdorura në shqip).
Bazuar mbi kërkimet dhe rregullat strukturore të gjeneruar nga grupi i gjuhëtarëve, do mundësohet aplikimi i rregullave për rastet kur mund te aplikohet për gjenerimin e të gjitha trajtave të mundshme.

ORGANIZIMI I INFORMACIONIT
Ekipi I gjuhëtarëve nga çdo fjalë në fjalorin e grumbulluar do të përcaktojë rrënjën e fjalës, temën dhe grupimin.
Për të përshkruar me një shembull: Emrat e gjuhës shqipe u përkasin në shumicën e rasteve disa rregullave të qarta të lakimit. Kështu, emrat në gjuhën shqipe i gjejmë në 3 gjini, Mashkullore, Femërore dhe Asnjanëse. Emrat e gjinisë mashkullore mbarojnë me një nga prapashtesat –i, -u. Teorikisht shumica e emrave të gjinisë mashkullore që mbarojnë me prapashtesën –i do të lakohen sipas një rregulli të njëjtë. Pas përcaktimit të temës së fjalës dhe grupit ku ai përket, sistemi do të jetë në gjendje të gjenerojë të gjitha trajtat që kjo fjalë merr sipas lakimit apo zgjedhimit. Aplikimi I rregullave të njëjtë do të jetë i mundur vetëm kur fjalët, (emra apo folje) u përkasin trajtave të rregullta. Në rastin e fjalëve të tjera të gjuhës shqipe si lidhëzat, ndajfoljet, parafjalët etj, rregullta të veçantë organizimi.
Emrat apo foljet që nuk u përkasin trajtave të rregullta do të plotësohen manualisht nga kontribuesit.

Informacione me te plota per Projekt Idene gjenden ne kete Skedar Propozim Projekti.

Projekti ka disa faza. Kuptohet qe faza e pare eshte Ngritja e fondeve te nevojshme. Shume shpejt do te publikojme nje faqe te dedikuar ketij projekti.

Nese dikush deshiron te bashkepunoje ne nivel gjuhesor apo si kontribues i jashtem (shih projektin) do jete i mirepritur per ta zgjeruar me tej si koncept.

Subjekti

Projekti do të mbledhë fjalët shqipe në një fjalor. Fjalët do të jenë të përshkrueshme mbi kuptimin, rregullat nën të cilat përdoren në gjuhën shqipe dhe të gjitha trajtat e tij.

Përveç fjalëve fjalori do të përmbajë të gjitha rregullat nën të cilin trajtohen fjalët e shqipes, shembuj përshkrimor etj.

Struktura Informatike

Informacioni do të përshkruhet semantikisht në ontologji duke krijuar njëkohësisht dhe një fjalor semantik të termve shqip[1].

Grumbullimi i informacionit

Për grumbullimin e informacionit do të përdoren metoda informatike. Një fjalor me të gjithë termat unikë do të gjenerohet nga baza të dhënash informacioni si ato informative (mediatike) (ShqiperiaCom ka mbi 400 000 artikuj me mijëra fjalë të përdorura në shqip).

Bazuar mbi kërkimet dhe rregullat strukturore të gjeneruar nga grupi i gjuhëtarëve, do mundësohet aplikimi i rregullave për rastet kur mund te aplikohet për gjenerimin e të gjitha trajtave të mundshme.


[1] Trajtim semantik në këtë kuadër ka të bëjë me termin informatik për semantikën dhe jo atë gjuhësor