Merab Zakalashvili

Linguistic Technologies Group

IT Specialist

https://orcid.org/0009-0006-0757-6856

ქართული ენის ლინგვისტური მოდელი სიტყვაფორმათა სინთეზისა და ანალიზისთვის

ბუნებრივ ენათა დამუშავების უზრუნველსაყოფად შექმნილია სპეციალური ინსტრუმენტები (კომპიუტერული პროგრამები). აგლუტინაციური ენებისათვის, მათ შორის ქართულისთვის განსაკუთრებით მნიშვნელოვანია მორფოლოგიური დონის ავტომატური დამუშავება, რისთვისაც სხვადასხვა სახის მიდგომები არსებობს. ძირითადად იყენებენ სტანდარტულ მეთოდებს, უპირატესადსასრული პოზიციის ავტომატებს, რომლებიც აპრობირებულია მრავალი ენის მორფოლოგიური ანალიზისას. აღსანიშნავია, რომ ინდოევროპული ენებისათვის შექმნილი სტანდარტული პროგრამებით ვერ ხერხდება ქართული ენის ავტომატური ანალიზისა და სინთეზის  სირთულეების სრულად დაძლევა, ამიტომ საჭირო ხდება მათი მოდიფიკაცია, რაც პრობლემას ბოლომდე მაინც ვერ აგვარებს. 

ამ ამოცანის გადასაწყვეტად ლიგვისტური ტექნოლოგიების ჯგუფმა განსხვავებული მეთოდი აირჩია, კერძოდ, ჯერ შევქმენით ქართული ენის მოდელი, შემდეგ კი მის საფუძველზე მომზადდა პროგრამული ინსტრუმენტი (მორფოლოგიური პროცესორი), რომლითაც ხორციელდება თანამედროვე ქართული ენის სიტყვაფორმათა სინთეზი და ანალიზი.

 ჩვენს ლინგვისტურ მოდელში ენა არ არის აღწერილი რომელიმე კონკრეტული გრამატიკული თეორიის მიხედვით, არამედ ენობრივი მონაცემები წარმოდგენილია  ფორმალიზებული სახით. მასში სრულად არის ასახული ენის მორფოლოგიური სისტემა. ფორმალური წესების საშუალებით აღიწერა ქართული ენის ფლექსიური და დერივაციული შესაძლებლობანი, ფონოლოგიური პროცესები, მორფოსინტაქსური თავისებურებები. კერძოდ, წარმოდგენილია სახელურ და ზმნურ მორფემათა რანგობრივი ცხრილები, სახელური და ზმნური მატრიცები, ფუძის ფონეტიკურ მახასიათებელთა სიები და . . მოდელი განთავსებულია მონაცემთა ბაზაში, ძირების ლექსიკონთან ერთად. ამ უკანასკნელში  წარმოდგენილია ქართული ენის განმარტებითი ლექსიკონის მასალა, აგრეთვე  სხვა წყაროებიდან დამატებული ინფორმაცია.

ქართული ენის ლინგვისტური მოდელის მიხედვით შევქმენით პროგრამული ინსტრუმენტიმორფოლოგიური პროცესორი, რომელიც სამი ნაწილისგან შედგება: პროგრამა-რედაქტორი, სინთეზის პროგრამა (მორფოლოგიური სინთეზატორი) და ანალიზის პროგრამა (მორფოლოგიური ანალიზატორი).

პროგრამა-რედაქტორი უზრუნველყოფს მონაცემთა ბაზის მართვას. მისი საშუალებით  შესაძლებელია მასალის შეყვანა და რედაქტირება როგორც მოდელში, ისე ძირების ლექსიკონში. მონაცემთა ბაზის ინფორმაციისა და  ფორმალური წესების მიხედვით კონკრეტული ფუძიდან სინთეზატორით ხდება შესაბამისი სიტყვაფორმების სინთეზი (გენერირება). ანალიზატორი ახორციელებს საპირისპირო პროცესს: სიტყვაფორმათა ანალიზს. 

მოხსენებაში წარმოვადგენთ მორფოლოგიურ პროცესორს, კერძოდ, ძირების პროგრამა-რედაქტორს, ავხსნით სიტყვაფორმათა სინთეზის მექანიზმს;  საილუსტრაციოდ განვიხილავთ კონკრეტულ ძირებს, აგრეთვე მათგან დერივაციითა და კომპოზიციით მიღებულ ფუძეებს; ვიმსჯელებთ თითოეული ფუძიდან გენერირებული სახელური და ზმნური სიტყვაფორმების შესახებ.