მანანა თანდაშვილი
ფილოლოგიის მეცნიერებათა დოქტორი
ფრანკფურტის უნივერსიტეტი
კავკასიურ ენათა დეპარტამენტის ხელმძღვანელი
მაინის ფრანკფურტი, გერმანია
მანანა თანდაშვილი
ფილოლოგიის მეცნიერებათა დოქტორი
ფრანკფურტის უნივერსიტეტი
კავკასიურ ენათა დეპარტამენტის ხელმძღვანელი
მაინის ფრანკფურტი, გერმანია
ქართული ენა მეცნიერების ახალი პარადიგმის კონტექსტში
(ენათა ახალი კლასიფიკაცია და ქართული ენის თანამედროვე სტატუსი)
აბსტრაქტი
XXI საუკუნემ, ინფორმაციული ტექნოლოგიების სწრაფი განვითარების პარალელურად, არსებითი ცვლილებები მოიტანა სამეცნიერო სფეროში. თუ ენათა კლასიფიკაციის ტრადიციული პარადიგმა მოიცავდა გენეტიკურ, ტიპოლოგიურ და რელაციურ კლასიფიკაციას, დღეს კლასიფიკაციის ახალი პარადიგმა შეიქმნა, რომელშიც ენათა დაჯგუფება ახალი პარამეტრების მიხედვით ხორციელდება: 1) ენის იურიდიული სტატუსი 2) ენის სიცოცხლისუნარიანობა და გამოყენების სფეროები და 3) ციფრულ ეპოქაში ენათა ფუნქციონირების ხარისხი. ამ უკანასკნელის მიხედვით დღეისათვის ენებს აჯგუფებენ უხვრესურსიან ენებად (HRL) და მწირრესურსიან (LRL) ენებად. შესაბამისად, ენათა ტრადიციული ატლასი, შეცვალა ენათა ატლასმა, რომელიც მსოფლიოს ენებზე მოლაპარაკეთა რაოდენობასა და ამ ენებზე ენის ბუნებრივი დამუშავებისათვის კმარი ციფრული რესურსების პროცენტულ შეფარდებას წარმოგვიდგეს.
თეორიული სამეცნიერო ლიტერატურის მიხედვით, „ტერმინი LRL გამოიყენება ისეთ ენებთან მიმართებით, რომელთა მონაცემების დამუშავება სტატისტიკური მეთოდების გამოყენებით შეუძლებელია მონაცემთა სიმცირის გამო“ (Cieri et al 2016:4543-44; Magueresse et al., 2020:1). ხელოვნური ინტელექტის სფეროს წარმომადგენლები მწირრესურსიან ენებად მიიჩნევენ ისეთ ენებს, რომლებსაც შეზღუდული რაოდენობის ენობრივი მონაცემები და რესურსები აქვთ NLP (ბუნებრივი ენების დამუშავების) ამოცანების შესასრულებლად. ნაკლები რესურსები, NLP-ის კონტექსტში, ნიშნავს ისეთი ანოტირებული ტექსტების, ენის ბაზების ან სხვა ლინგვისტური რესურსების (მაგ., ლექსიკონების) ნაკლებობას, რომლებიც საჭიროა ხელოვნური ინტელექტის დასატრენინგებლად, რათა შევქმნათ და განვავითაროთ ენის ეფექტური მოდელები.
ქართული ენა მწირრესურსიან ენად არის მოხსენიებული საერთაშორისო სამეცნიერო წრეში (Nancy et al., 2017). თუმცა, აქ წარმოდგენილი განმარტებებიდან გამომდინარე, ტერმინის „მწირრესურსიანი ენა“ ქართულთან მიმართებით გამოყენება არაადეკვატურად მიგვაჩნია, როგორც შინაარსობრივი, ისე ფაქტობრივი თვალსაზრისით, ვინაიდან დღეისათვის საკმაოდ გაგვაჩნია ქართული ენისათვის როგორც დიდ მონაცემთა ბაზები (თანდაშვილი, ყამარაული 2021:87-100), ისე ენის ტექნოლოგიები (ავტომატური მასწორებელის სისტემები, მეტყველების ტექსტად და ტექსტის მეტყველებად გარდაქმნის პროგრამული საშუალებები, ქართული ენის ანალიზისა და სინთეზის პროგრამები და ა.შ.). აქედან გამომდინარე, ვფიქრობთ, რომ უნდა გადაიხედოს ენათა ახალი კლასიფიკაციის მეოთხე პარამეტრი, კერძოდ, ორდონიანი სისტემის (HRL vs. LRL) მაგივრად შემუშავდეს მრავალდონიანი სისტემა ციფრულ ეპოქაში ენათა ფუნქციონირების ადეკვატურად ასახვის მიზნით.
მოხსენების მიზანია ქართული ენის სტატუსის ადეკვატურობის კრიტიკული განხილვა მეცნიერების ახალი პარადიგმის კონტექსტში და კლასიფიკაციის ექვსსაფეხურიანი სისტემის შეთავაზება. კერძოდ, დიქოტომია HRL vs. LRL უნდა განივრცოს რამდენიმე შუალედური დონით:
1. უხვრესურსიანი ენები ანუ ენები, რომელთაც გააჩნიათ საკმარისი რესურსები ხელოვნური ინტელექტის დასატრენინგებლად;
2. კმარრესურსიანი ენები ანუ ენები, რომელთა ციფრული რესურსები, სავარაუდოდ, არ არის საკმარისი ხელოვნური ინტელექტის დასატრენინგებლად, მაგრამ საკმარისია არაამბიციური ამოცანების გადასაჭრელად;
3. ნაკლებრესურსიანი / არასაკმარისი რესურსების მქონე ენები ანუ ენები, რომელთა ციფრული რესურსები არ არის საკმარისი სხვადასხვა ამოცანების კომპიუტერული დამუშავებისთვის;
4. მწირრესურსიანი ენები, ანუ ენები, რომლებიც მცირე რაოდენობის არასტუქტურირებული ციფრული რესურსებით არიან წარმოდგენილი;
5. გაუციფრებელი ენები ანუ ენები, რომლებიც ჯერ კიდევ არ არიან წარმოდგენილი ციფრული რესურსებით, მაგრამ შესაძლებელია ამ ენებისათვის რესურსების შექმნა;
6. ურესურსო ენები ანუ ენები, რომლებიც ვერასოდეს იქნებიან წარმოდგენილი ციფრული რესურსებით სხვადასხვა მიზეზების გამო (მაგ., ეს ენები კრიტიკულად საფრთხეში მყოფ ან გამქრალ ენებად ითვლებიან, ამ ენაზე მეტყველი სოციუმის რაოდენობა იმდენად მცირე, რომ შეუძლებელია მოცემული ენისათვის რაოდენობრივად სიგნიფიკანტური ციფრული რესურსების შექმნა და ა. შ.).
საკვანძო სიტყვები: დიგიტალური ქართველოლოგია, ქართული ენა, მწირრესურსიანი ენები.