კომპიუტერული ლინგვისტიკა

კომპიუტერული ლინგვისტიკა – გამოყენებითი ლინგვისტიკის მიმდინარეობა, რომელიც ადგენს ლინგვისტურ მონაცემთა დამუშავებისა და შენახვის ავტომატიზებულ მეთოდებს. ამ ტერმინის ატრიბუტული ნაწილი („კომპიუტერული”) გამართლებულია იმდენად, რამდენადაც პირველადი ბიძგი ამ დარგის განვითარებას გამომთვლელმა მანქანამ (კომპიუტერმა) მისცა. კვლევის არედ მანქანური თარგმნის ამოცანა იქცა. როგორც კი პირველი, საკმაოდ ზერელე, წარმატების შემდეგ აღმოჩნდა, რომ კომპიუტერი ამ ამოცანას მარტო ვერ გადაწყვეტდა, გაჩნდა ორგვარი რეაქცია: ერთი მხრივ, დაცხრა ინტერესი მანქანური თარგმნის მიმართ, მეორე მხრივ, სტიმული მიეცა ამ ამოცანისა (მანქანური თარგმნისა) და, საერთოდ, ენისადმი კომპიუტერული მიდგომის ღრმა თეორიულ შესწავლასა და გააზრებას.

ამ მიმდინარეობის განვითარებაში უდიდესი წვლილი მიუძღვის მოსკოვის სკოლას (ი. მელჩუკი, ა. ჟოლკოვსკი, ი. აპრესიანი). მათი (უპირველესად ი. მელჩუკის) თაოსნობით დამუშავდა ისეთი მოდელის საფუძვლები, რომელიც ნებისმიერი განვითარებული ენობრივი კომპიუტერული სისტემის ქვაკუთხედს უნდა წარმოადგენდეს. ასეთია „შინაარსი ←→ ტექსტი“-ს მოდული, რომელიც მოწოდებულია ადამიანის ენობრივი ქცევის ორი ძირითადი პროცესის საიმიტაციოდ. ეს პროცესებია ტექსტის წარმოქმნა (ანუ სინთეზი) და ტექსტის გაგება (ანუ ანალიზი). პროცესები ხორციელდება საფეხურებრივად: ანალიზი იწყება ტექსტის ჩვეულებრივი ფონემური/გრაფემული წარმოდგენის მორფოლ. გარჩევით, რის შემდეგაც სინტაქსურ წესებს მორფოლოგიური ანალიზის შედეგები გადაჰყავს ტექსტის სინტაქსურ წარმოდგენაში: შედეგი გადამუშავდება სემანტიკური კომპონენტების მეშვეობით ტექსტის საბოლოო (მოცემული პროცესისათვის) სემანტიკურ წარმოდგენად. ეს უკანასკნელი ექსპლიციტურად უნდა გამოხატავდეს შესავალ ტექსტში იმპლიციტურად კოდირებულ შინაარსს. სინთეზმა, ბუნებრივია, უნდა გაიაროს იგივე საფეხურები საპირისპირო მიმართულებით.

ყოველი ენობრივი დონის წარმოდგენას თავისი სპეციფიკა აქვს: ფონემურ/გრაფემულ დონეზე ტექსტი წარმოდგენილია როგორც ფონემათა/გრაფემათა უბრალო თანამიმდევრობა; მორფოლ. წესებს იგი გადაჰყავს სიტყეათა წარმოდგენის თანამიმდევრობაში, სადაც ყოველ სიტყვას ენაცვლება შესატყვისი – გრამატიკულად დახასიათებული ლექსემა, ანუ სიტყვის ფუძე. ამ უკანასკნელს ახლავს ფუძის კონკრეტული ფორმით და მასზე დართული აფიქსებით განსასღვრული გრამატიკული კატეგორიების მნიშვნელობები. ეს ერთეულები სინტაქსური წესების სათანადო დამუშავების შემდეგ წინადადების სინტაქსის ამსახველი ხისებრი სტრუქტურის კვანძებში იკავებენ ადგილს. საბოლოოდ ეს უკანასკნელი წარმოდგენა სემანტიკურმა წესებმა უნდა გადაიყვანოს შინაარსის მაქსიმალურად ცალსახა და ექსპლიციტურ გამოხატულებაში, რომელიც წარმოდგენილია გრაფის სახით. გრაფაში მიმართებები მაქსიმალურად სტანდარტიზებულია, საკვანძო ერთეულები კი იდეალურ შემთხვევაში დაყეანილია სემანტიკური პრიმიტივების დონეზე. საერთოდ, ანალიზის ერთ-ერთ ძირითად პრინცპს წარმოადგენს ტექსტური ერთეულების მრავალმნიშენელიანობის, ანუ ომონიმიის, ამ ტერმინის ყველაზე ფართო გაგებით, მოხსნა და შინაარსის შესაძლებელი ვარიანტების მაქსიმალური შეზღუდვა.

მის საპირისპიროდ, ტექსტის მასინთეზირებელმა პროცესმა უნდა შეძლოს (იდეალურ შემთხეევაში) მოცემული შინაარსის ყველა დასაშვები ენობრივი გამოხატულების აგება, ე. ი. უნდა წარმოქმნას სინონიმური ტექსტების, ანუ ურთიერთპარაფრაზების სრული სიმრავლე.

ამრიგად, ლაპარაკია სისტემაზე, რომელიც თავის იდეალურ, ზღერულ გადაწყვეტაში ენას ადამიანივით უნდა ფლობდეს. თეორიული თვალსაზრისით ეს მოასწავებს ახალ, მეტად მნიშვნელოვან ეტაპს ენათმეცნიერების საერთო განვითარებაში: თუ ტრადიციულად ენათმეცნიერება იკელევდა ენობრივი ქცევის პროდუქტს, ანუ ტექსტს (ამ სიტყვის ფართო გაგებით), ადგენდა ამ ტექსტის ერთეულების ინვენტარებს ლექსიკონებისა და გრამატიკების სახით, კომპიუტერული ლინგვისტიკის განვითარების ფაზაში დღის წესრიგში შესულია ახალი, თუმცა წინა პუნქტიდან ბუნებრივად გამომდინარე საკითხი: როგორ წარმოიქმნება ტექსტი, ანუ როგორ შეიძლება ფუნქციონირებდეს ის ენობრივი მექანიზმი, რომელიც ტექსტს წარმოქმნის.

ნიშანდობლივია ისიც, რომ სწორედ ამ ღრმა თეორიულ კვლევას მოჰყვება წმინდა პრაქტიკული (კომპიუტერული) გამოყენების ისეთი პერსპექტივები, როგორიცაა ავტომატური თარგმანი, დიალოგი კომპიუტერთან (და სხვ. ტექნიკურ მოწყობილობებთან) ბუნებრივი ენის საშუალებით, ენის სწავლების ავტომატიზაცია და ა.შ. ამ ტექნოლოგიებს უდიდესი მნიშენელობა ენიჭება ახალ ათასწლეულში, რომელმაც უკეე დაიმსახურა ინფორმაციის ეპოქის სახელი.

კომპიუტერული ლინგვისტიკის პირველი კერა საქართველოში წარმოიშვა XX ს.50-იანი წლების დამლევს ახლანდელი მართვის სისტემების ინსტიტუტში. პირველი მიღწევა იყო რუსულ-ქართული ავტომატური თარგმნის ექსპერიმენტული სისტემის შექმნა, შემდეგ – ლინგვისტური პროცესორების დამუშავება კომპიუტერთან ბუნებრივ ენაზე დიალოგისათვის და გრამატიკის სწავლების კომპიუტერული სისტემები. ამ სამუშაოების საფუძველი ენობრივი (ქართული, რუსული, გერმანული, ინგლისური) ალგორითმების შექმნა იყო, ხოლო კვლევის პრიორიტეტული ობიექტი – მორფოლოგიური დონე.

კომპიუტერული ლინგვისტიკა

პირადი ხელსაწყოები

სახელთა სივრცე

ვარიანტები

გადახედვა

მოქმედებები

ძიება

ნავიგაცია

ხელსაწყოები