ЕТІСТІКТІҢ МАҒЫНАЛЫҚ ТОПТАРЫНЫҢ ІШКОРПУСТА БЕРІЛУ ЖОЛДАРЫ

Автор(лар)

  • Солтанбекова А.А. АО "КазУМОиМЯ имени Абылай хана"
  • Рамазанов Т.
  • Жолшаева М.С.
  • Калибекулы Т.

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.48371/PHILS.2023.69.2.014

Кілт сөздер:

ұлттық корпус, метабелгіленім, белгі-код, лексика-семантикалық белгіленім, лексика-грамматикалық ерекшелік, цифрландыру, етістік, ішкорпус

Аннотация

Бүгінгі таңда қазақ тіліндегі зерттеулер, ғылыми еңбектер, тіл білімінің жекелеген салалары  бойынша жұмсалатын тілдік категориялар қатарын цифрландыру кеңістігінде пайдалану мүмкіндігіне ие боп отырмыз. Лингвистикалық білімдер жүйесін, тілтанымдық ресурстарды автоматтандыру  жұмыстарын яғни корпусқа енгізу мәселелерін А.Байтұрсынұлы атындағы Тіл білімі институтының ғалымдары дайындаған болатын. Қазір институттың сайтында «Қазақ тілінің ұлттық корпусы» деген платформа жұмыс істейді. 21 млн. сөзқолданыстан тұратын мәтіндер базасында тіл білімінің морфология, сөзжасам, лексика, фонетикаға қатысты білімдер жүйесі автоматтандырылған.  

Ұлттық корпустың өзі іштей ішкорпустарға бөлінеді. Сондай ішкорпустардың бірі сөз таптары бойынша лексика-семантикалық  белгіленімін енгізу жұмыстары қарқынды жүріп жатыр. Мақалада етістіктердің лексика-семантикалық, лексика-грамматикалық белгі-кодтары анықталып ірі және ұсақ мағыналық топтарға жіктеу жұмыстары жөнінде айтылады. Мысал ретінде алынған етістіктерге лексика-семантикалық белгіленім қою арқылы қалай автоматтандырылады деген мәселе төңірегінде жазылады. Етістіктің лексика-семантикалық ішкорпусын дайындау үдерісі ең алдымен жинастырылған етістіктердің семантикалық ерекшелігіне қарай макро мен микро топтарға бөлуден басталады. Одан кейін барып лексика-грамматикалық, морфологиялық, сөзжасамдық, коннотациялық белгіленімдер әзірлемесін дайындаудың жолдары көрсетіледі.

Сонымен қатар осы уақытқа дейін ірі грамматист ғалымдардың етістіктің лексика-семантикалық топтарға жіктеу үлгілері сараланады. Қазіргі таңда соңғы сұрыпталған классификация үлгісі ғалымдардың мағына бөлінісімен салыстырыла отырып белгіленім енгізу үшін толықтырылады. Лексика-семантикалық белгіленім бағдарламасын жасауға қажетті етістіктің мағыналық топтарының классификациясы жасалып, сол арқылы Институтта етістік сөз табының лексика-семантикалық белгіленімдерін ішкорпусқа енгізу жолдары сөз болады.

Мақалада лексика-семантикалық белгіленім ішкорпусына енетін етістіктерге лингвистикалық белгіленімдер әзірлемесін жасауда компьютерлік-бағдарламалық әдістер,  корпустық лингвистиканың теориялық және практикалық жаңа білімдер жүйесімен толықтыруда сипаттамалы әдістер, сондай-ақ ішкорпусқа енгізілетін етістіктерге морфологиялық, сөзжасамдық, лексикалық талдау жасау әдісі кеңінен қолданылды. Ұсынылған зерттеу жұмысын келешекте кез келген тіл үйренуші, студент, тіл маманы, жалпы қауым етістіктің лексика-грамматикалық, сөзжасамдық қызметін анықтау үшін және лексика-семантикалық  тобын анықтау үшін пайдалануға болады. Мақалада осы мақсатқа сәйкес белгіленім қою жолдары берілді.  Бұл жұмыстың құндылығын арттыра түседі.

Жүктеулер

Жарияланған

2023-06-28

Жоба

Раздел

Статьи