ПУТИ ПЕРЕДАЧИ СЕМАНТИЧЕСКИХ ГРУПП ГЛАГОЛОВ В ПОДКОРПУСЕ
DOI:
https://doi.org/10.48371/PHILS.2023.69.2.014Ключевые слова:
национальный корпус, метаразметка, знак-код, лексико-семантическая специфика, лексико-грамматическая спецификация, цифровизация, глагол, подкорпусАннотация
В статье автором рассматриваются возможности использования языковых категорий, в частности лингвистических разметок, в современном цифровом пространстве, которые могут использоваться в отдельных областях языкознания, в научных трудах и исследованиях на казахском языке. Внедрение системы лингвистических разметок и все работы по автоматизации языковых ресурсов подготовлены учеными Института языкознания имени А. Байтурсынова. Следует отметить, что сейчас на сайте института работает платформа «Национальный корпус казахского языка». Автоматизированы база текстов, состоящая из 21 миллиона словоупотреблений, и вся система языкознания, состоящая соответственно из таких разделов, как морфология, словообразование, лексика, фонетика.
В статье рассказывается о работе по классификации глаголов на макро- и микросмысловые группы с определением лексико-семантических, лексико-грамматических разметок-кодов. В качестве примера можно привести автоматизацию лексико-семантических разметок заимствованных глаголов. Процесс подготовки лексико-семантического подкорпуса глагола начинается прежде всего с деления собранных глаголов на макро- и микрогруппы в зависимости от их семантической специфики. Далее идет подготовка разработки лексико-грамматических, морфологических, словообразовательных, коннотационных разметок.
В то же время дифференцируются модели классификации глаголов на лексико-семантические группы крупными учеными-грамматистами. В настоящее время последняя отсортированная модель классификации дополняется для введения разметок с учетом значений, выделенных различными учеными. Разработана классификация семантических групп глаголов, необходимая для создания программы лексико-семантических разметок, необходимой для введения Институтом лексико-семантических разметок классов глагольных слов в подкорпус.
В статье широко использовались компьютерно-программные методы разработки лингвистических обозначений глаголов, входящих в подкорпус лексико-семантического обозначения, описательные методы в дополнение к новой системе теоретических и практических знаний корпусной лингвистики, а также метод морфологического, словообразовательного, лексического анализа глаголов, вводимых в подкорпус. Предлагаемая исследовательская работа может быть использована в дальнейшем любым изучающим язык студентом, лингвистом для определения лексико-грамматической, словообразовательной деятельности глагола и его лексико-семантической группы. В статье даны способы постановки разметки в соответствии с указанными целями. Это повышает ценность работы.