LANGUAGE REPRESENTATION OF THE PRODUCTIVE SCHEMES OF ACADEMIC CONCEPTS CORRELATION (BASED ON THE EXAMPLE OF ASTROPHYSICS TERMINOLOGY)


Cite item

Full Text

Abstract

The article is devoted to the peculiarities of academic concepts correlation schemes representation in language. It also describes the results of the application of the developed computer program for the construction of a terminological network that represents a type of semantic network the vertices of which are the academic concepts of a particular field of knowledge that belong to definite categories and the arcs are the systemic relations of different types that exist between them. The research was based on the analysis of the language material that involved academic texts and terms of the domain of astrophysics. The standard structure of the models that comprises such elements as the categories of adjacent concepts, the type of systemic relation, the vector of the systemic relation is described. The issue of the degree of their productivity is considered as well as their common features and differences. The specificity of representation of each of the schemes elements that can be expressed in academic texts by vocabulary units that belong to different strata is analyzed.

Full Text

Введение. Изучение особенностей соотнесенности разноформатных элементов знания представляется значимым для решения целого ряда общих и частных прикладных задач в сферах автоматической обработки данных, интеллектуализации поиска, развития семантического Интернета, создания экспертных систем и др. При этом исследование организации знания тесно связано с понятием категоризации, формированием и выделением категорий, причислением единицы к его множеству [1], когнитивным расчленением реальности [2]. В этой связи не менее важным является понимание существующих закономерностей соотнесенности разноформатных элементов знания во взаимосвязи со спецификой их репрезентации на языковом уровне, поскольку как справедливо отмечает Н.Н. Болдырев «человек не отражает мир в языке, а конструирует его с помощью языка в своем сознании» [3, c. 10]. Последнее представляется особенно значимым в отношении текстов научной направленности, отражающих системность элементов научного знания [4; 5], в том числе дефиниций терминов, поскольку они содержат сведения о значимых элементах содержания понятий [6]. Здесь также следует отметить, что, в рамках когнитивного подхода, по справедливому замечанию А.В. Суперанской, «понятие представляет собой ментальный конструкт» [7, c. 161]. При этом «термины в составе терминологической системы через систему понятий создают модель фрагмента объективной действительности, необходимую в процессе познания и освоения мира» [8, c. 26]. Системное представление определенной области знания возможно посредством терминологической сети, вершинами которой выступают понятия разных категорий, связанные разными типами системных отношений [9]. Как показали более ранние исследования, на их основе выделяются и ее более сложные структурные элементы, представляющие собой модели сопряженности понятий [10], продуктивность и особенности репрезентации которых рассматриваются нами далее. Методология и алгоритм исследования. Материалом для исследования послужили свыше 1600 фрагментов текстов научной направленности и более 1100 терминов астрофизики. Модели их соотнесенности были изучены посредством установления типов системных отношений между ними и моделирования терминосистемы посредством терминологической сети. Ее вершинами выступают понятия 12 базовых категорий (среди которых Естественный объект, Процесс, Характеристика, Вещество, Деятель и др.), связанные между собой более 40 типами системных отношений, которые, как показали наши более ранние исследования, являются наиболее продуктивными (более подробно о типологии понятий и системных отношений см. Лату, 2016). К таковым, например, относятся системные отношения AKO («a kind of, родовидовое отношение», связь между гиперонимом и гипонимами), PO («part of, связь между меронимом и холонимом); At («attribute», отношение атрибутивности, где один референт выступает признаком другого); S («subject», связь между инициатором / активным началом в процессе и самим процессом) Loc - («location», отношение между референтами, один из которых является местом расположения другого); R - («result», отношение между процессом и его результатом). Категории понятий устанавливались при помощи методов дефиниционного и компонентного анализа, которые также использовались для определения типов системных отношений при установлении их вербализаторов и особенностей языковой репрезентации продуктивных моделей. Для построения терминологической сети и получения статистических данных использовалась разработанная нами программа «Генератор терминологической сети» [11] (см. Рис. 1). Рис.1 Окно режима визуализации взаимосвязанных терминов программы для построения терминологической сети (Window for visualization of interrelated terms of the program for building a terminological network) Продуктивные модели и их репрезентация. Модели взаимодействия понятий обладают прототипической структурой, которая включает понятие категории 1, понятие категории 2, системное отношение определенного типа и вектор системного отношения, который может быть направлен как от понятия категории 1 к понятию категории 2, так и наоборот. Таким образом, они представляют собой более сложные элементы терминологической сети по сравнению с вершинами и дугами. Поскольку каждый из данных элементов такой прототипической структуры вариативен и представляет собой переменную, то данный факт предполагает значительное количество потенциальных комбинаций соотнесенности понятий, каждая из которых представляет собой модель сопряженности элементов знания. Тем не менее, как показывает анализ, они обладают весьма различной продуктивностью и частотностью реализации, в том числе и на языковом уровне, в то время как некоторые из них вовсе являются невозможными (например, термины категории Характеристика не могут быть связаны с термином категории Процесс отношениями Inst или S, иными словами выступать в роли инициатора процесса или инструмента для его реализации). Конечно, представляется достаточно ожидаемым, что, если модель сопряженности понятий имеет незначительное количество репрезентантов, то на языковом уровне она будет представлена реже. Одновременно с этим определенные модели являются высокопродуктивными и часто представлены во фрагментах научных текстов. Так, например, одной из наиболее продуктивных является модель Естественный объект -AKO-> Естественный объект (32%, здесь и далее указывается процентное соотношение связей данного типа с понятиями Категории 2 у Категории 1 от общего количества ее связей других типов с другими категориями), которая показывает, что объект соотносится с определенным классом и также может иметь разновидности. Другими продуктивными моделями соотнесенности понятий астрофизики являются Естественный объект <-PO- Естественный объект (16,2%, показывает, что объект может состоять из других объектов или входить в структуру более сложного объекта), Естественный объект <-PO- Вещество (14,3%, показывает из каких веществ состоит объект), Естественный объект -Loc-> Локус (18,7% нахождение объекта в конкретной области пространства), Процесс -Loc-> Естественный объект (12,8%, наличие активности на поверхности или внутри объекта), Процесс <-R- Естественный объект (19,6% , формирование объекта в результате конкретного процесса), Процесс <-S- Естественный объект (21%, активность, осуществляемая объектом), Вещество -Loc-> Локус (8% , нахождение вещества в конкретной области пространства), Характеристика -At-> Естественный объект (61% , наличие у объекта конкретных свойств), Локус -PO-> Естественный объект (6% , выделение областей в составе объекта) и др. Рассмотрим специфику их репрезентации более подробно. В первую очередь, следует обратить внимание на то, что структурные составляющие модели соотнесенности понятий в научных текстах репрезентируются посредством языковых средств, которые обладают определенной спецификой и могут принадлежать разным стратам. Так, взаимосвязанные понятия 1 и 2 категорий преимущественно выражаются посредством терминологической лексики (но также единицами общеупотребительной лексики, если для данного элемента знания термин отсутствует), в то время как вербализаторы связи в большинстве своем представляют слова и сочетания слов общеупотребительной лексики (также могут использоваться графические и грамматические языковые средства). При этом категории взаимосвязанных понятий модели, представленной в дискурсе конкретной области научного знания, преимущественно репрезентируются терминами, которые относятся к ее терминологии (связи также могут устанавливаться с междисциплинарными терминами и терминами смежных наук), например, в астрофизике категория Естественный объект выражается терминами нейтронная звезда, спутник, экзопланета, астероид, неправильная галактика и др., категория Характеристика выражается терминами светимость, звездная величина, космическая скорость и др., категория Локус представлена терминами межзвездное пространство, зона Златовласки, щели Кирквуда и др. Вербализаторы системных отношений, напротив, являются универсальными, а не специфичными для дискурса конкретной области знания и их конкретный набор определяется типом связи. При этом все составляющие элементы модели могут быть представлены в содержательном пространстве одного простого предложения, что является типовым и достаточно распространенным случаем (например, «Нейтронная звезда образуется в результате взрыва сверхновой звезды (так образовалась, например, Крабовидная туманность…)» [12], (Процесс <-R- Естественный объект)), но также могут относиться к двум разным предложениям и быть разделены точкой или запятой в составе сложного предложения, как нередко имеет место быть в дефинициях. В данном случае вербализатор системного отношения и второй термин в связке представлены в содержательном пространстве одного предложения, например, «Принципиальным отличием SS433 является постоянный сверхкритический режим аккреции газа на релятивистскую звезду, в результате которого формируется сверхкритический аккреционный диск» [12], (Процесс <-R- Естественный объект). Выбор конкретного вербализатора связи в ряде случаев может быть обусловлен типом текста. Так, например, в дефиниции связь между определяемым гипонимом и его родовым понятием выражается посредством вербализатора «-» и его сочетанием с такими вербализаторами как «это», «разновидность», в то время как во фрагментах научных текстов статей они сочетаются с такими вербализаторами как «представляет собой», «является», «называется» и др., например, «Аэролит - каменный метеорит, состоящий в основном из силикатов» [13], (Естественный объект -AKO-> Естественный объект). В ряде случаев определенное значение имеет порядок расположения взаимосвязанных элементов знания относительно друг друга и вектор связи. Так, если вектор связи PO направлен от A (часть) к B (целое), то когда A предшествует B в тексте используются такие вербализаторы как «входит в состав», «является элементом» и др. (A входит в состав B), в случае когда B предшествует A, используются вербализаторы «состоит из», «включает» и др. (B включает A)., например, «Звезды типа VV Цефея - затменно-двойные системы, состоящие из сверхгиганта спектрального класса М и голубого сверхгиганта спектрального класса В или гиганта» [13], (Естественный объект <-PO- Естественный объект). Еще одной особенностью является вариативность расположения вербализатора относительно взаимосвязанных терминов, что связано со свободным порядком слов в русском языке. Типовой последовательностью элементов модели является термин 1, вербализатор, термин 2, например, радиогалактика является разновидностью активной галактики. Тем не менее, сложный по структуре вербализатор, состоящий из нескольких элементов также может быть разделен вторым термином, например, разновидностью активных галактик является радиогалактика. При этом меняется как последовательность терминов, так и элементов в составе вербализатора. Таким образом, фактором в данном случае выступает расположение первого и второго терминов относительно друг друга при неизменном направлении вектора связи. Такие варианты последовательности, когда вербализатор предшествует или следует за двумя взаимосвязанными терминами, а также когда он разделен ими, являются нетипичными. Использование продуктивных моделей соотнесенности понятий при анализе конкретной сферы знания в определенной степени позволяет определить лакуны и осуществить прогнозирование ее развития. Так, референты категории Естественный объект могут состоять из других референтов этой категории или входить в состав более сложного по структуре астрономического объекта (например, галактики, звездного скопления), обладать определенными свойствами, располагаться на каком-либо участке пространства (категория Локус) или другом объекте (категория Естественный объект) и в свою очередь выступать местом расположения таковых, выступать в роли активного начала, результата, объекта воздействия в рамках какого-либо процесса и т.д. Отсутствие системных отношений с другими элементами знания в рамках данных моделей у конкретного понятия может указывать на то, что по мере новых данных о его референте и дальнейшего встраивания его в систему они потенциально могут возникнуть и представляют собой дальнейшие пути развития научного знания о нем. Выводы. Таким образом, определенные модели системной соотнесенности элементов знания являются высокопродуктивными. В первую очередь, это, конечно же, сопряженность двух понятий одной категории по иерархическому принципу. При этом некоторые из них являются универсальными для разных наук (например, модель, раскрывающая разновидности процессов), в то время как другие более специфичными для конкретных сфер знания (например, модель иерархии естественных объектов в астрофизике, которая незначительно представлена или не представлена совсем в гуманитарных и технических науках). Также наиболее часто сопряженность понятий раскрывает структурный или вещественный состав объектов естественной природы, а также различную локализацию объектов относительно других референтов категории Естественный объект или категории Локус, свойства веществ и объектов естественной природы, процессы, в рамках которых они выступают в роли активного начала и др. Репрезентация данных моделей в научных текстах характеризуется рядом общих особенностей. Так, сопряженные элементы знания, относящиеся к конкретным категориям, выражаются в первую очередь терминами, а системное отношение, раскрывающее характер связи между ними, выражается посредством конкретного специфичного набора языковых средств, являющихся его вербализаторами, которые преимущественно представляют собой единицы общеупотребительной лексики и их сочетания. Все структурные элементы модели могут быть репрезентированы как в содержательном пространстве одного простого предложения, в двух разных предложениях или разделены запятой в составе одного сложного, что может влиять на выбор вербализатора. Другими факторами такого влияния для определенных связей могут выступать тип текста, порядок следования взаимосвязанных элементов знания относительно друг друга. Особенностью репрезентации также являются вариации в расположении вербализатора относительно взаимосвязанных языковых единиц, что обусловлено допустимыми синтаксическими трансформациями порядка слов и, бесспорно, необходимо учитывать при автоматической обработке текста.
×

About the authors

Maxim N. Latu

Pyatigorsk State University

Email: Laatuu@yandex.ru
Ph.D. in philology, associate professor of West European languages and cultures department, Director of Applied Linguistics, Terminology Studies and Linguistic Cognitive Technologies Research Center

References

  1. Кубрякова Е.С. Язык и знание: на пути получения знаний о языке: части речи с когнитивной точки зрения. Роль языка в познании мира. М., Языки славянской культуры, 2004. 560 с.
  2. Маслова В.А. Введение в когнитивную лингвистику. М., Флинта, 2007. 296 с.
  3. Болдырев Н.Н. Когнитивные схемы языковой интерпретации // Вопросы когнитивной лингвистики. 2016. №4. С. 10 - 20.
  4. Malaise V., Zweigenbaum, P., Bachimont, B. Detecting semantic relations between terms in definitions. CompuTerm 2004. 3d International Workshop on Computational Terminology. 2004. Pp. 55 - 62.
  5. Константинова Е.С., Раздуев А.В. Основные характеристики лексической и терминологической сочетаемости // Язык, культура, этнос. Сб. статей: к 65-летнему юбилею профессора Замиры Касымбековны Дербишевой. Сер. "Концептуальный и лингвальный миры" 2017. С. 416 - 423.
  6. Дубовский Ю.А., Заграевская Т.Б. Становление лексикографии в отечественном языкознании // Известия Самарского научного центра Российской академии наук. Социальные, гуманитарные, медико-биологические науки. 2014. Т.16. № 2-1. С. 166 - 171.
  7. Суперанская А.В., Подольская Н.В., Васильева Н.В. Общая терминология. Вопросы теории. М., Наука, 2003. 246 с.
  8. Лейчик В.М. Терминоведение: предмет, методы, структура. М., КомКнига, 2006. 256 с.
  9. Лату М.Н. Принципы построения терминологических сетей: типы вершин и отношений // Вопросы когнитивной лингвистики. 2016. №4. С 142 - 149.
  10. Лату М.Н. Прототипичные модели взаимодействия понятий в терминологической сети // Когнитивные исследования языка. Вып. XXXIV. 2018. С. 710 - 713.
  11. Лату М.Н. Программа для ЭВМ «Генератор терминологической сети». Свидетельство о регистрации №2018618837 от 20.07.2018.
  12. Портал Астронет: http://www.astronet.ru
  13. Хопкинс Дж. Толковый словарь английских терминов по астрономии и астрофизике. М., Мир. 1980. 300 с.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2019 Latu M.N.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies