About the function of planned languages at the present time and their application as the languages of non-terminal symbols of generative grammars


Cite item

Full Text

Abstract

In the article the task is set to consider the issue of the prospects of using planned languages for different purposes as interlinguas between different nationalities and, first of all, as the natural language modeling languages. An experiment about the usage of conlangs as languages of non-terminal symbols of Chomsky’s generative grammars is described. The analysis is offered on the topic of planned languages based on interlinguistic approach, referred to studying international artificial languages as means of overcoming language barrier. A conclusion is made that the international communication with the help of planned languages can be applied not only as an art form, hobby and tools for modeling and analy-ing natural languages, but also particularly for natural language generation, executing linguistic transformations and as a generative grammar non-terminal symbols language.

Full Text

В работе рассматривается проблема создания и применения различных конлангов, в частности, в целях обеспечения генерации естественных языков, их моделирования и анализа. На сегодняшний день широко распространены и разрабатываются разнообразные системы, в частности, программы-переводчики, экспертные системы, системы поддержки диалога с пользователем, системы автоматического реферирования текстов и извлечения информации из текстов на естественном языке. Проблема выбора и создания искусственного языка описания естественных языков является актуальной в связи с необходимостью развития машинного перевода, взаимодействия с компьютерными системами на основе естественно-языкового интерфейса. Проблема построения и применения конлангов решается на стыке таких наук, как лингвистика, интерлингвистика, компьютерная лингвистика, логика, 44 Вестник СибГАУ. № 1(53). 2014 философия и психология [1-5]. Проблема построения и применения конлангов давно и широко исследуется различными авторами. Однако вопрос о применении более эффективных плановых языков, в частности для моделирования естественных языков, требует дополнительных исследований в рамках теории классификаций, векторизации классов классификации и применения закона исключенного третьего при построении семантической классификации. Цель данной работы состоит в сравнительном описании некоторых плановых языков, описании преимуществ и сфер применения некоторых языков, их применимости для решения проблемы порождения осмысленных подмножеств естественного языка. Основная идея работы состоит в рассмотрении некоторых классов плановых языков и построении модели их применения в качестве инструмента генерации осмысленных подмножеств естественных языков, английского, русского и др. Новизна работы состоит в использовании модели, представленной в работе [1] в качестве принципа построения конланга, однозначно задающего семантическую классификацию слов, с возможностью их успешного применения в качестве нетерминальных символов порождающей грамматики Хомского. О проблеме создания и применения конлангов. Конланги первоначально имели цель упрощения общения между людьми на планете, преодоления различных межнациональных барьеров (языковых, культурных и т. п.). На сегодняшний день широко распространены и разрабатываются разнообразные модели языков. Огромное множество конлангеров (создателей искусственных языков) работают над самыми разнообразными проектами плановых языков. Кон-лангеры отражают в своих языках особенную индивидуальную философию, взгляды, идеи, логику или эстетику. В работе учитываются, возможно, самые известные и значимые из плановых (искусственных) языков, таких как Эсперанто, Токи Пона, Пандуния, Интерлингва и Ложбан. Процесс создания искусственных языков исследуется различными авторами, в частности, Жеффом Бурке, Салли Кавесом, Джоном Е. Клиффордом и А. Вежбицкой, а также Д. Тарту. В последнее время в области систем машинного перевода господствует идея о необходимости создания систем Интерлингва - промежуточных языков машинного перевода. То есть существующие естественные языки должны переводиться на Интерлингва и обратно с Интерлингва. Таким образом, можно получать перевод с любого языка A на язык B, применяя цепочку A-I-B, где I - это язык Интерлингва. Наиболее известная interlingua-система разрабатывалась в Голландии под названием Distributed Language Translation (с 1979 по 1992 гг.). Вскоре после этого запустился интерлингва-проект UNL (Universal Network Language). Возникновение этого проекта японских разработчиков определялось потребностью перевода документов в Интернете. Этот проект состоит в идее сопоставления слов и неких атрибутов, отличающих их различные лексико-семантические варианты. Часто ставится вопрос о применении какого-либо простого и ясного по структуре искусственного языка в качестве языка моделирования естественных языков: английского, немецкого, французского, русского, китайского и др. Эта идея всегда привлекала лингвистов, специализирующихся на формальных моделях естественных языков. Вопрос о международном искусственном языке без полисемии и конфигуральных условностей особенно активно разрабатывался в конце XIX в. Всего в мире насчитывается более 1000 проектов таких языков. Единственный язык такого рода, получивший относительно широкое распространение среди энтузиастов, - язык Эсперанто. Он на сегодняшний день содержит около 1900 корней (в основном романского происхождения). Эсперанто был основан на схожести многих европейских языков и содержит, таким образом, много схожих с другими языками слов. Грамматика Эсперанто отличается логичностью и простотой. В языке Эсперанто широко представлено словообразование. Существуют другие искусственные языки, такие как Basic English, содержащий 1000 слов (изначально в нем было 850 слов) и описывающий весь вокабуляр словосочетаниями видоизмененного английского языка. Сегодня на нем написана одна из Ви-кипедий. О. Н. Селиверстова, говоря о языке в широком смысле, пишет следующее: «Словарь семантического языка в идеале, который пока никем не был достигнут, должен удовлетворять следующему условию: каждое его слово должно выражать ровно одно, по возможности, элементарное значение, а все элементарные значения должны выражаться ровно одним словом семантического языка, совершенно независимо от того, в составе какого толкования оно встречается», т. е. такой язык должен удовлетворять требованиям детерминированности и однозначности. Языки описания естественных языков. В таблице в качестве иллюстрации приведен пример базовых компонентов сем-морфем - основных языковых единиц на одном из искусственных философских языков, в целях пояснения принципа описания естественного языка на основе конлангов. Так, слово Gi означает передачу идеи кем-то кому-то; Di - создание идеи; PiL - позитивное свойство идеи; GiL - передачу позитивной идеи; GiLuuu - передачу позитивной идеи о реципиенте. Таким образом, кодируются слова «сообщать», «думать», «разумный», «восхищаться» и «хвалить». Таким образом, слова некоторых конлан-гов являются полным или кратким определением слова, составленным из первоэлементов - сем («атомов смысла»). Некоторые конланги могут быть использованы в качестве средства моделирования естественных языков, с их помощью может осуществлять успешную работу язык генерации абстрактных текстов к урокам иностранного языка, решая таким образом проблему построения программ генераторов учебных заданий. 45 Математика, механика, информатика Эксперимент. Трансформируя данный подход в терминах порождающих грамматик, семантический конланг можно использовать для обозначения нетерминальных символов порождающей грамматики, в частности, авторская программа «Генератор классификаций» показывает принцип такого порождения (рис. 1). Как известно, стандартные порождающие грамматики над строками имеют вид четверки: G<S, T, N, R>, где S - начальный символ порождающей грамматики, T - множество терминальных символов, N -множество нетерминальных символов и R - множество правил трансформации одной строки в другую [3]. Таким образом, множество нетерминальных символов языка {cn} с T, тогда как множество терминальных символов {wm} с N. **• IMi Ш - ' 1» J» | Over Tree* t m general ♦ tht* ♦ A'aa ♦ A'o' ♦ odd’i' ♦ ‘nA'ooT ♦ a'e ’ Over Strings in general ♦ the ♦ A'aa ♦ 'A'o' ♦ odd'i' ♦ it ♦ a'e Boo<ean2* in general ♦ the ♦ A'aa ♦ 'A'o' ♦ odd’i' ♦ the ♦ a'e Chemistry* in general ♦ the ♦ AJtTaa ♦ АЯГо' ♦ odd'i' ♦ nA'ooT ♦ a'e Words» in general ♦ the ♦ Annn'aa ♦ Annn'o' ♦ oddV ♦ nA'ooT ♦ 'a' Phrases Making* in general ♦ the ♦ Arrr'aa ♦ Al'o' ♦ 'oddV ♦ nA'ooT ♦ a'e E-Course* in general ♦ the ♦ Arrr'aa' ♦ 'AJTo' ♦ 'oddV ♦ the ♦ a'e' Annn’aa' > handsome in general ♦ the ♦ young ♦ AJTo ♦ odd'i ♦ nA'ooT ♦ a'e in general ♦ this ♦ young ♦ AJiro ♦ odd'i ♦ < ♦ a'e АЯГо > girl in general ♦ the ♦ young ♦ АЯГо ♦ oddV ♦ the ♦ a'e АЯГо > lady Annn'o' > boy in general ♦ the ♦ young ♦ lady ♦ odd’i" ♦ nA’ooT ♦ a'e' Annn'o' > gentleman in general * the ♦ young ♦ АЯГо' ♦ oddV + 4 * 'a'e in general ♦ this ♦ young ♦ АЯГо ♦ odd'i' ♦ the ♦ a’e «■> in general ♦ the ♦ young ♦ girl ♦ ‘oddV + nA'ooT ♦ a’e . Рис. 1. Работа порождающей грамматики на основе промежуточного языка - конланга oGir’o Общеизвестно, что порождающие грамматики, они же формальные грамматики, находят самое широкое применение при создании лингвистического программного обеспечения, в частности, программ-переводчиков, экспертных систем, систем поддержки диалога с пользователем, систем автоматического реферирования текстов. Ниже приведен фрагмент порождающей грамматики с использованием языка oGir’o в качестве нетерминальных символов: "Start" > 'a'ee' + 'a'ooD' + 'a'i' + 'a'ooT' + 'a'e' 'a'ee' > in principle 'a'ee' > as far as I know a'ooD' > I a'ooD' > you 'a'ooD' > 'y'a' + 'A'aa' + 'A'o' 'a'i' + 'a'ooT' > 'E'i' + 'nA'ooT' 'a'i' + 'a'ooT' > 'odd'i' + 'nA'ooT' 'a'i' + 'a'ooT' > 'E'i' + 'y'a' + 'E'aa' + 'E'o' 'a'i' + 'a'ooT' > 'odd'i' + 'y'a' + 'odd'aa' + 'odd'o' 'nA'ooT' > it 'nA'ooT' > this 'a'ooT' > 'y'a' + 'A'aa' + 'A'o' 'y'a' > the 'y'a' > this 'A'aa' + 'A'o' > 'Alll'aa' + 'Alll'o' 'A'aa' + 'A'o' > 'Annn'aa' + 'Annn'o' 'A'aa' + 'A'o' > 'Arrr'aa' + 'Alll'o' 'A'aa' + 'A'o' > 'Arrr'aa' + 'Annn'o' 'Arrr'aa' > young 'Alll'aa' > beautiful Annn'aa' > handsome 'Arrr'aa' > kind 'Alll'o' > girl 'Alll'o' > lady 'Annn'o' > boy 'Annn'o' > gentleman 'E'i' > 'E'itttaaa' 'E'itttaaa' > reads 'E'itttaaa' > writes 'E'itttaaa' > copies 'E'itttaaa' > scans 'E'aa' > interesting E'aa' > published 'Ellll'o' > file 'Ellll'o' > image 'Ellll'o' > icon Emmmm'o' > magazine 'Emmmm'o' > document odd'aa' > tasty odd'aa' > appetizing odd'o' > food odd'o' > cutlet В скобочках вида '...' приведены термины семантического языка oGir’o, возможно применение в этой связи и других конлангов, однако конланг oGir’o специально разрабатывался для применения в сфере генерации, анализа и синтеза естественных языков и был создан с учетом критериев осмысленности и анализа порождающих особенностей естественных языков и их моделей. Рис. 2. Дополнительный пример работы порождающей грамматики на основе конланга Так, на рис. 1 показан процесс порождения фраз вида «in general this young girl eats it with pleasure», «in general this young girl cooks this thoughtfully», «in general this young girl chews it emotionally» и т. д. С другой стороны, на рис. 2 показан процесс генерации фраз вида «as far as I know you love the beautiful girl very much», «as far as I know you appreciate the beautiful girl emotionally», «as far as I know you adore the beautiful girl sincerely» и др. 46 Семы одного из конлангов (oGir’o) использовать f = импликация, причина ee = появление C = сущность i = идея bb = тело w = все ВТОРАЯ ОСНОВА i = глагол I = предикат (i)z = настоящее - делать s = и, конъюнкция aa = продолжать J = аспект e = место pp = часть l = много ii = глагол требующий инфинитива / герундия II = модальность, комплимент (i)v = будущее iii = делатель x = посылка, результат oo = исчезать P = свойство o = объект dd = еда r = достаточно e = наречие E = обстоятельство (i)q = прошлое eee = реципиент с = процесс ii = существовать F = связь a = абстракция tt = начинка m = мало ee = вводное слово EE = вводная фраза (i)f = совершенное aaa = объект v = будущее uu = не существовать D = действие u = отношение, действие gg = одежда n = минимум, нисколько o = существительное U = место предлога, связь (i)c = длительное ooo = инструмент z = настоящее yy = избегать T = получение, принятие O = сознание kk = покрытие, крышка W = отличный oo = местоимение OD = субъект (i)h = неопределенное uuu = себя q = прошлое EE = возможно Z = соединение A = существо vv = группа существ, организация L = хороший a = притяжательное местоимение, порядковое числительное OT = объект (i)p = длительное совершенное yyy = процесс j = время OO = необходимо G = передача кому-либо E = информация ff = кипа, куча, коллекция R = нормальный oa = количественное существительное O = именная группа (i)j = инфинитив III управление b = часть, включаться в II = не возможно K = получение от кого-либо I = интеллект zz = здание, дом, помещение M = плохой aa = прилагательное AA = атрибут, определение (i)vf = будущее совершенное EEE -цепочка d = быть, тождество UU = без необходимости, произвольно X = обмен U = непонятное ss = контейнер, тара N = ужасный u - союз, предлог между частями речи A = определитель (o)t = единственное AAA -взаимно g = целое, включать YY = отложить Q = запрос Y = иррациональное qq = сидение ww = твердый, жесткий uu - союз, предлог между предложениями (o)h = множественное OOO -параллельно dj = объединение, сложение AA = возобновить y = конкретное, данное, понятное xx = опора ll = мягкий yy - слово предложение, междометие, слова вежливости (o)tc = парное UUU -цикл p = меньше jj = устройство rr = жидкий ? - частица (aa)r = просто YYY -иерархия t = равно djj = устройство mm = газообразный ?? - наречие степени (aa)l = более ??? одиночное k = больше cc = инструмент nn = огонь, плазма y - вопросительное слово (aa)w = самый tc = отлично от tcc = инструмент WW = совершенный io - отглагольное существительное (aa)m = менее Математика, механика, информатика Использование планового языка в качестве промежуточного языка машинного перевода, языка векторного компонентного представления значения слов, языка описания валентностей слов, языка семантической классификации, языка нетерминальных символов порождающих грамматик можно считать перспективной и актуальной задачей. Она связана с решением проблемы моделирования, анализа, синтеза и потенциальной генерации естественного языка. Вероятно, будущее межнационального общения связано с работой эффективных систем машинного перевода с поддержкой голоса, а не с внедрением конлангов в качестве основных языков. При этом, по сравнению с изучением и исследованием конлангов в их применении в искусстве и в качестве хобби, использование конструируемых языков как средства моделирования и анализа естественных языков, использование языка описания нетерминальных символов порождающих грамматик является научной и технической задачей, требующей дальнейшего исследования.
×

About the authors

Dmitry Victorovich Lichargin

Siberian Federal University

Email: lichdv@hotmail.ru
Candidate of Engineering Sciences, associate professor of the Department of Conversational Foreign Language

Konstantin Vladimirovich Safonov

Siberian State Aerospace University named after academician M. F. Reshetnev

Email: kvsafonov@rambler.ru
Doctor of Physical and Mathematical Sciences, Head of the Department of Applied Mathematics

Aleksandra Vadimovna Lade

Siberian Federal University

Email: withlady@yandex.ru
teacher of the Department of Conversational Foreign Language

Darya Dmitrievna Mishchenko

Siberian Federal University

Email: mddarja@gmail.com
Master’s Degree student

Aleksandra Tolgatovna Gordeyeva

Siberian Federal University

Email: alexandra-uk@mail.ru
associate professor of the Department of Conversational Foreign Language

References

  1. Личаргин Д. В. Методы и средства порождения семантических конструкций естественно языкового интерфейса программных систем: дис.. канд. техн. наук : 05.13.17. Красноярск, 2004. 154 с.
  2. Сафонов К. В., Личаргин Д. В. Разработка векторизованной семантической классификации над словами и понятиями естественного языка // Вестник СибГАУ. 2010. № 4 (30). С. 33-37.
  3. Сафонов К. В. О возможности вычислительного распознавания контекстно-свободных грамматик // Вычислительные технологии. 2005. Т. 10, № 4. С. 91-98.
  4. Тарту Д. Общая интерлингвистика и плановые языки. М. : Русский язык, 1989.
  5. Исаев М. И. Проблемы международного вспомогательного языка. М. : Наука, 1991.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2014 Lichargin D.V., Safonov K.V., Lade A.V., Mishchenko D.D., Gordeyeva A.T.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies