О функции плановых языков на современном этапе и их применении в качестве языков нетерминальных символов порождающих грамматик


Цитировать

Полный текст

Аннотация

Рассмотрен вопрос о перспективах использования плановых языков в различных целях в качестве языка-посредника между различными народами и, в первую очередь, в качестве языка моделирования естественных языков. Описывается эксперимент по использованию конлангов как языка нетерминальных символов порождающих грамматик Хомского. Приведен анализ плановых языков на основе интерлингвистического подхода, связанного с изучением международных искусственных языков как средства преодоления языкового барьера. Делается вывод о том, что плановые языки межнационального общения могут найти свое применение не только в искусстве в качестве хобби, средства моделирования и анализа естественных языков, но и, в частности, для генерации осмысленной речи, осуществления языковых трансформаций и как языка нетерминальных символов порождающих грамматик.

Полный текст

В работе рассматривается проблема создания и применения различных конлангов, в частности, в целях обеспечения генерации естественных языков, их моделирования и анализа. На сегодняшний день широко распространены и разрабатываются разнообразные системы, в частности, программы-переводчики, экспертные системы, системы поддержки диалога с пользователем, системы автоматического реферирования текстов и извлечения информации из текстов на естественном языке. Проблема выбора и создания искусственного языка описания естественных языков является актуальной в связи с необходимостью развития машинного перевода, взаимодействия с компьютерными системами на основе естественно-языкового интерфейса. Проблема построения и применения конлангов решается на стыке таких наук, как лингвистика, интерлингвистика, компьютерная лингвистика, логика, 44 Вестник СибГАУ. № 1(53). 2014 философия и психология [1-5]. Проблема построения и применения конлангов давно и широко исследуется различными авторами. Однако вопрос о применении более эффективных плановых языков, в частности для моделирования естественных языков, требует дополнительных исследований в рамках теории классификаций, векторизации классов классификации и применения закона исключенного третьего при построении семантической классификации. Цель данной работы состоит в сравнительном описании некоторых плановых языков, описании преимуществ и сфер применения некоторых языков, их применимости для решения проблемы порождения осмысленных подмножеств естественного языка. Основная идея работы состоит в рассмотрении некоторых классов плановых языков и построении модели их применения в качестве инструмента генерации осмысленных подмножеств естественных языков, английского, русского и др. Новизна работы состоит в использовании модели, представленной в работе [1] в качестве принципа построения конланга, однозначно задающего семантическую классификацию слов, с возможностью их успешного применения в качестве нетерминальных символов порождающей грамматики Хомского. О проблеме создания и применения конлангов. Конланги первоначально имели цель упрощения общения между людьми на планете, преодоления различных межнациональных барьеров (языковых, культурных и т. п.). На сегодняшний день широко распространены и разрабатываются разнообразные модели языков. Огромное множество конлангеров (создателей искусственных языков) работают над самыми разнообразными проектами плановых языков. Кон-лангеры отражают в своих языках особенную индивидуальную философию, взгляды, идеи, логику или эстетику. В работе учитываются, возможно, самые известные и значимые из плановых (искусственных) языков, таких как Эсперанто, Токи Пона, Пандуния, Интерлингва и Ложбан. Процесс создания искусственных языков исследуется различными авторами, в частности, Жеффом Бурке, Салли Кавесом, Джоном Е. Клиффордом и А. Вежбицкой, а также Д. Тарту. В последнее время в области систем машинного перевода господствует идея о необходимости создания систем Интерлингва - промежуточных языков машинного перевода. То есть существующие естественные языки должны переводиться на Интерлингва и обратно с Интерлингва. Таким образом, можно получать перевод с любого языка A на язык B, применяя цепочку A-I-B, где I - это язык Интерлингва. Наиболее известная interlingua-система разрабатывалась в Голландии под названием Distributed Language Translation (с 1979 по 1992 гг.). Вскоре после этого запустился интерлингва-проект UNL (Universal Network Language). Возникновение этого проекта японских разработчиков определялось потребностью перевода документов в Интернете. Этот проект состоит в идее сопоставления слов и неких атрибутов, отличающих их различные лексико-семантические варианты. Часто ставится вопрос о применении какого-либо простого и ясного по структуре искусственного языка в качестве языка моделирования естественных языков: английского, немецкого, французского, русского, китайского и др. Эта идея всегда привлекала лингвистов, специализирующихся на формальных моделях естественных языков. Вопрос о международном искусственном языке без полисемии и конфигуральных условностей особенно активно разрабатывался в конце XIX в. Всего в мире насчитывается более 1000 проектов таких языков. Единственный язык такого рода, получивший относительно широкое распространение среди энтузиастов, - язык Эсперанто. Он на сегодняшний день содержит около 1900 корней (в основном романского происхождения). Эсперанто был основан на схожести многих европейских языков и содержит, таким образом, много схожих с другими языками слов. Грамматика Эсперанто отличается логичностью и простотой. В языке Эсперанто широко представлено словообразование. Существуют другие искусственные языки, такие как Basic English, содержащий 1000 слов (изначально в нем было 850 слов) и описывающий весь вокабуляр словосочетаниями видоизмененного английского языка. Сегодня на нем написана одна из Ви-кипедий. О. Н. Селиверстова, говоря о языке в широком смысле, пишет следующее: «Словарь семантического языка в идеале, который пока никем не был достигнут, должен удовлетворять следующему условию: каждое его слово должно выражать ровно одно, по возможности, элементарное значение, а все элементарные значения должны выражаться ровно одним словом семантического языка, совершенно независимо от того, в составе какого толкования оно встречается», т. е. такой язык должен удовлетворять требованиям детерминированности и однозначности. Языки описания естественных языков. В таблице в качестве иллюстрации приведен пример базовых компонентов сем-морфем - основных языковых единиц на одном из искусственных философских языков, в целях пояснения принципа описания естественного языка на основе конлангов. Так, слово Gi означает передачу идеи кем-то кому-то; Di - создание идеи; PiL - позитивное свойство идеи; GiL - передачу позитивной идеи; GiLuuu - передачу позитивной идеи о реципиенте. Таким образом, кодируются слова «сообщать», «думать», «разумный», «восхищаться» и «хвалить». Таким образом, слова некоторых конлан-гов являются полным или кратким определением слова, составленным из первоэлементов - сем («атомов смысла»). Некоторые конланги могут быть использованы в качестве средства моделирования естественных языков, с их помощью может осуществлять успешную работу язык генерации абстрактных текстов к урокам иностранного языка, решая таким образом проблему построения программ генераторов учебных заданий. 45 Математика, механика, информатика Эксперимент. Трансформируя данный подход в терминах порождающих грамматик, семантический конланг можно использовать для обозначения нетерминальных символов порождающей грамматики, в частности, авторская программа «Генератор классификаций» показывает принцип такого порождения (рис. 1). Как известно, стандартные порождающие грамматики над строками имеют вид четверки: G<S, T, N, R>, где S - начальный символ порождающей грамматики, T - множество терминальных символов, N -множество нетерминальных символов и R - множество правил трансформации одной строки в другую [3]. Таким образом, множество нетерминальных символов языка {cn} с T, тогда как множество терминальных символов {wm} с N. **• IMi Ш - ' 1» J» | Over Tree* t m general ♦ tht* ♦ A'aa ♦ A'o' ♦ odd’i' ♦ ‘nA'ooT ♦ a'e ’ Over Strings in general ♦ the ♦ A'aa ♦ 'A'o' ♦ odd'i' ♦ it ♦ a'e Boo<ean2* in general ♦ the ♦ A'aa ♦ 'A'o' ♦ odd’i' ♦ the ♦ a'e Chemistry* in general ♦ the ♦ AJtTaa ♦ АЯГо' ♦ odd'i' ♦ nA'ooT ♦ a'e Words» in general ♦ the ♦ Annn'aa ♦ Annn'o' ♦ oddV ♦ nA'ooT ♦ 'a' Phrases Making* in general ♦ the ♦ Arrr'aa ♦ Al'o' ♦ 'oddV ♦ nA'ooT ♦ a'e E-Course* in general ♦ the ♦ Arrr'aa' ♦ 'AJTo' ♦ 'oddV ♦ the ♦ a'e' Annn’aa' > handsome in general ♦ the ♦ young ♦ AJTo ♦ odd'i ♦ nA'ooT ♦ a'e in general ♦ this ♦ young ♦ AJiro ♦ odd'i ♦ < ♦ a'e АЯГо > girl in general ♦ the ♦ young ♦ АЯГо ♦ oddV ♦ the ♦ a'e АЯГо > lady Annn'o' > boy in general ♦ the ♦ young ♦ lady ♦ odd’i" ♦ nA’ooT ♦ a'e' Annn'o' > gentleman in general * the ♦ young ♦ АЯГо' ♦ oddV + 4 * 'a'e in general ♦ this ♦ young ♦ АЯГо ♦ odd'i' ♦ the ♦ a’e «■> in general ♦ the ♦ young ♦ girl ♦ ‘oddV + nA'ooT ♦ a’e . Рис. 1. Работа порождающей грамматики на основе промежуточного языка - конланга oGir’o Общеизвестно, что порождающие грамматики, они же формальные грамматики, находят самое широкое применение при создании лингвистического программного обеспечения, в частности, программ-переводчиков, экспертных систем, систем поддержки диалога с пользователем, систем автоматического реферирования текстов. Ниже приведен фрагмент порождающей грамматики с использованием языка oGir’o в качестве нетерминальных символов: "Start" > 'a'ee' + 'a'ooD' + 'a'i' + 'a'ooT' + 'a'e' 'a'ee' > in principle 'a'ee' > as far as I know a'ooD' > I a'ooD' > you 'a'ooD' > 'y'a' + 'A'aa' + 'A'o' 'a'i' + 'a'ooT' > 'E'i' + 'nA'ooT' 'a'i' + 'a'ooT' > 'odd'i' + 'nA'ooT' 'a'i' + 'a'ooT' > 'E'i' + 'y'a' + 'E'aa' + 'E'o' 'a'i' + 'a'ooT' > 'odd'i' + 'y'a' + 'odd'aa' + 'odd'o' 'nA'ooT' > it 'nA'ooT' > this 'a'ooT' > 'y'a' + 'A'aa' + 'A'o' 'y'a' > the 'y'a' > this 'A'aa' + 'A'o' > 'Alll'aa' + 'Alll'o' 'A'aa' + 'A'o' > 'Annn'aa' + 'Annn'o' 'A'aa' + 'A'o' > 'Arrr'aa' + 'Alll'o' 'A'aa' + 'A'o' > 'Arrr'aa' + 'Annn'o' 'Arrr'aa' > young 'Alll'aa' > beautiful Annn'aa' > handsome 'Arrr'aa' > kind 'Alll'o' > girl 'Alll'o' > lady 'Annn'o' > boy 'Annn'o' > gentleman 'E'i' > 'E'itttaaa' 'E'itttaaa' > reads 'E'itttaaa' > writes 'E'itttaaa' > copies 'E'itttaaa' > scans 'E'aa' > interesting E'aa' > published 'Ellll'o' > file 'Ellll'o' > image 'Ellll'o' > icon Emmmm'o' > magazine 'Emmmm'o' > document odd'aa' > tasty odd'aa' > appetizing odd'o' > food odd'o' > cutlet В скобочках вида '...' приведены термины семантического языка oGir’o, возможно применение в этой связи и других конлангов, однако конланг oGir’o специально разрабатывался для применения в сфере генерации, анализа и синтеза естественных языков и был создан с учетом критериев осмысленности и анализа порождающих особенностей естественных языков и их моделей. Рис. 2. Дополнительный пример работы порождающей грамматики на основе конланга Так, на рис. 1 показан процесс порождения фраз вида «in general this young girl eats it with pleasure», «in general this young girl cooks this thoughtfully», «in general this young girl chews it emotionally» и т. д. С другой стороны, на рис. 2 показан процесс генерации фраз вида «as far as I know you love the beautiful girl very much», «as far as I know you appreciate the beautiful girl emotionally», «as far as I know you adore the beautiful girl sincerely» и др. 46 Семы одного из конлангов (oGir’o) использовать f = импликация, причина ee = появление C = сущность i = идея bb = тело w = все ВТОРАЯ ОСНОВА i = глагол I = предикат (i)z = настоящее - делать s = и, конъюнкция aa = продолжать J = аспект e = место pp = часть l = много ii = глагол требующий инфинитива / герундия II = модальность, комплимент (i)v = будущее iii = делатель x = посылка, результат oo = исчезать P = свойство o = объект dd = еда r = достаточно e = наречие E = обстоятельство (i)q = прошлое eee = реципиент с = процесс ii = существовать F = связь a = абстракция tt = начинка m = мало ee = вводное слово EE = вводная фраза (i)f = совершенное aaa = объект v = будущее uu = не существовать D = действие u = отношение, действие gg = одежда n = минимум, нисколько o = существительное U = место предлога, связь (i)c = длительное ooo = инструмент z = настоящее yy = избегать T = получение, принятие O = сознание kk = покрытие, крышка W = отличный oo = местоимение OD = субъект (i)h = неопределенное uuu = себя q = прошлое EE = возможно Z = соединение A = существо vv = группа существ, организация L = хороший a = притяжательное местоимение, порядковое числительное OT = объект (i)p = длительное совершенное yyy = процесс j = время OO = необходимо G = передача кому-либо E = информация ff = кипа, куча, коллекция R = нормальный oa = количественное существительное O = именная группа (i)j = инфинитив III управление b = часть, включаться в II = не возможно K = получение от кого-либо I = интеллект zz = здание, дом, помещение M = плохой aa = прилагательное AA = атрибут, определение (i)vf = будущее совершенное EEE -цепочка d = быть, тождество UU = без необходимости, произвольно X = обмен U = непонятное ss = контейнер, тара N = ужасный u - союз, предлог между частями речи A = определитель (o)t = единственное AAA -взаимно g = целое, включать YY = отложить Q = запрос Y = иррациональное qq = сидение ww = твердый, жесткий uu - союз, предлог между предложениями (o)h = множественное OOO -параллельно dj = объединение, сложение AA = возобновить y = конкретное, данное, понятное xx = опора ll = мягкий yy - слово предложение, междометие, слова вежливости (o)tc = парное UUU -цикл p = меньше jj = устройство rr = жидкий ? - частица (aa)r = просто YYY -иерархия t = равно djj = устройство mm = газообразный ?? - наречие степени (aa)l = более ??? одиночное k = больше cc = инструмент nn = огонь, плазма y - вопросительное слово (aa)w = самый tc = отлично от tcc = инструмент WW = совершенный io - отглагольное существительное (aa)m = менее Математика, механика, информатика Использование планового языка в качестве промежуточного языка машинного перевода, языка векторного компонентного представления значения слов, языка описания валентностей слов, языка семантической классификации, языка нетерминальных символов порождающих грамматик можно считать перспективной и актуальной задачей. Она связана с решением проблемы моделирования, анализа, синтеза и потенциальной генерации естественного языка. Вероятно, будущее межнационального общения связано с работой эффективных систем машинного перевода с поддержкой голоса, а не с внедрением конлангов в качестве основных языков. При этом, по сравнению с изучением и исследованием конлангов в их применении в искусстве и в качестве хобби, использование конструируемых языков как средства моделирования и анализа естественных языков, использование языка описания нетерминальных символов порождающих грамматик является научной и технической задачей, требующей дальнейшего исследования.
×

Об авторах

Дмитрий Викторович Личаргин

Сибирский федеральный университет

Email: lichdv@hotmail.ru
кандидат технических наук, доцент кафедры разговорного иностранного языка

Константин Владимирович Сафонов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Email: kvsafonov@rambler.ru
доктор физико-математических наук, заведующий кафедрой прикладной математики

Александра Вадимовна Ладе

Сибирский федеральный университет

Email: withlady@yandex.ru
преподаватель кафедры разговорного иностранного языка Института космических и информационных технологий

Дарья Дмитриевна Мищенко

Сибирский федеральный университет

Email: mddarja@gmail.com
магистрант Института космических и информационных технологий

Александра Толгатовна Гордеева

Сибирский федеральный университет

Email: alexandra-uk@mail.ru
доцент кафедры разговорного иностранного языка Института космических и информационных технологий

Список литературы

  1. Личаргин Д. В. Методы и средства порождения семантических конструкций естественно языкового интерфейса программных систем: дис.. канд. техн. наук : 05.13.17. Красноярск, 2004. 154 с.
  2. Сафонов К. В., Личаргин Д. В. Разработка векторизованной семантической классификации над словами и понятиями естественного языка // Вестник СибГАУ. 2010. № 4 (30). С. 33-37.
  3. Сафонов К. В. О возможности вычислительного распознавания контекстно-свободных грамматик // Вычислительные технологии. 2005. Т. 10, № 4. С. 91-98.
  4. Тарту Д. Общая интерлингвистика и плановые языки. М. : Русский язык, 1989.
  5. Исаев М. И. Проблемы международного вспомогательного языка. М. : Наука, 1991.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Личаргин Д.В., Сафонов К.В., Ладе А.В., Мищенко Д.Д., Гордеева А.Т., 2014

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах