Обнаружение депрессии среди пользователей социальной сети с использованием методов машинного обучения
- Авторы: Зоткина А.А.1, Мартышкин А.И.1
-
Учреждения:
- Пензенский государственный технологический университет
- Выпуск: Том 10, № 4 (2023)
- Страницы: 16-22
- Раздел: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И МАШИННОЕ ОБУЧЕНИЕ
- URL: https://journals.eco-vector.com/2313-223X/article/view/626619
- DOI: https://doi.org/10.33693/2313-223X-2023-10-4-16-22
- ID: 626619
Цитировать
Полный текст



Аннотация
Статистические данные, представленные ФГБУ «НМИЦПН им. В.П. Сербского» Минздрава России, указывают на то, что депрессия, как психоэмоциональное состояние, является основной причиной беспокойства во всем мире, которая в большинстве случаев приводит к самоубийству, если ее не выявить, и к угрозе окружающим. Исследования показывают, что депрессия, как правило, оказывает влияние на стиль письма и соответствующее использование языка. Основной целью предлагаемого исследования является изучение сообщений пользователей в социальной сети ВКонтакте и определения атрибутов, которые могут указывать на депрессивные симптомы пользователей. В статье используются подходы машинного обучения (логистическая регрессия, случайный лес, машина опорных векторов, XGBoost) и методы обработки естественного языка (удаление стоп-слов, удаление символов, токенизация, лемматизация) для подготовки данных и оценки их эффективности. В работе было продемонстрировано, что возможность поиска депрессивных пользователей с точностью 77% с помощью классификатора XGBoost. Этот метод комбинируется с другими лингвистическими функциями (N-грамм + TF-IDF) и LDA для достижения более высокой точности. В заключительной части данной научной публикации представлены существенные результаты, полученные в ходе проведенных исследовательских работ.
Ключевые слова
Полный текст

Об авторах
Алена Александровна Зоткина
Пензенский государственный технологический университет
Автор, ответственный за переписку.
Email: alena.zotkina.97@mail.ru
ORCID iD: 0000-0002-2497-6433
аспирант 4-го года обучения кафедры «Программирование»
Россия, ПензаАлексей Иванович Мартышкин
Пензенский государственный технологический университет
Email: mai@penzgtu.ru
ORCID iD: 0000-0002-3358-4394
кандидат технических наук, доцент; заведующий кафедрой «Программирование»
Россия, ПензаСписок литературы
- Abboute A., Boudjeriou Y., Entringer G. et al. Mining Twitter for suicide prevention. In: Natural language processing and information systems. NLDB 2014. Lecture notes in computer science. E. Métais, M. Roche, M. Teisseire (eds.). Vol. 8455. Cham: Springer, 2014. Pp. 250–253. DOI: https://doi.org/10.1007/978-3-319-07983-7_36
- Chattopadhyay S. A study on suicidal risk analysis. 9th International Conference on e-Health Networking, Application and Services. Taipei: IEEE, 2007. Pp. 74–78.
- Coppersmith G., Ngo K., Leary R., Wood A. Exploratory analysis of social media prior to a suicide attempt. In: Proceedings of the third workshop on computational linguistics and clinical psychology. San Diego, CA: Association for Computational Linguistics. 2016. Pp. 106–117.
- O’dea B., Wan S., Batterham P.J. et al. Detecting suicidality on Twitter. Internet Interventions // The Application of Information Technology in Mental and Behavioural Health. 2015. No. 2 (2). Pp. 183–188. doi: 10.1016/j.invent.2015.03.005.
- Бонцанини М. Анализ социальных медиа на Python. Извлекайте и анализируйте данные из всех уголков социальной паутины на Python / пер. с англ. А.В. Логунова. М.: ДМК Пресс, 2018. 288 с. ISBN 978-5-97060-574-5. URL: https://e.lanbook.com/book/108129
- Зоткина А.А. Анализ депрессивного состояния пользователей социальной сети «ВКонтакте» // XXI век: итоги прошлого и проблемы настоящего плюс. 2022. Т. 11. № 4 (60). С. 52–55. doi: 10.46548/21vek-2022-1160-0007.
- Коэльо Л.П., Ричарт В. Построение систем машинного обучения на языке Python / пер. с англ. А.А. Слинкин. 2-е изд. М.: ДМК Пресс, 2016. 302 с. ISBN 978-5-97060-330-7. URL: https://e.lanbook.com/book/82818
- Макшанов А.В., Журавлев А.Е., Тындыкарь Л.Н. Большие данные. Big Data. 2-е изд., стер. СПб.: Лань, 2022. 188 с. ISBN 978-5-8114-9690-7. URL: https://e.lanbook.com/book/198599
- Москвитин А.А. Данные, информация, знания: методология, теория, технологии: монография. СПб.: Лань, 2022. 236 с. ISBN 978-5-8114-3232-5. URL: https://e.lanbook.com/book/206267
- Семериков А.В., Глазырин М.А. Классификация объектов на основе нейронной сети и методами дерева решения и ближайших соседей: учеб. пособие. Ухта: УГТУ, 2022. 68 с. URL: https://e.lanbook.com/book/267857
- Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. М.: ДМК Пресс, 2015. 400 с. ISBN 978-5-97060-273-7. URL: https://e.lanbook.com/book/69955
- Шалев-Шварц Ш., Бен-Давид Ш. Идеи машинного обучения: учеб. пособие / пер. с англ. А.А. Слинкина. М.: ДМК Пресс, 2019. 436 с. ISBN 978-5-97060-673-5. URL: https://e.lanbook.com/book/131686 (дата обращения: 02.02.2023).
Дополнительные файлы
