МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ЧЕЛОВЕЧЕСКОЙ АКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ ДАТЧИКОВ ОКРУЖАЮЩЕЙ СРЕДЫ


Цитировать

Полный текст

Аннотация

Распознавание человеческой активности представляет собой быстро развивающуюся область исследований, целью которой является определение типа поведения людей на основе собираемых данных. Системы распознавания человеческой активности находят широкое применение в медицине, спорте, производстве и многих других сферах. Данные для систем распознавания могут быть получены при помощи видеонаблюдения, а также с использованием различного рода датчиков. Датчики окружающей среды обладают рядом преимуществ: простота, дешевизна и широкое применение в системах «умного дома». Для обработки данных в системах распознавания часто используются методы машинного обучения. Данная статья посвящена приложению различных методов машинного обучения к распознаванию человеческой активности на основе данных, полученных с датчиков окружающей среды «умного дома».

Полный текст

Введение Распознавание человеческой активности (Human Activity Recognition - HAR) является бы- стро развивающейся областью исследований, це- лью которой является идентификация действий людей на основе собираемых данных [1-3]. Рас- познавание человеческой активности находит широкое применение в медицине: диагностика ряда заболеваний, уход за пожилыми людьми и инвалидами; в производстве: отслеживание дей- ствий и реакции персонала в различных ситуа- циях; в спорте: оценка уровня подготовки спорт- сменов. В настоящее время существует два основных направления развития систем HAR, определяе- мых типом используемых данных [1-3]: системы на основе видеонаблюдения и системы на основе данных, собираемых с различного вида датчиков. В системах первого типа данные представляют собой видеоизображения человеческой деятель- ности, которые необходимо отнести к заранее определенным классам. В системах второго типа данными являются показания датчиков, закре- пляемых на теле человека или устанавливаемых в окружающей человека среде, на основе этих данных требуется классифицировать текущую человеческую активность. Несмотря на то что в области распознавания изображений были получены впечатляющие ре- зультаты, внедрение систем HAR на основе видео- наблюдения на практике может привести к ряду затруднений. Во-первых, для надежной работы таких систем необходимо получение изображе- ний высокого разрешения и четкости, что может потребовать использования достаточно дорого- стоящих видеокамер. Во-вторых, мониторинг ак- тивности в нескольких помещениях, а также на- личие различных закрывающих обзор объектов делает необходимым использование нескольких видеокамер, что значительно удорожает внедре- ние систем данного типа. И в-третьих, распозна- вание активности с помощью видеонаблюдения в личных помещениях, что актуально, например, при наблюдении за пожилыми людьми, часто мо- жет быть неприемлемо из-за нарушения частной жизни и раскрытия персональных данных [1-3]. Большое распространение умных устройств, таких как смартфоны и фитнес-браслеты, ко- торые уже снабжены встроенными датчиками, «Infokommunikacionnye tehnologii» 2021, Vol. 19, No. 1, pp. 91-100 а также достаточно низкая стоимость большин- ства датчиков в сравнении с видеокамерами высокого разрешения, делают использование систем HAR на основе показаний датчиков эко- номически весьма привлекательными. Помимо этого использование таких систем может вызвать меньше вопросов, связанных с раскрытием ин- формации о частной жизни, так как собираемые данные могут быть ограничены только опреде- ленным набором, по которому идентификация личности будет сильно затруднена. Вместе с тем следует также отметить, что системы HAR на ос- нове датчиков в настоящее время имеют более низкую надежность распознавания в сравнении с системами видеонаблюдения [1-3]. Датчики распознавания активности Датчики, используемые для распознавания ак- тивности, можно разделить на четыре группы [1-3]: датчики носимых устройств; датчики параметров окружающей среды; датчики идентификации объектов; неспециализированные датчики. К датчикам носимых устройств относят дат- чики, которые часто встроены в персональные устройства, переносимые на теле человека, такие как смартфоны, смарт-часы, фитнес-браслеты, предметы одежды. Устройства с такими датчика- ми обычно закрепляют на руке, ноге или поясе. Наиболее широко распространенными датчика- ми данного типа являются акселерометры и гиро- скопы. Акселерометр - это датчик, измеряющий ускорение тела по трем осям несколько десятков раз в секунду. Гироскоп позволяет фиксировать изменения угловой скорости по трем осям с ча- стотой несколько десятков герц. Носимые дат- чики позволяют получить непосредственную информацию о движениях тела человека, что де- лает их незаменимыми при распознавании инди- видуальной динамической активности человека, например, ходьбы, бега, поднятия тяжестей [1]. Датчики, измеряющие параметры окружаю- щей среды, обычно встраивают в различного рода устройства Internet вещей: лампы освещения, системы контроля микроклимата помещений, умную бытовую технику, системы безопасности. К датчикам данного типа относят: термометры, датчики освещения, датчики приближения и при- сутствия, счетчики воды и энергопотребления. В отличие от носимых датчиков, они подходят под распознавание сложной бытовой активности сразу нескольких индивидов [1]. Датчики идентификации объектов служат для определения взаимодействия человека с какимлибо предметом обихода. В качестве подобных датчиков наиболее широко применяют считы- ватели радио-идентификационных меток (Radio Frequency Identification - RFID). Уникальные RFID-метки закрепляются на бытовых пред- метах, таких как кружка, тарелка, зубная щетка и т. п., после чего взаимодействие с предметом фиксируется считывателем меток, который дол- жен быть закреплен на теле человека. Датчики идентификации объектов хорошо подходят для распознавания комплексной активности, которая включает взаимодействие с несколькими быто- выми предметами, снабженными метками, на- пример, приготовление пищи и личную гигиену. Однако использование таких датчиков сопряже- но с рядом неудобств, поскольку требует от че- ловека постоянного ношения считывателя меток и крепления меток на множестве бытовых пред- метов [1-3]. К неспециализированным датчикам можно отнести устройства, которые помимо своего пря- мого назначения имеют дополнительные возмож- ности, позволяющие их использовать для распоз- навания активности. Примером таких датчиков являются встроенные микрофоны смартфонов и бытовых аудиосистем. Встроенные микрофоны способны улавливать очень широкий диапазон звуковых частот, обработка которого позволяет распознавать разнообразную человеческую ак- тивность: ходьбу, относительное перемещение в пространстве, открытие и закрытие дверей, рабо- ту на компьютере. Также к подобным датчикам можно отнести беспроводные устройства, спо- собные фиксировать изменения картины электро- магнитного поля в помещении [1]. Методы распознавания активности Получаемые с датчиков данные, как правило, представляют собой хронологические последо- вательности нескольких параметров. Например, для носимых систем это могут быть показания гироскопа для трех пространственных осей на определенном временном этапе. Основной за- дачей обработки таких данных является опреде- ление типа активности на заданных временных интервалах. Таких образом, задача обработки данных HAR относится к задачам классификации многопараметрических временных рядов. Для решения данной задачи широко применяются ме- тоды статистики и машинного обучения [1-3]. При использовании статистических методов вычисляются математические ожидания и диспер- сии сигналов датчиков на временных интервалах, после чего их соотносят с заранее определенными эталонными значениями для заданных типов ак- тивностей. Такой подход, однако, пригоден только для весьма ограниченного набора простых дина- мических активностей [1]. В более сложных ме- тодах данного типа используется преобразование временных последовательностей в частотную об- ласть, далее составляются двумерные спектраль- ные картины на заданных интервалах, обработка которых производится методами классификации изображений. Такие методы хорошо зарекомен- довали себя при анализе данных с носимых и встраиваемых датчиков, однако не подходят для обработки больших объемов данных с множества датчиков, что актуально для систем, использую- щих данные датчиков окружающей среды [1-3]. Методы машинного обучения нашли широкое применение для задач классификации активно- стей. Наиболее часто для распознавания приме- няется обучение с учителем (supervised learning). При данном подходе с помощью заранее анно- тированного набора данных производится обу- чение выбранного алгоритма, который затем ис- пользуется для классификации вновь собранных данных. Преимуществом методов машинного обучения являются хорошая адаптируемость под разнообразный характер данных и большое чис- ло активностей, а также отсутствие необходимо- сти в сложной предварительной обработке сиг- налов. Основной недостаток методов машинного обучения заключается в необходимости большо- го аннотированного набора данных для обучения алгоритмов [1-3]. Традиционно выделяют классические и ан- самбльные методы машинного обучения, а также методы, основанные на использовании искус- ственных нейронных сетей [4; 5]. Классические методы машинного обучения К классическим методам машинного обуче- ния часто относят [4; 5]: алгоритм k-ближайших соседей kNN; дерево решений DesTree; метод опорных векторов SVM; наивный байесовский классификатор NB. Алгоритм k-ближайших соседей (k-Nearest Neighbors - kNN) является одним из простейших непараметрических алгоритмов машинного обу- чения, в котором классификация входного век- тора данных производится на основе простого большинства классов k-ближайших аннотиро- ванных векторов из обучающего набора данных. Например, при k = 1 входному вектору просто присваивается класс ближайшего соседнего век- Рисунок 1. Пример дерева решений тора. В качестве расстояния до соседних векто- ров обычно берется расстояние в евклидовом пространстве. Также в большинстве практических реализа- ций kNN используется взвешенная оценка вкла- да соседей в итоговый класс: чем ближе сосед, тем выше его вес при определении класса. Пре- имуществом алгоритма kNN является простота реализации, а главный недостаток заключает- ся в плохой устойчивости при большом наборе входных параметров, поскольку линейный рост параметров приводит к экспоненциальному ро- сту расстояния между соседними векторами, что значительно затрудняет классификацию. Данная проблема, известная как «проклятие размерно- сти», характерна для многих других классических методов машинного обучения. Дерево решений (Decision Tree) представляет собой алгоритм классификации, в основе кото- рого лежит последовательное бинарное разделе- ние всего пространства выбора. Дерево решений представляет собой ациклический граф - см. ри- сунок 1, в узлах которого производится принятие решений путем сравнения входных данных, а ре- бра являются результатами сравнения (да/нет). Замыкающие вершины (листья) соответствуют итоговым классам С1, С2, … [4]. Получение дерева решений производится рекурсивным бинарным делением пространства обучающих данных. Критерием выбора наи- лучшего дерева является минимизация целевой функции, определяющей совокупную точность классификации обучающих данных. Часто для задач классификации в качестве целевой функ- ции используется критерий Джини [4]. В методе опорных векторов (Support Vector Machine - SVM) для классификации используется данных при заданном классе P(X|Ci), при «наи- вном» допущении ее можно вычислить как про- изведение независимых вероятностей для каждой переменной xj входного вектора по обучающим данным для заданного класса. Вероятность входных данных P(X) является постоянной для всех классов и поэтому в рас- четах обычно не используется. Таким образом, определение наиболее вероятного класса C’ при наивном байесовском подходе сводится к вычис- лению: C '  arg max{P(Ci ) P(xi | Ci )}. i i (2) Рисунок 2. Принцип SVM разделение пространства векторов при помощи гиперплоскостей. Класс входного вектора опре- деляется исходя из области, которая ограничена гиперплоскостями. С целью уменьшения ошибки классификации подбираются гиперплоскости с максимальным расстоянием до ближайших век- торов. Для этого от ближайшего вектора (точки) проводится перпендикуляр до гиперплоскости. Точки, лежащие на перпендикуляре, получили название опорных векторов (см. рисунок 2). Классификация с наименьшей ошибкой обе- спечивается при максимальной длине опорных векторов. В случае, когда точное разделение классов с помощью гиперплоскостей невозмож- но, их положение выбирается так, чтобы мини- мизировать ошибку классификации (так называе- мая мягкая классификация). Обучение алгоритма SVM производится путем подбора разделяющих гиперплоскостей для обучающего набора дан- ных, при этом применяются различные методы линейной алгебры [4; 5]. Наивный байесовский классификатор (Naive Bayes - NB) основан на выборе наиболее веро- ятного класса (Ci) для вектора входных данных X = (x1, x2, ..., xn), используя предварительные «наивные» представления о данных, основанные на известной теореме Байеса об условной вероят- ности [4; 5]: Простейший байесовский наивный классифи- катор основан на предположении о равноверо- ятном распределении данных для всех классов, что на практике встречается достаточно редко. В том случае, если вероятность классов зависит от нормального распределения входных данных, используется гауссовский наивный байесовский классификатор (Gaussian NB). Другими распро- страненными вариантами являются наивные байесовские классификаторы для мультиноми- ального распределения (Multinomial NB) и рас- пределения Бернулли (Bernoulli NB) [4; 5]. Ансамбльные методы машинного обучения В основе ансамбльных методов машинного обучения лежит одновременное использование множества простых алгоритмов классификации. Итоговое решение о принадлежности к опреде- ленному классу входного вектора признаков вы- носится на основе большинства вынесенных ре- шений отдельными алгоритмами [4; 6]. К ансамбльным методам относят: бэггинг-классификация Bagging; лес случайных деревьев RForest; экстремальные деревья ExTree; градиентный бустинг GBoost. В бэггинг-классификации (Bagging Classifier) производится одновременное обучение несколь- ких деревьев решений. Обучающие данные раз- биваются на несколько наборов, сохраняющих репрезентативность исходных данных. Прово- дится построение дерева решений для каждого набора. Классификация входных данных произ- P(C | X )  P(Ci )P( X | Ci ) . (1) водится всеми деревьями, после чего в качестве i P( X ) Как следует из выражения (1) для определе- ния класса входных данных, необходимо знать предварительную вероятность класса P(Ci), кото- рая вычисляется по частоте класса в обучающих данных, а также условную вероятность входных итогового класса выбирается наиболее частое решение. Данный подход позволяет повысить стабиль- ность и точность классификации, но требует большей вычислительной мощности и памяти. Основным параметром данного метода является число деревьев решений, чаще всего оно подби- рается итерационно, пока точность классифика- ции не перестает расти. Бэггинг-классификация может также использоваться и для других мето- дов машинного обучения, например, искусствен- ных нейронных сетей [4; 6]. Лес случайных деревьев (Random Forest) пред- ставляет собой модификацию бэггинга для дере- Подробно реализация данных нейросетей рас- смотрена в работе [7]. Основное отличие ней- ронных сетей для классификации заключается в особой функции активации выходного слоя ней- ронов. В задачах классификации двух классов обычно используется функция, называемая логи- стическим сигмоидом (sigmoid) [4; 5]: 1 вьев решений. При классическом бэггинге часто получаются структурно сходные деревья, что (x)  . 1  e- x (3) приводит к сильной корреляции их решений, это негативно сказывается на обобщающей способ- ности алгоритма классификации. В лесе случай- ных деревьев для построения деревьев решений используются не все признаки, а только случайно выбранная их часть. Значения сигмоид-функции находятся в пределах от 0 до 1, что позволяет их интерпретировать как вероятности одного из классов. При числе классов больше двух для активации применяется softmax-функция [4; 5]: exi Таким образом, снижается точность класси- фикации отдельного дерева, но при этом повыша- ются обобщающая способность и устойчивость softmax(x)i  K . exj j 1 (4) общей классификации. Недостатком данного метода является значительно большее требуемое количество деревьев для достижения заданной точности в сравнении с простым бэггингом [4]. Метод экстремальных деревьев (Extra Trees) является дальнейшей модификацией леса слу- чайных деревьев. Основное его отличие состоит в том, что обучение случайных деревьев решений производится на всех обучающих данных, кроме этого все точки принятия решения в дереве вы- бираются случайно, а не рекурсивно. Это позво- ляет, во-первых, повысить скорость обучения, во-вторых, снизить влияние на классификацию Данная функция позволяет нормализовать значения выходных нейронов и интерпретиро- вать их как распределения вероятностей между классами. Поскольку обучение искусственных нейрон- ных сетей производится методом градиентного спуска и его модификациями, для этого необхо- дима дифференцируемая функция оценки ошиб- ки классификации. Для задач классификации наиболее часто в качестве функции оценки ошиб- ки используется перекрестная энтропия (Cross Entropy - CE). В задачах для двух классов пере- крестная энтропия имеет вид [5]: различных случайных факторов [4]. CE  -( y log( p)  (1 - y) log(1 - p)), (5) Суть метода градиентного бустинга (Gradient Boosting) состоит в том, что вклад в общее реше- ние отдельных классификаторов учитывается с весом, обратно пропорциональным ошибке клас- сификации. В конечном счете влияние на итого- вую классификацию «хороших» классификатогде p - вероятность одного из классов, предска- занная алгоритмом; y - показатель правильности классификации (0 или 1). Для классификации с числом классов более двух перекрестная энтропия имеет вид [5]: K ров повышается, а «плохих» снижается. Ошибка классификации и соответствующий CE  - yi log( pi ), i 1 (6) вес рассчитываются после добавления каждого нового дерева, таким образом, происходит гради- ентный спуск или бустинг в направлении сниже- ния общей ошибки классификации [4]. Искусственные нейронные сети Для задач классификации хронологических последовательностей используются те же типы искусственных нейронных сетей, что и для задач регрессии [4; 5]: многослойный перцептрон (MLP); сверточная нейронная сеть (CNN); рекуррентные нейронные сети (RNN). где pi - вероятность i-го класса; yi - индикатор правильности классификации данного класса. Оценка качества классификации Наиболее часто для оценки качества клас- сификации кого-либо метода на практике при- меняется точность (accuracy) классификации, определяемая как отношение числа корректно классифицированных экземпляров данных к их общему числу. Также в качестве меры оценки можно использовать частоту ошибок (error rate): долю ошибочно классифицированных данных в общем числе данных [4]. Таблица 1. Пример матрицы спутывания Истинные классы Предсказанные классы C1 C2 C3 C1 5 1 0 C2 1 4 1 C3 2 0 4 Однако приведенные оценки качества являалгоритма классификации. Для получения более детальной информации о работе алгоритма по отношению к отдельным классам часто исполь- зуются дополнительные параметры оценки: мет- кость и чувствительность. Меткость (precision) показывает отношение правильных классификаций класса к общему числу случаев классификаций, отнесенных к это- му классу [4]: ются интегральными и не позволяют получить представление, насколько точно данный метод Pr  TP . TP  FP (8) классифицирует данные разных классов, что осо- бенно актуально при неравномерном распределе- нии данных из разных классов. В этом случае для оценки точности классификации разных классов широко применяется так называемая матрица спутывания (confusion matrix). Матрица спутывания представляет собой квадратную матрицу, Чем выше меткость алгоритма по отношению к определенному классу, тем большее число дан- ных будет отнесено к этому классу. Чувствительность (recall) показывает отноше- ние правильных классификаций класса к общему числу экземпляров этого класса [4]: TP названия строк и столбцов в которой содержат обозначения всех возможных классов данных. R  . TP  FN (9) Пример такой матрицы спутывания для трех классов представлен в таблице 1 [4]. Значение на пересечении i-й строки и j-й ко- лонки таблицы обозначает, сколько данных i-го класса было отнесено алгоритмом к j-му классу. Таким образом, значения на главной диагонали матрицы спутывания показывают число коррек- тно классифицированных случаев. В представ- ленном примере четыре экземпляра класса С3 были определены корректно, однако два экземпляра данного класса были отнесены к классу Чем выше чувствительность алгоритма по отношению к определенному классу, тем большее число экземпляров этого класса будет правильно классифицировано как экземпляры этого класса. Меткость и чувствительность алгоритма часто находятся в обратной зависимости: высокая мет- кость алгоритма, как правило, ведет к меньшей чувствительности и наоборот. В связи с этим при- меняют комбинированный параметр: F1-метрику, объединяющую оценки меткости и чувствительности [4; 5]: С1 [4]. Точность классификации для отдельного  Pr  R (10) класса можно получить, разделив соответству- F1 2 . Pr  R ющее значение на главной диагонали матрицы Чем ближе значение F1 к единице, тем более спутывания на общее число экземпляров этого класса в данных. Точность классификации отдельного класса складывается из четырех факторов [4]: правильного отнесения экземпляров данно- го класса к этому классу (TP - True Positive); неверного отнесения экземпляров других классов к данному классу (FP - False Positive); неверного отнесения экземпляров этого класса к другим классам (FN - False Negative); правильного отнесения экземпляров других классов к другим классам (TN - True Negative). сбалансированным является соотношение мет- кости и чувствительности алгоритма по отноше- нию к данному классу. Анализ отдельных параметров классов может быть затруднен при их большом числе. Инте- гральную оценку сбалансированности класси- фикации по всем классам можно получить, ис- пользуя корреляционный коэффициент Мэтью (Matthew Correlation Coefficient - MCC), который определяется по следующей формуле [4]: MCC  Используя значения данных факторов, вычис- ленные на основе матрицы спутывания, опреде-  TP  TN - FP  FN . (TP  FP)(TP  FN )(TN  FP)(TN  FN ) (11) лим точность классификации отдельного класса, согласно [4], в следующем виде: Здесь МСС может принимать значения от +1 (наилучшая классификация) до -1 (наихудшая Acc  TP  TN . TP  TN  FP  FN (7) классификация). Как правило, алгоритм класси- фикации требуется для работы на постоянно по- Как уже было сказано, точность является ин- тегральной характеристикой качества работы ступающих новых данных, но для оценки каче- ства его работы нельзя использовать обучающие Рисунок 3. Пример распределения активностей резидентов данные. Поэтому их всех доступных данных для итоговой оценки точности классификации выде- ляют определенную часть (20-30 %), остальные 70-80 % могут быть использованы для обучения алгоритма [4-6]. Описание данных и постановка задачи Для исследования возможностей различных методов машинного обучения по распознава- нию человеческой активности на основе данных с датчиков окружающей среды был выбран от- крытый набор данных, собранный исследовате- лями Вашингтонского университета [8]. Данные представляют собой непрерывные показания с датчиков «умного дома», установленных в домах резидентов-добровольцев. Показания собира- лись непрерывно в течение приблизительно двух месяцев с помощью протокола ZigBee с датчиков движения, открытия/закрытия дверей, управле- ния освещением и других. На основе необработанных данных формиро- вался аннотированный вектор атрибутов событий в каждый момент времени, который включает в себя такие параметры, как: час дня в локальном времени (last Sensor Event Hour); отсчет в сек от полуночи (last Sensor Event Seconds); порядковый день недели (last Sensor Event Day Of Week); время в сек от момента последнего срабаты- вания датчика кухни (Sensor ElTime-Kitchen); время в сек от момента последнего срабаты- вания датчика прихожей (Sensor ElTime-Hall) и др. Всего в векторе записано 36 различных атри- бутов событий. Каждый вектор аннотирован со- ответствующей активностью резидента в данный момент времени, например: приготовление обеда (Cook_Dinner); просмотр телевизора (Watch_TV); сон (Sleep); утренний прием медицинских препаратов (Morning_Med); нераспознанная активность (Other_Activity). Всего в наборе данных каждого резидента мо- жет насчитываться от 31 до 36 различных актив- ностей. Следует отметить весьма значительную неравномерность событий для разных активно- стей. Пример активностей резидента с обозначением csh101 представлен на рисунке 3. Для всех резидентов от 25 до 40 % событий составляет нераспознанная активность, в то вре- мя как активности вида прием лекарств или мы- тье посуды могут занимать менее 0,01 %, что зна- чительно затрудняет их распознавание. Цель данного исследования была сформули- рована следующим образом: провести оценку Таблица 2. Оценки методов классификации Метод csh101 csh103 csh107 Acc MCC Acc MCC Acc MCC kNN(5) 0,71 0,64 0,86 0,82 0,75 0,65 DesTree 0,56 0,44 0,81 0,75 0,76 0,65 SVM 0,75 0,68 0,89 0,86 0,83 0,75 NB 0,67 0,56 0,72 0,63 0,57 0,27 Bagging 0,63 0,54 0,79 0,73 0,81 0,72 RForest 0,73 0,66 0,89 0,85 0,85 0,79 ExTree 0,77 0,7 0,91 0,88 0,86 0,79 GBoost 0,8 0,75 0,89 0,86 0,85 0,79 MLP 0,76 0,7 0,9 0,86 0,83 0,77 CNN 0,76 0,7 0,89 0,86 0,84 0,77 различных методов машинного обучения для предсказания текущей активности резидента «умного дома», используя показания датчиков окружающей среды. Анализ полученных результатов Пример полученных оценок точности класси- фикации и коэффициент Метью, рассмотренных методов машинного обучения для трех резиден- тов, обозначенных как csh101, chs103 и csh107, представлены в таблице 2. Расчеты проводились для активностей, доля событий которых превышает 2 % от общего числа событий, чтобы обеспечить статистическую до- стоверность результатов. Моделирование методов классического и ансамбльного машинного обуче- ния проводилось с использованием пакета scikit- learn [9]. Моделирование искусственных нейрон- ных сетей проводилось в пакете TensorFlow [10]. Использовалась MLP с двумя скрытыми слоями из 64 и 32 нейронов, а также CNN с одним свер- точным слоем, состоящим из 32 фильтров, и раз- мером ядра в два нейрона без слоя пуллинга, с дополнительным скрытым слоем из 32 нейронов. В обеих нейросетях для активации всех слоев, кроме выходного, использовался линейный вы- прямитель (ReLU). Число нейронов в выходном слое соответствовало количеству классифициру- емых активностей, для активации нейронов вы- ходного слоя использовалась softmax функция. Исходные коды моделей всех рассмотренных ме- тодов машинного обучения представлены в репо- зитории [11]. Как видно из приведенных оценок, наилуч- шие результаты по точности и сбалансирован- ности классификации показали алгоритмы экстремальных деревьев (ExTree) и градиентного бустинга (GBoost). Точность классификации до- вольно значительно различается по резидентам, что может быть обусловлено индивидуальными привычками. Также необходимо отметить, что точность классификации имеет большой разброс и по активностям: для продолжительных во вре- мени активностей (сон, просмотр телевидения, работа вне дома) точность классификации может достигать 80-90 %, в то время как для кратко- временных активностей (прием лекарств, мытье посуды, одевание) точность классификации со- ставляет 20-30 %. Данные особенности следует учитывать при внедрении систем распознавания активностей на основе датчиков окружающей среды. Заключение В работе рассмотрены методы машинного обу- чения для классификации человеческой актив- ности на основе данных датчиков окружающей среды. Показано, что системы, основанные на ис- пользовании датчиков окружающей среды, име- ют ряд преимуществ, в том числе: использование готовой инфраструктуры «умного дома»; защита персональных данных и др. В ходе проведенного моделирования на набо- ре данных реального «умного дома» было проде- монстрировано, что наилучшую точность и сба- лансированность классификации обеспечивают методы экстремальных деревьев и градиентного бустинга. Также показано, что системы распозна- вания на основе датчиков окружающей среды це- лесообразно применять для распознавания чело- веческих активностей, занимающих длительные интервалы времени в пределах «умного дома».
×

Об авторах

А. В Трошин

Поволжский государственный университет телекоммуникаций и информатики

Email: a.v.troshin77@yandex.ru
Самара, РФ

Список литературы

  1. Deep learning for sensor-based human activity recognition: Overview, challenges and opportunities / K. Chen [еt аl.]. URL: https://arxiv.org/abs/2001.07416 (дата обращения: 01.10.2020)
  2. Deep learning for sensor-based activity recognition: A survey / J. Wang [еt аl.] // Pattern Recognition Letters. 2019. Vol. 119. P. 3-11. DOI: https://doi.org/10.1016/j.patrec.2018.02.010
  3. Hussain Z., Sheng M., Zhang W.E. Different approaches for human activity recognition: A survey. URL: https://arxiv.org/abs/1906.05074 (дата обращения: 01.10.2020)
  4. Marsland S. Machine Learning: An Algorithmic Perspective; 2nd ed. Boca Raton: CRC Press, 2015. 430 р
  5. Goodfellow I., Bengio Y., Courville A. Deep Learning. Cambridge: MIT Press, 2016. 800 р
  6. Kuhn M., Johnson K. Applied Predictive Modeling. Berlin: Springer, 2013. 600 p
  7. Трошин А.В. Машинное обучение для прогнозирования трафика в сети LTE // Инфокоммуникационные технологии. 2019. Т. 14, № 4. С. 400-406
  8. Human activity recognition from continuous ambient sensor data set. URL: https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+from+Continuous+Ambient+Sensor+Data (дата обращения: 01.10.2020)
  9. Scikit-learn. URL: https://www.scikit-learn.org (дата обращения: 01.10.2020)
  10. TensorFlow. URL: https://www.tensorflow.org (дата обращения: 01.10.2020)
  11. Troshin A. Human activity recognition with ambient sensors. URL: https://github.com/av-troshin77/har_ambient_sensors (дата обраще- ния: 04.10.2020)

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Трошин А.В., 2021

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах