Корреляционная обработка данных для определения усредненной дифференциальной хроматограммы при многократном вводе проб

Обложка


Цитировать

Полный текст

Аннотация

Показана связь входного и выходного сигналов хроматографа. Отмечена целесообразность повышения отношения сигнал/шум и использования для этого корреляционной обработки данных. Приводится алгоритм вычисления хроматограммы, усредненной по множеству вводов пробы некоторого отдельно взятого образца. Далее этот алгоритм модифицируется на случай вычисления дифференциальной усредненной хроматограммы, когда требуется определить различие компонентного состава двух различных образцов. Для формирования входных сигналов используется псевдослучайная последовательность Лежандра. Алфавит этой последовательности 1 или 0: 1 означает ввод пробы, 0 – отсутствие ввода пробы в данный момент времени. В случае анализа двух образцов входные последовательности, управляющие вводом проб первого и второго образцов, являются дополнительными: если проба первого образца не вводится, то вводится проба второго образца, и наоборот. Алгоритм вычисления усредненной хроматограммы сводится к регрессионному анализу. Вводится информационная матрица плана эксперимента. Точность оценивания характеризуется с помощью ковариационной матрицы оценок. Выбор оптимальной входной последовательности ввода проб осуществляется исходя из условия D-оптимальности (условия максимизации определителя информационной матрицы), что обеспечивает минимум обобщенной дисперсии всех оценок ординат усредненной хроматограммы. Приведены результаты численного имитационного эксперимента, доказывающие эффективность использования корреляционного метода обработки данных для усреднения хроматограмм.

Полный текст

Качество оценок параметров хроматографического сигнала, полученных на этапе первичной обработки, и качество результатов всего анализа в целом определяется в первую очередь качеством исходной хроматограммы. Поэтому ее улучшению, повышению отношения сигнал/шум необходимо уделять внимание уже в ходе хроматографического эксперимента. Особенно это важно, когда измерения проводятся на пределе обнаружения хроматографа [1]. Снижение предела обнаружения компонентов позволяет проводить эксперименты с малыми объемами пробы и быстрым их вводом в колонку, что позволяет получать хроматограммы с хорошо разделенными пиками. Это особенно важно при обработке быстро элюируемых компонентов. Однако в результате проведения таких анализов часто получаются хроматограммы низкого качества, т. е. с малым отношением сигнал/шум. Таким образом, важнейшая проблема – повышение качества хроматографических сигналов до проведения их первичной и вторичной обработки [2].

Выходной сигнал хроматографа st как реакция на входное воздействие xt, имеющее форму узкого импульса, описывается интегралом линейной суперпозиции:

st=+gτxtτdτ (1)

Входное воздействие xt представляют дельта-функцией δt, тогда интегральное соотношение (1) примет вид

st=+gτδtτdτ=gt (2)

Сигнал st называют хроматограммой (совпадает с приборной функцией). В случае анализа многокомпонентных смесей st может быть представлена в виде аддитивной модели совмещенных хроматографических пиков [3]. Длительность хроматограммы определяется временем элюирования последнего компонента смеси Tэ из условия st=gt0 при tTэ.

Практически выходной сигнал хроматографа yt представляет собой аддитивную смесь полезного сигнала st, несущего информацию о качественном и количественном составе анализируемых веществ, и флуктуационной помехи (шума) nt:

yt=st+nt (3)

Шум nt представляют распределенным по нормальному закону nt~N0,σn2 с нулевым математическим ожиданием и дисперсией σn2. Нормальный характер распределения шума в хроматографическом сигнале подтверждается измерениями [3].

В хроматографии именно шумом определяется предел обнаружения (детектирования) компонента: высота пика определяемого вещества должна не менее чем двое превышать уровень флуктуации шума (нулевого сигнала). По существующим методикам отношение сигнал/шум (s/n) также часто рекомендуют определять как отношение удвоенной высоты пика на хроматограмме к размаху h флуктуации шума [4]. Этот размах можно оценить в единицах СКО σn, например принять h=6σn. Таким образом, для понижения предела обнаружения компонентов необходимо повышать отношение сигнал/шум хроматографического сигнала.

На практике эффект повышения отношения сигнал/шум может достигаться предварительным концентрированием компонентов анализируемой пробы. Однако при количественном анализе ко всем методам предварительной обработки пробы и концентрирования следует относиться осторожно и стремиться выполнить анализ без химического и физического изменения состава пробы. Кроме того, отсутствие предварительной обработки пробы облегчает автоматизацию анализа.

Традиционно используемые методы подавления помехи, основанные на цифровой фильтрации хроматографического сигнала, в большинстве случаев изменяют форму сигнала [5]. Например, на хроматограмме после фильтрации шумов может измениться форма пиков, и чем лучше результат фильтрации шумов, тем более существенно изменение формы пика.

Для уменьшения влияния nt и повышения отношения сигнал/шум можно использовать усреднение по ансамблю реализаций, когда осуществляется регулярный ввод проб с интервалами между вводами, большими Tэ. Каждая реализация отсчитывается от момента ввода очередной пробы. Если таким образом осуществить p вводов пробы, а затем рассчитать усредненную по множеству полученных реализаций хроматограмму, то отношение сигнал/шум будет возрастать пропорционально p. Однако такой подход к повышению соотношения сигнал/шум требует обеспечения стабильности работы хроматографа в течение длительного времени и приводит к увеличению общего времени проведения эксперимента Tэкс=pTэ. Если, например, Tэ составляет 30 минут, то это может привести к неприемлемо большим значениям Tэкс.

В этой связи перспективным методом получения усредненных на некотором множестве вводов проб хроматограмм, позволяющим увеличить отношение сигнал/шум при приемлемом суммарном времени проведения эксперимента Tэкс, является корреляционная обработка данных [6, 7].

Анализ известных результатов в области корреляционной обработки хроматографических сигналов позволил выделить комплекс нерешенных проблем, связанных с созданием эффективных и точных алгоритмов вычислений, позволяющих определять несмещенные оценки усредненной хроматограммы.

Необходимо отметить, что практически во всех работах в качестве входной последовательности используются М-последовательности. Эта разновидность псевдослучайных последовательностей часто применяется в задачах идентификации объектов управления, а алгоритм их получения прост в реализации. Однако использование М-последовательностей сужает возможность корреляционной обработки, поскольку период этой последовательности изменяется большими скачками, что является нежелательным при корреляционной обработке хроматографических сигналов.

Таким образом, важным представляется выбор входных последовательностей, позволяющих упростить вычислительные алгоритмы при сохранении высокой точности результатов, без дополнительных систематических погрешностей. В данной работе в качестве входной последовательности используется псевдослучайная последовательность Лежандра.

В соответствии с этим разработан алгоритм получения оценок усредненного хроматографического сигнала, учитывающий вид входной последовательности, конечность как длины последовательности, так и времени усреднения. Далее этот алгоритм модифицирован для вычисления усредненной дифференциальной хроматограммы, когда интересует различие компонентного состава двух образцов (например, исследуемого и эталонного).

Определение усредненной хроматограммы при многократном вводе проб одного образца. При этом на вход хроматографа подается последовательность проб xt. Обработка связана с вычислением оценок автокорреляционной функции Rxxτ входного сигнала и взаимно-корреляционной функции Rxyτ входного xt и выходного yt сигналов.

Пусть gt – искомая хроматограмма, gt=0, при t<0 и tTэ, где Tэ – время элюирования хроматограммы. Представим функции gt, yt, xt в виде последовательности дискретных отсчетов: gj, j=0,1,2,...,m; yj, j=0,1,2,...,km; xl, l=m,m1,...,0,1,2,...,k; m=TэΔ, k=TΔ, Δ – интервал дискретизации по времени. Здесь T – время, соответствующее последнему вводу пробы. Таким образом, в дискретном виде отсчеты входного воздействия могут действовать от -m до k.

В дискретной форме для динамической системы справедливо соотношение [8]

R^xyj=l=0mglR^xxjl, j=0,1,2,...,m (4)

где R^xyj=1k+1l=0kylxlj; R^xxj=1k+1l=0kylxlj.

После введения матричных обозначений

G=g0g1...gm; Y=y0y1...yk; X=x0x1x2...xmx1x0x1...xm1xkxk1xk2...xmk (5)

соотношение (4) можно представить в виде

XTY=XTXG (6)

где T – знак транспонирования матрицы.

Обозначим вектор оценок приборной функции (усредненную хроматограмму) через G^, тогда из (6)

G^=XTX1XTY (7)

Алгоритм вычисления усредненной хроматограммы эквивалентен методу наименьших квадратов, и все результаты регрессионного анализа могут быть использованы при корреляционной обработке хроматографических данных [9–11]. При этом матрицу C=XTX будем рассматривать как информационную матрицу плана эксперимента [12].

Точность оценивания ординат G^ описывается ковариационной матрицей оценок covG^. При равенстве дисперсий всех отсчетов выходного сигнала и их некоррелированности ковариационная матрица covG^ равна

covG^=σn2C1 (8)

где C1 – матрица, обратная информационной матрице C=XTX; σn2 – дисперсия помехи.

Тогда дисперсии σg^j2 оценок g^j, j=0,1,2,...,m вектора G^ и коэффициенты корреляции rjg между оценками g^j и g^g будут определяться соотношениями:

σg^j2=σn2cjj1 (9)

rjg=cjg1cjj1cgg1 (10)

где cjj1, cjg1, cgg1 – элементы матрицы C1.

Дисперсии оценок значений усредненной хроматограммы σg^j2, j=0,1,2,...,m зависят не только от дисперсии помехи σn2, но и от вида выбранных последовательностей вводов проб (регулярная, псевдослучайная), их длительностей, размещения во времени и т. д.

Хроматография связана с активным экспериментом, поэтому может быть поставлена задача планирования эксперимента как задача выбора входной последовательности, обеспечивающей наибольшую точность оценивания всей совокупности ординат g^j, j=0,1,2,...,m. В качестве показателя, интегрально характеризующего точность оценивания этой совокупности, можно выбрать определитель ковариационной матрицы det covG^. Тогда выбор оптимальной входной последовательности может быть осуществлен исходя из условия минимизации определителя det covG^ (критерий D-оптимальности) или, что то же самое, из условия максимизации определителя det C. В статистическом смысле D‑оптимальность обеспечивает минимум обобщенной дисперсии всех оценок g^j, j=0,1,2,...,m [13].

Входные последовательности ввода проб. Генерирование последовательности Лежандра. Если в некоторый момент l дискретного времени осуществляется ввод пробы, то соответствующее значение xl принимается равным единице (xl=1); если нет, то xl=0. Таким образом, входной сигнал представляет собой последовательность единиц и нулей, соответствующих вводу или отсутствию ввода пробы в данный момент времени. При этом длина последовательности L – это общее количество элементов (нулевых и единичных). Она должна быть равна или незначительно превышать длительность хроматограммы от однократного ввода пробы [7].

Входные последовательности должны позволять гибко изменять их длину, этому требованию удовлетворяют последовательности с одноуровневой корреляционной функцией [14], в частности последовательности Лежандра. Период последовательности Лежандра определяется соотношением L=4t+3, где L – простое число, t – положительное целое число. Допустимые значения длин L последовательности Лежандра для L<200: 11, 19, 23, 31, 43, 47, 55, 67, 71, 79, 83, 103, 107, 127, 131, 139, 151, 163, 167, 179, 191, 199.

В отличие от М-последовательностей для последовательности Лежандра не существует генератора, легко реализуемого на сдвиговых регистрах и логических элементах, и она требует более специфических вычислений [15].

Пусть задана длина последовательности L. Обозначим через al=a0,a1,a2,...,aL1 искомую последовательность Лежандра. Символ al=1, если для соответствующего l=1,2,...,L1выполняется тождество

z2=lzmod L (11)

где z принимает все возможные значения от 1 до L-1; все остальные символы al=0, a0=1.

Таким образом, синтез последовательности сводится к тому, что, постепенно увеличивая значения z от 1 до L-1, находят номера l, удовлетворяющие соотношению (11) (повтор номера не учитывается). Общее количество найденных единичных символов будет равно p=L+12. Оно определяет общее число вводов пробы. Конкретные примеры последовательностей Лежандра разной длины приведены в таблице.

В общем случае произвольная входная последовательность может быть задана на интервале m,k, причем k>0, km. В зависимости от конкретных значений параметров k, m матрица Xбудет иметь различный вид.

Анализ входной последовательности относительно интервала усреднения 0÷k позволяет выделить вариант, когда входная последовательность x содержит две части: основную – длительностью L, начинающуюся в момент времени l=0 и заканчивающуюся в момент времени k=L1, и предысторию, представляющую собой фрагмент основной части, имеющей длину m, значения которой удовлетворяют условию: xl=xkl+1; l=1,2,...,m. Это позволяет сформировать симметричную теплицевую матрицу C=XTX, что упрощает анализ информационной матрицы и алгоритм вычисления усредненного сигнала.

 

Результаты анализа псевдослучайных входных воздействий

Входная последовательность*

pLm+1cjj1det C
150101202120210104

12

23

23

0,1597

1,89541019

1301202140102101601204120310101010

13021402106101201041202102

40

79

79

0,0494

4.835710104

1201303102160120102101010104102102

12015012031302150103140214010130310

10412041301051203102130210510212012

0140101010120102106120130310

90

179

179

0,0221

1.515710298

*Краткая запись последовательности со степенями, показывающими количество следующих подряд единичных или нулевых значений.

 

Как следует из соотношения (9), дисперсия σg^j2 оценки любой ординаты g^j, j=0,1,...,m одна и та же и равна

σg^j2=cjj1σn2

Значения коэффициентов cjj1 зависят от длины последовательности L и длительности хроматограммы m+1. Для конкретных псевдослучайных последовательностей ввода проб значения коэффициентов cjj1 представлены в таблице. При сравнении СКО оценок σg^j и помехи σn коэффициент cjj1 можно рассматривать как коэффициент подавления помехи. Например, при L=m+1=23, 79, 179 значения этого коэффициента равны соответственно ~0,4; ~0,22; ~0,15.

Вычисление усредненной дифференциальной хроматограммы. Пусть имеются два образца A и B, каждый из которых является смесью некоторых компонентов. Интересует различие компонентного состава этих образцов между собой. Такая задача возникает, например, при необходимости выявления маркерных соединений для идентификации лекарственного сырья.

При получении лекарственного сырья предпочтение отдают определенным сортам. Изучение компонентного состава эфирного масла растений методом газовой хроматографии может подтвердить или опровергнуть принадлежность образца к искомому виду и, соответственно, определить возможность его использования в качестве источника для получения лекарственного растительного сырья [16].

Представим приборные функции (хроматограммы от однократного ввода проб) первого и второго образцов соответственно как векторы отсчетов G1 и G2.

Для дифференциальной хроматограммы входные последовательности, управляющие вводом проб соответственно первого и второго образцов, являются дополнительными: если проба первого образца в данный момент времени не вводится, то вводится проба второго образца, и наоборот.

Рассмотрим алгоритм вычисления усредненной дифференциальной хроматограммы. В качестве входной последовательности используется псевдослучайная последовательность Лежандра с периодом L, выбираемым из условия

Lmaxm1+1,m2+1

где m1+1, m2+1 – длительности хроматограмм первого и второго образцов при их однократном вводе.

Для формирования последовательности вводов проб первого образца используется последовательность x, содержащая основную часть xl, l=0,1,...,k длительностью L и предысторию xl=xkl+1, l=1,2,...,m. На основе последовательности x формируется дополнительная последовательность 1xl, которая служит для управления вводом второй пробы.

С учетом всех введенных проб первого и второго образцов можно записать матричное уравнение

Y=XG1+TXG2 (12)

Здесь G1 и G2 – отсчеты хроматограмм соответственно первого и второго образцов; X – матрица, сформированная из входной последовательности x; T – матрица соответствующей размерности, все элементы которой равны 1.

Из соотношения (12)

Y=X¯G1G2+TG2,

где матрица X¯ соответствует матрице X, в которой единичные элементы сохраняются, а нулевые элементы заменяются на 1. Следовательно,

G1G2=X¯TX¯1X¯TYTG2 или G1G2+B=X¯TX¯1X¯TY,

где B – это вектор-столбец, все значения которого одинаковы и равны j=0kgj. Таким образом, получаем оценку разностной хроматограммы G1G2, которая будет приподнята или опущена на некоторый постоянный уровень В. Этот уровень возникает за счет того, что число введенных проб одного из образцов при использовании многократного ввода проб на единицу больше числа вводов другого образца. Он определяется на этапе настройки алгоритма вычислений для конкретного эксперимента.

Моделирование. Для проверки работы алгоритма корреляционной обработки хроматографического сигнала, полученного при многократном вводе проб одного образца и двух образцов при сравнении их компонентного состава, проведены численные имитационные эксперименты. Методика проведения эксперимента заключается в моделировании заданных приборных функций хроматографического сигнала при многократном вводе проб одного или двух образцов с наложенной помехой, генерировании соответствующих входных последовательностей, корреляционной обработке данных и сопоставлении результатов обработки с заданной приборной функцией.

Для реализации методики разработан комплекс программ компьютерного моделирования в среде MATLAB. Имитационное моделирование проводилось для разных входных последовательностей x, видов приборной функции gt и уровня помехи nt. Некоторые из результатов моделирования приведены ниже.

На рис. 1 кривая 4 представляет результат оценки усредненного сигнала на множестве вводов проб. Ввод проб производился с использованием псевдослучайной последовательности Лежандра длительностью 179 отсчетов. Число вводов проб – 90.

 

Рис. 1. Корреляционная обработка хроматограмм: а – сигнал от однократного ввода пробы: 1 – s(t) без наложенной помехи; 2 – высокочастотная помеха n(t) (σn=2); б – 3 – сигнал y(t) с наложенной помехой при однократном вводе пробы; 4 – усредненный хроматографический сигнал g(t) на множестве вводов проб: p=90

 

Зашумленный сигнал от однократного ввода пробы представлен кривой 3. Кривая 1 соответствует полезной составляющей сигнала с пиками несимметричной формы. В качестве математической модели несимметричных пиков использована комбинированная функция, предложенная в работе [17]. Кривая 2 соответствует высокочастотной помехе, для генерирования которой использовалась стандартная программа MATLAB: nt~N0,σn2, СКО помехи σn=2.

Сопоставление сигнала 3 с результатом корреляционной обработки (кривая 4) показывает существенное уменьшение помехи (коэффициент подавления помехи ~0,15).

На рис. 2 представлена дифференциальная хроматограмма (кривая 6). Кривые 1, 2 – хроматограммы без помехи от однократного ввода проб первого и второго образцов. Кривые 4, 5 – сигналы с наложенной помехой первого и второго образцов при их однократном вводе. Кривая 6 соответствует усредненному разностному сигналу, когда производится 90-кратный ввод проб первого образца и 89-кратный ввод проб второго образца.

 

Рис. 2. Дифференциальная хроматограмма: а – 1 – сигнал без помехи s1(t) от однократного ввода пробы первого образца; 2 – сигнал без помехи s2(t) от однократного ввода пробы второго образца; 3 – разностный сигнал s1(t)-s2(t); б – 4 – сигнал y1(t) с наложенной помехой (σn=2) от однократного ввода пробы первого образца; 5 – сигнал y2(t) с наложенной помехой (σn=2) от однократного ввода пробы второго образца; 6 – усредненный разностный сигнал (g1-g2)t: p=90 для первого образца, p=89 для второго образца

 

Простое сравнение зашумленных хроматограмм первого и второго образцов (кривые 4 и 5 на рис. 2) не позволяет оценить различие компонентного состава этих образцов, однако это можно сделать по усредненному разностному сигналу (кривая 6 на рис. 2).

В целом результаты моделирования подтвердили эффективность использования корреляционной обработки данных для вычисления дифференциальной хроматограммы и правильность предложенных алгоритмов оценок усредненного хроматографического сигнала. Корреляционная обработка позволяет значительно уменьшить помеху, тем самым понизить предел обнаружения компонентов анализируемой пробы и расширить диапазон измеряемых концентраций.

×

Об авторах

Марсель Жаудатович Сайфулин

Самарский государственный технический университет

Автор, ответственный за переписку.
Email: sayfulinmarsel@yandex.ru

аспирант кафедры информационно-измерительной техники

Россия, 443100, г. Самара, ул. Молодогвардейская, 244

Список литературы

  1. Платонов И.А., Новикова Е.А., Платонов В.И. Хроматографические методы анализа: учебное пособие. Самара: Самарский университет, 2021. 96 с. EDN: JXKOWU.
  2. Гуревич А.Л., Русинов Л.А., Сягаев Н.А. Автоматический хроматографический анализ. Л.: Химия, 1980. 192 с.
  3. Русинов Л.А. Автоматизация аналитических систем определения состава и качества веществ. Л.: Химия, 1984. 160 с.
  4. Эпштейн Н.А. О допустимых значениях порога игнорирования примесей и отношение сигнал/шум при проверке чувствительности хроматографической системы // Ведомости НЦЭСМП. 2014. Т. 7, № 2. С. 85–90.
  5. Каламбет Ю., Мальцев С., Козьмин Ю. Фильтрация шумов: окончательное решение проблемы // Аналитика. 2011. № 1. С. 50–55. EDN: PIEIFT.
  6. Кальюранд М. Анализ нестационарных потоков вещества: возможности компьютерной хроматографии // Химия. 1989. № 28. С. 25–33. doi: 10.3176/chem.1989.1.06.
  7. Филаретов Г.Ф., Сайфулин Ж.Т. Корреляционный метод измерений в системах автоматизации хроматографического эксперимента // Заводская лаборатория. 1991. № 10. С. 59–63.
  8. Сайфуллин Р.Т. Использование корреляционного метода для усреднения хроматограмм // Вестник Самарского государственного технического университета. Серия: Технические науки. 2009. Вып. № 3 (25). С. 109–116. EDN: LALEMB.
  9. Вуколов Э.А. Регрессионный анализ. М.: МИЭТ, 2000. 52 с.
  10. Гроп Д. Методы идентификации систем. М.: Мир, 1979. 302 с.
  11. Эйкхофф П., Ванечек А., Савараги Е. и др. Современные методы идентификации систем. М.: Мир, 1983. 400 с.
  12. Мелас В.Б., Шпилев П.В. Планирование и анализ регрессионных моделей. СПб: СПбГУ, 2014. 94 с.
  13. Маслов Г.Г., Трубилин Е.И., Цибульский В.В. Моделирование в агроинженерии. Краснодар: КубГАУ, 2019. 304 с.
  14. Дейч А.М. Методы идентификации динамических систем. М.: Энергия, 1979. 240 с.
  15. Сайфуллин Р.Т. Ввод пробы по случайному закону в корреляционной хроматографии // Информационно-измерительные и управляющие системы: сб. науч. ст. Самара: СамГТУ, 2009. С. 80–84.
  16. Маланкина Е.Л., Козловская Л.Н., Кузьменко А.Н., Евграфов А.А. Определение компонентного состава эфирного масла видов тимьяна методом газовой хроматографии // Вестник Моск. ун-та. Серия 2: Химия. 2019. Т. 60, № 6. С. 411–415. EDN: OXHJTQ.
  17. Бочкарев А.В. Повышение точности количественного хроматографического анализа с помощью новой модели пика // Автоматизация в промышленности. 2022. № 7. С. 36–41. doi: 10.25728/avtprom.2022.07.11. EDN: EPPYCW.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рис. 1. Корреляционная обработка хроматограмм: а – сигнал от однократного ввода пробы: 1 – s(t) без наложенной помехи; 2 – высокочастотная помеха n(t) (σn=2); б – 3 – сигнал y(t) с наложенной помехой при однократном вводе пробы; 4 – усредненный хроматографический сигнал g(t) на множестве вводов проб: p=90

Скачать (189KB)
3. Рис. 2. Дифференциальная хроматограмма: а – 1 – сигнал без помехи s1(t) от однократного ввода пробы первого образца; 2 – сигнал без помехи s2(t) от однократного ввода пробы второго образца; 3 – разностный сигнал s1(t)-s2(t); б – 4 – сигнал y1(t) с наложенной помехой (σn=2) от однократного ввода пробы первого образца; 5 – сигнал y2(t) с наложенной помехой (σn=2) от однократного ввода пробы второго образца; 6 – усредненный разностный сигнал (g1-g2)t: p=90 для первого образца, p=89 для второго образца

Скачать (208KB)

© Сайфулин М.Ж., 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.