USAGE OF BLOCK LU-FACTORIZATION FOR ACCELERATION OF COUPLED TRANSMISSION LINES TIME-DOMAIN RESPONSE CALCULATION TACING INTO ACCOUNT THE SUBSTRATE PERMITTIVITY FREQUENCY DEPENDENCY


Cite item

Full Text

Abstract

Usage of block LU-factorization for speeding up of time domain response calculation taking into account the substrate permittivity frequency dependency is investigated on example of a coupled microstrip lines. Correctness of the implementation of the block me-thod of LU-factorization in TALGAT system is demonstrated. Coarse segmentation of dielectric-dielectric boundaries with controlled calculation error are proposed. Expedi-ency of moderate coarse segmentation which gives 2-times speed-up with maximal error about 2% is justified.

Full Text

Введение Для моделирования задач электромагнитной совместимости (ЭМС) печатных плат необходимо знать значения диэлектрической проницаемости их подложек. Известно, что комплексная «Инфокоммуникационные технологии» Том 11, № 3, 2013 Куксенко С.П., Салов В.К., Суровцев Р.С. 65 диэлектрическая проницаемость е, зависит от частоты. При вычислении временного отклика многопроводных линий передачи эту зависимость необходимо учитывать, так как результаты получаются более «физичными» [1]. Однако такое моделирование требует довольно больших временных затрат. Значительная их часть связана с необходимостью вычисления матрицы емкостей для каждой частоты, а количество частотных точек может достигать нескольких десятков тысяч. Каждое вычисление емкостной матрицы предполагает решение системы линейных алгебраических уравнений (СЛАУ) для Ncond (по количеству проводников линии, не считая опорного) векторов свободных членов. В поперечном сечении линии границы проводник-диэлектрик делятся на подынтервалы, последовательно нумерующиеся от 1 до .УС, а диэлектрик-диэлектрик - от N + 1 до N. Из параметров подынтервалов вычисляются элементы матрицы СЛАУ. При этом специфика матрицы СЛАУ такова, что при изменении частоты изменяются только элементы нижней части главной диагонали (см. рис. 1). 1 Nc N Nc N Рис. 1. Структура матрицы СЛАУ при вычислении емкостной матрицы Неполное изменение матрицы СЛАУ - ресурс, который можно использовать для уменьшения общего времени вычислений. Подходящими методами, использующими неполное изменение матрицы, являются блочное LU-разложение и блочное решение СЛАУ. Краткий обзор их видов [2] показал, что для реализации и последующего использования наиболее подходит блочная gaxpy-версия LU-разложения [3]. Выполнено исследование эффективности данного метода применительно к многократному решению СЛАУ с частично изменяющейся матрицей, в результате получено максимальное ускорение 35 раз [4]. Также выявлено, что ускорение решения СЛАУ сильно зависит от отношения количества подынтервалов проводник-диэлектрик к порядку матрицы СЛАУ (NC/N), при NC/N -> 1 ускорение стремится к максимальному [4]. Описан усовершенствованный (за счет блочного LU-разложения) алгоритм вычисления емкостных матриц структур проводников и диэлектриков методом моментов, реализованный в системе TALGAT [6], а также (на примере соединителя, содержащего 41 проводник, не считая опорного) показано ускорение 2,7 раза по сравнению с исходным алгоритмом (обычное LU-разложение) для 10 значений диэлектрической проницаемости диэлектрика [5]. Таким образом, возможно ускорение вычисления отклика с учетом частотной зависимости е, материалов за счет использования блочного LU-разложения. Если при этом увеличивать длину подынтервалов l на границах диэлектрик-диэлектрик, то уменьшится размер нижнего правого блока матрицы СЛАУ, а следовательно, и общее время вычислений, но необходимо контролировать влияние загрубления сегментации на точность вычислений. Отметим, что такая оценка, ускорения решения в целом (то есть не только решения СЛАУ, а включая вычисление временного отклика), ранее не выполнялась. Цель данной работы - показать возможность ускоренного блочным методом вычисления отклика сигнала с контролируемой точностью вычислений. Для этого необходимо провести моделирование отклика с учетом частотной зависимости sr диэлектрика с использованием и без использования блочного LU-разложения, а также с увеличенным значением l для границ диэлектрик-диэлектрик и оценить применимость такого подхода. Моделирование отклика с использованием усовершенствованного алгоритма Проведено моделирование отклика связанной микрополосковой линии передачи длиной 1 м на трапециевидный импульс с длительностью фронтов 100 пс и длительностью вершины 10 пс. Количество отсчетов сигнала по времени (а следовательно, и количество решений СЛАУ) равно 216. В общем случае оно определяется как отношение длительности анализируемого временного интервала к длительности одной дискреты времени. Линия передачи - два проводника на диэлектрической подложке над проводящей плоскостью. Вид поперечного сечения моделируемой структуры, разбитой на подынтервалы в системе TALGAT, показан на рис. 2. В качестве диэлектри «Инфокоммуникационные технологии» Том 11, № 3, 2013 66 Куксенко С.П., Салов В.К., Суровцев Р. С. ка выбран широко распространенный материал для подложек печатных плат FR-4, для которого зависимость ejf хорошо исследована [7]. Результаты этих исследований реализованы в системе TALGAT в виде аппроксимирующей функции и используются при моделировании. Выполнено два варианта моделирования, и в каждом учитывалась частотная зависимость є подложки. Но в первом использовался исходный алгоритм, а во втором - усовершенствованный [5]. В результате моделирования получено совпа дение откликов в конце активной линии, подтверждающее корректность работы усовершенствованного алгоритма (см. рис. 3). Далее проведено несколько вычислений отклика с изменением l для границ диэлектрик-диэлектрик, в ходе которых с каждым вычислением отклика значение l увеличивалось в два раза по сравнению с предыдущим значением (от 5 мкм до 640 мкм). При l = 640 мкм, границы диэлектрик-диэлектрик уже не делятся на подынтервалы. Результаты моделирования приведены на рис. 4. Рис. 2. Геометрическая модель поперечного сечения исследуемой структуры Рис. 3. Совпадение сигналов в конце активного проводника связанной микрополосковой линии при использовании исходного и усовершенствованного алгоритмов Сигналы в конце активного проводника связанной микрополосковой линии при изменении / «Инфокоммуникационные технологии» Том 11, № 3, 2013 Куксенко С.П., Салов В.К., Суровцев Р.С. 67 Таблица 1. Время и амплитуда импульсов и их относительные ошибки в зависимости от I 1, мкм tu НС Ati/tu % Уи В AV\IVi, % h, не At2/t2, % Vi, в av2/v2, % t2-t\, нс A{t2-t\)l(t2-t\), % 5 5,4730 0 0,1355 0 5,9660 0 0,1222 0 0,493 0 10 5,4615 0,20 0,1358 0,22 5,9575 0,14 0,1224 0,16 0,496 0,60 20 5,4430 0,55 0,1363 0,59 5,9428 0,39 0,1228 0,49 0,500 1,41 40 5,4178 1,00 0,1371 1,18 5,9215 0,75 0,1232 0,82 0,504 2,23 80 5,3823 1,66 0,1378 1,69 5,8940 1,20 0,1237 1,22 0,512 3,85 160 5,3295 2,62 0,1393 2,80 5,8545 1,87 0,1244 1,80 0,525 6,50 320 5,2690 3,73 0,1408 3,91 5,8100 2,61 0,1252 2,45 0,541 9,73 640 5,2418 4,22 0,1414 4,35 5,7743 3,21 0,1258 2,94 0,533 8,11 Из рис. 4 следует, что увеличение l вносит некоторую ошибку при вычислении матрицы емкостей, поскольку влияет на отклик: график сдвигается влево, а амплитуды импульсов увеличиваются. В таблицу 1 сведены время, когда импульсы достигают максимального значения, амплитуда этих импульсов и вычисленные ошибки по времени и амплитуде в зависимости от l. Видно, что при увеличении l от 5 до 640 мкм: время задержки уменьшилось на 4,22% для первого импульса и 3,21% - для второго; амплитуда увеличилась на 4,35% для первого импульса и 2,94% - для второго; разность задержек увеличилась на 8,11 % (при максимальном значении 9,73%). Таким образом, даже очень грубая сегментация (но загрубленная только на границах диэлектрик-диэлектрик) может сохранять приемлемую точность результатов. Очевидно, что на практике существуют структуры с большим числом диэлектрических слоев (например, подложек и препрегов, а также паяльной маски и влагозащитного покрытия печатных плат), сегмента ция которых при первом вычислении может быть очень грубой, а при последующих - учащаться с контролем точности интересующего параметра. Реализация такой процедуры даст матрицу СЛАУ минимального порядка N, а значит, минимальное время решения СЛАУ. Между тем при указанной процедуре N уменьшается за счет уменьшения числа подынтервалов на границах диэлектрик-диэлектрик, так что NJN 1. Поэтому интересна оценка ускорения от использования блочного LU-разложения. Время и ускорение вычислений отклика, выполненных на одном и всех ядрах компьютера, сведены в таблицу 2. Видно, что с загрублени-ем сегментации время вычислений значительно уменьшилось: примерно в 6 раз для исходного алгоритма и в 4 раза - для усовершенствованного, а ускорение есть, но уменьшается с 2 до 1,5 раза. Также видно, что после l = 40 мкм усовершенствованный алгоритм не ускоряется использованием нескольких ядер. Дальнейшее увеличение l нецелесообразно, так как ускорение возрастает Таблица 2. Время и ускорение вычисления отклика в зависимости от I при использовании одного и всех ядер компьютера /, мкм Ne N Ne/N Одно ядро Все ядра Ти, с Гу, с Ги/Ту Ги, с Гу, с Ги/Гу 5 288 708 0,40 9825 4587 2,14 6565 3913 1,68 10 288 498 0,58 4341 2012 2,16 3215 1897 1,69 20 288 393 0,75 2668 1312 2,03 2174 1297 1,67 40 288 339 0,85 2057 1088 1,89 1757 1093 1,61 80 288 314 0,92 1820 1024 1,77 1601 1021 1,56 160 288 302 0,95 1722 995 1,73 1513 991 1,52 320 288 295 0,98 1654 976 1,69 1466 976 1,50 640 288 291 0,99 1610 969 1,66 1436 966 1,48 «Инфокоммуникационные технологии» Том 11, № 3, 2013 68 Куксенко С.П., Салов В.К., Суровцев Р. С. незначительно, а ошибка - существенно. Например, при l = 40 мкм ускорение составляет 1,6...1,9 раза, а ошибка - около 2%. Таким образом, можно получить ускорение вычисления отклика блочным LU-разложением, сохранив при этом приемлемую точность вычислений. В заключение отметим, что полученное ускорение за счет блочного LU-разложения не так велико из-за нескольких факторов. Прежде всего оно несколько уменьшается за счет последующего за LU-разложением решения СЛАУ с двумя (по количеству проводников) векторами свободных членов. Затем сказывается (после ускоряемого вычисления каждой емкостной матрицы) неускоряемое вычисление собственно отклика. Наконец, довольно мал порядок матрицы. Тот факт, что исследование выполнено на примере вычисления временного отклика лишь одного отрезка, причем обычной связанной ми-крополосковой линии (содержащей только один диэлектрический слой), не означает, что предложенный в работе метод ускорения вычисления отклика не может применяться к более сложным структурам произвольных схем из любого числа отрезков многопроводных линий передачи. Это следует из того, что ускорение достигается именно на этапе вычисления емкостной матрицы. Кроме того, отметим, что ускорение (даже без загрубления сегментации) сильно зависит от конкретной структуры поперечного сечения многопроводной линии передачи, в частности от специфики ее диэлектрического заполнения (числа диэлектриков, протяженности границ диэлектрик-диэлектрик и начальной их сегментации). Наконец, важно отметить, что специфика диэлектрического заполнения может давать различные ошибки вычислений отклика при загрублении сегментации, что требует контроля этой ошибки, как это выполнено в данной работе. Работа выполнена по договору
×

References

  1. Салов В.К., Орлов П.Е., Газизов Т.Р. Важность корректного учета частотной зависимости диэлектрической проницаемости материалов при моделировании задач ЭМС // Известия высших учебных заведений. Физика. № 10/2, 2012. - С. 106-108.
  2. Суровцев Р.С. Обзор методов блочного LU-разложения // Материалы Научной сессии ТУСУР-2011. Томск: В-Спектр, 2011. - С. 141-143.
  3. Highman N.J. Accuracy and Stability of Numerical Algorithms. Philadelphia: SIAM, 1961. - 680 p.
  4. Суровцев Р.С., Куксенко С.П., Газизов Т.Р. Ускорение многократного решения СЛАУ с частично изменяющейся матрицей // Доклады ТГУСУР. Ч.1, №2, 2011. - С. 141-144.
  5. Куксенко С.П., Газизов Т.Р. Совершенствование алгоритма вычисления методом моментов емкостных матриц системы проводников и диэлектриков в диапазоне значений диэлектрической проницаемости диэлектриков // Электромагнитные волны и электронные системы. №10, 2012. - С. 13-21.
  6. TALGAT 2010. Свид. о госрегистрации программы для ЭВМ №2012610712 от 26. 09. 2011. // Газизов Т.Р., Мелкозеров А.О., Газизов Т.Т. и др. Зарег. 13. 01. 2012.
  7. Djordjevich A.R., Biljic R.M., Likar-Smiljanic V.D., Sarkar T.K. Wideband frequency-domain characterization of FR-4 and time-domain causality // IEEE Transactions on Electromagnetic Compatibility.Vol. 43, № 4, 2001. - P. 662-666.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2013 Kuksenko S.P., Salov V.K., Surovtsev R.S.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies