复杂目标电磁散射特性精确计算方法的并行化和实现

电磁散射论文 多层快速多极子算法论文 并行计算论文 消息传递接口论文
论文详情
复杂目标电磁散射特性的快速分析与计算在雷达系统设计与雷达目标识别、目标隐身和反隐身、现代电子系统电磁兼容性分析等领域中有广泛应用。利用计算机进行精确电磁仿真具有相对高效、准确的特点。特别是多层快速多极子算法(MLFMA)在电磁领域的成功开发,极大地提高了电磁仿真能力。但是受到单台计算机资源的限制,串行MLFMA算法对电大尺寸散射体分析常常无能为力。随着计算机集群技术的发展和并行计算技术的成熟,采用并行MLFMA算法计算复杂目标电磁散射特性,可以有效扩展仿真规模,提高仿真效率。对于具有复杂边界的电磁问题,实现高性能并行MLFMA算法的关键是如何在处理器间平均分配计算资源(即各处理器负载均衡)、减少处理器间的数据交换,减少算法实现环节中所占用的内存和计算量。这些问题的解决对最终计算效率和计算能力有直接影响。为解决上述问题,本文将MLFMA算法的计算域分解为数据域和角谱域。针对数据域和角谱域的不同并行性能,提出一种更为高效的并行方案,给出具体实现手段并分析其数值性能。论文的主要创新点如下:提出了分布树的负载均衡算法。并行MLFMA的负载均衡性主要体现在数据域上对分布树的划分上。传统的划分方法通常是在分布树的最底层将组均分到每个计算节点,每个计算节点采用自底向上的方式构建分布树。这对于外形完全对称的目标来说,具有非常好的负载均衡性。然而,实际的目标都具有复杂的外形。为此,我们修正了分布树的分割方法,通过均分某一层(非最细层)的方式来构建分布树,从而达到负载均衡的目的。提出了对(反)插值过程进行块划分的角谱域并行算法。在角谱域上并行MLFMA算法,具有非常好的负载均衡性。但是由于(反)插值操作的存在,节点间的通信是无法避免的。角谱域分解的主要问题是如何减少节点间通信量,增加共享层的层数。对(反)插值矩阵采用条划分的方法,尽管能够将通信限制在左右相邻的节点间进行,但同时也限制了程序可并行节点数的规模。为解决这个问题,我们提出了基于块划分的并行计算方法。这种方法能够将通信限制在上下左右四个相邻节点间进行,扩大了可并行节点数的规模。与条划分相比,大大减少了每次的通信量。进行了不变项的并行优化计算。本文针对分布树、(反)插值矩阵、转移矩阵和近邻阻抗矩阵等数据结构在计算时间和计算空间上的特点,从缩减内存和计算量的角度出发,提出了相应的计算和存储方法。对(反)插值矩阵提出了先串行计算再并行分布的方法。针对转移矩阵,计算过程采用了压缩存储的并行计算方式,分布过程中采用非压缩的存储方式。相对于传统的“边对”划分方法,提出了按组对划分近邻阻抗矩阵,利用数据局部性原理实现近邻阻抗矩阵的填充及近场的叠加。提出了转移和(反)插值操作的通信拓扑结构。利用转移通信列表确定远亲组之间的通信关系,通过建立转移通信的发送队列和接收队列,一次性交换数据,提高转移通信的通信效率。根据(反)插值矩阵的特点,利用虚拟进程拓扑,建立了(反)插值操作的通信拓扑结构。通过调整行和列的通信次序,实现了与四周相邻节点间的通信。针对各种复杂目标,本文围绕并行算法的精度和效率进行了大量实验。实验结果验证了所提出并行MLFMA算法的可行性,能够有效提高并行效率。该算法能够实现未知量在千万量级的复杂目标电磁散射,并在实际工程中获得应用。
摘要第8-10页
ABSTRACT第10-11页
目录第12-15页
第一章 绪论第15-25页
    1.1 研究背景与研究内容第15-21页
        1.1.1 研究背景第15-16页
        1.1.2 研究现状第16-21页
    1.2 本文的主要研究工作第21-24页
    1.3 本文结构安排第24-25页
第二章 复杂目标电磁散射特性精确计算方法的比较与选择研究第25-46页
    2.1 引言第25页
    2.2 矩量法第25-28页
        2.2.1 电磁场基本方程第26-27页
        2.2.2 矩量法求解积分方程的步骤第27-28页
    2.3 时域有限差分法第28-32页
        2.3.1 基本差分方程第28-29页
        2.3.2 时域有限差分法求解第29-30页
        2.3.3 算法分析第30-32页
    2.4 有限元法第32-33页
        2.4.1 基本原理第32页
        2.4.2 FEM 法的特点第32-33页
    2.5 快速算法第33-37页
        2.5.1 快速算法概述第33-36页
        2.5.2 相关软件和应用第36-37页
        2.5.3 精确算法比较第37页
    2.6 MLFMA 的基本原理第37-40页
        2.6.1 聚合第38-39页
        2.6.2 转移和解聚第39页
        2.6.3 计算复杂度分析第39-40页
    2.7 分布式存储系统与MPI 并行编程模型第40-44页
        2.7.1 硬件平台第41-42页
        2.7.2 软件环境第42页
        2.7.3 并行算法第42-43页
        2.7.4 并行性能评测与影响因素第43-44页
    2.8 本章小结第44-46页
第三章 并行框架内不变项的优化计算第46-58页
    3.1 引言第46-47页
    3.2 插值矩阵的计算和存储技术第47-50页
        3.2.1 (反)插值原理第47-49页
        3.2.2 插值矩阵的并行计算与存储第49-50页
    3.3 转移矩阵的计算和存储技术第50-54页
        3.3.1 转移矩阵计算原理第50-52页
        3.3.2 转移矩阵的并行计算与存储第52-54页
    3.4 近场的计算与叠加第54-57页
        3.4.1 近邻阻抗矩阵的计算和存储技术第54-56页
        3.4.2 近场的叠加第56-57页
    3.5 本章小结第57-58页
第四章 数据域并行技术第58-68页
    4.1 引言第58-59页
    4.2 分布树的构建第59-62页
        4.2.1 Morton Key 的编码第59-60页
        4.2.2 Morton Key 的性质第60-61页
        4.2.3 分布树的构建第61-62页
    4.3 基于负载均衡的分布树第62-64页
    4.4 性能分析第64-65页
    4.5 转移操作的通信拓扑第65-67页
    4.6 本章小结第67-68页
第五章 角谱域并行技术第68-83页
    5.1 引言第68页
    5.2 角谱域分解第68-71页
        5.2.1 混合划分第69-70页
        5.2.2 条划分第70-71页
        5.2.3 块划分第71页
    5.3 谱域通信第71-79页
        5.3.1 混合划分第71-72页
        5.3.2 条划分第72-74页
        5.3.3 块划分第74-79页
    5.4 性能分析第79-82页
        5.4.1 基于角谱域分解的并行可扩展性第79-80页
        5.4.2 过渡层的设置第80-81页
        5.4.3 基于角谱域分解的矩矢乘积第81-82页
    5.5 本章小结第82-83页
第六章 实验结果第83-91页
    6.1 引言第83页
    6.2 计算环境第83-84页
    6.3 自强3000 的效率测试第84-86页
        6.3.1 启动时间和带宽第84-85页
        6.3.2 MPI 例程第85-86页
    6.4 实验模型第86-88页
        6.4.1 调试的实验数据第86-87页
        6.4.2 测试的实验数据第87-88页
    6.5 正确性验证第88-89页
    6.6 性能评估第89-90页
    6.7 本章小结第90-91页
第七章 总结与展望第91-98页
    7.1 本文主要工作第91-92页
    7.2 调试和测试的经验第92-97页
        7.2.1 程序调试第92-94页
        7.2.2 程序测试第94-95页
        7.2.3 模型的选择问题第95-96页
        7.2.4 计算误差第96页
        7.2.5 测试工具第96-97页
    7.3 展望第97-98页
参考文献第98-106页
作者在攻读博士学位期间公开发表的论文第106-108页
作者在攻读博士学位期间所作的项目第108-109页
致谢第109-110页
论文购买
论文编号ABS541547,这篇论文共110页
会员购买按0.30元/页下载,共需支付33
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付55
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656