搜索结果: 1-15 共查到“知识库 计算机科学技术 GPU”相关记录38条 . 查询时间(0.062 秒)
Verification of Producer-Consumer Synchronization in GPU Programs
Verification GPUs data races synchronization deadlock barrier recycling
2016/5/24
Previous efforts to formally verify code written for GPUs have focused solely on kernels written within the traditional data-parallel GPU programming model. No previous work has considered the higher ...
基于GPU的光线追踪算法
光线跟踪 加速结构 着色语言 GPU
2016/4/5
为在个人PC上实现实时光线追踪技术,设计并实现一种基于GPU的光线追踪算法。介绍光线追踪原理,深入分析实时光线追踪的特点,研究实时光线追踪中最困难的空间加速结构构建和搜索问题,并进行算法优化和实验。结果表明,该算法可得到非常逼真的图形效果,为人们提供深度信息,实现二维图像中的三维效果。在仿真模拟、几何造型、广告影视、指挥控制及科学计算的可视化等领域都得到广泛应用。
基于GPU的光线追踪算法
光线跟踪 加速结构 着色语言 GPU
2016/5/25
为在个人PC上实现实时光线追踪技术,设计并实现一种基于GPU的光线追踪算法。介绍光线追踪原理,深入分析实时光线追踪的特点,研究实时光线追踪中最困难的空间加速结构构建和搜索问题,并进行算法优化和实验。结果表明,该算法可得到非常逼真的图形效果,为人们提供深度信息,实现二维图像中的三维效果。在仿真模拟、几何造型、广告影视、指挥控制及科学计算的可视化等领域都得到广泛应用。
Kriging插值算法被广泛应用于地学各领域,有着极其重要的现实意义,但在面对大规模输出网格及大量输入采样点时,不可避免地遇到了性能瓶颈。利用OpenCL和OpenMP在异构平台上实现了CPU与GPU协同加速普通Kriging插值。针对Kriging插值中采样点的不规则分布及CPU和GPU由于体系结构差异对其的不同适应性,提出一种基于不同设备间计算性能的差异和数据分布特点的负载均衡方法。试验结果表...
利用CUDA Fortran语言发展了基于图形处理器(GPU)的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW+格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况...
高光谱影像降维快速独立成分分析过程包含大规模矩阵运算和大量迭代计算。通过分析算法热点,设计协方差矩阵计算、白化处理、ICA迭代和IC变换等关键热点的图像处理单元映射方案,提出并实现一种G-FastICA并行算法,并基于GPU架构研究算法优化策略。实验结果显示:在处理高光谱影像降维时,CPU/GPU异构系统能获得比CPU更高效的性能,G-FastICA算法比串行最高可获得72倍加速比,比16核CPU...
GPU集群能耗优化控制模型研究
能耗控制 GPU集群 能量消减 模型预测
2017/1/4
随着大数据技术的发展,GPU集群作为一种高效的并行系统被应用到大规模数据实时计算中.能量是实时计算时重要的资源,GPU集群的能耗优化及实时消减成为一个具有挑战性的问题.从集群全局角度引入模型预测控制策略,并建立闭环反馈机制的多输入多输出控制器.通过调整计算频率和改变活跃流多处理器来改变能耗状态,利用反馈和滚动优化机制完成对未来的控制预判,实现消减冗余能耗的目标.实验表明:控制模型的精度和节能效果优...
硅各向异性腐蚀过程复杂,采用元胞自动机模拟硅各向异性腐蚀非常耗时。为了加速腐蚀模拟过程,研究了基于图形处理器(GPU)进行硅的各向异性腐蚀模拟。针对串行算法直接并行化方法存在加速效率低等问题,提出了一个改进的并行模拟方法。该方法增加了并行部分的负载,减少了内存管理的开销,从而提高了加速性能。实验证明该方法能够获得较理想的加速比。
利用并行GPU对分层分布式狄利克雷分布算法加速
分层分布式狄利克雷分布 潜在狄利克雷分布 文本分类 分布式框架 并行图形处理器
2014/2/18
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,但是因为单节点算法的计算量大,仍然存在对大数据分类运行时间太长的问题。而大规模文本集合分散到多个节点上迭代推导,单个节点上文档集合的推导仍是顺序进...
基于GPU的LCS算法加速机制研究与实现
协议特征识别 LCS算法 CUDA平台 GPU加速
2014/3/26
协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较大,那么运行的时间将会非常长,为此不得不控制输入数据分组的大小和数量,这严重限制了所采用样本集的大小。提出了基于GPU对LCS运算实现加速的方法。在此基础上搭建和配置了CUDA平台,在此平台下研究并实...
交替方向隐式CFD解法器的GPU并行计算及其优化
交替方向隐式 计算流体力学解法器 结构网格 GPU并行
2014/4/17
交替方向隐格式(ADI)是常见的偏微分方程离散格式之一,目前对ADI格式在计算流体力学(CFD)实际应用中的GPU并行工作开展较少。从一个有限体积CFD应用出发,通过分析ADI解法器的特点和计算流程,基于统一计算架构(CUDA)编程模型设计了基于网格点与网格线的两类细粒度GPU并行算法,讨论了若干性能优化方法。在天河-1A系统上,采用128×128×128网格规模的单区结构网格算例,无粘项、粘性项...
心脏成像和可视化技术在心脏疾病诊断、治疗规划中发挥着重要作用。针对分割后的心脏体数据集,提出了使用图形处理器(GPU)加速光线投射算法进行高质量三维可视化的新方法。该方法结合心脏体数据统计信息设计传递函数,增大细微组织的不透明度值;基于梯度模自适应地调整采样步长,提高组织边界的采样频率;应用改进的Blinn-Phong多光源光照模型,增强可视化效果。实验结果表明,该方法在实现实时绘制的同时,能够获...
层流扩散燃烧在GPU上的并行计算和数值分析
层流扩散燃烧 数值模拟 GPU并行计算 预处理稳定双共轭梯度法 加速比
2014/4/21
在实际工程应用中,使用传统的CPU串行计算来开展燃烧数值模拟往往难以满足对模拟速度的要求。利用GPU比CPU更强的计算能力,通过在交错网格上将燃烧物理方程离散化,使用预处理稳定双共轭梯度法(PBiCGSTAB)求解离散化方程,并且探索面向GPU编程的矩阵向量乘并行算法和逆矩阵向量乘并行算法,从而给出一种在GPU上数值求解层流扩散燃烧的可行方法。实验结果表明,GPU并行程序获得了相对串行CPU程序约...
RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一。本文基于CPU+GPU的混合计算平台实现了对Zuker算法的并行和加速。根据CPU和GPU计算性能的差异,通过合理的任务分配策略,实现二者之间的并行协作计算和处理单元间的负载平衡;针对CPU和GPU的不同硬件特性,对Zuker算法在CPU和GPU上的实现分别采取了不同的并行优...