工学 >>> 计算机科学技术 >>> 计算机系统结构 >>> 计算机系统设计 并行处理 分布式处理系统 计算机网络 计算机运行测试与性能评价 计算机系统结构其他学科
搜索结果: 1-8 共查到计算机系统结构 GPU相关记录8条 . 查询时间(0.148 秒)
中国科学院地理科学与资源研究所专利:一种基于CPU+GPU架构的空间几何体线段相交判断并行处理方法。
中国科学院地理科学与资源研究所专利:基于CPU+GPU架构的多边形数据空间关系查询并行系统。
利用CUDA Fortran语言发展了基于图形处理器(GPU)的计算流体力学可压缩湍流求解器。该求解器基于结构网格有限体积法,空间离散采用AUSMPW+格式,湍流模型为k-ω SST两方程模型,采用MPI实现并行计算。针对最新的GPU架构,讨论了通量计算的优化方法及GPU计算与PCIe数据传输、MPI通信重叠的多GPU并行算法。进行了超声速进气道及空天飞机等算例的数值模拟以验证GPU在大网格量情况...
高光谱影像降维快速独立成分分析过程包含大规模矩阵运算和大量迭代计算。通过分析算法热点,设计协方差矩阵计算、白化处理、ICA迭代和IC变换等关键热点的图像处理单元映射方案,提出并实现一种G-FastICA并行算法,并基于GPU架构研究算法优化策略。实验结果显示:在处理高光谱影像降维时,CPU/GPU异构系统能获得比CPU更高效的性能,G-FastICA算法比串行最高可获得72倍加速比,比16核CPU...
硅各向异性腐蚀过程复杂,采用元胞自动机模拟硅各向异性腐蚀非常耗时。为了加速腐蚀模拟过程,研究了基于图形处理器(GPU)进行硅的各向异性腐蚀模拟。针对串行算法直接并行化方法存在加速效率低等问题,提出了一个改进的并行模拟方法。该方法增加了并行部分的负载,减少了内存管理的开销,从而提高了加速性能。实验证明该方法能够获得较理想的加速比。
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,但是因为单节点算法的计算量大,仍然存在对大数据分类运行时间太长的问题。而大规模文本集合分散到多个节点上迭代推导,单个节点上文档集合的推导仍是顺序进...
2010年4月24日上午,中国科学院高效能分布式GPU超级计算系统启用仪式在中国科学院过程工程研究所举行。中国科学院院长路甬祥、副院长李静海、秘书长邓麦村、副秘书长谭铁牛,国家财政部教科文司司长赵路出席启用仪式。
相对于传统的CPU(中央处理器)计算而言,GPU(图形处理器)为大规模并行计算提供了一种新的选择,具有很大的发展潜力,是多核CPU主要的竞争对手。日前,GPU的发明者NVIDIA(英伟达)公司正式宣布,授予中科院过程工程研究所和清华大学CUDA卓越中心的称号,以表彰他们在中国推广CUDA和GPU计算以及利用GPU在高性能计算领域作出的杰出贡献。在此之前,CUDA卓越中心已在哈佛大学、剑桥大学等5所...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...