•   按检索    检索词:    高级检索
     排序:相关度 OA 时间 被引次数 点击次数 下载次数 共有10000条符合的查询结果,以下是第81-100项 搜索用时 83 毫秒
[首页] « 上一页 [1] [2] [3] [4] 5 [6] [7] [8] [9] [10] [11] 下一页 » 末  页»
81.
精确对角化(exact diagonalization)方法是一种在量子物理、凝聚态物理等领域广泛应用的数值计算方法,是最直接求得量子系统基态的数值方法. 仅从哈密顿矩阵的对称性出发,利用无矩阵(matrix-free)方法、分层通信模型以及适配于MT-3000的数据级并行算法,提出了面向天河新一代超算系统上的超大稀疏哈密顿矩阵向量乘异构并行算法,可以实现基于一维Hubbard模型的大规模精确对角化. 提出的并行算法在天河新一代超算系统上进行了测试,其中在1400亿维度矩阵规模上,8192进程相比256进程强扩展效率为55.27%,而弱扩展到7300亿维度矩阵规模上,13740个进程相比64进程的弱扩展效率保持在51.25%以上.… …   相似文献
82.
基于拉取请求(Pull Requests, PRs)的软件开发机制是开源软件中的重要实践.合适的代码评审人能够通过代码审查帮助贡献者及时发现PR中的潜在错误,为持续开发和集成过程提供质量保障.然而,代码变更内容的复杂性以及评审行为固有的多样性增加了评审人推荐的难度.现有方法主要聚… …   相似文献
83.
84.
移动应用是近10年来兴起的新型计算模式, 深刻地影响人民的生活方式. 移动应用主要以图形用户界面(graphical user interface, GUI)方式交互, 而对其进行人工测试需要消耗大量人力和物力. 为此, 研究者提出针对移动应用GUI的测试自动生成技术以提升测试效… …   相似文献
王博  陈冲  邓明  董震  林友芳  郝丹 《软件学报》2025,36(6):2713-2746
85.
软件开发者在编写代码时, 常常会参考项目中实现了相似功能的代码. 代码生成模型在生成代码时也具有类似特点, 会以输入中给出的代码上下文信息作为参考. 基于检索增强的代码补全技术与这一思想类似, 该技术从检索库中检索到外部代码作为额外信息, 对生成模型起到提示的作用, 从而生成目标… …   相似文献
86.
大规模语言模型参数量呈指数级增长趋势,对加速卡算力密度与通信效率提出更高要求,推动单卡多芯粒、多芯片及多通信实体等新型架构的快速发展. 申威智能加速卡采用4个核组片上环网架构,但在大模型训练中,数据通信量大和卡内传统Ring集合通信方式面临单核组显存容量与传输带宽双重限制、卡内集… …   相似文献
87.
随着大规模人工智能应用的普及与发展,工业界和学术界对于人工智能算力的需求逐渐提升,结合了异构计算技术与缓存一致性技术的异构一致性融合计算系统逐渐成为未来构建智算中心的重要解决方案. 然而,由于异构计算和一致性互连技术尚不成熟,现有工作难以实现对该系统进行性能建模,导致研究者无法以… …   相似文献
88.
领域专用加速器设计有望进一步提升数据压缩算法的性能,以适应更大规模的数据处理. 新兴的Zstandard压缩软件基于LZ77压缩算法,具有性能优势,但其“控制流数据依赖”与“滑动窗口扩大”的特征限制了加速器的性能发挥. 新型数据压缩加速器BeeZip2实践“算法-架构”跨层优化方… …   相似文献
89.
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x, …, Asx的计算. 上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK). 由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能. 但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销. 提出了缓存感知的MPK(cache-aware MPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用. 测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍.… …   相似文献
90.
针对现有图像编辑方法存在编辑结果不自然、不能很好地模拟图像闭塞内容的问题, 提出基于局部区域相关信息的图像编辑算法. 首先, 获取图像编辑区域和剩余区域的掩码, 使用预训练的StyleGAN2模型和掩码分别得到编辑区域和剩余区域的雅可比矩阵; 然后, 基于图像编辑区域变化最大和剩… …   相似文献
91.
针对腹部CT图像多器官分割面临的不同器官大小形态不一、相邻器官边界难以确认以及低对比度等挑战问题, 提出一种特征增强的双分支多器官分割模型. 模型总体采取编码器-解码器结构: 编码器采取主/从双分支结构, 主分支使用Mamba捕捉多器官全局依赖信息, 从分支使用CNN逐层提取多器官局部信息, 同时设计级联上下文模块将从分支局部细节特征补充到主分支中; 解码器设计多尺度特征融合模块和深度特征增强模块, 多尺度特征融合模块对跨层级特征信息进行融合, 增强多器官边界分割锐度, 深度特征增强模块应用交叉注意机制提高器官前景与背景的对比度, 减少背景信息对分割的干扰. 在Synapse和ACDC两组公开数据集上的实验结果表明, 与近几年主要基线模型相比, 所提模型的Dice相似系数 (DSC)、HD95指标均具有一定的提升.… …   相似文献
92.
由于眼底图像背景复杂、毛细血管细小且模糊以及噪声干扰等原因, 传统视网膜血管分割算法容易出现识别不准确和断连等问题. 针对这些问题, 提出一种基于改进U-Net和注意力机制的视网膜血管分割算法(MRAU-Net). 为解决特征提取不充分问题, 设计了多尺度残差卷积模块(MSRCB)来代替U-Net传统的卷积块; 为了减少信息丢失和噪声干扰, 在瓶颈层嵌入双维注意力优化模块(DAOM); 为了减少在编解码过程中造成的信息丢失, 构建了一种新的多尺度密集空洞卷积块(MDCB), 并与传统的跳跃连接相结合. 在DRIVE和CHASE_DB1两个公开数据集上进行了实验, F1-score分别为82.92%、83.75%, AUC分别为98.87%、98.96%, 灵敏度分别为84.50%、83.82%, 准确率分别为97.11%、97.63%. 实验结果表明MRAU-Net较现有优秀算法拥有更优异的性能表现.… …   相似文献
93.
扩散模型的发展使得高质量图像生成变得更加便捷, 但同时引发了生成图像的版权保护问题. 现有研究通常在扩散过程中隐秘性地嵌入水印, 以提升水印鲁棒性. 然而, 目前现有基于扩散过程的水印方案集中于嵌入固定水印, 无法满足用户对水印多样化的需求. 此外, 还存在被恶意用户更换解码器规避水印的风险. 为了解决上述问题, 本文提出了基于LoRA的双阶段扩散模型水印方案. 首先, 该方案在水印编解码预训练阶段训练出水印编解码器, 保证水印嵌入的稳定性; 然后, 在U-Net微调阶段通过LoRA和自适应注意力机制, 使U-Net在保持生成质量的同时学习到第1阶段的水印模式, 实现多用户定制化. 实验表明, 该方案在图像一致性和水印鲁棒性上均优于现有方法. 在图像攻击下, 水印图像的FID距离提高了0.61%, 平均提取精度提升了4.9%.… …   相似文献
94.
贝叶斯优化是一种优化黑盒函数的技术, 高效的样本利用率使其在众多科学和工程领域中得到了广泛应用, 如深度模型调参、化合物设计、药物开发和材料设计等. 然而, 当输入空间维度较高时, 贝叶斯优化的性能会显著下降. 为了克服这一限制, 许多研究对贝叶斯优化方法进行了高维扩展. 为了深… …   相似文献
95.
随着互联网广告市场的快速增长, 精准的广告推荐变得至关重要. 如何有效学习用户特征和广告特征之间交互是点击率(CTR)与转化率(CVR)预测任务的关键. 然而, 现有的点击率与转化率预测模型存在特征依赖性偏差和广告语义信息挖掘不足的问题. 为此, 本文提出了一种知识图谱增强的广告… …   相似文献
96.
具备千亿级参数的大型语言模型正在引领当今人工智能与异构计算的技术革新及商业模式的深刻转变. 然而,大模型训练任务需要长时间占用大量的硬件资源,软硬件故障发生的频率高且类型较多,并且故障原因难定位导致训练中断时间较长. 针对大模型训练过程中面临的网络中断、节点宕机、进程崩溃等多种典… …   相似文献
97.
RISC-V因其开源和模块化设计等特性,已在嵌入式领域取得显著成功,并逐步向高性能计算(HPC)领域拓展. 面向HPC的RISC-V硬件(如Sophon SG2042多核处理器)已展现出与x86/ARM同类型产品相当的性能水平,但不完善的软件生态是阻碍其发展的最大障碍之一. 开发… …   相似文献
98.
在边缘智能计算系统中使用边缘工作节点训练深度学习推荐模型(deep learning recommendation model,DLRM)具有诸多优势,尤其是在数据隐私保护、低延迟和个性化推荐等方面. 然而,由于嵌入表的规模庞大,在训练DLRM时通常采用1个或多个参数服务器来维护… …   相似文献
99.
传统联邦学习在应用中面临设备异构、数据异构、通信资源约束等挑战. 终端设备异构导致训练过程中过低的协作效率,而数据异构所包括的数据量和数据特征分布异构则导致全局模型精度损失以及模型缺少泛化性. 为了有效利用终端的计算、通信以及数据资源,提出了一种自适应优化的分层联邦学习方法. 该… …   相似文献
100.
大型语言模型的快速发展极大地影响了软件工程领域. 这些模型利用大量开源仓库代码进行预训练, 能够高效完成诸如代码生成和代码补全等任务. 然而, 开源软件仓库中存在大量受开源许可证约束的代码, 这给大模型带来了潜在的开源许可证违规风险. 本文聚焦于大模型生成代码与开源仓库的许可证违… …   相似文献
王毅博  王莹  余跃  许畅  于海  朱志良 《软件学报》2025,36(6):2535-2557
[首页] « 上一页 [1] [2] [3] [4] 5 [6] [7] [8] [9] [10] [11] 下一页 » 末  页»