近日,摩尔线程公司近期宣布了一项重大举措,开源其创新成果——MooER(摩耳)音频理解大模型。作为业内首个在国产全功能GPU上完成训练与推理的大型语音模型,MooER的发布凸显了摩尔线程在人工智能技术创新方面的前沿地位,为开源社区贡献了宝贵的资源,同时也展现了其在推进本土化GPU应用上的深厚积累。
MooER大模型在摩尔线程夸娥(KUAE)智算平台上,仅用38小时便完成了5000小时音频数据和伪标签的训练。这一成就得益于公司自研的创新算法和高效计算资源的结合。MooER不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力,在多个语音识别领域的测试集中展现出优异表现。特别在Covost2中译英测试集中,MooER-5K取得了25.2的BLEU分数,接近工业级效果。
摩尔线程AI团队开源了推理代码和5000小时数据训练的模型,并计划进一步开源训练代码和基于8万小时数据训练的模型。MooER的模型结构包括Encoder、Adapter和Decoder三个部分,使用开源的Paraformer语音编码器、Qwen2-7B-instruct大语言模型来初始化Encoder和LLM模块。
在技术对比中,MooER-5K在中文和英文测试集上的表现均优于其他开源模型。摩尔线程通过这一开源项目,为数据资源和计算资源有限的开发者提供了宝贵的参考和支持。
8月2日消息,摩尔线程与360集团在第十二届互联网安全大会期间宣布建立战略合作伙伴关系,双方于会上正式签署了合作协议,此次携手预示着双方将在网络安全和技术融合方面展开深入合作,共同推动行业进步。
双方此次合作旨在聚焦数字安全、信息与数字化服务及大模型等领域的创新应用,共同构建一个更加强大、可靠的人工智能生态系统,为各行各业提供先进的技术支持和服务。双方还将携手打造“360 智脑大模型一体机”,加速推动人工智能技术的发展与应用,为大模型行业的发展注入强劲动力。
据介绍,“360 智脑大模型一体机”集成了 360 智脑大模型,具备大模型管理、推理部署等功能,摩尔线程全功能 GPU 将为其提供底层算力,“以高性价比硬件方案确保大模型推理效率和成本的平衡”。双方还将共同研发和优化推理框架,在软件层面深入定制,致力于为大模型推理带来更具竞争力的方案。
360 大模型产品也已经与摩尔线程完成适配,基于摩尔线程夸娥(KUAE)千卡智算集群,360 集团已成功完成了 70 亿和 700 亿参数的大模型分布式训练任务。摩尔线程方面称,测试结果显示全程软硬件即插即用,集群训练稳定性达到 100%,训练效率和兼容性均达到预期。
据报道,今年 7 月,摩尔线程宣布其 AI 旗舰产品夸娥(KUAE)智算集群解决方案从当前的千卡级别扩展至万卡规模。摩尔线程夸娥万卡智算集群以全功能 GPU 为底座,打造能够承载万卡规模、具备万 P 级浮点运算能力的国产通用加速计算平台,号称专为万亿参数级别的复杂大模型训练而设计。
9月20日消息,摩尔线程成功完成了其自主开发的统一系统架构MUSA与开源计算机视觉库OpenCV的融合工作,并正式推出了OpenCV-MUSA的开源项目,这一举措将进一步促进计算机视觉技术在多元平台上的应用与发展。
OpenCV 作为计算机视觉领域最重要的开源库之一,为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。
在现有 OpenCV 代码的基础上,摩尔线程新增了 MUSA 设备后端,并为多个算法模块提供了 MUSA 加速支持,同时对编译脚本也进行了适配。
目前 OpenCV-MUSA 已支持包括 core、mudev、musaarithm、musawarping、musafeatures2d、musafilters、musaimgproc、musaobjdetect、musastereo、musabgsegm、photo、stitching、superres、videostab、xfeatures2d 在内的多个模块。
OpenCV-MUSA 支持绝大部分 cv::cuda 命名空间下的数据结构及 API,尤其是 OpenCV 中为 GPU 设计的核心图像数据结构 GpuMat。开发者只需将现有 C++ 代码中的命名空间 cv::cuda 替换为 cv::musa,即可在 MUSA 设备上实现相同的功能。
mobile3g.cn 版权所有 (C)2011 https://www.mobile3g.cn All Rights Reserved 渝ICP备20008086号-42