近日消息,随着AI领域的竞争持续白热化,Meta公司紧随其Llama 3.1模型开源之后,法国Mistral这家人工智能新秀企业也不甘示弱,宣布了其最新的旗舰模型——Mistral Large 2,进一步加剧了高端AI模型市场的竞逐态势。
模型简介
该模型共有 1230 亿个参数,在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。
Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面有非常明显的改进。
Mistral 公司表示,训练的重点之一是尽量减少模型的幻觉问题。该公司称,Large 2 接受的训练让它的反应更具辨别力,当它不知道某些事情时,它会承认自己不知道,而不是编造一些看似合理的事情。
开放方式
援引官方新闻稿,该 AI 模型的关注点之一,在于“授权开放”非商业研究用途,包括开放权重、支持第三方根据其喜好进行微调(fine-tune)等等。
如果商业 / 企业想要使用 Mistral Large 2,需要从 Mistral 公司购买单独的许可和使用协议。
性能
与 Llama 3.1 的 4050 亿个参数(即指导其性能的内部模型设置)相比,它的参数数量较少,但性能仍接近前者。
Mistral Large 2 可在公司的主平台上使用,也可通过云合作伙伴使用,它建立在原有 Large 模型的基础上,带来了先进的多语言功能,并提高了推理、代码生成和数学方面的性能。
官方称其为 GPT-4 级模型,在多项基准测试中的性能非常接近 GPT-4o、Llama 3.1-405 和 Anthropic 的 Claude 3.5 Sonnet。
Mistral 指出,该产品将继续“推动成本效益、速度和性能的发展”,同时为用户提供新的功能,包括高级函数调用和检索,以构建高性能的人工智能应用。
近日消息,法国的人工智能初创企业 Mistral AI 发布了一款新的内容审核 API。这款工具的推出旨在与 OpenAI 等行业领导者竞争,并解决不断增长的 AI 安全性和内容过滤需求。
这项服务基于 Mistral 的 Ministral8B 模型,经过精细调优,能够在九个不同类别中检测潜在的有害内容,包括色情内容、仇恨言论、暴力行为、危险活动以及个人可识别信息等。该 API 同时具备对原始文本和对话内容的分析能力。
Mistral AI 在发布会上强调,“安全性在使 AI 变得有用方面扮演着关键角色。” 他们认为,系统级的安全防护措施对于保护下游应用至关重要。
此次发布的内容审核 API 恰逢 AI 行业面临越来越大压力之际,各公司被迫提升技术的安全性。上个月,Mistral 还与其他主要 AI 公司共同签署了 AI 安全峰会的协议,承诺将负责任地开发 AI 技术。
新推出的 API 已在 Mistral 的 Le Chat 平台上投入使用,支持包括阿拉伯语、中文、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语和西班牙语在内的11种语言。这种多语言能力使 Mistral 在某些主要只关注英语内容的竞争对手中脱颖而出。
Mistral AI 还与微软 Azure、Qualcomm 和 SAP 等高调企业建立了合作关系,逐步在企业 AI 市场中增强影响力。SAP 最近宣布将在其基础设施上托管 Mistral 的模型,包括 Mistral Large2,以提供符合欧洲法规的安全 AI 解决方案。
Mistral 的技术策略显示了其超越年龄的成熟性。通过训练其审核模型理解对话背景,而不仅仅是分析孤立文本,Mistral 开发了一个能够捕捉更微妙的有害内容的系统,这种内容可能会在更基本的过滤器中被遗漏。
目前,审核 API 已通过 Mistral 的云平台提供,按使用量收费。Mistral 表示,将根据客户反馈和不断变化的安全需求持续提升系统的准确性并扩展功能。
自成立以来,Mistral 迅速成长为推动企业 AI 安全思考的重要力量。在一个由美国科技巨头主导的领域中,Mistral 以其欧洲视角在隐私和安全方面可能成为其最大优势。
近日消息,Mistral 公司发布了其最新的两款AI模型——Ministral 3B 和 Ministral 8B。这两款模型专为提高笔记本电脑和智能手机等设备的本地化AI体验而设计,无需依赖云服务器即可运行。
Mistral 官方宣称它们是“世界上最好的边缘计算模型”,这一声明反映了该公司在推动边缘计算技术进步方面所取得的重大进展。通过这些创新,Mistral 旨在让更多的用户能够享受到高效且便捷的人工智能服务。
Mistral 公司表示越来越多的企业希望能够在个人设备上运行 AI 模型,一方面确保安全的数据处理,另一方面也提高响应速度。
上述两个模型可在没有互联网接入的情况下,执行翻译服务、本地分析和机器人等多项服务。
这两个 AI 模型的上下文窗口均为 128K,相当于一次可以处理 50 页文档。
Ministral 8B 的价格为每百万个 tokens 售价 0.1 美元,而 3B 版本则为 0.04 美元,适合小规模操作或初创开发者。Ministral 8B 采用了特殊的交错滑动窗口注意力机制,这种设计可以在推理时更快且节省内存。
mobile3g.cn 版权所有 (C)2011 https://www.mobile3g.cn All Rights Reserved 渝ICP备20008086号-42