Microsoft于8月28日发布两款完全自主研发的AI模型“MAI-Voice-1”和“MAI-1-preview”,标志着这家科技巨头首次摆脱对OpenAI的依赖,正式进入AI模型开发竞赛。MAI-Voice-1为语音生成模型,能在单个GPU上1秒内生成1分钟高品质音频,而MAI-1-preview则是Microsoft首个End-to-end训练的基础模型。
Microsoft AI部门开发的MAI-Voice-1是该公司首款语音生成模型,能提供从单一说话者到多说话者场景的高品质、具表现力的音频。该模型在单个GPU上能于1秒内生成1分钟音频,是“现在最高效率的语音系统之一”。该模型已集成至Copilot Daily和Podcasts功能,用户可在Copilot Labs测试其语音表现力和故事叙述功能。用户能通过简单提示,创建“choose your own adventure”式故事,或制作个性化冥想内容以助入眠。
MAI将语音定位为AI伴侣的未来界面,并强调语音互动在消费者体验的重要性。
MAI-1-preview是Microsoft与OpenAI完全脱钩后,首个End-to-end自主训练的基础模型。该模型使用约15,000个NVIDIA H100 GPU进行预训练和后续训练,相比之下xAI的Grok模型则使用超过100,000个GPU,显示Microsoft更注重训练效率。该模型功能强大,专为日常问题提供有用回应,现已在社区模型评估平台LMArena展开公开测试。根据测试结果,MAI-1-preview在LMArena排名第15位,表现优于GPT-4.1 Flash,但略逊于gemini-2.5-flash。
Microsoft计划在未来数周内,将该模型部署至Copilot特定文本应用场景,并根据用户反馈持续学习和改进。
Microsoft AI行政总裁Mustafa Suleyman在LinkedIn发文表示,MAI-Voice-1是“我使用过最具表现力和最自然的语音生成模型”,这次发布只是“冰山一角”。他强调公司除了专注模型进步,也致力调整各种专业模型,以释放更大价值。他在访问中解释,Microsoft开发自主模型时,专注于“效率和成本效益”。他指出:“训练模型的艺术和技巧,在于选择最完美的数据,避免在对模型学习无益的不必要标记上,浪费计算资源”。
微软这项发展也反映Microsoft与OpenAI的关系出现微妙变化。虽然Microsoft向OpenAI投资数十亿美元,但两家公司近月关系紧张,OpenAI高层更曾考虑指控Microsoft在合作中存在反竞争行为。
Mustafa Suleyman在X平台呼吁开发者加入:“我们为所有人创建AI。若你认同,就一起来创造。我的私人消息是开放的”,展示Microsoft招揽人才的积极态度。
数据源:ITmedia
双融配资-炒股的杠杆平台-我要配资官网-a股如何加杠杆提示:文章来自网络,不代表本站观点。