通义万相2.5系列模型发布,可一键P图、生成BGM视频

小小MT4 来源:新浪科技 °C 栏目:MT4苹果版下载

  新浪科技讯 9月24日下午消息,在2025杭州云栖大会上,阿里发布通义万相Wan2.5 preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型,其中,通义万相2.5视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力,有效降低了电影级视频创作的门槛。即日起,用户可在阿里云百炼平台调用API,或在通义万相官网直接体验。

  据悉,全新的通义万相2.5在创作能力上实现了全面升级:视频生成时长从5秒提升至10秒,单次生成可实现更完整的剧情故事;支持24帧每秒的1080P高清视频生成,画面质量进一步提升,满足电影级场景的创作需求;与此同时,模型指令遵循能力进一步提升,在视频生成任务中可理解运镜等复杂连续变化指令控制,图像编辑任务也可以跟随指令一键实现人物变身、风格变化等效果。用户只需输入提示词即可生成人声、环境音效和背景音乐,并且精准与画面内容、人物口型匹配,让视频演绎更加生动形象。

  此外,通义万相2.5还升级了图像生成能力,可生成中英文文字和图表,包含复杂文字排版、艺术海报、流程图、架构图等,同时支持图像编辑功能,输入一句话即可完成P图。

  目前,通义万相模型家族已支持文生图、文生视频、图生视频、人声生视频和动作生成等10多种视觉创作能力,累计生成3.9亿张图片、7000万个视频。自今年2月以来,通义万相已连续开源20多款模型,在开源社区和三方平台的下载量已超3000万。(文猛)