7月4日,2024世界人工智能大会(WAIC)公布“镇馆之宝”名单,其中商汤科技首个面向C端用户的可控人物视频生成大模型Vimi、阿里云AI编程助手通义灵码、支付宝智能助理、智谱AI基座大模型、特斯拉赛博越野旅行车、联想YOGA Book 9i 笔记本、智能飞行器展示区等入选。据南方+记者了解到,“镇馆之宝”是此次大会的最高荣誉,评选维度包括科技含量、市场前景、创新性以及社会经济效益等,每年入选数量不超过10个。
阿里云方面表示,本次入选的阿里云AI编程助手通义灵码精通200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码,是国内最受欢迎的辅助编程工具,其下载量超350万,每日辅助开发者生成代码超3000万次,已广泛应用于金融、制造、互联网、交通、汽车、能源等行业。
而同样入选的支付宝智能助理,则是基于蚂蚁集团自研的百灵大模型进行研发,依托支付宝这一国内最大的服务型超级App,用户在首页下拉就能唤起,问一问就能获得出行、健康、政务、金融等领域的超8000项数字生活服务。今年4月,支付宝智能助理在首页开启灰度测试。用户通过其下达指令,就能迅速提供相关资讯,并一键直连支付宝生态内挂号、订票、充话费等海量的数字服务,起到“App智能导航”的作用。
据商汤科技介绍,Vimi基于商汤日日新大模型的强大能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。据悉,Vimi将完全面向C端用户开放使用,尤其能够满足广大女性用户的娱乐创作需求。用户只需上传不同角度的高清人物图片,即可自动生成数字分身和不同风格的写真视频。由Vimi生成的视频人物不再只是呆板的五官运动,而是搭配手势、肢体、头发等,形成更完整、统一的人物动作,让创作者可基于生成的视频素材进行剪辑和再创作。
南方+记者 叶丹