推荐关注:

第一男王妃通义千问App也“EMO”啦!一段音频就能驱动照片唱歌

收集整理:九站网 更新时间:2024-04-30 06:34 文章来源:每日看点快看

第一男王妃本文转自:每日商报商报讯(记者王彬彬)近日,又一款AI模型EMO上线通义千问App。输入一段音频、一张照片,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》

原标题:《通义千问App也“EMO”啦!一段音频就能驱动照片唱歌》

第一男王妃本文转自:每日商报

第一男王妃商报讯(记者王彬彬)近日,又一款AI模型EMO上线通义千问App。输入一段音频、一张照片,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。这是继现象级应用“全民舞王”在社交平台掀起“兵马俑跳科目三”“金毛跳舞”热潮后,通义千问解锁的又一种AI模型新玩法。

第一男王妃用户打开通义千问App,进入“全民舞台”频道,就可来到EMO产品页面“全民唱演”。在歌曲、热梗、表情包中任选一款模板,上传肖像照片,EMO随即就能合成视频。首批上线了80多个EMO模板,包括热门歌曲《上春山》《野狼disco》等,网络热梗“钵钵鸡”“回手掏”等。目前通义App暂不开放用户自定义音频,用户只能选择App预置的音频来生成视频。

第一男王妃记者体验过后发现,最终生成的唱歌视频中,原本图片里的人物不仅能准确地对上歌词的口型,连面部表情和眼神也十分的自然。需要提醒的是,用户上传的照片需要确保已获得权利人的同意,除用于AIGC服务外,不得用于其他用途,避免对他人隐私及版权构成侵权。

第一男王妃据了解,EMO与“全民舞王”背后的模型AnimateAnyone均出自通义实验室,2月底,阿里通义实验室的一篇论文让EMO火遍海内外,成为继SORA之后最受关注的AI模型之一,模型的产品化进程也广受关注。

第一男王妃EMO背后的肖像说话(TalkingH..ead)技术是当前大热的AIGC领域。EMO之前的TalkingH..ead技术都需针对人脸、人头或者身体部分做3D建模,通义实验室在业界率先提出了弱控制设计,无需建模就可驱动肖像开口说话,不仅降低视频生成成本,还大幅提升了视频生成质量。EMO学习并编码了人类表达情绪的能力,能将音频内容和人物的表情、嘴型匹配,还能把音频的语气特征和情绪.se彩反映到人物微表情上。

第一男王妃如今,EMO通过通义千问App开放给所有用户免费使用,未来,EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。不仅如此,近期,通义App还陆续推出了超长文档解析、AI编码助手、AI会议助手等免费使用功能,通义大模型正在成为越来越多用户的超级AI助手。

第一男王妃本文转自:每日商报第一男王妃商报讯(记者王彬彬)近日,又一款AI模型EMO上线通义千问App。输入一段音频...

阅读全文

띲띪띺第一男王妃通义千问App也“EMO”啦!一段音频就能驱动照片唱歌》一文由九站智能AI收集整理,不代表本站支持其观点
如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。

热门频道推荐 建站经验 策划盈利 搜索优化 业界动态 境外动态 网络评论 传媒播报 产品运营 交互设计 网站推广 免费资源 网络游戏 网页游戏 电商要闻 电商分析 移动通讯 数码咨讯 移动应用 数码评测 创业模式 创业资本 创业点评 创业经验 电商淘客 电商微商

九站草根门户 服务草根站长 集结网络群体的力量!
免责申明:本站为非盈利性网站,不刊登或转载任何完整的新闻内容,其版权归原作者所有。如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。
PHP程序订制开发,九站系统销售联系QQ 1142088012 蜀ICP备06021074号-10 Copyright 2011-2022 © Www.O9z.Net .All Rights Reserved