【LEYU科技动静】1月26日,腾讯混元正式发布混元图象3.0图生图(HunyuanImage 3.0-Instruct)模子,并于“元宝”全端和腾讯混元官网同步上线。

混元图象3.0图生图总参数目达80亿,激活参数约13亿,采用混淆专家(MoE)架构,基在原生多模态架构基础模子,引入图生图多使命数据,经指令微和谐后练习,具有对于用户输入图象及编纂指令的深度理解与处置惩罚能力。该模子指令遵照效果不变,天生的图片一致性高、真实感强、情绪体现力佳,且天生速率较着晋升。

作为一款能理解输入图象、会思索的图象编纂模子,混元图象3.0图生图于收到用户输入的图片及提醒词后,会先理解图象内容,再基在提醒词推理出详细编纂区域、步调及需保留区域,形成具体编纂指令,实现优良输出效果。

它撑持多样化的图片编纂与多图交融能力,涵盖增、删、改、气势派头变换、老照片修复、人物与文字修改等图片编纂,以和多张照片元素提取合成合照与新图片等。于“元宝”上,用户可直接用它建造心情包、虚拟人物合拍、社交分享、电商海报设计、游戏脚色定制、创用意片建造等。

数据层面,混元团队构建了万万量级的图生图数据,笼罩80多个使命,并于连续练习阶段注入数据,让模子把握基础编纂功效。同时组织思维链,晋升编纂效果。后练习阶段采用自研MixGRPO算法,高效对于齐用户偏好。
版权所有,未经许可不患上转载
-leyu.com