发布日期:2024-09-01 18:33 点击次数:76
IT之家 8 月 24 日音尘白鹿 ai换脸,Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模子,适用于二维姿势预估、形体部位分割、深度忖度和名义法线瞻望 4 种以东谈主为中心的基本视觉任务。
成人激情网这些模子的参数数目各不交流,从 3 亿到 20 亿不等。它们接收视觉转机器架构,任务分享交流的编码器,而每个任务有不同的解码器头。
二维姿势预估:这项任务包括检测和定位二维图像中东谈主体的过失点。这些过失点时时与肘、膝和肩等要津相对应,有助于了解东谈主的姿势和当作。
形体部位分割:这项任务将图像分割成不同的形体部位,如头部、躯干、手臂和腿部。图像中的每个像素齐被归类为属于特定的形体部位,这对虚构试穿和医学成像等诓骗相称有用。
深度忖度:这项任务是估算图像中每个像素与录像头的距离,从而灵验地从二维图像中生成三维图像。这对增强实际和自动驾驶等诓骗至关蹙迫,因为在这些诓骗中,了解空间布局相称蹙迫。
名义法线瞻望:这项任务是瞻望图像中名义的标的。每个像素齐会分拨一个法向量,默示名义朝向的标的。这些信息关于三维重建和了解场景中物体的几何样子相称有价值。
Meta 公司默示该模子可原生复古 1K 高分歧率推理,况且相称容易针对个别任务进行挽救,只需在向上 3 亿张野生东谈主类图像上对模子进行预检修即可。
即使在标注数据稀缺或透彻是合成数据的情况下,所生成的模子也能对野生数据施展出超卓的泛化能力。
IT之家附上参考地址
Sapiens: Foundation for Human Vision Models
Sapiens: Foundation for Human Vision Models
GitHub
告白声明:文内含有的对外跳转聚首(包括不限于超聚首、二维码、口令等款式),用于传递更多信息,省俭甄选时辰,后果仅供参考白鹿 ai换脸,IT之家所有著作均包含本声明。