news 2026/4/3 6:09:27

rvm抠图笔记

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
rvm抠图笔记
import torch import cv2 import numpy as np from PIL import Image from torchvision import transforms from model import MattingNetwork # RVM 的模型定义文件 # 加载模型 model = MattingNetwork("resnet50") model.load_state_dict(torch.load(r"D:\project\seg\jacke121-rvm_128_json\model_a\rvm_resnet50.pth", map_location="cpu")) model = model.eval() # 输入图像 # img = cv2.imread("input.jpg")[:, :, ::-1] # BGR -> RGB # img = cv2.imread(r"D:\project_2025\live2d\LayerDiffuse_DiffusersCLI-main\imgs\inputs\mm01.jpg") # BGR -> RGB img = cv2.imread(r"D:\soft\801.jpeg") # BGR -> RGB img = cv2.imread(r"D:\soft\805.png") # BGR -> RGB h, w, _ = img.shape # 转 tensor img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img = img.astype(np.float32) / 255.0 # 归一化到 0-1 # 转 tensor: [H,W,3] -> [1,3,H,W] src = torch.from_numpy(img).permute(2, 0, 1).unsqueeze(0) src = src.cpu() # RVM 需要 recurrent states (init None) rec = [None] * 4 # 推理,RVM 输入为:src, downsample_ratio, *rec with torch.no_grad(): fgr, pha, *rec = model(src, downsample_ratio=0.25, *rec) # fgr: foreground,pha: alpha matte fgr = fgr[0].permute(1, 2, 0).cpu().numpy() pha = pha[0].permute(1, 2, 0).cpu().numpy() # 合成为 rgba rgba = np.concatenate([fgr, pha], axis=2) # [H,W,4] rgba = (rgba * 255).astype(np.uint8) Image.fromarray(rgba).save("output_rvm.png") print("Done: output_rvm.png")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/31 17:30:05

告别风格不一:2025年有哪些仿写软件值得选择?体验蜜度模力通

在工作中,我们常常会遇到这样的挑战:需要撰写一份新的稿件,但要求与已有的某篇优秀范文风格保持一致;或者需要多人协作完成系列文件,却难以统一文风和表达习惯。这时,一款得力的仿写工具就显得尤为重要。20…

作者头像 李华
网站建设 2026/3/28 23:23:10

如何快速配置群晖Audio Station歌词插件:面向初学者的完整指南

如何快速配置群晖Audio Station歌词插件:面向初学者的完整指南 【免费下载链接】qq_music_aum Synology LRC Plugin. 群晖 Audio Station 歌词插件,歌词来自QQ音乐。 项目地址: https://gitcode.com/gh_mirrors/qq/qq_music_aum 还在为群晖Audio …

作者头像 李华
网站建设 2026/3/30 0:18:55

打造高效AI研究代理:技术要点与实战经验分享

文章探讨了构建高效AI研究代理的技术与经验,强调设计能随模型发展改进的系统架构。重点介绍了上下文工程的重要性,提出简化编排逻辑、增强自主性的优化方法,以及人机交互建模的创新思路。通过减少令牌消耗(相比传统方法减少66%)提高效率&…

作者头像 李华
网站建设 2026/4/3 0:01:13

容联云位居IDC MarketScape中国AI赋能的联络中心 领导者类别

近日,全球领先的IT研究和咨询公司IDC发布《IDC MarketScape: 中国 AI 赋能的联络中心 2025 年厂商评估》报告,容联云位居IDC MarketScape中国AI赋能的联络中心领导者类别。本次评估严格筛选具备核心能力、扎根中国市场、具备落地成效的联络中心技术提供商…

作者头像 李华