首页 » 排名链接 » 解决现有技术中无法同时保证支持自然语言引导且文本引导精确的缺陷(金融界图像图像编辑文本向量)

解决现有技术中无法同时保证支持自然语言引导且文本引导精确的缺陷(金融界图像图像编辑文本向量)

雨夜梧桐 2024-07-24 17:21:37 0

扫一扫用手机浏览

文章目录 [+]

专利摘要显示,本发明涉及三维建模技术领域,提供一种三维图像编辑方法、系统、电子设备及存储介质,其中方法包括:获取原始图像和文本指令;将原始图像和文本指令输入图像编辑模型,得到由图像编辑模型输出的编辑图像,编辑图像包括从不同角度展示述原始图像中的目标对象的多张,且每张编辑图像中的目标对象的形态均与文本指令的描述相匹配;其中,图像编辑模型用于将原始图像映射为隐向量,并在通过采用噪声预测器在文本指令的引导下,去除添加在隐向量上的噪声后,基于去除噪声得到的条件除噪隐向量,通过三维生成对抗网络渲染出编辑图像。
本发明用以解决现有技术中目前应用的三维图像编辑方法,无法同时保证支持自然语言引导且文本引导精确的缺陷。

本文源自金融界

解决现有技术中无法同时保证支持自然语言引导且文本引导精确的缺陷(金融界图像图像编辑文本向量) 排名链接
(图片来自网络侵删)

相关文章