介绍hallo是一个用于人像图像动画的分层音频驱动视觉合成的项目,在使用语音音频输入的驱动下,人像图像动画领域在生成逼真和动态的人像。它采用了端到端扩散范式,并引入了分层音频驱动的视觉合成模块,以提高音频输入和视觉输出之间的对齐精度,包括嘴唇、表情和姿势运动。无缝集成了基于扩散的生成模型、基于UNet的降噪器、时间对齐技术和参考网络。所提出的分层音频驱动的视觉合成提供了对表情和姿势多样性的自适应控制,从而实现了针对不同身份的更有效的个性化。在图像和视频质量、唇形同步精度和运动多样性方面取得了明显的提高
此外,该项目支持与 ComfyUI 工具集成
官网:https://fudan-generative-vision.github.io/hallo/
github:https://github.com/fudan-generative-vision/hallo
启动整合包下载:https://pan.quark.cn/s/455b24f79fc6
演示
启动包说明启动整合包不包含训练模型,适用于WIN系统,大小6.8g,要求最低内存需要8G,训练模型可从 HuggingFace 存储库 ...
IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。该技术包含两个关键组件:一是视觉编码器,用于提取服装图像的高级语义信息;二是GarmentNet,一个并行UNet网络,用于捕捉服装的低级细节特征。IDM-VTON还引入了详细的文本提示,以增强模型对服装特征的理解,从而提升生成图像的真实度。,同时支持Win和Mac,
下载:https://pan.quark.cn/s/9a3abbca0ad7
功能特色
虚拟试穿图像生成:根据用户和服装的图像,生成用户穿戴特定服装的虚拟图像。
服装细节保留:通过GarmentNet提取服装的低级特征,确保服装的图案、纹理等细节在生成的图像中得到准确反映。
支持文本提示理解:利用视觉编码器和文本提示,使模型能够理解服装的高级语义信息,如款式、类型等。
个性化定制:允许用户通过提供自己的图像和服装图像,定制化生成更符合个人特征的试穿效果。
逼真的 ...
介绍该SD启动器是由GetAI出品,具有一键安装下载启动的使用特性,你可以快速调用大模型及插件
下载:https://pan.quark.cn/s/38bcedb8162a
介绍这是一款集成 Dreambooth 和 LoRA 模型训练的Stable Diffusion WebUI 启动器,包含丰富的模型、插件,随时更新、内置丰富精选AI课程、内置丰富的AI工具导航站,轻松找到、海量AI工具
官网:https://www.easyartx.com/landing
下载:https://pan.quark.cn/s/e78b277bc1da
特征丰富的模型、插件随时更新支持丰富模型快速下载
支持丰富插件管理,即插即用
Dreambooth、LoRA模型训练针对新手、专家设置不同的模式,满足不同用户模型训练需求
一键快速安装,完全无忧
前言:这次是在上次发布过的抖音自动化关键词点赞视频的基础上增加的的AI调用,上篇文章请查看https://www.noiseblogs.top/posts/8f0120ea/ 或 https://mp.weixin.qq.com/s/mOYPecfs4ck7lxhx9S81tw
这次我们依然使用影刀来完成
自动化运行简单演示视频:
由于上次已将步骤分享过,所以这次只讲AI模块,此模块主要是将python调用模型引入到流程中,我们可以看到主要是占用符调用HTTP 请求的 http.client 模块来完成json块的请求和转换,这里我调用的是自己搭建的one api使用gpt3.5模型来请求的,你可以替换为自己的api
使用:右侧流程中新建python模块写入代码,然后在左侧指令中搜索你新建的模块并拖入工作流中!
重点是ai请求什么元素来完成评论!
在演示中我使用的是选取视频标题部分来读取文本,然后扔给ai
AI读取文本后进行问题提问,如下
最后点击到评论区输入ai输出后的文本信息即可:
整个流程下来其实用不了多少时间,重点看你怎么调用模块
由于我不是影刀企业用户无法分享整个 ...
资源分享
未读
介绍这是包含了上百个CG相关的课程相关资源,我已将链接整理为txt及excel文件,其中包括文件目录
大小:约3.6T
云:百度
下载:夸克:https://pan.quark.cn/s/5992b9fb0689
百度链接: https://pan.baidu.com/s/1aAUCh6wGKV-LCE36H8wCmw 提取码: dt8g
蓝奏云:https://noise.lanzoul.com/iaiPV21mz19g
预览
批量转存根据可参考:https://github.com/hxz393/BaiduPanFilesTransfers
WIN打包程序下载:https://pan.quark.cn/s/55338a74cb3e
介绍TuneFree是一款基于Splayer进行二次开发的音乐播放器,可解析并播放网易云音乐中所有的付费资源
Github:https://github.com/GSQZ/TuneFree
官方页面:https://pt.sayqz.com
下载:https://sayqz.lanpv.com/s/tunefree
也可以通过远嘛进行自己编译
预览
🎉 功能
🎵 支持播放网易云音乐所有的付费资源
🆕 软件内检查更新
🤳 独立Android客户端
✨ 支持扫码登录
📱 支持手机号登录
📅 自动进行每日签到及云贝签到
🎨 封面主题色自适应
📁 本地歌曲管理及分类(建议先使用 音乐标签 进行匹配后再使用)
⬇️ 下载歌曲(最高支持 超清母带)
➕ 新建歌单及歌单编辑
❤️ 收藏 / 取消收藏歌单或歌手
🎶 每日推荐歌曲
📻 私人 FM
☁️ 云盘音乐上传
📂 云盘内歌曲播放
🔄 云盘内歌曲纠正
🗑️ 云盘歌曲删除
📝 支持逐字歌词
🔄 歌词滚动以及歌词翻译
📹 MV 与视频播放
🎶 音乐频谱显示
⏭️ 音乐渐入渐出
🔄 支持 PWA
💬 支持评论区及 ...
发现安利
未读
一、城市租房生存指南
这是一份租房避坑指南,你可以在线阅读或以电子书形式阅读
访问地址:https://zufang.ababtools.com
写的比较全了,包括注意的事项及相关法规等都有
此外维护者还提供了一份各地城市的租房导航
二、快捷键备忘录
里面涵盖了日常使用的一些软件的快捷键指南,包括WIN和MAC的,很用心了
访问地址:https://hotkeycheatsheet.com/zh
三、Veggie AI
访问地址:https://veggieai.net
vigle ai是一个利用AI的能力在线生成可控的视频工具产品,用户只需要输入图片、视频或者文字prompt等素材,就可以生成动作和任务形象完全一致的短视频。使用简单,任何人都可以上手使用,不需要有任何的AI知识基础,当然,它不是免费的,站之前单独推荐过,详细的可以查看以前的文章
演示:https://jsd.cdn.noisework.cn/gh/rcy1314/tuchuang@main/uPic/main.mp4
四、创艺里巷
创艺里巷设计网站是创意与设计的交汇点,提供灵感分享、作品展示及资源下载,助力设 ...