Linly-Talker: 开源数字人对话系统,轻松构建个性化AI

Linly-Talker: 开源数字人对话系统,轻松构建个性化AI

Linly-Talker 是一款开源数字人对话系统,集成LLM、ASR、TTS和语音克隆技术。支持多轮对话、语音克隆和实时交互,WebUI界面易用。立即体验个性化AI对话!

LivePortrait: 高效 PyTorch 人像动画生成工具 - 静态照片变动态

LivePortrait: 高效 PyTorch 人像动画生成工具 - 静态照片变动态

LivePortrait 是一款基于 PyTorch 的高效人像动画生成工具,支持静态照片、视频人物编辑,甚至猫狗等动物动画生成。特点包括:高效性、区域控制、动作模板和友好的用户界面。立即体验静态照片变动态的神奇效果!

AniTalker: 开源 AI 让静态人像开口说话,生成逼真视频

AniTalker: 开源 AI 让静态人像开口说话,生成逼真视频

AniTalker 是一个开源项目,基于深度学习技术,可以将静态人像与语音音频结合,生成逼真自然的说话人脸视频。项目易用性高,提供多种预训练模型,支持灵活的参数配置,快速生成定制化动画。立即体验 AniTalker,让你的照片动起来!

JoyHallo:京东健康开源的高效普通话数字人模型

JoyHallo:京东健康开源的高效普通话数字人模型

JoyHallo是京东健康研发的普通话数字人模型,解决了普通话视频生成难题,采用半解耦结构提升效率,支持跨语言生成。本文详细介绍了JoyHallo的项目背景、优势、使用方法和训练方法。

MimicTalk: 几分钟快速训练个性化3D说话头像

MimicTalk: 几分钟快速训练个性化3D说话头像

MimicTalk是一个开源项目,基于PyTorch和Real3D-Portrait,可快速训练个性化3D说话头像。几分钟内生成逼真视频,支持CLI和WebUI,立即体验!

FAST Anime VSR: 加速动漫视频超分辨率处理,实时提升画质

FAST Anime VSR: 加速动漫视频超分辨率处理,实时提升画质

FAST Anime VSR 利用 GPU 加速动漫视频超分辨率,基于 Real-CuGAN 和 Real-ESRGAN,实现实时处理 480P 视频。了解其使用方法、优势以及未来发展方向,立即提升动漫观看体验!

NeuCoSVC2一键歌声转换:高效灵活的AI歌声克隆工具

NeuCoSVC2一键歌声转换:高效灵活的AI歌声克隆工具

NeuCoSVC2实现高效灵活的歌声转换,支持任意到任意转换及语音参考音频,操作简单,持续更新,大幅提升转换质量和自然度。了解更多!

Fish Speech: 开源多语言语音克隆工具,快速上手!

Fish Speech: 开源多语言语音克隆工具,快速上手!

Fish Speech 是一款开源多语言文本转语音工具,支持高质量语音克隆,仅需 10-30 秒语音样本。支持多种语言,提供 WebUI 和 GUI 界面,高性能且易于部署。了解更多并立即体验!

Exo:用你的旧手机搭建AI集群,免费运行大型语言模型!

Exo:用你的旧手机搭建AI集群,免费运行大型语言模型!

利用闲置的iPhone、Android、Mac等设备,通过Exo轻松构建自己的AI计算集群,运行LLaMA、Mistral等大型语言模型,无需昂贵的GPU!点击了解更多。

Docling: 高效文档解析工具,赋能 RAG 和 QA 应用

Docling: 高效文档解析工具,赋能 RAG 和 QA 应用

Docling 能够轻松地将 PDF、DOCX、PPTX 等文档转换为 Markdown 和 JSON 格式,并与 LlamaIndex 和 LangChain 无缝集成,助力构建强大的检索增强生成和问答应用。立即了解 Docling!

AFFiNE: 开源多合一工作区,Notion和Miro的替代品

AFFiNE: 开源多合一工作区,Notion和Miro的替代品

AFFiNE 是一款开源的多合一工作区,结合了笔记、知识管理、演示和数字资产管理功能,是 Notion 和 Miro 的优秀替代品,注重隐私保护和本地优先。了解更多 AFFiNE 的功能、优势和使用方法,立即体验!

Moondream: 轻量级视觉语言模型,让图像理解更简单

Moondream: 轻量级视觉语言模型,让图像理解更简单

Moondream是一款功能强大的小型视觉语言模型,能够理解图像内容并回答相关问题。它易于使用、资源消耗低,可在各种平台上运行。了解如何通过Hugging Face Transformers库、命令行界面以及Gradio可视化界面使用Moondream。立即体验!

Deep-Live-Cam: 基于深度学习的实时摄像头应用,赋予摄像头全新能力

Deep-Live-Cam: 基于深度学习的实时摄像头应用,赋予摄像头全新能力

Deep-Live-Cam 利用深度学习模型,实现物体检测、图像分类、姿态估计等功能,为摄像头赋能。开源免费,易于使用,扩展性强,适用于监控、安防等领域。了解详情并立即体验!

已全部加载