Google赞助广告

AI-VTuber:拥有意图识别、长短期记忆的AI数字人 基于智谱 API ,支持对接哔哩哔哩直播间

AI-VTuber:拥有意图识别、长短期记忆的AI数字人 基于智谱 API ,支持对接哔哩哔哩直播间

AI-VTuber,即人工智能虚拟主播,是一种利用人工智能技术驱动的虚拟角色。

如果需要一个高度可定制的AI-VTuber,不妨关注一下这个项目。它不仅能让你的虚拟主播在直播平台上与观众互动,还能通过智谱API进行智能对话,理解观众的意图并作出回应。

软件简介

AI-VTUBER是一个端到端的可定制AI-VTuber项目,基于智谱API作为语言模型,具备意图识别和长短期记忆功能,并支持与哔哩哔哩直播间的对接。该项目支持搭建个性化认知库和歌曲作品库,让它更加独特和有趣。并集成了多种当前流行的先进技术,比如语音转换、语音合成、图像生成和数字人驱动技术,让你的虚拟主播看起来和听起来都超级逼真。同时提供了一个用户友好的客户端界面。

功能特色

  •  对接哔哩哔哩开放平台
  •  支持edge-tts+svc实现定制化的语音合成
  •  支持gpt-sovits
  •  支持智谱api
  •  通过图数据库实现本地歌库多元化搜索
  •  通过向量数据库和知识图谱搭建知识库
  •  自动化的知识图谱制作工具
  •  支持多模板AI虚拟主播定制
  •  具有短期/长期记忆
  •  支持情感聊天
  •  支持对话、唱歌、本地/网络搜索、画画四种意图的任务
  •  对接so-vits-svc并提供训练-推理的一条龙服务
  •  对接sd(webui和comfyui)
  •  对接EasyAiVtuber项目
  •  streamlit客户端设计(主要是管理和定制你的ai-vtuber的)

项目特点

  • 1.本项目对于本地显卡的要求并不高,能正常运行stable-diffusion的电脑基本都能安心食用本项目。
  • 2.本项目占地面积可能会比较大(完整部署后大约20多g,还不算第三方项目),主要是因为虚拟环境体积比较大,日后会着手解决该问题。
  • 3.本项目内置miniconda3管理虚拟环境,便于用户自行扩展第三方模块。
  • 4.本项目提供了一个可视化的客户端(基于streamlit框架构建),支持:环境管理、虚拟主播定制、扩展项目自启动、一些实用的小工具、直播后端监听、图数据库编辑等操作。
  • 5.本项目提供了对于so-vits-svc4.1项目的训练-推理一条龙服务。
  • 6.本项目提供了一个后端API服务器,支持通过get/post请求获得本项目绝大多数服务。
  • 7.本项目支持虚拟主播模板构建、多人设模板管理、实时切换虚拟主播模板等操作。
  • 8.当前版本中,本项目对接的开源项目包括:so-vits-svc4.1(语音转换)、GPT-Sovits(语音合成)、UVR5(人声分离)、fast-whisper(语音识别)、stable-diffusion-webui(图像生成)、stable-diffusion-comfyui、easyaivtuber(数字人驱动)、rembg(背景扣除)
  • 9.本项目提供的实用小工具包括:视频/音频爬虫、语音识别、人声分离、语音合成、语音转换、AI画画、图片去背景。
  • 10.本项目通过构建角色提示词模板、基于知识图谱查询的认知/作品知识库、基于向量数据库的知识库查询构建AI虚拟主播人设(技术实现可以去看作者的语雀文档或者博客)。

截图

 

项目/下载地址

GitHub:https://github.com/whoiswennie/AI-Vtuber/releases

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容