«

在消费级显卡上打造离线个人知识库chatwithrtx（一）

时间：2024-2-27 13:52 作者：Anglei 分类： 大数据AI

如果你有NV的30或40系列的显卡，那么恭喜你，可以按照本文搭建本地知识库语言大模型了！

前言

Chat With RTX 是一个 Demo，用来将您自己的资料（文档、笔记、视频或其他数据）与大语言模型建立连接，从而令 LLM 更具个性化。利用检索增强生成 (RAG)、TensorRT-LLM 和 RTX 加速，您可以与自定义聊天机器人对话，快速灵活地获得聊天机器人根据您的内容给出的见解。此外，由于 Chat with RTX 完全在 Windows RTX PC 或工作站本地以安全的方式运行，因此您可以更快获得更满意的结果。
https://www.nvidia.cn/ai-on-rtx/chat-with-rtx-generative-ai/

下载地址

https://www.nvidia.cn/ai-on-rtx/chat-with-rtx-generative-ai/

安装过程：

整个过程持续了46分钟

运行

直接运行桌面的快捷方式

不过初次运行会报错

在ui\user_interface.py的257行添加share=True 即可解决

之后运行界面如下

离线运行

在config\app_config.json中，会记录一个内嵌模型名称

这个时候会下载模型到本地缓存 C:\Users\deans.cache\torch\sentence_transformers\WhereIsAI_UAE-Large-V1 我们只需要把路径修改为这个路径即可离线运行。

总结

本文主要记录安装过程。后续计划使用期打造个人的知识库。

本文完结，相关标签: chatwithrtx

版权所有：Anglei
文章标题：在消费级显卡上打造离线个人知识库chatwithrtx（一）
除非注明，本站文章如未特殊说明均为 MAXADA社区知识库原创，且版权所有，请勿用于任何商业用途。

推荐阅读：

开源模型DeepSeek R1本地离线部署完全指南
 本地部署DeepSeek R1+Dify+SearXNG，支持私有知识库、智能体、联网搜索的保姆级教程
 全网最详细，DeepSeek R1 版本硬件配置与性能对比
 分分钟教会你如何把ChatGpt接入公众号
 基于WINDOWS通过Ollama+WebUI搭建轻量级大模型本地知识库
 史上最强基于大语言模型的本地化知识库-MaxKB部署实践完全指南
 手把手教你将个人微信变成智能AI-ChatGPT，秒变专家
 使用Ollama部署deepseek大模型及WEB UI
腾讯云deepseek V3/R1满血版免费API+Cherry Studio构建本地大语言模型
 Ollama+Deepseek+Dify搭建本地知识库, 助力企业内部高效管理

看完后感想如何？
路过(0)	雷人(0)	握手(0)	鲜花(0)	鸡蛋(0)