废了我半条命设计的deepseek本地知识库方案
个性化打造您的专属微信智囊、微信助理、微信客服
图片
图片
(开篇先问候我们敬爱的审核大大,祝您身体健康、事业有成、发大财,求别再封号,是真怕了。)
一、开篇的话(为让所有学习者理解我做的什么,我会非常认真的把我的想法和过程写下来,如果对这部分不感兴趣的,可以直接划到后面。)
近几年自各种AI大模型兴起之后,如chatgpt或者deepseek等等。
我觉得他们都很棒,上知天文下知地理,拓展了我们的知识边界。
图片
但是我觉得美中不足的是,我们所畅想的具有未来感的人工智能,他是能渗透到我们每一个人的专属贴身管家。
他应该足够了解你,也应该具备学习能力,以持续了解不断变化成长的你。
这就是以前所有大模型缺失的一部分,也是大模型和你相差的最后一公里。
图片
以前我觉得要做到这样的效果,得要根据你自己的信息训练大模型,想想都复杂。
但自从最近deepseek火了之后,大家开始关注到用AI来给自己打造知识库。
那么当你在向AI询问的时候,他不再是根据已经被公司训练的内容回答,而是先了解你给到他的资料来回答。
这样事情就变得非常有趣了,也就是说,你似乎可以定制出属于你自己的AI了,他足够了解你。
你存入专业知识文件,他就可以成为你的专属智囊。
你存入备忘事项,他就能成为你的贴心管家。
你存入经常被问到的问答内容,他就能成为你的免费客服。
你存入个人情感类的诉求,你甚至你能给自己打造一个男朋友、女朋友,或者属于你的贾维斯、哆啦A梦。
图片
想到这里的时候,我就已经足够兴奋了,那么要如何实现和使用呢?
我花了大半个月的时间浏览了各个平台的攻略,能给到我的无非就那么几套方案,常见的都是ollama、anythingllm、cherrystudio、dify、chatbox、docer以及阿里云、腾讯云等等。
但我浏览了全网的攻略,都无法实现我心中所想要的智能助理。
本地部署知识库的方面,很简单,anythingllm和cherrystudio都很不错,但是目前都只能电脑使用。
那可不就不方便了吗?要是能用手机访问该多好呀。
于是我又继续研究,发现了dify接入飞书、钉钉等等,还不错,可是我不想用这些软件,我就想用熟悉的微信,要是能接入微信就好了。
云部署的我不喜欢,我就想要我的资料都存储在自己电脑上,方便,安全。
在我这样努力钻研的时候,腾讯的ima出来了。
基本能实现我的要求,方便、智能,我甚至觉得似乎我都不用再研究下去了。
但是结果一看,小程序访问、2G内存,好像,似乎也差那么点儿意思。
到底能不能实现让我的本地智能知识库以我微信好友的身份出现在我微信列表里,我直接跟他对话就可以了呀!!!!
本地知识库,早就搭建好了的。
deepseek接入微信,早就实现了的。
那怎么将搭载了deepseek的我的本地知识库接入微信呢?
这个问题困扰了我好多好多天。
就在上周六的深夜,就在我苦苦查找几天也没有线索的时候。
就在我对自己说,再试验最后一次,不行就睡觉的时候。
我终于找到了突破这个障碍的关键技术贴,于是一鼓作气。
那一夜,我熬了一个通宵。
终于,哆啦A梦,诞生了。
图片
那一刻,我似乎感受到了用功读书的大雄唤醒沉睡的哆啦A梦的喜悦。
图片
二、功能使用和效果展示篇他在那里?
他就躺在你的微信好友列表里,他就是你的好友。
你可以像给好友发消息一样和他对话。
图片
他本身就是deepseek,所以你可以像deepseek一样使用他。
他挨个回答了我同时提出的多个问题,限于篇幅,我只截取了部分。
对了,多个人同时问他,他也会先后挨个回复哦。
图片
他接入了你自己存放在电脑里的资料,因此,你也可以就你自己的文档进行提问。
图片
每次都要在电脑端上传资料,是不是很麻烦?
我还创造性的增加了通过固定格式对话来自动存储进知识库的功能。
可以支持很长一段文本存入知识库,也就是说,可以把你备忘的事情,或者学习笔记,会议记录,直接敲进对话框里。
图片
要分享他,要分享你的知识库,你只需要把微信号发给你的朋友,让他也添加哆啦A梦即可。
他们加上好友,就可以对话了,就能访问你的知识库了。
三、基础篇:本地化部署知识库流程那么我是怎么做到的呢?
先介绍知识库建设这部分,我是通过Deepseek+ollama+anythingllm实现的,这种方式在网上已经有很多很多教程了,都被说烂了。
我本来是准备考虑跳过这部分,因为这部分的内容很容易找到,99%的博主也只说了这部分。
但我这两天发现,我之所以觉得这部分非常基础非常简单,是因为我足够熟悉了。
而对于别人,大数据并没有定点给他们推送那么多。
因此我还是想从最简单的地方讲起,让你们能跟小白时候的我一样学懂。
首先我们来认识他们。
Deepseek,自不必多说,时下最时兴的AI。
要单独使用他,手机应用商城直接搜索即可,或者上官网DeepSeek | 深度求索。
在我的方案中,你既可以把官方训练好的模型下载下来(后续会讲到),也可以直接通过API接口调用。
(API,你可以简单的理解为,两台电脑连接一般要用网线,而在网络上API就是这个网线)
图片
OLLAMA,一个国外的软件,他是用来管理大模型的,要下载deepseek的大模型包,就是通过它,而不是deepseek官网哦。
OLLAMA的官网是https://ollama.com/。你要下载其他的模型,都需要用它。
(下载大模型可能会有点慢,但如果加点魔法可能会有不一样的效果哦。)
图片
Anythingllm,也是一个国外的软件。
就是用他来制作知识库,就是他将OLLAMA和deepseek以及你的知识库连接起来,功德无量啊。
网https://anythingllm.com/。
图片
好了,认识了这些软件之后,我们就可以开始了。
第一步,下载安装OLLAMA。
如我上图在官网中标注的地方。
安装方式和别的软件差不多,没啥可说的。
你的模型会默认下载在C盘,想改路径的话,在安装OLLAMA后,下载模型前,通过修改环境变量的方式修改安装路径。
不懂的可以网查或者问deepseek,以下是deepseek 的回答。
图片
第二步,下载AI模型。
进入OLLAMA的官网,左边顶上Models(模型)这里点进去。
下载第一个模型,deepseek-r1模型。
这里都不用搜索,太火了,放在了第一个。
图片
点进去之后根据你电脑的配置选择1.5B-671B的模型。
数字越大,代表这个模型包越大,包含的内容越多,越智能。
当然对电脑性能也会要求越高。
671B别想了,别人360、腾讯什么的就是布置的这个。
我们个人小电脑也就安装个1.5B-32B就不错了。
比如我的是办公笔记本,单位办公淘汰的,集成显卡。
1.5B运行起来还可以,7B就很慢了。
图片
以下是deepseek给出的各个模型的电脑配置要求。
图片
图片
图片
我个人而言呢,7B以下的模型,还是不够智能。
7B以上的模型,我电脑带不起来没试过,但听说也不太行。
我觉得吧,我们个人用户,选择直接调用deepseek的API接口就不错了,很智能,很方便,很便宜。
当然如果你电脑足够好,安装模型的方式,倒是可以让你终身免费使用。
API接口有多便宜呢,反正我每天用的最多的时候也才两三块钱。
用了大半个月还没用完赠送的14块钱。
API接口的配置方式因为要结合ANYTHINGLLM,因此在下面讲。
除了deepseek的模型,我们还得下载一个模型。
你无需多问,就在OLLAMA官网搜这个nomic-embed-text,就行了。
网大多数人都用的这个,我自己应用也还行。
这个是用来干什么的呢?
你上传的自己的文件,要让模型能够读懂,就得靠他。
毕竟机器人的语言,跟咱不一样。
如何安装nomic-embed-text和deepseek的模型呢?先复制模型。
图片
然后在电脑开始菜单里面找到命令提示符,点击他。
图片
在弹出的黑框里,粘贴你复制的模型名称就行了。
图片
然后回车,他自己就开始安装了。
看到这样的界面就表示安装好了。
图片
下载了必要的两个模型之后,接下来就是第三步。
第三步,下载安装anythingllm。
也是如一般软件一样的操作。
输入邮箱、设置工作区名称,也不需要注册就能直接进入到操作界面。
如下图所示,newwork是我设置的工作区名称,特别提示,为了方面后面用代码调用anythingllm的结构,这个工作区名称用英文小写!!!!!
图片
要跟你的工作区对话的话,点一下你的工作区名称,和default,就能看到你聊天的界面了。
你如果新装的话,这里是空白的。
图片
但是我们还无法对话,因为还没配置大模型。
点击左下角扳手的符号,进入设置界面。
LLM首选项里面可以选择模型。
我们在提供商里面可以选deepseek的API,或则选择ollama,用我们下载好的模型。
选择API的话,在官网API开放平台——APIKEYS——创建KEYS,即可生成一条密钥。
注意马上复制粘贴到其他地方保存起来。
后面无法再复制了。
注意,这个密匙保管好,这是你的小钱钱呢,别人用了你的密钥就是在用你的钱。
图片
如果是选择OLLAMA的模型,界面长这样。
我选的1.5B.且只需要在这个地方选择就可以了。
然后点击右上角的save changes。也即是保存你的设置。
图片
再在embedder首选项里面,嵌入引擎提供商选择我们刚下载的第二个模型包-Nomic。
图片
模型选择好之后,就可按左下角的返回键回到操作页面。
这个时候你其实可以直接对话了。
因为这个时候你已经算是接上deepseek的模型了,可以和deepseek对话了。
那么如何传入我们自己的文档呢?
点击工作区名称newwork旁边向上的箭头。
图片
你会看到这个界面。
图片
再点击下面那个一朵云,加个箭头的地方就能上传你本地的文档了。
图片
选择你的文档,上传,可能需要花一点时间。
上传后,文档出现在软件上了,如下图。
图片
当然,这个时候你还不算把他加入知识库了哟。
这里只是软件管理文件的地方。
你要选中文件,点击move to workspace,意思是移动到你的工作区。
图片
并看到你的文档出现在下面的框框才算成功,再在下面的框框的右下角点击save and embed就可以了。
看到下面在转圈圈,说明大模型在解析你的文档了。
这个需要花费一点时间,如果文案很大很复杂,需要花费的时间有点多。
图片
等转圈转完了就算是解析好了。
敲重点,记得把那个钉子点上!!。
他的意思是将你的文件置顶,对话的时候,大模型就一定会去搜索文档后回答。
如果不点的话,很可能模型会根据自己想法乱说。
图片
为了提高回复的准确性。
工作区旁边的齿轮点一下,在聊天设置里面。
聊天模式选择查询,LLM温度填0。
聊天提示里面,可以把你对这个机器人的人设输入进去,这就是个性定制的部分。
图片
然后向量数据库中按我这样设置吧。
图片
好了,这样一个回复准确的知识库就配置好了。
在聊天框输入对话试试吧。
(码字到这里,我的WOED已经24页了,累死了。)
99%的博主也就只讲到这里,如果你是小白,到这里就为止吧。
后面的水太深不适合你。
但如果你是像我这样具有钻研精神的小白,那就勇敢的往前冲!!!!
写了这么多,要是还没有流量,我得气死!!!!
****************************************************
四、进阶篇:将部署的本地知识库接入微信***************************************************
敲重点敲重点!!!!!打瞌睡的醒一醒!!!!全篇最具含金量的部分来了。
前面我们的步骤,大多数博主都已经讲过了,但是以下内容绝对是99%的博主都没有讲过的。
我们最终的目的,是要通过微信端来访问我们的知识库。
那么首先,你得有个微信账号吧?
你得在电脑端安装一个微信客户端吧?
安装微信客户端就不用我多讲了,有手就行的东西。
如果连这个都不会,那进阶篇不适合你。
进阶篇需要有一点点Python基础,如果你有钻研精神,就不需要太多基础,比如像我,也就几十页书的基础,但咱有钻研精神啊。
我们要实现的最终目的,是通过代码编程,将微信客户端和我们已经部署好的anythingllm连接起来。
我为了突破这个,熬了三个通宵,所以我才说废了我半条命。
关键我本来对pyton也半罐水都不到。
现在人都是虚的,行行好各位给个评论、关注、收藏、转发。
新号起号不容易。
要实现这个连接,就是用代码调用anythingllm的api接口,在代码和微信客户端交互。
首先给给大家科普下angythingllm的API文档,怎么看懂。
我当初为了看懂他都花了好多天。
我们还是点击小扳手,拉到最下面,看到API密钥这里,点一下。然后弹出的界面,点左上角的阅读API文档。
如果点击生成新的AP密钥就会生成能访问你本地知识库的密匙。
图片
首先你得要读懂这个API文档,要学会怎么通过代码去调用他。
1.创建你的apikey,并把他填写到Authorize里面。
操作这一步的意思就是用你的密钥给这个文档里所有的接口地址授权了。
只有在这里填写了,你才能用代码调用每个地址对应的功能。
当然你也可以在每个地址那里对应的锁的位置去填。
图片
2. 认识不同地址代表什么意思
我们要调用api密钥一般需要密钥KEY和地址URL。
密钥刚刚我们已经创建了,而地址呢,比如你刚刚调用deepseek的密钥,地址就要填deepseek的官网api地址,https://api.deepseek.com。
然而我们不是部署在网络上,是部署在本地,则就需要你本地的地址。
一般来说应该是这个'http://localhost:3001/api/v1',但这只是前半部分,我们姑且把他叫做基础地址URL。
应该大多数电脑都是这个,这一段的意思呢,locahost就是要去调用你自己电脑的IP地址。
你不用去查你的IP地址,不用去改成你真正的IP,就这样写就可以了。
端口的话应该统一都是3001。
刚刚说了那个只是前半部分,那后半部分呢??
就需要看我们的接口文档了。点开文档的每个下拉菜单,你能看到一段英文,你自己用翻译软件挨个去翻一下就明白什么意思了。
这里我重点说实现我的功能的三个重要的地址。
又要敲黑板了!
(1)/v1/document/upload
这个地址的功能就是将你本地的文件,上传到anythingllm的文件夹里面。
注意,只是上传到前文提到的文件上传的上面那个框框,还没有移入工作区。
如果你想执行传文件这个功能,完整的URL地址就是刚刚提到的基础URL加上这个。
也就是http://localhost:3001/api/v1/document/upload
这个就是调用这个功能的完整地址。
图片
(2)/v1/workspace/{slug}/update-embeddings
这个路径的意思是将上一步上传的文档移动到工作区。
比如我的就是移动到newwork的工作区。
这一步完整的地址也是一样基础地址加这个。
图片
(3)/v1/workspace/{slug}/chat
这个就是最终要的地址,你可以不用前面两个地址,但一定要会这个。
这个就是通过代码调用anythingllm聊天功能的地址,密钥都是同一个哈,每个功能的地址不一样。
也就是,通过这个地址,你就可以通过代码调用你用anythingllm部署的本地知识库了!!!!!
激动吗,兴奋吗???
当我试验成功的时候,我感觉绝天地通的不周山都通了。
图片
(4)/v1/admxinq/wo5rks1pa9ce8s/{wo7rks5pac0eS4lug}/m7anage-users
至于再进一步,如何编码调用?
可以在网络上搜索这两篇帖子,对我帮助很大。
他写的有完整的代码。
或者给我点赞、关注、转发、收藏,私信我我把最关键一步的代码给你。
图片
图片
另外就是代码驱动微信,我参考的是这个。
图片
好了,现在我们学会了1+1等于2,你也学会了举一反三,1+2=3了,那么你已经非常精通了,试试做下这道题,练练手吧。
图片
哈哈哈哈哈哈哈哈哈!加油吧骚年,冲!!
五、写在最后的话不知不觉,我已经写了整整五个小时,30多页了。
我本身其实也是个小白,在此之前只看来PYTHON从入门到精通的半本书,掌握了一点基础知识。
所以我觉得我可以,你肯定也可以。
只要你也和我一样热爱,一样具有钻研精神。
显然你比我容易多了,毕竟我把一路走过的旅程,已经指给你了。
期待你打开新世界大门的时候。
自从开始研究这个,每天大脑都在不停的运转,这个半月都没睡好。
昨天大号本来发出来都爆了,结果被封号了。
郁闷的凌晨4点才睡,8点就起了。
又肝这篇文章到现在,我觉得我另一条命也要没了。
哎,求关注、转发、点赞、评论,行行好。
如有疑问或者需求,留言,有时间会解答。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。