
AI 实践笔记:2月个人知识库搭建(Obsidian|DeepSeek|IMA)
2 月深度探索了个人知识库与AI 结合,体验还不错,记录下方法和思考。我过去尝试过OneNote、EverNote、Apple备忘录、飞书Doc、腾讯 Doc,但是最终都弃坑了,不是这些产品力不行,只是不适合我。我的痛点如下产品容器要纯粹稳定简单。纯粹是不要太多广告营销(EverNote),稳定是内容存到本地并能离线编辑(~飞书Doc、腾讯 Doc),简单是支持Markdown格式(OneNote
写在前面
2 月深度探索了个人知识库与AI 结合,体验还不错,记录下方法和思考。我过去尝试过OneNote、EverNote、Apple备忘录、飞书Doc、腾讯 Doc,但是最终都弃坑了,不是这些产品力不行,只是不适合我。
我的痛点如下
-
产品容器要纯粹稳定简单。纯粹是不要太多广告营销(EverNote),稳定是内容存到本地并能离线编辑(~飞书Doc、腾讯 Doc),简单是支持Markdown格式(OneNote~)。
-
产品不能只是一个容器。知识库搭建容易陷入一个误区,就是把知识库当成信息存储工具,最终信息过载到知识库“热寂”。
-
产品有创造局部有序的功能。知识库产品的下限是具备容器的能力,上线是有知识管理思维。预防知识库“热寂”的唯一方式是对抗熵增,面对知识库的熵增,产品在信息分类、知识管理上提供一些能创造局部有序的功能。
-
能够一键打通优质信源,方便收集和整理。
-
能够使用AI,支持本地知识库探索或在线问答。
以上是我对知识库产品的核心痛点,其中创造局部有序的功能是我最大的痛点。如果你和我有类似的痛点,相信接下来这个解决方案对你有一些帮助。
搭建流程
我的解决方案是Obsidian+Copilot+IMA,接下来我从信息收集、分类、应用三个方面介绍这套方案。
1/ 信息收集
信息收集分成两种:个人信息、公域信息。
个人信息指每天的冒出来的想法和感觉,这类时效性要求很高,例如一个灵感,不迅速记录可能就忘了,这类我现在都用豆包智能体记录。
如果你也想尝试一下,欢迎使用我常见的豆包智能体。
MKFlomo - 豆包智能体[https://doubao.com/bot/ZtJCwXun]
公域信息指不同平台的文章、视频、图文等,我主要收集图文信息。微信公众号文章用五彩插件,网页浏览文章用Obsidian 官方插件或者五彩插件,我平时五彩插件用的多,同步速度也挺快的。
官方插件:Obsidian Web Clipper[https://obsidian.md/clipper]
五彩插件:五彩插件[https://doc.wucai.site/]
2/ 信息分类
信息分类是我最钟意Obsidian的部分,结合 dataview插件与属性,能很好的将收集的信息展示出来。任何信息的收集一定都可以归类到主题,至于笔记放在哪个文件夹其实不重要,如果能构建自己的知识主题,相关笔记自然可以分类到该主题下,并且动态更新。
Dataview:是一个功能强大的插件,用于在 Obsidian 笔记中动态查询和展示数据。它允许用户通过特定的语法从笔记中提取、整理和展示信息,就像一个小型的数据库工具,非常适合管理复杂的知识体系和项目。
我用 dataview 来展示全量的笔记,方便我按日期来看最近更新了哪些笔记。同时我分主题来看最近有哪些笔记,方便对主题进行优化。通过 Dataview函数和属性插件,基本上摆脱物理文件夹的思路,查找文件直接从每个主题去看就行,也方便对每个主题下的文件进行管理。
按日期倒序列出来每天新增的笔记
分主题列出来我有哪些笔记
属性:通常指的是一些可以管理、展示或操作笔记属性(如元数据、标签、YAML Frontmatter 等)的插件。这些插件可以帮助用户更高效地组织和利用笔记内容,尤其是在需要对笔记进行分类、查询或动态展示。属性可以在 meta data里面设计,也可以通过 templater 插件对新增笔记进行添加。
信息分类还有很多用法不展开了,例如索引、内外链、tag 等等,核心是让笔记与笔记之间建立联系,把单点的知识串起来,形成一个知识关系图谱,这里解决了知识库管理局部有序的痛点。例如点开搜索增强笔记,我大概能支持这些笔记与哪些笔记相关,哪些笔记是我收集的,哪些是我自己总结的。
3/ 知识库应用
在完成信息收集和分类之后,这里主要介绍一下知识库如何使用AI。
AI配置
通用的解决方案是使用 copilot,copilot 可以接各大厂商的大模型API,我之前用硅基流动,现在用火山引擎,实测下来,还是火山引擎好一些。通过火山引擎能用到豆包、DeepSeek等一系列模型。
硅基流动配置:硅基流动配置Obsidian Copliot
火山引擎配置:火山引擎配置Obsidian Copliot[https://www.zhihu.com/zvideo/1878038640178909185]
Copilot 使用
copilot 有 chat、vaultQA及 copilot plus beta 版本。chat 就是对话模型,我一般不去 DeepSeek 官网了,直接在 chat 里面聊各类问题。vault QA是支持本地知识库回答,限定于知识库回答。beta 版本要付费,支持多模态输入和输出,但是我没用。在写这篇文章的时候,copilot 会显示相关笔记,还挺准的,基本上是与这个主题相关的笔记。
另外无论是 chat 还是 vaultQA都有 Suggested Prompts,如何问好一个问题,是回答好一个问题的关键。我对知识库设定了一些通用的 prompt,例如基于第一性原理,回答相关主题,这些 prompt 都可以存下来,后面反复使用。每次问答的结果都能一键存档,非常方便了。
问题:基于设定的 prompt 框架。
回答:基于知识库内容。
问题&回答:基于本地文档,进行回答。
基于收集的信息,无论是学习新主题还是优化内容,确实能产生意想不到的效果,并且能将内容一键存档,copilot 好用爱用!
写在后面
信息收集不是知识库搭建的目的,打造知识循环利器才是知识库存在的必要,其中最难的是要对抗知识库信息熵增,而Obsidian 的局部功可以让笔记之间形成了关联,同时让知识从收集到输出无缝衔接。
最后的最后,如果是PDF类型的资料,我会倾向用IMA,支持下兄弟部门的产品,所以想清楚需求再选择对应的产品还是很重要的~
AI大模型学习福利
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
大模型&AI产品经理如何学习
求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。
1.学习路线图
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方图片前往获取
3.技术文档和电子书
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
4.LLM面试题和面经合集
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
更多推荐
所有评论(0)