逐水寻源

路漫漫其修远兮

VLDB 2024广州之旅

Tim 发布于 2024-09-23 收录于经历分享

体验VLDB 2024学术会议的精彩瞬间，品味广州的美食盛宴，领略岭南文化的独特魅力。从现代化的都市到充满历史韵味的角落，探索一座包容开放的城市。

数据枯竭危机：AI发展面临的数据瓶颈与应对措施

Tim 发布于 2024-08-21 收录于大语言模型

AI的发展依赖于大量数据，互联网中的高质量文本数据正在逐渐耗尽，AI行业面临“数据墙”的挑战。本文探讨了当前的应对策略——从数据质量提升、合成数据的使用，到模型微调和强化学习。了解如何突破数据瓶颈，确保AI的持续发展。

微调GPT-4o-Mini生成博客文章

Tim 发布于 2024-07-24 收录于大语言模型

本文详解微调、提示词和思维链技术的应用场景，并以生成博客文章为例，提供准备数据、微调模型和评估结果的具体步骤。通过在线接口微调OpenAI最新发布的GPT-4o-mini模型，其性能接近GPT-4，价格仅为GPT-3.5的一半。

在实现通用人工智能（AGI）的过程中，AI Agent智能体的设计模式扮演着重要角色。与传统的AI方法不同，Agent允许AI在任务执行过程中进行多次修改，并借助外部工具和合作伙伴。这种灵活性使Agent成为2024年实现AGI的一条重要路径。本文结合吴恩达在红衫AI峰会的演讲和近一年的研究论文，整理了16种AI Agent设计模式，并将其归纳为四大设计范式：反思、工具使用、规划和多智能体协作。反思范式包括基本反思、Reflexion Actor和LATS等模式，通过自我反思和外部反馈来提高智能体的推理和决策能力。工具使用范式强调通过调用外部工具来增强智能体的功能。规划范式中的ReAct和Plan and Execute方法，分别通过结合推理与行动和制定多步骤计划来提高智能体的灵活性和适应性。多智能体协作范式则通过监管和分层团队的方式，协调多个智能体共同完成复杂任务。这些设计模式为AI Agent的开发提供了理论基础和实践指导，帮助开发者更好地利用基础模型实现任务自动化和智能化。尽管Agent是一种有希望的AGI实现方式，但它并不是唯一的方法。Agent可以与其他技术，如RAG和用户参与相结合，以实现更复杂的任务解决方案。

向量数据库对比:Weaviate、Milvus和Qdrant

Tim 发布于 2024-04-02 收录于大语言模型和 RAG检索增强生成

RAG系统的成功在于其高效处理海量信息的能力，而向量数据库是其核心。向量数据库将文本、图像等数据转换为向量并存储，影响RAG系统的最终效果。选择合适的向量数据库需考虑开源性、CRUD支持、分布式架构等因素。Weaviate、Milvus、Qdrant、Vespa和Pinecone是当前热门的专用向量数据库。向量库如FAISS、HNSWLib、ANNOY主要用于存储静态数据，不支持CRUD操作。全文搜索数据库如ElasticSearch在处理高维数据时不如向量数据库强大。支持向量的SQL数据库如pgvector在处理大量向量数据时性能不佳，而NoSQL数据库的向量支持功能尚在初级阶段。专用向量数据库支持多种向量运算，采用近似最近邻算法，平衡效率、存储和准确性。Pinecone、Chroma、Vearch和Vald各有优缺点，Weaviate、Milvus、Qdrant和Vespa是RAG的最佳选择。Milvus支持多向量搜索，适合复杂情况；Weaviate支持混合搜索和生成式搜索；Qdrant支持关键词过滤应用于向量搜索。选择向量数据库需基于性能和可扩展性基准测试，同时考虑系统设计和功能特点。

从AI知识库到RAG

Tim 发布于 2024-03-21 收录于大语言模型和 RAG检索增强生成

在AI应用开发中，模型常常面临数据不足的问题，导致无法准确处理特定任务。检索增强生成技术（RAG）通过检索外部资料来提高生成式AI模型的准确性和可靠性。RAG技术的出现是为了解决大语言模型在应用时的幻觉问题，即输出与事实不符或编造答案的问题。通过RAG，模型可以访问最新或自定义的资料，并允许用户验证信息来源，确保准确性。RAG的基本组成包括索引、检索和生成三个阶段。首先，用户上传文档，系统通过Embedding将文档存储到向量数据库中。当用户提问时，问题会被转换为向量并在数据库中匹配，进行初步检索。接着，Rerank模型对检索结果进行重排序，输出相关性最高的结果用于生成阶段。构建AI知识库的方式包括提示词工程、微调和嵌入，其中嵌入是最主流的方式，并需要结合RAG才能发挥作用。开源的RAG实现如Dify和Langchain-Chatchat提供了不同的功能支持，帮助开发者构建高效的AI应用。

VLDB 2024广州之旅

数据枯竭危机：AI发展面临的数据瓶颈与应对措施

微调GPT-4o-Mini生成博客文章

AI Agent智能体四类设计模式：通用人工智能必经之路

向量数据库对比:Weaviate、Milvus和Qdrant

从AI知识库到RAG