频率增强Self-Consistency

1. 频率增强Self-ConsistencySelf-Consistency的步骤如下: 多次生成:对同一个问题进行多次推理。每次推理的结果可能略有不同,通过多次生成可以覆盖更多可能的答案。 结果汇总:对每次推理的结果进行汇总,统计每个答案的出现频率。常见的答案通常是正确的,通过频率统计可以找到最可能的正确答案。 最终答案选择:选择出现频率最高的答案作为最终的推理结果。通过这种方式,可以...

CoT & ToT

1. 思维链(Chain of Thought,CoT)2. 树状思维链(Tree of Thought,ToT) ToT的核心优势包括: 多方向探索:利用树状结构,同时评估多个思维路径,避免了CoT单一线性路径的局限。 系统化搜索:在复杂问题空间中系统地遍历各种可能路径,确保找到最优解。

ReAct(推理-行动-观察)

1. ReAct(推理-行动-观察) LLaMA 3在多步推理中的流程大致可分为以下几个步骤: 推理(Thought):模型在执行每个行动时,基于已有知识和当前环境信息进行推理,以决定下一步的行动。 工具调用(Act):模型根据推理结果调用外部工具,并执行相关操作。 观察(Obs):模型在行动后观察结果,并分析这些结果与预期之间的差异。 1.1 代码1234567891011121314...

RAG

1. 朴素RAG的基本流程 文档分割 文档分割是RAG流程的起点,其目标是将大块的文档拆分成可管理的小片段。分割方式通常基于文本长度、段落、句子结构或者逻辑结构。例如: 固定长度分割:将文档按照字符或词汇数量分割成固定大小的块。 逻辑分割:基于语义或文档的段落、章节等自然分界线,保持片段的逻辑连贯性。 分割文档主要是为了便于后续的嵌入生成和检索。过大或者过小的片段都会影响嵌入质量和检索效...

对话系统

1. ChatGPT 客服对话1.1 代码123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051import ollama# 创建指向本地服务器的客户端client = ollama.Client(host='http://192.168.100.13...

LLama3本地大模型初体验

借助ollama调用llama3本地大模型 模型拉取: 1. 文章续写代码: 1234567891011121314151617181920212223242526272829303132import ollama# 1. 配置远程 Ollama 服务器地址# 格式: http://<your_server_ip>:<port>ollama_client = o...

借助魔搭社区运行llama3本地模型

1. 魔搭社区可以看到可以长期使用一个8c 32g的py环境,就想着把本地调试的工作放到社区提供的环境上。 2. 使用2.1 下载模型1234567import torchfrom modelscope import snapshot_downloadfrom transformers import AutoModelForCausalLM, AutoTokenizer# 下载模型cach...

Dify实战教程

1. 背景 2. 发展、应用、场景 3. 智能体工作原理 4. 核心元素 5. 主流智能体框架 6. 赋能各行业解析 7. AI Agent + 硬件 8. dify私有化部署借助sealos【云端容器化平台】一键部署 9. 接入deepseek 10. dify基础介绍三类应用: 探索(别人搭建好的不同类型的智能体): 知识库: tools(调用外部工具的能力): 11. 案例...

私有化部署dify

1. 环境准备操作系统:CentOS Linux release 7.4.1708 (Core) Docker版本:Docker version 26.1.4, build 5650f9b 2. 部署2.1 拉取镜像并启动12345678910111213141516171819202122232425[root@dify ~]# cd /opt/module/dify/[root@dif...

软件安装

LangChain构建RAG问答系统

0. 前沿0.1 实验目的项目名称:“易速鲜花”内部员工知识库问答系统。 项目介绍:“易速鲜花”作为一个大型在线鲜花销售平台,有自己的业务流程和规范,也拥有针对员工的SOP手册。新员工入职培训时,会分享相关的信息。但是,这些信息分散于内部网和HR部门目录各处,有时不便查询;有时因为文档过于冗长,员工无法第一时间找到想要的内容;有时公司政策已更新,但是员工手头的文档还是旧版内容。 基于上述需求...

1234513

本站由 卡卡龙 使用 Stellar 1.29.1主题创建

本站访问量 次. 本文阅读量 次.