向量存储系统(Vector Store)选型与应用指南

1. 概述向量存储系统(Vector Store)是基于大语言模型(LLM)应用的核心组件之一,负责将文本数据转换为向量表示并进行存储和检索。在检索增强生成(RAG)系统中,向量存储系统直接影响问答质量和系统性能。 向量存储系统主要承担以下职责: ...

大模型

文本嵌入模型(Embedding Model)选型与应用指南

1. 概述文本嵌入模型(Embedding Model)是检索增强生成(RAG)系统和各类自然语言处理应用中的核心组件,负责将文本转换为高维向量表示。这些向量表示能够捕捉文本的语义信息,使得语义相似的文本在向量空间中距离更近。 在RAG系统中,嵌入模...

大模型

文本分割器(Text Splitters)选型与应用指南

1. 概述在检索增强生成(RAG)系统、文档处理系统以及其他基于大语言模型(LLM)的应用中,文本分割器(Text Splitter)是关键组件之一。它负责将长文档按照特定策略切分为更小的语义单元,这些单元随后会被转换为向量表示并存储在向量数据库中。...

大模型

Kubernetes Operator 介绍与使用

介绍什么是 CRD?首先我们需要知道第一个概念就是 CRD,CRD 全称 Custom Resource Definition,是 Kubernetes 提供的一种 API 扩展机制,允许用户定义新的资源类型。通过 CRD,你可以像使用原生资源(如 ...

K8s

LangChain学习笔记

什么是LangChain?LangChain 是一个开源的语言模型工具链框架,旨在使研究人员和开发人员能够更轻松地构建、实验和部署以自然语言处理(NLP)为中心的应用程序。它提供了多种组件和工具,可帮助用户利用最近的语言模型进展,如大型 Transf...

大模型

使用Ollama大模型打造专属本地知识库

在进行本地知识库的搭建实操之前,我们需要先对RAG有一个大概的了解。 什么是 RAG 技术检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 ...

大模型

Ollama大模型本地部署教程

前提条件 一台Linux服务器 安装完docker 安装完Anaconda 安装Ollama 启动 ollama 1docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollam...

使用Gradio调用通义千问实现一个chatbot机器人

准备 一台云服务器,安装python及dashscope、dotenv和gradio库 开通模型服务灵积,申请API_KEY 编码12345678910111213141516171819202122232425262728293031323334...

大模型

Docker搭建PostgreSQL一主二从架构

前提条件3台服务器并安装Docker 配置PostgreSQL主节点 远程连接PostgreSQL主节点,依次运行以下命令,安装PostgreSQL。 输入mkdir postgresql命令,创建postgresql文件夹。 输入cd post...

Docker

记一次解决iframe嵌入网页无法免登录

问题场景开发一个配合外部系统的一个子系统过程中,外部系统需要实现“一网通管”且通过单点登录方式实现免登录。目前通过外部系统传来sso_token信息,子系统返回一个重定向的response,外部系统在新标签打开是可以访问子系统的数据看板页面。在外部系...

安全与运维
1236