Embeddings和向量数据库#

学习内容#

1. 基于内容的推荐#

  • 什么是N-Gram
  • 余弦相似度计算
  • 为酒店建立内容推荐系统

2. Word Embedding#

  • 什么是Embedding
  • Word2Vec进行词向量训练

3. 向量数据库#

  • FAISS, Milvus, Pinecone的特点
  • 向量数据库与传统数据库的对比

4. Faiss工具使用#

  • 文本抄袭自动检测分析
  • 使用DeepSeek + Faiss搭建本地知识库检索

学习收获#

  • 掌握Embedding核心原理与应用
  • 理解N-Gram、词向量(Word2Vec)和余弦相似度等核心概念
  • 了解掌握FAISS、Milvus、Pinecone等向量数据库的特点及适用场景
  • 通过酒店内容推荐系统、文本抄袭检测等案例,学会基于Embedding和向量数据库构建实际应用