Embeddings和向量数据库#
学习内容#
1. 基于内容的推荐#
- 什么是N-Gram
- 余弦相似度计算
- 为酒店建立内容推荐系统
2. Word Embedding#
- 什么是Embedding
- Word2Vec进行词向量训练
3. 向量数据库#
- FAISS, Milvus, Pinecone的特点
- 向量数据库与传统数据库的对比
4. Faiss工具使用#
- 文本抄袭自动检测分析
- 使用DeepSeek + Faiss搭建本地知识库检索
学习收获#
- 掌握Embedding核心原理与应用
- 理解N-Gram、词向量(Word2Vec)和余弦相似度等核心概念
- 了解掌握FAISS、Milvus、Pinecone等向量数据库的特点及适用场景
- 通过酒店内容推荐系统、文本抄袭检测等案例,学会基于Embedding和向量数据库构建实际应用