归档: 2023/11 | zezepath

zezepath

本站致力于IT相关技术的分享

2023

问题的起点非常明确：我们需要为一个包含数百万文档的语料库构建语义相似性检索功能。每个文档通过一个高维稀疏向量表示，维度高达50万，由TF-IDF模型生成。在这样的维度下，一个常规的 NumPy 稠密矩阵是完全不可行的——仅100万个文档就需

2023-11-20 数据工程

SciPy Pinecone BASE 构建与工具