Skip to main content

Hugging Face(拥抱脸)

这个页面介绍了如何在 LangChain 中使用 Hugging Face(包括 Hugging Face Hub)生态系统。 它分为两个部分:安装和设置,以及特定 Hugging Face 包装的参考文档。

安装和设置

如果你想使用 Hugging Face Hub:

  • 使用 pip install huggingface_hub 安装 Hub 客户端库
  • 创建一个 Hugging Face 账户(免费!)
  • 创建一个 访问令牌 并将其设置为环境变量(HUGGINGFACEHUB_API_TOKEN

如果你想使用 Hugging Face Python 库:

  • 使用 pip install transformers 安装用于模型和标记器的库
  • 使用 pip install datasets 安装用于数据集的库

包装器

LLM

有两个 Hugging Face LLM 包装器,一个用于本地流水线,一个用于在 Hugging Face Hub 上托管的模型。 请注意,这些包装器仅适用于支持以下任务的模型:text2text-generationtext-generation

要使用本地流水线包装器:

from langchain.llms import HuggingFacePipeline

要使用在 Hugging Face Hub 上托管的模型的包装器:

from langchain.llms import HuggingFaceHub

有关 Hugging Face Hub 包装器的更详细的演练,请参见 此笔记本

嵌入

有两个 Hugging Face 嵌入包装器,一个用于本地模型,一个用于在 Hugging Face Hub 上托管的模型。 请注意,这些包装器仅适用于 sentence-transformers 模型

要使用本地流水线包装器:

from langchain.embeddings import HuggingFaceEmbeddings

要使用在 Hugging Face Hub 上托管的模型的包装器:

from langchain.embeddings import HuggingFaceHubEmbeddings

有关此的更详细的演练,请参见 此笔记本

标记器

通过 transformers 包,有几个地方可以使用标记器。 默认情况下,它用于计算所有 LLM 的标记数。

您还可以在拆分文档时使用它来计算标记数

from langchain.text_splitter import CharacterTextSplitter
CharacterTextSplitter.from_huggingface_tokenizer(...)

有关此的更详细的演练,请参见 此笔记本

数据集

Hugging Face Hub 有很多优秀的 数据集,可以用来评估您的 LLM 链。

有关如何使用它们进行评估的详细演练,请参见 此笔记本