bert-base-uncased-Hugging Face

微草AIGC录1年前 (2024)发布 873b2a563b3acc92

BERT是一个transformers模型，它是在一个大型英文语料库上进行自监督预训练的。这意味着它仅在原始文本上进行预训练，没有任何人类以任何方式对其进行标注（这就是为什么它可以使用大量公开可用的数据、，并使用自动过程从这些文本中生成输入和标签。更准确地说，它是通过两个目标进行预训练的：

掩码语言建模（MLM、：将一个句子，模型随机屏蔽输入中15％的单词，然后将整个屏蔽的句子通过模型运行，并预测屏蔽的单词。这与传统的递归神经网络（RNN、不同，后者通常一个接一个地看到单词，或者与GPT这样的自回归模型内部屏蔽未来的标记。它允许模型学习句子的双向表示。

下一句预测（NSP、：模型在预训练期间将两个掩码句子连接在一起作为输入。有时它们对应于原始文本中相邻的句子，有时则不是。然后，模型必须预测这两个句子是否相互跟随。

通过这种方式，模型学习了英语语言的内部表示，然后可以用于提取对下游任务有用的特征：例如，如果您有一个标记的句子数据集，您可以使用BERT模型生成的特征作为输入来训练标准分类器。
本文URL：https://www.ainavpro.com/sites/2559.html

收录说明：
1、本网页并非 bert-base-uncased-Hugging Face 官网网址页面，此页面内容编录于互联网，只作展示之用；
2、如果有与 bert-base-uncased-Hugging Face 相关业务事宜，请访问其网站并获取联系方式；
3、本站与 bert-base-uncased-Hugging Face 无任何关系，对于 bert-base-uncased-Hugging Face 网站中的信息，请用户谨慎辨识其真伪。
4、本站收录 bert-base-uncased-Hugging Face 时，此站内容访问正常，如遇跳转非法网站，有可能此网站被非法入侵或者已更换新网址，导致旧网址被非法使用,
5、如果你是网站站长或者负责人，不想被收录请邮件删除：i-hu#Foxmail.com （#换@）

前往AI网址导航

# 微草AIGC录 # Fill-Mask # HF自然语言处理

文章版权归作者所有，未经允许请勿转载。

bert-base-uncased-Hugging Face

天才助理

飞书妙记

相关文章