理解Token和概率

​ 我们在前面”一些概念“中接触过Token,接下来在多介绍一些关于Token以及概率的概念。

​ 我们的模型通过将文本分解为称为Token的更小的单元来处理文本。Token可以是单词、单词块或单个字符。来看下下面的文本以查看它如何被转化为Token的。

token

图-7

​ 像“cat”这样的常见单词是单个Token,而不太常见的单词通常会分解为多个Token。例如,“Butterscotch”翻译为四个Token:“But”、“ters”、“cot”和“ch”。许多Token以空格开头,例如“hello”和“bye”。

​ 什么是概率,给定一些文本,模型会确定接下来最有可能出现的Token。例如,文本“Horses are my favorite”最有可能后面跟着Token是“animal”。

图-8

​ 在这种情况下,temperature参数起到重要作用。如果您使用温度设置为0重复提交这个提示4次,模型将始终选择具有最高概率的 “animal” 作为下一个标记。然而,如果您增加温度,模型将变得更加冒险,会考虑到概率较低的其他标记。

temperature

图-9