计算机自然也可以模拟。
通过大量的人力标注,告诉计算机哪些是斑马线,哪些是路灯,哪些是车辆,区分人和垃圾桶。
李前能够读懂两份文件,它们足够简练,将复杂的知识形象的展现在面前。
这些大量的人工经验反馈给计算机,算法进行比对,就能得出更准确答案,快速分析图像。
此外,还能够人工调整参数权重,以提高回答准确率。
比如计算机分析数字8。
从0-9的数字中,找出数字8。
没有任何经验,计算机可能给出9和6和8三个答案。
人工标注错误的答案,调低9和6的参数,那么下次给出的就是准确答案。
但是,现实生活中的应用,复杂度远不是分辨数字8那样简单。
从静止的街道景物,到一张张图片组成的动态景象,每一秒的计算量都是海量的。
无数的参数在一层又一层的计算中,不停地变化。
计算机计算的过程,产生的那些参数,对于现在的人类来说等同于黑箱,难以研究。
一旦出错,都不知道错在哪里。
因而,调参是一个非常复杂重要的工作。
尤其智辅过于庞大,涉及方方面面。
人的大脑也是一样。
人脑有着几百亿个神经细胞,更多的神经突触。
大脑对人类而言,也是黑箱,思维意识的运转自然神秘无比。
后来,樱花国工程师,提出‘自注意力机制’。
该机制,造就了大语言模型。
使得计算机从识别图像,迈入识别人类语言的阶段。
可以回答问题,推理甚至是学习。
迄今为止,人类积累的所有知识,诞生的全部精神,抽象的数学概念等,都是用语言描述。
而语言的边界,就是世界的边界。
人类不了解认知之外的事情,比如可观测宇宙之外。
宇宙之外又是什么样子?
因为不知道,所以无法用语言描述。
有的人读书多,能够组成更多的词句,所以他思想深刻。
有的人经历得多,面临过各种现实复杂问题并解决,当他遇到新的难题,快速找到问题关键,并想出解决之法。
可以说这个人经验丰富,能力强。
理论而言,世界上所有的一切,都可以使用文字语言描述清楚——除非词穷。
那么大语言模型,是如何认知和使用人类的语言?
阅读到了这里,李前有点儿吃力,他开启通天祗,请教一直静静等待的林朝初和张琳。
林朝初看了眼张琳,张琳道:
“大语言模型使用统计学,推算文字排列组合的概率。”
她接过李前手里的平板,放在茶几上进行演示。
点开浏览器,输入一串文字:
‘这颗星球上最厉害的人是谁?’
“当我点下回车,算法会将这行文字,以单独文字和符号为单位,转化为数列,我们称之为token,token之间以向量连接。”
向量在数学的高维中,可以用空间坐标系表示。
智能模型,输入、计算、输出的计算过程,分为许多个维度。
每一个维度就是一个向量空间。
模型能力,取决于向量空间和向量的数量。
以智辅为例,发展到今天,其拥有近十亿个庞大向量空间,无数的向量。
“向量空间中,每个字词都有相互距离。”
张琳进入讲解模式,紧张消解,更显专业,
“相似的词语,在向量空间中的距离相近,比如玩家李前、游戏、超级地震、蜃景、林宇等,人一旦接触到相关事物,就会进行联想。
比如有人提到今天的蜃景。
假如是国人,他大概首先想到4号蜃景,想到林宇,想到林宇的处境。
如果林宇的处境比较危险,就会想到超级地震,然后想到还有玩家李前,李前可以解决麻烦。”
客厅中,李前正襟危坐,微微蹙眉听讲解,若有所思。
林朝初面带微笑。
李前的反应在预料之外,张琳略略尴尬,继续说道:
“理论来讲,超级地震和林宇间的距离,肯定比你和超级地震之间的距离更近,因为在大众认知中,异常生物消失,而李前非常强大。
林宇却很弱,飞都不会飞,又处在充满未知风险的大海上,随时可能遇到危机,死亡风险大。”
“向量不止有距离,还有夹角。
角度表示向量的相似性,20个蜃景,都很相似,但已经消失的蜃景,比现存的蜃景之间夹角更大。
虽然都是蜃景,但现存的都还在,消失的已经看不到。
因而如4号、7号、12号、13号等,都相近,夹角差不多。
1号蜃景已经消失,与4号、7号的夹角更大。”
“那么现在,我点下回车,计算开始——”
张琳手指点中屏幕上的‘搜索’,计算开始。
这章没有结束,请点击下一页继续阅读!