长文本模型:目前长文本模型采用类似向量数据库的方式来处理长文本 Kimi能力更胜一筹

小小MT4 来源:市场资讯 °C 栏目:MT4电脑版下载

  来源 Gangtise投研

  专家透露,目前阿里和百度的长文本模型采用类似向量数据库的方式来处理长文本,并不能读完200万字的长文本,而是把文章分成各个章节目录后再在目录下找资料;而Kimi则是能全部读完200万字的文本,因此能力更胜一筹。此外,在训练长文本模型时,需要比一般文字模型更大内存的GPU,而在推理时则不需要。