用户名  找回密码
 立即注册
搜索

傅盛的大模型,只做百亿级,这是为啥

[XinWen.Mobi 原创复制链接分享]
xinwen.mobi 发表于 2024-1-23 06:15:41 | 显示全部楼层 |阅读模式

傅盛的大模型选择只做百亿级,可能是出于以下几个原因:

资源和时间限制:百亿级的模型需要大量的计算资源和时间来训练和优化。如果模型规模过大,可能会超出团队的资源和能力范围,导致训练和优化的难度增加。

数据质量和规模:百亿级的模型需要大量高质量的训练数据来支持其准确性和泛化能力。如果数据规模不够大或数据质量不够高,可能会影响模型的性能。

模型复杂性和稳定性:百亿级的模型通常非常复杂,需要大量的参数和复杂的模型结构来支持其性能。然而,这种复杂性也可能导致模型的不稳定性和过拟合问题。

模型应用场景:百亿级的模型可能更适合某些特定的应用场景,例如自然语言处理、图像识别等。如果模型规模过小,可能无法满足某些应用场景的需求。

因此,傅盛的大模型选择只做百亿级,可能是为了在资源和时间限制下,保证模型的性能和稳定性,并满足特定的应用场景需求。
回复

举报

QQ|手机版|标签|新闻移动网xml|新闻移动网txt|全球新闻资讯汇聚于 - 新闻移动网 ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-5-21 07:06 , Processed in 0.082436 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表