零一万物开源全新Yi-9B模型:代码与数学能力出众,超越多个同类模型
3月7日消息,近日,“零一万物 01AI”官方公众号发布消息,宣布其已成功开源名为Yi-9B的全新模型。该模型被誉为Yi系列中的“理科状元”,在代码和数学能力上展现出卓越实力,成为目前Yi系列模型中的佼佼者。
据悉,Yi-9B模型的实际参数达到了8.8B,默认上下文长度更是高达4K tokens。这款模型在Yi-6B的基础上进行了进一步的训练和优化,使用了0.8T tokens的数据进行精细调整,训练数据截至2023年6月。
在综合能力方面,Yi-9B模型表现出色,超越了众多同尺寸的开源模型,如DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等。在代码能力上,Yi-9B仅次于DeepSeek-Coder-7B,但超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B等众多竞争对手。同时,在数学能力方面,Yi-9B也展现出强大的实力,仅次于DeepSeek-Math-7B,超越了SOLAR-10.7B、Mistral-7B和Gemma-7B等模型。
Yi-9B在常识和推理能力方面也表现出不俗的水平,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相上下。此外,官方还特别强调,无论是Yi-9B(BF 16)还是其量化版Yi-9B(Int8),都能够在消费级显卡上实现轻松部署,大大降低了使用成本,对开发者来说非常友好。 据本站了解,零一万物公司由李开复创新工场董事长兼CEO带队创办,此前已经成功推出了Yi-34B和Yi-6B两个开源大模型。该公司表示,他们对学术研究完全开放,并同步开放免费商用申请,以推动人工智能技术的广泛应用和发展。 |