
CodeShell-北京大学开源的代码大模型
CodeShell是什么?
CodeShell是北京大学知识计算实验室联合四川天府银行AI团队研发的多语言代码大模型基座。CodeShell具有70亿参数,在五千亿Tokens进行了训练,上下文窗口长度为8192。在权威的代码评估Benchmark(HumanEval与MBPP)上,CodeShell取得同等规模最好的性能。
本次开源的模型如下:
- CodeShell Base:CodelShell底座模型,具有强大的代码基础能力。
- CodeShell Chat:CodelShell对话模型,在代码问答、代码补全等下游任务重性能优异。
- CodeShell Chat 4bit:CodelShell对话模型4bit量化版本,在保证模型性能的前提下内存消耗更小,速度更快。
- CodeShell CPP:CodelShell对话模型CPP版本,支持开发者在没有GPU的个人电脑中使用。注意,CPP版本同样支持量化操作,用户可以在最小内存为8G的个人电脑中运行CodeShell。
CodeShell主要特性
- 强大的性能:CodelShell在HumanEval和MBPP上达到了7B代码基座大模型的最优性能
- 完整的体系:除了代码大模型,同时开源IDE(VS Code与JetBrains)插件,形成开源的全栈技术体系
- 轻量化部署:支持本地C++部署,提供轻量快速的本地化软件开发助手解决方案
- 全面的评测:提供支持完整项目上下文、覆盖代码生成、代码缺陷检测与修复、测试用例生成等常见软件开发活动的多任务评测体系(即将开源)
- 高效的训练:基于高效的数据治理体系,CodeShell在完全冷启动情况下,只训练了五千亿Token即获得了优异的性能
如何使用CodeShell?
CodeShell系列模型已经上传至 Hugging Face,开发者可以通过Transformers快速调用CodeShell和CodeShell-Chat。
在开始之前,请确保已经正确设置了环境,并安装了必要的代码包,以及满足上一小节的环境要求。你可以通过下列代码快速安装相关依赖。
pip install -r requirements.txt
接下来你可以通过Transformers使用CodeShell。
数据评估
关于CodeShell-北京大学开源的代码大模型特别声明
本站做视频AI导航网提供的CodeShell-北京大学开源的代码大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由做视频AI导航网实际控制,在2023年11月7日 下午5:23收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,做视频AI导航网不承担任何责任。
相关导航

天工 — 双千亿级大语言模型官网入口网址,天工 — 双千亿级...

Stable Code Instruct 3B:Stability AI推出的代码语言模型
Stable Code Instruct 3B是St...

达观数据·曹植GPT
专注于长文本处理的AI大语言模型达观数据·曹植GPT官网入口...

Hyper-SD:高效图像合成技术领航者
Hyper-SD是一种用于高效图像合成的轨迹分段一致性模型...

Bing AI
Bing是一款功能强大的搜索引擎,提供图片搜索、视频搜索、购...

度小满轩辕金融大模型
度小满轩辕金融大模型官网入口网址,轩辕是国内首个开源的千亿级...

AnythingLLM 本地AI知识库
AnythingLLM | The ultimate AI ...

MovieLLM-通过AI生成电影来增强长视频理解的框架
MovieLLM 是一个由复旦大学和...
暂无评论...