codefuse-admin

upload model from ant-group,shanshuo.ss@antgroup.com

ed69c50 over 2 years ago

4.43 kB

	<div align="center">
	<h1>
	DevOps-Model-7B-Base
	</h1>
	</div>

	<p align="center">
	🤗 <a href="https://huggingface.co/codefuse-ai" target="_blank">Hugging Face</a> •
	🤖 <a href="https://modelscope.cn/organization/codefuse-ai" target="_blank">ModelScope</a>
	</p>

	DevOps-Model 是一个开发运维大模型，主要致力于在 DevOps 领域发挥实际价值。目前，DevOps-Model 能够帮助工程师回答在 DevOps 生命周期中遇到的问题。欢迎访问我们 Github 获取更多信息 [DevOps-Model](https://github.com/codefuse-ai/CodeFuse-DevOps-Model)

	DevOps-Model-7B-Base 是我们经过高质量 DevOps 语料训练基于 Qwen-7B 加训后的 Base 模型。我们的 Base 模型在开源和 DevOps 领域相关的评测数据上可以取得同规模模型中的最佳效果。同时我们也开源了经过对齐后的 [DevOps-Model-7B-Chat](https://modelscope.cn/models/codefuse-ai/CodeFuse-DevOps-Model-7B-Chat/summary) 模型，和 14B 参数量的[DevOps-Model-14B-Base](https://modelscope.cn/models/codefuse-ai/CodeFuse-DevOps-Model-14B-Base/summary) 和 [DevOps-Model-14B-Chat](https://modelscope.cn/models/codefuse-ai/CodeFuse-DevOps-Model-14B-Chat/summary) 。
	<br>
	同时我们也在搭建 DevOps 领域专属的评测基准 [DevOpsEval](https://github.com/luban-agi/DevOps-Eval)，用来更好评测 DevOps 领域模型的效果。

	<br>
	<br>

	# 模型评测
	我们先选取了 CMMLU 和 CEval 两个评测数据集中和 DevOps 相关的一共六项考试。总计一共 574 道选择题，具体信息如下：

	\| 评测数据集 \| 考试科目 \| 题数 \|
	\|-------\|-------\|-------\|
	\| CMMLU \| Computer science \| 204 \|
	\| CMMLU \| Computer security \| 171 \|
	\| CMMLU \| Machine learning \| 122 \|
	\| CEval \| College programming \| 37 \|
	\| CEval \| Computer architecture \| 21 \|
	\| CEval \| Computernetwork \| 19 \|

	我们分别测试了 Zero-shot 和 Five-shot 的结果，我们的 DevOps-Model-7B-Base 模型可以在测试的同规模的开源 Base 模型中取得最高的成绩，后续我们也会进行更多的测试。

	\|模型\|模型大小\|Zero-shot 得分\|Five-shot 得分\|
	\|--\|--\|--\|--\|
	\|DevOps-Model-7B-Base\|7B\|62.72\|62.02\|
	\|Qwen-7B-Base\|7B\|55.75\|56.0\|
	\|Baichuan2-7B-Base\|7B\|49.30\|55.4\|
	\|Internlm-7B-Base\|7B\|47.56\|52.6\|



	<br>

	# 快速使用
	我们提供简单的示例来说明如何利用 🤗 Transformers 快速使用 Devops-Model-7B-Base 模型

	## 要求
	- python 3.8 及以上版本
	- pytorch 2.0 及以上版本
	- 建议使用CUDA 11.4及以上


	## 依赖项安装
	下载模型后，直接通过以下命令安装 requirements.txt 中的包就可以
	```bash
	cd path_to_download_model
	pip isntall -r requirements.txt
	```

	## 模型推理示例

	```python
	from transformers import AutoModelForCausalLM, AutoTokenizer
	from transformers.generation import GenerationConfig

	tokenizer = AutoTokenizer.from_pretrained("path_to_DevOps-Model-7B-Base", trust_remote_code=True)

	model = AutoModelForCausalLM.from_pretrained("path_to_DevOps-Model-7B-Base", device_map="auto", trust_remote_code=True, bf16=True).eval()

	# 指定 generation_config
	model.generation_config = GenerationConfig.from_pretrained("path_to_DevOps-Model-7B-Base", trust_remote_code=True)

	inputs = '''Java 中 HashMap 的实现原理是'''
	input_ids = tokenizer(inputs, return_tensors='pt')
	input_ids = input_ids.to(model.device)
	pred = model.generate(**input_ids)

	print(tokenizer.decode(pred[0]))
	# Java 中 HashMap 的实现原理是数组 + 链表，数组存放的是链表中的每个节点，链表中的每个节点又存放着下一个节点的地址，从而实现了链表的遍历。当链表长度大于 8 时，链表就会转换成红黑树，从而加快了查询速度。...
	```



	# 免责声明
	由于语言模型的特性，模型生成的内容可能包含幻觉或者歧视性言论。请谨慎使用 DevOps-Model 系列模型生成的内容。
	如果要公开使用或商用该模型服务，请注意服务方需承担由此产生的不良影响或有害言论的责任，本项目开发者不承担任何由使用本项目（包括但不限于数据、模型、代码等）导致的危害或损失。



	# 致谢
	本项目参考了以下开源项目，在此对相关项目和研究开发人员表示感谢。
	- [LLaMA-Efficient-Tuning](https://github.com/hiyouga/LLaMA-Efficient-Tuning)
	- [Qwen-7B](https://github.com/QwenLM/Qwen-7B/tree/main)