EE-Silicon-Maid-7B-Slerp.gguf

Slerp

EE-Silicon-Maid-7B is a merge of the following models using LazyMergekit:

🧩 Configuration

slices:
  - sources:
      - model: SanjiWatsuki/Silicon-Maid-7B
        layer_range: [0, 32]
      - model: SanjiWatsuki/Loyal-Macaroni-Maid-7B
        layer_range: [0, 32]
merge_method: slerp
base_model: SanjiWatsuki/Silicon-Maid-7B
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16

💻 Usage

!pip install -qU transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "ND911/EE-Silicon-Maid-7B"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

Downloads last month: 3

GGUF

Model size

7B params

Architecture

llama

Hardware compatibility

We're not able to determine the quantization variants.

View all variants

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for ND911/EE-Silicon-Maid-7B-slerp-gguf

SanjiWatsuki/Loyal-Macaroni-Maid-7B

SanjiWatsuki/Silicon-Maid-7B

Merge model

this model