Instructions to use Taisekamo/llm-jp-3-13b-finetune with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Local Apps
- Unsloth Studio new
How to use Taisekamo/llm-jp-3-13b-finetune with Unsloth Studio:
Install Unsloth Studio (macOS, Linux, WSL)
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for Taisekamo/llm-jp-3-13b-finetune to start chatting
Install Unsloth Studio (Windows)
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for Taisekamo/llm-jp-3-13b-finetune to start chatting
Using HuggingFace Spaces for Unsloth
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for Taisekamo/llm-jp-3-13b-finetune to start chatting
Load model with FastModel
pip install unsloth from unsloth import FastModel model, tokenizer = FastModel.from_pretrained( model_name="Taisekamo/llm-jp-3-13b-finetune", max_seq_length=2048, )
Uploaded Model
- Developed by: Taise Kojima
- License: apache-2.0
- Finetuned from model: llm-jp/llm-jp-3-13b
Sample Use
以下は、elyza-tasks-100-TV_0.jsonlのタスクに回答するための推論コードです。このコードはGoogle Colabでの実行を想定しており、Hugging Faceにアップロードされたモデルとアダプタを使用します。推論結果はJSONL形式で出力されます。
必要な準備
elyza-tasks-100-TV_0.jsonlファイルを実行コードと同じディレクトリ階層に配置してください。- 以下のコードをColabセルにコピーして実行してください。
!pip install transformers
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
import json
from tqdm import tqdm
import re
# モデル名の指定
MODEL_NAME = "Taisekamo/llm-jp-3-13b-finetune"
# GPUが利用可能か確認
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")
# トークナイザーとモデルのロード
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME).to(device)
# データセットの読み込み
datasets = []
with open("./elyza-tasks-100-TV_0.jsonl", "r") as f:
item = ""
for line in f:
line = line.strip()
item += line
if item.endswith("}"):
datasets.append(json.loads(item))
item = ""
# モデルによるタスクの推論
results = []
for data in tqdm(datasets):
input = data["input"]
prompt = f"""### 指示
{input}
### 回答
"""
tokenized_input = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)
attention_mask = torch.ones_like(tokenized_input)
with torch.no_grad():
outputs = model.generate(
tokenized_input,
attention_mask=attention_mask,
max_new_tokens=100,
do_sample=False,
repetition_penalty=1.2,
pad_token_id=tokenizer.eos_token_id
)[0]
output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)
results.append({"task_id": data["task_id"], "input": input, "output": output})
# 推論結果をJSONLファイルとして保存
jsonl_id = re.sub(".*/", "elyza-tasks-100-TV_0", "elyza-tasks-100-TV_0.jsonl")
with open(f"./{jsonl_id}-outputs.jsonl", 'w', encoding='utf-8') as f:
for result in results:
json.dump(result, f, ensure_ascii=False) # ensure_ascii=False for handling non-ASCII characters
f.write('\n')
実行結果
このコードを実行すると、elyza-tasks-100-TV_0-outputs.jsonlというファイルが生成され、各タスクの結果が保存されます。
JSONL形式のデータは、以下のような形式で出力されます:
{
"task_id": "001",
"input": "タスクの指示文",
"output": "モデルの生成した回答"
}
このようにして、ELYZA-tasks-100-TVタスクに対する成果物を得ることができます。
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
Model tree for Taisekamo/llm-jp-3-13b-finetune
Base model
llm-jp/llm-jp-3-13b