Uploaded Model

Developed by: Taise Kojima
License: apache-2.0
Finetuned from model: llm-jp/llm-jp-3-13b

Sample Use

以下は、elyza-tasks-100-TV_0.jsonlのタスクに回答するための推論コードです。このコードはGoogle Colabでの実行を想定しており、Hugging Faceにアップロードされたモデルとアダプタを使用します。推論結果はJSONL形式で出力されます。

必要な準備

elyza-tasks-100-TV_0.jsonlファイルを実行コードと同じディレクトリ階層に配置してください。
以下のコードをColabセルにコピーして実行してください。

!pip install transformers

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
import json
from tqdm import tqdm
import re

# モデル名の指定
MODEL_NAME = "Taisekamo/llm-jp-3-13b-finetune"

# GPUが利用可能か確認
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

# トークナイザーとモデルのロード
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME).to(device)

# データセットの読み込み
datasets = []
with open("./elyza-tasks-100-TV_0.jsonl", "r") as f:
    item = ""
    for line in f:
        line = line.strip()
        item += line
        if item.endswith("}"):
            datasets.append(json.loads(item))
            item = ""

# モデルによるタスクの推論
results = []
for data in tqdm(datasets):
    input = data["input"]

    prompt = f"""### 指示
    {input}
    ### 回答
    """

    tokenized_input = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)
    attention_mask = torch.ones_like(tokenized_input)

    with torch.no_grad():
        outputs = model.generate(
            tokenized_input,
            attention_mask=attention_mask,
            max_new_tokens=100,
            do_sample=False,
            repetition_penalty=1.2,
            pad_token_id=tokenizer.eos_token_id
        )[0]
    output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)

    results.append({"task_id": data["task_id"], "input": input, "output": output})

# 推論結果をJSONLファイルとして保存
jsonl_id = re.sub(".*/", "elyza-tasks-100-TV_0", "elyza-tasks-100-TV_0.jsonl")
with open(f"./{jsonl_id}-outputs.jsonl", 'w', encoding='utf-8') as f:
    for result in results:
        json.dump(result, f, ensure_ascii=False)  # ensure_ascii=False for handling non-ASCII characters
        f.write('\n')

実行結果

このコードを実行すると、elyza-tasks-100-TV_0-outputs.jsonlというファイルが生成され、各タスクの結果が保存されます。

JSONL形式のデータは、以下のような形式で出力されます：

{
    "task_id": "001",
    "input": "タスクの指示文",
    "output": "モデルの生成した回答"
}

このようにして、ELYZA-tasks-100-TVタスクに対する成果物を得ることができます。

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Taisekamo/llm-jp-3-13b-finetune

Base model

llm-jp/llm-jp-3-13b

Finetuned

(1081)

this model