forgeenv-source / forgeenv /roles /drift_generator.py

forgeenv source snapshot for training job

a15535e verified 13 days ago

6.2 kB

	"""Drift Generator parser + a deterministic baseline policy.

	In training the LLM produces a JSON breakage spec; we parse it. In rollouts
	where we want a baseline (or a fallback when the LLM emits malformed JSON)
	we use `BaselineDriftGenerator`, which samples from the per-category set of
	known good primitive parameterisations.
	"""
	from __future__ import annotations

	import json
	import random
	import re
	from dataclasses import dataclass
	from typing import Optional

	from forgeenv.primitives.breakage_primitives import (
	PRIMITIVE_REGISTRY,
	parse_breakage_spec,
	BreakagePrimitive,
	)


	_JSON_RE = re.compile(r"\{[\s\S]*\}")


	def parse_drift_output(text: str) -> Optional[dict]:
	"""Extract a JSON object from possibly-noisy LLM output.

	Handles markdown fences, prose preamble, trailing commas (best-effort).
	Returns None on failure.
	"""
	if not text:
	return None
	text = text.strip()
	if text.startswith("```"):
	text = re.sub(r"^```[a-zA-Z]*\n?", "", text)
	text = re.sub(r"\n?```$", "", text)
	match = _JSON_RE.search(text)
	if not match:
	return None
	blob = match.group(0)
	try:
	return json.loads(blob)
	except json.JSONDecodeError:
	cleaned = re.sub(r",\s*([}\]])", r"\1", blob)
	try:
	return json.loads(cleaned)
	except json.JSONDecodeError:
	return None


	def parse_drift_to_primitive(text: str) -> Optional[BreakagePrimitive]:
	"""End-to-end: LLM text -> validated BreakagePrimitive (or None)."""
	data = parse_drift_output(text)
	if not isinstance(data, dict):
	return None
	try:
	return parse_breakage_spec(data)
	except (ValueError, TypeError):
	return None


	# ---------------------------------------------------------------- baselines
	_DEFAULT_PARAMS_BY_TYPE: dict[str, list[dict]] = {
	"RenameApiCall": [
	{"old_name": "trainer.train", "new_name": "trainer.start_training"},
	{"old_name": "save_pretrained", "new_name": "save_to_hub"},
	{"old_name": "from_pretrained", "new_name": "load_from_hub"},
	],
	"DeprecateImport": [
	{
	"old_module": "from transformers import Trainer",
	"new_module": "from transformers.legacy import Trainer",
	},
	{
	"old_module": "from transformers import TrainingArguments",
	"new_module": "from transformers.training import TrainingArguments",
	},
	],
	"ChangeArgumentSignature": [
	{
	"function_name": "TrainingArguments",
	"removed_arg": "num_train_epochs",
	"added_arg": "max_steps",
	"added_value": "1000",
	},
	{
	"function_name": "TrainingArguments",
	"removed_arg": "evaluation_strategy",
	"added_arg": "eval_strategy",
	"added_value": '"steps"',
	},
	],
	"ModifyConfigField": [
	{"config_class": "TrainingArguments", "field_name": "learning_rate", "new_value": "5e-3"},
	{"config_class": "TrainingArguments", "field_name": "per_device_train_batch_size", "new_value": "1"},
	],
	"RestructureDatasetSchema": [
	{"old_column": "text", "new_column": "input_text"},
	{"old_column": "label", "new_column": "labels"},
	{"old_column": "tokens", "new_column": "words"},
	],
	"ChangeTokenizerBehavior": [
	{"old_kwarg": "padding", "old_value": "True", "new_kwarg": "pad_to_max_length", "new_value": "True"},
	{"old_kwarg": "truncation", "old_value": "True", "new_kwarg": "truncate", "new_value": "True"},
	],
	"RemoveDeprecatedMethod": [
	{"class_name": "Trainer", "method_name": "evaluate", "replacement": "evaluation_loop"},
	{"class_name": "Trainer", "method_name": "save_model", "replacement": "save_to_hub"},
	],
	"ChangeReturnType": [
	{"function_name": "Trainer.predict", "old_access": ".predictions", "new_access": "[0]"},
	{"function_name": "tokenizer", "old_access": '["input_ids"]', "new_access": ".input_ids"},
	],
	}


	@dataclass
	class BaselineDriftGenerator:
	"""Deterministic stand-in for the LLM Drift Generator.

	Used for warm-start data, baseline rollouts, and unit tests.
	"""

	seed: Optional[int] = None

	def __post_init__(self) -> None:
	self._rng = random.Random(self.seed) if self.seed is not None else random

	def propose(
	self, target_category: str = "", script: str = ""
	) -> dict:
	"""Produce a JSON-serializable breakage spec for `target_category`.

	Order of preference:
	1. A primitive of `target_category` whose default params apply to `script`.
	2. A primitive of any type whose default params apply to `script`.
	3. A primitive of `target_category` (no-op fallback).
	"""

	preferred_types = (
	[target_category] if target_category in _DEFAULT_PARAMS_BY_TYPE else []
	)
	all_types = list(_DEFAULT_PARAMS_BY_TYPE.keys())

	for type_set in (preferred_types, all_types):
	shuffled = self._rng.sample(type_set, len(type_set)) if type_set else []
	for ptype in shuffled:
	for params in self._rng.sample(
	_DEFAULT_PARAMS_BY_TYPE[ptype],
	len(_DEFAULT_PARAMS_BY_TYPE[ptype]),
	):
	if self._params_apply_to_script(ptype, params, script):
	return {"primitive_type": ptype, "params": dict(params)}

	ptype = preferred_types[0] if preferred_types else all_types[0]
	return {
	"primitive_type": ptype,
	"params": dict(_DEFAULT_PARAMS_BY_TYPE[ptype][0]),
	}

	@staticmethod
	def _params_apply_to_script(ptype: str, params: dict, script: str) -> bool:
	"""Heuristic: would this primitive actually mutate `script`?"""
	if not script:
	return True
	for key in ("old_name", "old_module", "removed_arg", "field_name", "old_column", "old_kwarg", "method_name", "old_access"):
	if key in params and params[key] and params[key] in script:
	return True
	return False