{"data":{"kind":"file","path":"README.md","version_id":"zutgxxkhcf7scnfhr2h848jv","entry":{"name":"README.md","path":"README.md","is_directory":false,"size":1367,"modified_at":"2026-01-04T05:08:18.368000","content_hash":"17f06bb1c58190f12a0273a47f877a9c787aaad763c70c610e09aff326b8468e"},"entries":[],"content":"# reasoning-core-env\n\n### Overview\n- **Environment ID**: `reasoning-core-env`\n- **Short description**: Single-turn evaluation over `reasoning_core` procedural tasks with XML formatting.\n- **Tags**: reasoning, procedural, single-turn, xml, synthetic\n\n### Datasets\n- **Primary dataset(s)**: Generated via [reasoning_core](https://github.com/sileod/reasoning_core)\n- **Source links**: `reasoning_core` library\n- **Split sizes**: Configurable counts for train/eval via loader args\n\n### Task\n- **Type**: single-turn\n- **Parser**: `ThinkParser()`\n- **Rubric overview**: Score computed via `reasoning_core` task-specific scorer; optional format component\n\n### Quickstart\nRun an evaluation with default settings:\n\n```bash\nuv run vf-eval reasoning-core-env\n```\n\nConfigure model and sampling:\n\n```bash\nuv run vf-eval reasoning-core-env   -m gpt-4.1-mini   -n 20 -r 3 -t 1024 -T 0.7   -a '{\"key\": \"value\"}'  # env-specific args as JSON\n```\n\nNotes:\n- Use `-a` / `--env-args` to pass environment-specific configuration as a JSON object.\n\n### Environment Arguments\n\n| Arg | Type | Default | Description |\n| --- | ---- | ------- | ----------- |\n| `max_examples` | int | `-1` | Limit on dataset size (use -1 for all) |\n\n### Metrics\n\n| Metric | Meaning |\n| ------ | ------- |\n| `reward` | Main scalar reward (weighted sum of criteria) |\n| `accuracy` | Exact match on target answer |\n\n","encoding":"utf-8","truncated":false,"total_bytes":1367},"status":null}