{"data":{"kind":"file","path":"README.md","version_id":"y35y1zc9wuremu73ckhxoskb","entry":{"name":"README.md","path":"README.md","is_directory":false,"size":1263,"modified_at":"2025-09-20T07:47:05.997000","content_hash":"99d9d03915ecae197329adfe2256892d11cebfb7d59bdf649912d363d4e80e52"},"entries":[],"content":"# mcp-env\n\n### Overview\n\n- **Environment ID**: `mcp-env`\n- **Short description**: MCP Environment\n- **Tags**: MCP, Tools\n\n### Datasets\n\n- **Primary dataset(s)**: N/A\n- **Source links**: N/A\n- **Split sizes**: N/A\n\n### Task\n\n- **Type**: <multi-turn | tool use>\n- **Parser**: N/A\n- **Rubric overview**: N/A\n\n### Quickstart\n\nRun an evaluation with default settings:\n\n```bash\nuv run vf-eval mcp-env\n```\n\nConfigure model and sampling:\n\n```bash\nuv run vf-eval mcp-env   -m gpt-4.1-mini   -n 1 -r 1\n```\n\nNotes:\n\n- Use `-a` / `--env-args` to pass environment-specific configuration as a JSON object.\n\n### Environment Arguments\n\nDocument any supported environment arguments and their meaning. Example:\n\n| Arg            | Type | Default | Description                            |\n| -------------- | ---- | ------- | -------------------------------------- |\n| `max_examples` | int  | `-1`    | Limit on dataset size (use -1 for all) |\n\n### Metrics\n\nSummarize key metrics your rubric emits and how they’re interpreted.\n\n| Metric     | Meaning                                       |\n| ---------- | --------------------------------------------- |\n| `reward`   | Main scalar reward (weighted sum of criteria) |\n| `accuracy` | Exact match on target answer                  |\n","encoding":"utf-8","truncated":false,"total_bytes":1263},"status":null}