{"data":{"kind":"file","path":"README.md","version_id":"h73vb6qukvcc6hrbla3qpayl","entry":{"name":"README.md","path":"README.md","is_directory":false,"size":1745,"modified_at":"2026-03-07T05:26:57.977000","content_hash":"88105bbb436f2e59da91d38ac03e88f42b8f329a48fd6c06cd3927a7fa559af0"},"entries":[],"content":"# USACO Verifier Environment\n\nA reinforcement learning environment for USACO programming competition problems.\n\n## Installation\n\n```bash\npip install usaco-verifier --extra-index-url https://hub.primeintellect.ai/YOUR_USERNAME/usaco-verifier/\n```\n\nOr install from source:\n```bash\ncd usaco_verifier\npip install -e .\n```\n\n## Usage\n\n```python\nfrom verifiers import load_environment\n\n# Load the environment\nenv = load_environment('usaco-verifier')\n\n# List available problems\nproblems = env.get_problems()\nprint(f\"Available problems: {problems[:5]}...\")\n\n# Reset with a specific problem\nproblem_desc = env.reset(problem_name=problems[0])\nprint(f\"Problem description: {problem_desc[:200]}...\")\n\n# Generate and test code\ncode = '''\nn = int(input().strip())\n# Your solution here\nprint(n * 2)\n'''\n\n# Get reward\nresult = env.step(code)\nprint(f\"Reward: {result.reward}\")\nprint(f\"Passed tests: {result.info['passed']}/{result.info['total']}\")\n```\n\n## Reward Function\n\nLinear reward based on test pass rate:\n- 10/10 tests = 1.0\n- 8/10 tests = 0.8  \n- 0/10 tests = 0.0\n\n## Environment Spec\n\n- **Observation**: Problem description (text)\n- **Action**: Python code solution\n- **Reward**: Linear (passed/total)\n- **Episode Length**: Until all tests pass or max attempts\n\n## Available Problems\n\nThe environment includes USACO problems from:\n- Bronze division\n- Silver division\n- Gold division\n- Platinum division\n\nEach problem includes multiple test cases with input/output files.\n\n## For Prime RL Training\n\n```toml\n[[env]]\nid = \"yourusername/usaco-verifier\"\n```\n\n## Development\n\n```bash\n# Install in development mode\npip install -e .\n\n# Test locally\npython -c \"from usaco_verifier import USACOEnvironment; env = USACOEnvironment(); print(env.get_problems())\"\n```\n","encoding":"utf-8","truncated":false,"total_bytes":1745},"status":null}