Codex Builds Laravel CRM Fast but Needs Fixes

Phased Prompting Drives Efficient Generation

Break projects into 8+ detailed phases with subphases (e.g., Phase 1: database tables with field specs; Phase 4: services/actions; Phase 5: leads list/table/forms). Feed each phase sequentially to Codex, committing output blindly before reviews. This yielded a Laravel/Filament mini-CRM admin panel (from Upwork spec) in ~2 hours total, consuming <20% of $25 weekly OpenAI plan. Phase times: database (20 min), core logic/services (38 min), leads UI (7 min). Avoid fully isolating database phase—Codex embeds domain validation in Eloquent models (DDD-aligned), but early reviews flag incomplete logic.

Dual AI Reviews Catch 5-13 Issues Per Phase

Review each phase's code three ways: (1) manual (e.g., move enums to app/Enums namespace, override default passwords); (2) Claude (flags logic inconsistencies, validation invariants, architecture—13 issues in Phase 4 vs. Codex's 5); (3) fresh Codex context (catches hard-coded passwords, deletions). Claude outperforms Codex at reviewing alien code, spotting field interactions and best practices. Run multiple models—they complement: Codex fixates on docs/tools, Claude on goals. Post-review commits fix enums, helpers, auth duplication, hard-codes (e.g., pipeline enums as 'everything except dead ends').

Codex Lags Claude in Tooling and Visibility

Codex generates tests in wrong folders (tests/feature/feature), issues redundant mv commands, runs artisan with bad params despite doc searches + terminal consults. Filament struggles: duplicates middleware auth, generates unneeded files, ignores traits. UI lacks consistent code diffs (says 'what' but hides 'how' vs. Claude's live terminal view). Non-deterministic: tools fail, rails off despite prompts/guidelines. GPT-5.4 edges Claude in accuracy sometimes, but terminal UX inferior—no easy code visibility toggle.

Use Both Tools and Plan Heavily for Production

Codex isn't main driver yet—pair as generator/reviewer (or vice versa) for real projects. Invest upfront in scoping, context, goals, stack-specific guides (e.g., Filament MCPs). Results hinge on planning details, not model alone. Test Codex app for better UX.