Tool · Image → Video

Image / PDF to Video

Upload a screenshot, photo, or PDF. Vision AI extracts text, formats it as HTML, and captures screenshots.

Source file

{file ? ( {file.name} ) : dragActive ? ( Drop to upload ) : ( <> Click to upload or drag-and-drop · PNG, JPG, or PDF )}

{ setFile(e.target.files?.[0] ?? null) setDropError(null) }} disabled={running} /> {dropError && (

{dropError}

)}

Extraction instructions (optional)

setInstructions(e.target.value)}
              disabled={running}
            />
          </div>
          <div>
            <label className="label" htmlFor="system-prompt">
              Custom HTML system prompt (optional)
            </label>
            <textarea
              id="system-prompt"
              className="textarea h-20 resize-y"
              placeholder="Override the default HTML formatting prompt…"
              value={systemPrompt}
              onChange={(e) => setSystemPrompt(e.target.value)}
              disabled={running}
            />
          </div>
        </div>

<div className="card space-y-4">
          <div className="text-sm font-medium text-slate-900 dark:text-slate-100">
            Capture settings
          </div>
          <div className="grid grid-cols-1 gap-4 sm:grid-cols-3">
            <Field label="Zoom" htmlFor="img-zoom">
              <input
                id="img-zoom"
                type="number"
                step="0.1"
                className="input"
                value={settings.zoom ?? 2.1}
                onChange={(e) => setSettings({ ...settings, zoom: Number(e.target.value) })}
                disabled={running}
              />
            </Field>
            <Field label="Overlap (px)" htmlFor="img-overlap">
              <input
                id="img-overlap"
                type="number"
                className="input"
                value={settings.overlap ?? 20}
                onChange={(e) => setSettings({ ...settings, overlap: Number(e.target.value) })}
                disabled={running}
              />
            </Field>
            <Field label="Max screenshots" htmlFor="img-max">
              <input
                id="img-max"
                type="number"
                className="input"
                value={settings.max_screenshots ?? 50}
                onChange={(e) =>
                  setSettings({ ...settings, max_screenshots: Number(e.target.value) })
                }
                disabled={running}
              />
            </Field>
          </div>
          <div className="grid grid-cols-1 gap-4 sm:grid-cols-2">
            <Field label="Viewport width" htmlFor="img-vw">
              <input
                id="img-vw"
                type="number"
                className="input"
                value={settings.viewport_width ?? 1920}
                onChange={(e) =>
                  setSettings({ ...settings, viewport_width: Number(e.target.value) })
                }
                disabled={running}
              />
            </Field>
            <Field label="Viewport height" htmlFor="img-vh">
              <input
                id="img-vh"
                type="number"
                className="input"
                value={settings.viewport_height ?? 1080}
                onChange={(e) =>
                  setSettings({ ...settings, viewport_height: Number(e.target.value) })
                }
                disabled={running}
              />
            </Field>
          </div>
        </div>

<div className="flex flex-wrap items-center gap-3">
          {!running ? (
            <button type="submit" className="btn-primary" disabled={!file}>
              <Play size={16} /> Generate
            </button>
          ) : (
            <button type="button" className="btn-danger" onClick={() => cancel()}>
              <StopCircle size={16} /> Cancel
            </button>
          )}
          {state.status === 'error' && !state.rejectedReason && (
            <span className="text-sm text-red-600 dark:text-red-400">{state.error}</span>
          )}
        </div>
        {state.status === 'error' && state.rejectedReason && (
          <BackendRejectedBanner
            reason={state.rejectedReason}
            message={state.error ?? 'Backend rejected the run.'}
          />
        )}
      </form>

</div>
  )
}

function Field({
  label,
  htmlFor,
  children,
}: {
  label: string
  htmlFor?: string
  children: React.ReactNode
}) {
  return (
    <div>
      <label className="label" htmlFor={htmlFor}>
        {label}
      </label>
      {children}
    </div>
  )
}