TypeScript API Python API Community GitHub Phoenix Cloud

English

Documentation
Self-Hosting
Cookbooks
Learn
Integrations
SDK and API Reference
Release Notes

English

Arize Phoenix
Quickstarts
User Guide
Environments
Phoenix Demo
🔭Tracing
📃Prompt Engineering
🗄️Datasets & Experiments
🧠Evaluation
🔍Retrieval
🌌inferences
⚙️Settings

Powered by GitBook

Platform

Tracing
Prompts
Datasets and Experiments
Evals

Software

Python Client
TypeScript Client
Phoenix Evals
Phoenix Otel

Resources

Container Images
X
Blue Sky
Blog

Integrations

OpenTelemetry
AI Providers

© 2025 Arize AI

On this page

Phoenix Evaluators
Bring Your Own Evaluator
Online Evals
Evaluating Phoenix Traces
Multimodal Evals

Was this helpful?

Evaluation

How to: Evals

PreviousQuickstart: Evals NextPre-Built Evals

Last updated 3 months ago

Was this helpful?

(llm_classify)
(llm_generate)

Run evaluations via a job to visualize in the UI as traces stream in.

Evaluate traces captured in Phoenix and export results to the Phoenix UI.

Evaluate tasks with multiple inputs/outputs (ex: text, audio, image) using versatile evaluation tasks.

🧠

Evaluating Phoenix Traces

Multimodal Evals

Phoenix Evaluators

Q&A on Retrieved Data

Retrieval (RAG) Relevance

Code Generation

Reference (Citation) Eval

User Frustration

SQL Generation Eval

Agent Function Calling Eval

Audio Emotion Detection

Bring Your Own Evaluator

Categorical evaluator

Numeric evaluator