evaluation

Class

ExperimentResults

Results container for experiment data with stats and examples.

Class

ExperimentResultRow

Class

ComparativeExperimentResults

Represents the results of an evaluate_comparative() call.

Class

AsyncExperimentResults

Class

EvaluationResult

Evaluation result.

Class

EvaluationResults

Batch evaluation results.

Class

RunEvaluator

Evaluator interface class.

Class

DynamicRunEvaluator

A dynamic evaluator that wraps a function and transforms it into a RunEvaluator.

Class

ComparisonEvaluationResult

Feedback scores for the results of comparative evaluations.

Class

DynamicComparisonRunEvaluator

Compare predictions (as traces) from 2 or more runs.

Class

StringEvaluator

Grades the run's string input, output, and optional answer.

Class

LLMEvaluator

A class for building LLM-as-a-judge evaluators.

LangChain Assistant

Menu

Classes

ExperimentResults

ExperimentResultRow

ComparativeExperimentResults

AsyncExperimentResults

EvaluationResult

EvaluationResults

RunEvaluator

DynamicRunEvaluator

ComparisonEvaluationResult

DynamicComparisonRunEvaluator

StringEvaluator

LLMEvaluator

Functions

evaluate

evaluate_existing

evaluate_comparative

aevaluate

aevaluate_existing

run_evaluator

comparison_evaluator