AI Safety

Artificial Intelligence

Definition

A research field focused on ensuring AI systems operate safely, reliably, and in alignment with human values. AI safety encompasses alignment research, robustness testing, adversarial defense, interpretability, and governance frameworks.

Defined Term

Term AI Safety
Category Artificial Intelligence
views 684

AI Safety

AI Safety

Defined Term

Related Terms

AI Agent

AI Alignment

AI Ethics

Activation Function

Agentic Workflow

Anomaly Detection