E
Evaluation
Kernfragen
- ?Welche Kriterien bestimmen, ob das Ergebnis akzeptabel ist?
- ?Welche Bewertungsskala und Schwellenwerte gelten?
- ?Was passiert, wenn das Ergebnis unter den Schwellenwert fällt?
- ?Wie viele Revisionszyklen sind erlaubt?
Mikro-Vorlage
Bewerten nach: (1) [Kriterium] — Score 1-5. (2) [Kriterium] — Score 1-5. Bei Score < [Schwelle] [Komponente] überarbeiten und neu generieren. Max. [N] Zyklen.
Anti-Patterns
| Error | Correction |
|---|---|
| Keine Bewertungskriterien definiert | Immer mindestens 2-3 messbare Kriterien für professionelle Outputs einschließen. |
| Vage Qualitätssprache ('mach es gut') | Subjektive Begriffe durch spezifische, bewertbare Kriterien ersetzen, die ans Object gebunden sind. |
| Kein Schwellenwert für akzeptable Qualität | Einen Mindestscore festlegen, der bei Unterschreitung eine Überarbeitung auslöst. |
| Kein Iterationsmechanismus | Definieren, was bei Nichtbestehen passiert: welche Komponente überarbeiten, wie viele Zyklen. |
| Bewertung gegen Kriterien, die nicht im Prompt stehen | Stellen Sie sicher, dass jedes Bewertungskriterium einer zuvor spezifizierten Komponente entspricht. |
Selbstprüfung
- ✔Lässt sich jedes Bewertungskriterium auf eine bestimmte Komponente zurückführen?
- ✔Ist die Bewertungsskala klar und umsetzbar?
- ✔Würde ein menschlicher Reviewer zustimmen, dass dies die richtigen Kriterien sind?
Interaktionshinweis
Evaluation schließt den Kreislauf. Sie transformiert Prompt Engineering von einer einmaligen Aktivität in einen systematischen, iterativen Prozess. E-Kriterien sollten direkt auf M (Zielausrichtung), O (Ergebnisqualität) und T (methodische Strenge) abbilden.