Validierungsergebnisse

Quantitative und qualitative Ergebnisse aus MOTIVEs Multi-Domänen-Validierungsstudie. Bewertungen, Expertenfeedback und Cross-Model-Tests.

Studiendemografie

Teilnehmer N = 30

Professionelle Domaenen 10

Erfahrungsspanne 2-15 Jahre

Getestete KI-Modelle GPT-4, Claude 3, Gemini

Evaluationsmethode Mixed-Methods

Studiendesign

Die Validierungsstudie verwendete ein Within-Subjects-Design, bei dem jeder Teilnehmer Prompts fuer domaenenspezifische Aufgaben sowohl mit als auch ohne das MOTIVE-Framework erstellte.

Phase 1: Baseline-Prompt-Erstellung

Phase 2: MOTIVE-Schulung

Phase 3: MOTIVE-strukturierte Prompt-Erstellung

Phase 4: Expertenbewertung & Interviews

Quantitative Ergebnisse

Durchschnittswerte auf einer 1-5-Likert-Skala ueber alle Domaenen und Modelle.

Strukturelle Vollstaendigkeit

Vorher

2.1

→

Nachher

4.3

+105%

Ausgaberelevanz

Vorher

2.8

→

Nachher

4.1

+46%

Umsetzbarkeit

Vorher

2.4

→

Nachher

4.0

+67%

Cross-Model-Konsistenz

Vorher

2.2

→

Nachher

4.2

+91%

Domaenenspezifitaet

Vorher

2.5

→

Nachher

4.1

+64%

Evaluationskriterien

Vorher

1.4

→

Nachher

4.4

+214%

Qualitative Themen

Reduzierter kognitiver Aufwand

Teilnehmer berichteten, dass das strukturierte Format den mentalen Aufwand zur Formulierung umfassender Prompts reduzierte.

Gesteigertes Vertrauen

Nutzer aeusserten groesseres Vertrauen in ihre Prompt-Qualitaet bei Verwendung der MOTIVE-Struktur.

Domaenenuebergreifende Uebertragbarkeit

Teilnehmer fanden das Framework ohne wesentliche Anpassung ueber verschiedene professionelle Kontexte hinweg anwendbar.

Evaluation als Treiber

Die Evaluationskomponente wurde als wirkungsvollste Ergaenzung genannt, die eine zuvor fehlende Qualitaetssicherung bietet.

Limitationen

•Die Stichprobengroesse (N=30) begrenzt die Verallgemeinerbarkeit; eine groessere Validierung ist geplant.
•Teilnehmer erhielten MOTIVE-Schulung, was einen Lerneffekt-Bias einfuehren kann.
•KI-Modell-Ausgaben entwickeln sich schnell; Ergebnisse koennen sich mit Modell-Updates aendern.
•Domaenenexperten-Bewertung fuehrt trotz strukturierter Raster Subjektivitaet ein.