Stats

Hver analyse genererer ét kald pr. backend. Gennemsnit og p95 beregnes kun over succesfulde kald, så fejlede timeouts ikke forvrider tallene.

Pr. backend

Gns. fund er gennemsnitligt antal rå fund pr. artikel, før dubletter mellem modellerne flettes. Konsensus er andelen af modellens fund, hvor en anden AI fandt det samme — høj konsensus tyder på præcision; lav på enten flere unikke fund eller flere falske positiver. For LanguageTool tæller "konsensus" som overlap med en hvilken som helst AI.

BackendKaldSuccesrateGns. fundKonsensusGns. tidP95
LanguageTool 7 100,0 % 37,0 6 % 5,1 s 15,8 s
Gemini 7 100,0 % 9,8 49 % 53,1 s 69,8 s
OpenAI (GPT) 7 100,0 % 6,8 67 % 54,4 s 79,2 s
Claude 7 85,7 % 4,0 67 % 7,5 s 18,5 s
Hele analysen (wall clock) 7 65,3 s 79,2 s

Sidste 10 kald

TidspunktBackendStatusTidFundFejl
den 28. april 2026 kl. 11:35 Claude OK 5,0 s 1
den 28. april 2026 kl. 11:35 OpenAI (GPT) OK 34,1 s 3
den 28. april 2026 kl. 11:35 Gemini OK 64,8 s 4
den 28. april 2026 kl. 11:35 LanguageTool OK 2,7 s 10
den 28. april 2026 kl. 11:34 Claude OK 5,0 s 1
den 28. april 2026 kl. 11:34 OpenAI (GPT) OK 79,2 s 5
den 28. april 2026 kl. 11:34 Gemini OK 43,8 s 9
den 28. april 2026 kl. 11:34 LanguageTool OK 4,3 s 39
den 28. april 2026 kl. 11:33 Claude Fejl 28,4 s 0 Claude returnerede ikke et brugbart tool_use-svar.
den 28. april 2026 kl. 11:33 OpenAI (GPT) OK 74,9 s 12