← Fogalomtár
Fogalom

Benchmark

Szabványosított feladatsorokból álló iparági teszt, amellyel a különböző mesterséges intelligenciák teljesítményét mérik össze matematikai, kódolási vagy logikai kategóriákban.

Analógia

Pontosan olyan, mint az autók töréstesztje vagy az érettségi vizsga: ad egy objektív viszonyítási alapot a piacnak, de önmagában nem mondja meg, hogy az adott sofőr vagy diák hogyan áll helyt a váratlan, valós életbeli szituációkban.

Miért fontos?

Bár jelenleg (2026) a teszteredmények hetente döntenek meg új rekordokat, fontos tudni, hogy a benchmarkok gyakran steril, laboratóriumi körülményeket tükröznek. Egy modell kiváló teszteredménye nem feltétlenül garantálja, hogy a mi egyedi üzleti problémánkat is ügyesebben oldja meg, mint a versenytársa.

Kapcsolódó oldalak